这是通过 Sai 分析 Reddit 情感的完整工作流程。这不是一个理论框架,而是 Sai 在您的计算机上执行的实际操作序列。
步骤 1:Subreddit 发现与映射
在分析情感之前,您需要知道哪些 subreddit 包含相关讨论。不同的 subreddit 会以截然不同的视角讨论同一话题。
Sai 的操作:
Sai 会在 Google 上搜索与您的关键词匹配的 Reddit 讨论(使用“[您的主题] site:reddit.com”等查询),并编制一份 subreddit 映射:
| Input | What Sai Extracts | Output |
|---|
| Product name | Subreddits where the product is discussed | Ranked list by post frequency and recency |
| Industry keyword | Communities discussing the topic | Subreddit names + subscriber counts + activity level |
| Competitor name | Threads comparing competitors | Cross-references between subreddits |
| Pain point | Threads where users describe the problem | Question patterns + common frustrations |
示例输出:
主题:“AI 桌面代理”
- r/artificial:30 天内有 12 篇相关帖子。语气:技术性、评估性。
- r/LocalLLaMA:8 篇帖子。语气:对开源持积极态度,对专有工具持怀疑态度。
- r/productivity:6 篇帖子。语气:实用主义,寻求零配置解决方案。
- r/selfhosted:4 篇帖子。语气:注重隐私,Docker 优先。
- r/SaaS:3 篇帖子。语气:业务导向,注重投资回报率。
有了这份映射,您就确切知道该将分析重点放在哪里,而不是猜测哪些 subreddit 更重要。
步骤 2:帖子和评论抓取
Sai 的操作:
Sai 会打开每个相关的 subreddit,滚动浏览与您的关键词匹配的最新帖子,并阅读完整的评论串。这是将基于浏览器的分析与基于 API 的方法区分开来的关键一步:
- API 方法: 返回帖子标题和顶级评论。嵌套回复(通常包含最真实的观点)需要单独的 API 调用,每次调用都会计入 每分钟100次请求的速率限制。
- Sai 的方法: 在真实浏览器中打开帖子,并滚动浏览整个评论树——包括折叠的回复、“加载更多评论”的展开内容以及嵌套的讨论。
为什么这很重要: 在 Reddit 上,顶级评论通常会说“我试过工具 X。”而三级深度的回复则会说“我用了工具 X 六个月,然后因为[具体原因]换成了工具 Y。”这种嵌套回复才是真正有价值的洞察所在。
第三步:AI 驱动的情感分类
Sai 的做法:
每篇帖子及其评论都被归类为积极、消极或中性。但与 VADER 等基于规则的工具不同,Sai 采用基于大型语言模型 (LLM) 的分类,能够理解:
- 讽刺: “哦,太棒了,又一个肯定不会胡言乱语、删除我文件的 AI 工具 /s”是负面的,而不是正面的。
- 有条件的赞扬: “如果你使用 Linux 并且熟悉 Docker,它会运行得很好”是积极的,但带有重要的限制条件。
- 比较性情感: “比工具 X 好,但比工具 Y 差”包含积极和消极两种信号。
- Reddit 特有语言: 点赞模式、奖励信号和评论 Karma 值作为参与度的衡量指标。
第四步:主题提取与差距分析
除了正面/负面标签,Sai 还能识别出所有分析讨论中反复出现的模式:
- 功能好评: 用户最常正面提及哪些功能?
- 重复投诉: 哪些问题在多个讨论串中反复出现?
- 未满足的需求: 用户明确希望存在但却无人开发的功能是什么?
- 竞争对手提及: 提到了哪些替代方案——以及在什么情境下?
主题输出示例:
| Theme | Frequency | Sentiment | Representative Quote |
|---|
| Safety/permissions concern | 15+ threads | Negative | "I don't trust an AI agent with access to my entire desktop" |
| Windows support gap | 10+ threads | Negative | "These tools only work on Linux/Mac" |
| Setup complexity | 8+ threads | Negative | "Why do I need Docker just to automate a spreadsheet?" |
| Time savings | 12+ threads | Positive | "Saved me 3 hours on a task I used to do manually every week" |
| Want human-like UX | 7+ threads | Neutral | "I want something that works like a human assistant, not a coding copilot" |
第五步:附带来源链接的结构化导出
Sai 的输出结果:
最终交付物是一份结构化报告——可以在聊天中查看,也可以导出到 Google 表格,或两者兼有:
- 摘要页: 总体情感分析(正面、负面、中立百分比)、主要主题、关键洞察
- 原始帖子页: 每篇分析过的帖子都附带情感标签、点赞数、评论数以及源帖子的直接链接
- 主题分析选项卡: 包含频率统计、情感分布以及带有链接的代表性引用的重复主题
每项洞察都直接链接回源帖子,方便您验证并深入挖掘。没有黑箱结论——全程可追溯。
Sai 的 Reddit 情感分析器 是开源的。您可以清楚地了解其工作流程,根据您的用例进行定制,或直接使用。立即开始 在 sai.work 免费试用 7 天 并尝试以下提示:
- “Reddit 对 [您的产品] 与 [竞争对手] 的看法如何?”
- “分析 r/[subreddit] 中关于 [主题] 在过去 30 天的情感”
- “Reddit 用户希望 [产品类别] 拥有哪些功能?”
免费试用 Sai 7 天