我和很多小伙伴最近正在参加 AI Web 大项目实操活动,而建站的第一步就是——找到明确的需求。
考虑到我们主要是面向海外用户出海,而老外的思维方式与我们确实存在一些差异,为了尽快定位他们真实的痛点和需求,我用上了一个超高效的工具:n8n 自动化流程。
大家可以翻阅我之前的帖子(里头有详细教程),可以直接白嫖搭建一个 n8n 的在线工作流平台。
https://scys.com/articleDetail/xq_topic/1524485511885422
视频讲解一下0成本部署N8N操作平台
这里是N8N工作流的。
结果数据展示
这里是google sheet的数据
为什么选择Reddit ?
Reddit 是一个基于兴趣和社区的内容聚合与讨论平台,它拥有全球数亿级别的活跃用户,在北美、欧洲及全球英语国家尤为活跃,被称为“美版知乎 + 微博 + 豆瓣”。
- 💬 用户可以在不同主题的 Subreddit(子论坛) 中提问、发帖、投票、讨论
- 👥 内容分类明确:如
r/smallbusiness,r/startups,r/freelance,r/SaaS,r/ecommerce,r/marketing等等 -
🔍 用户发帖多为求助、吐槽、经验分享、资源推荐 → 真实、高粘性、高痛点
在这个流程里,我接入了 Reddit 作为数据源
通过 n8n + Reddit + AI 的组合,我们可以自动抓取海外用户的真实问题、生成摘要、判断是否为商业机会,并自动归档进表格,让“找需求”变得不再拍脑袋,全靠数据说话。
基本概念了解
🟥 1. Reddit 节点
✅ 作用:从 Reddit 获取数据
- 用于抓取 Reddit 上指定 subreddit 中的帖子(如
r/smallbusiness)。 - 你可以使用关键词进行搜索,例如 “recommendation”, “looking for solution”。
- 支持返回内容包括:发帖时间、点赞数(ups)、正文内容(selftext)等。
👉 目标:获取 Reddit 上真实用户发布的问题或需求作为数据源。
🟨 2. IF 节点
✅ 作用:筛选符合条件的数据
- 是一个逻辑判断模块,用于过滤不需要的内容。
- 常见条件:
ups > 2:至少有一定点赞数(代表真实需求)selftext is not empty:帖子正文不为空created within 180 days:只保留半年内的数据
👉 目标:确保输入的数据是近期、有互动、有实质内容的真实问题。
🟩 3. AI Agent 节点
✅ 作用:调用 AI 判断帖子内容是否是“商业问题”
- 使用DeepSeek或其他大模型(如 GPT-4)对 Reddit 帖子进行分类。
- Prompt 示例:
- “判断这个 Reddit 帖子是否在描述一个具体商业问题或需求,仅回答 Yes 或 No。”
👉 目标:自动识别哪些内容是真的“痛点”或“机会”,跳过聊天、废话、情绪宣泄类帖子。
🟦 4. Merge 节点
✅ 作用:整合多个来源的数据
- 将来自不同节点(如原始帖子数据、AI判断结果、摘要内容、解决方案)的输出合并成一个对象。
- 可配置字段优先级和数据匹配方式。
👉 目标:将“问题 + 摘要 + AI生成的解决方案”等信息整合成一个完整数据结构,用于后续写入表格或发送通知。
🟧 5. Filter 节点
✅ 作用:进一步筛选合格数据
- 通常用于只保留 AI 判断为
yes的结果。 - 即使 AI Agent 处理完,也要再次确认是否真正命中你的筛选条件。
👉 目标:精炼数据,只保留真正值得生成商业方案的帖子内容。
🟪 6. Summarization Chain 节点
✅ 作用:自动摘要原始帖子内容
- 使用 AI(如 OpenAI)生成精炼的帖子摘要。
- 适合将 Reddit 上较长的问题描述,压缩为一句话概括。
- 示例输出:
- “创业者正在寻找跨平台的库存管理方案。”
👉 目标:为每个问题提供一个可视化、快速阅读的概括,便于整理归档或输入到 Google 表格。
🟪 7. Google Sheet
✅ 作用:保存数据
1:触发启动工作流的节点
Reddit 节点(search: post)
第一步需要创建reddit节点,我们需要到reddit上获取数据,Post Action 是 “search for a post”
这一步需要接入API,就相当于reddit授权给你,相当于给了你一把钥匙,允许你从我的平台获取数据。这里我们记住要填入Oauth Redirect URL , Client ID, Client Secret
文档参考 https://docs.n8n.io/integrations/builtin/credentials/reddit/?utm_source=n8n_app&utm_medium=credential_settings&utm_campaign=create_new_credentials_modal
我们进入文档链接 点击如图“third-party app”
https://www.reddit.com/prefs/apps
要求填入,其中 redirect uri 是 <你的域名>/rest/oauth2-credential/callback
填入之后就会给你Client ID ,Client Secret ,这里我们红色标注,将得到值回到之前那一步填入即可.
这一步我们需要将reddit设置明明白白的 ,我需要探索需求频道,通过关键词找“look for a sulution”来进行查找。
https://www.reddit.com/r/smallbusiness/ 这个社区足够的活跃
到这里我们先测试一下 看是否返回数据,可以看到有数据。
- Credential 用于连接你的 Reddit 账户。
- Resource:Post 表示你要操作的数据类型是帖子(Reddit Post)。
- Operation:Search 表示要进行的是“搜索帖子”的操作。
也可选其它操作,如 Get Post(获取指定帖子)、Submit(发帖)等。
- Location:Subreddit 指定搜索范围是某一个具体的 Subreddit(子论坛)。
如:只在 r/smallbusiness 中搜索。
- Subreddit:smallbusiness
填你要搜索的目标社区,这里是 r/smallbusiness,是 Reddit 上关于小企业经营的活跃社区。
- Keyword:looking for a solution
这是你要搜索的关键词。
示例中填写的是 “looking for a solution”,代表你在查找那些明确表达出老外遇到商业问题、希望得到解决方案的帖子。
- Return All:Off
若打开(On):会返回匹配的所有帖子(不建议,量太大)。
当前关闭(Off):你只会得到 Limit 指定数量的结果。
- Limit:5
返回最多 5 条搜索结果。推荐前期调试设置为 5~10,确认结果准确后再增大。
- Additional Fields(附加字段)
如你想按时间/热度排序结果,可以展开这里设置:
Sort: Hot / New / Top / Relevance / Comments
通常建议设置为 Hot,获取最新的火热的问题。
3 IF节点 筛选有效数据
从这里我收集到数据 需要判断筛选
条件1:{{ $json.ups }} is greater than 2
含义:这个帖子必须有至少 3个 upvotes(点赞)。
ups 是什么?
ups 是 Reddit API 返回的数据字段,表示帖子当前的点赞数量(upvotes)。
- 类似于微博的“赞”数量,用户点击“↑”代表觉得这个帖子有价值。
条件2:{{ $json.selftext }} is not empty
含义:帖子正文不能为空。
selftext 是帖子内容主体(不是标题),如果是纯链接帖或空内容就会被过滤掉。
{{ DateTime.fromSeconds($json.created).toISO() }}
``is after or equal to
``{{ $today.minus({days: 180}).toISO() }}
- 含义:只保留180天内发布的帖子。
created是帖子创建的时间戳(秒),通过.fromSeconds()转换为 ISO 格式日期$today.minus({days: 180})是当前日期往前推180天
还是老惯例,我们调试一下
4.Edit Fields(手动设定字段)
这一步我们需要过滤一下字段 ,发现好多字段,好烦呀,同理我们需要设置一下,重新整理之后的字段 ,我们就清晰多了。
5.AI Agent(+ DeepSeek Chat Model)
接下就用到我们的AI agent 分析了 ,这里选用我们的deepseek,这里选用的Model是deepseek-chat即可。(也可以选择Open AI)
- deepseek-chat
✅ 适合用途:自然语言对话,问答、摘要、翻译,prompt 工程、日常聊天机器人、n8n 工作流中的基本 AI Agent 任务
类似 ChatGPT 的风格,偏向“对话体验优化”,回复简洁、速度快,比较适合“判断类型、生成摘要、生成简答型文案”等任务
- deepseek-reasoner
数学计算、复杂逻辑推理、代码生成
多步骤推导(例如:链式思维、判断链、因果关系)
加强了思维链推理能力(Chain-of-Thought Reasoning)
更偏“研究型”思维,适合长文本推理、分析任务
这里根据提示词,筛选符合我们要求的Reddit帖子。用Yes或者No进行标注。方便我们后续筛选。
Reddit帖子是在描述一个商业相关的问题或者需要一个解决方案。这篇帖子应该提到具体的要求,正尝试积极解决它。
Reddit帖子:{{ $json.selftext }}
这篇文章是一个商业解决方案吗?只输出Yes或No
6.Merge
接下来我们将 yes or no的结果 同前面的数据合在一起,需要用到了 merge 节点 ,将 AI Agent 的判断结果 与 原始帖内容合并。
🔹 Mode:Combine 表示采用“合并”模式。
”yes or no的结果“同”前面的数据“合在一起。
🔹 Combine By:Position
表示合并是按位置对应进行的。
输入1(原始帖子)输出了 3 个 item
输入2(AI判断结果)也输出了 3 个 item
Merge 将第1个帖子与第1个判断结果组合成一个对象
🔹 Number of Inputs:2
表示这个 Merge 节点将接收 2 个输入端口的数据。
我们最想要的是yes,yes代表这用户需要寻求一种商业解决方案,我们用 “Filter” 节点筛选一下
8.Summarization Chain
在 n8n 中,Summarization Chain 是一个用于 将长文本内容压缩成简洁摘要 的 AI 节点,属于 Advanced AI 功能的一部分。你可以用它对 Reddit 帖子、用户评论、产品评价、客服对话 等冗长内容进行总结,用一句话或一小段话清楚表达“这段内容在说什么”。
🔹 Data to Summarize:Use Node Input (JSON)
表示从上一个节点传入的 JSON 数据中提取要摘要的内容。
🔹 Chunking Strategy:Simple (Define Below) 指定文本的“分块方式”。
Simple 意味着使用手动设置的字符数进行分段。
用于避免传入大段文本超过 LLM 模型 token 限制,或提升总结准确性。
🔹 Characters Per Chunk:1000
每块文本的最大长度是 1000 个字符。
如果一段 Reddit 帖子超过 1000 字符,就会被分割成多块分别摘要。
🔹 Chunk Overlap (Characters):200
每个块与下一个块之间重叠的字符数是 200。
好处是避免信息“被切断”,保持语义连贯。
常用于确保段落在分块时不会丢失上下文。
9.将数据存到Google Sheets中
我们想将内容存储到文档中
我们要想存储到google的文档中 我需要google给我们把钥匙。参考文档https://docs.n8n.io/integrations/builtin/credentials/google/oauth-single-service/?utm_source=n8n_app&utm_medium=credential_settings&utm_campaign=create_new_credentials_modal
授权之后 我们需要创建sheet,供N8N输出的数据到这输入
回到N8N界面我们从Document,From List 就可以看到我们创建的sheet了
我们将之前的数据,拖拽到google对应的字段中 点击右上角的 test step
还老惯例,我们调试下结果。
这样我们就可以得到老外的想法了。如果需要得到更多的数据 ,修改Reddit节点的limit值,重新触发工作流即可。
- 希望大家多多反馈,毕竟我身为能熟练操作N8N自动化工作流的人来写教程。
- 还有r/smallbusiness只是来抛砖引玉,如果还有其他想法,也可以寻找对应的频道。
- 文中的N8N是免费部署搭建的,所以没有做汉化处理。
- 由于是海外内容,需要设置网络
- 注意要小步快跑,每一步调试一下。