从 6.5 号开始,6 个工作日一共大概花费 15 个小时完成 7 个工作流 👏👏👏

  • day 1(2 小时):火柴人视频 Coze 自动生成
  • day 2(2-3 小时):自动化生成小红书爆款图文笔记
  • day 3 + day 4(4-5 小时):AI 视频自动化工作流
  • day 5(2 小时)口播短视频的二创改写
  • day 6(4 小时)
  • 搭建自己的「今日热榜」,定时推送
  • 网页监控并实时推送到 QQ 或微信
  • 资讯摘要定时推送助手

因为本次项目实操自己是带着较高的预期和严格的自我要求,是自己短视频 IP 规划的源点,所以不管是坚持的毅力还是投入度都是非常高;每天努力实操和认真撰写项目实操日志,竟可能学到更多技能。

同时,也尽自己的能力,在群里积极解答其他船员的问题,因为作为船员的我深知:遇到问题多次尝试无果的痛苦 😧🥲,以及问题能及时被解决的愉悦 😄😆。

接下来就以我自己认为较难的项目「AI 视频自动化工作流」为例,和大家一起聊聊:

  • 航行中的锲而不舍
  • 复盘后的欣喜若狂

一、航行中的心路历程

1、我是认真好学的(👀 有点小自负的样子 👀),绝对不会直接复制代码,肯定得自己一步步搭建

所以就直接无视下面红框内容,开始一步一步的搭建。

2、看到密密麻麻的节点,惊讶 🥺 🥺:这也太复杂了吧,我能搭建出来吗?💔💔💔(心已经凉了一大截)

via 2.3 AI视频自动化工作流(工作流全貌图)

3、正式开始搭建,逢代码节点是必报错,对代码已经有心理阴影💥💥💥

复制出来的代码大都有中文全角符号

刚开始很傻的,通过「Ctrl + F」一个个符号的批量替换

后来群里有人提醒,先将代码丢给豆包,让豆包帮忙检查;豆包会自动替换掉这类全角符号问题,大大提升了效率(具体如何操作,后面会详细讲到)。

4、搭建过程中,不住的复制粘贴,即使节点通过,自己也是一脑子浆糊 😮‍💨😮‍💨😮‍💨

后面在复盘的时候,我自己想知道每一步的「所以然」,打开剪映时间线,一段一段的对比,终于明白了节点里的核心参数的作用,复盘完后再回过来看每个节点,就非常清晰了。

5、经过 2 个半天的努力,终于搭建完毕

长舒一口气😩😩😩,终于搞定了,再也不想看了,赶紧关电脑回家 💤💤💤。

二、苦苦折腾 2 天跑通 AI 视频自动化工作流后的经验和心得

1、先熟悉成品和全貌图,再开始搭建

假如:从手册的第一行开始,看一段实操一段,看一段实操一段,会有几个弊端

  • 遇到问题,只能问,因为不知道为什么要做一步,很难自己去解决问题
  • 即使侥幸全部运行成功,自己也是晕乎乎,自己脑子里也回忆不起来自己都做了什么

总结:身体勤快,头脑简单,收益减半;因为自己完全没有思考过。

1)拆解成品视频的核心元素

  • 标记 1:右上角标题文案,书名 + 作者
  • 标记 2:底部一张背景图
  • 标记 3:书名字幕,就是书名,一直在中间不动
  • 标记 4:书评字幕,不断的变动

经过简单的元素拆解,能知晓大概需要哪些元素,后面在搭建时能映射得上,搭建思路更加清晰,而不是仅仅是「身体勤快」,同时也会大大提升自己的搭建速度。

2)浏览工作流全貌图

  • 知晓流程的复杂度,管理好自己的预期
  • 通过节点名称和刚才拆解的元素的匹配,大概知晓哪几个是核心节点

via 2.3 AI视频自动化工作流(工作流全貌图)

❤️ 四勾项目实操心法 ❤️

学习还是需要讲究方法,知晓重点是什么,哪些内容是贯穿始终的,才能事半功倍。

2、务必要学会阶段性调试 🔬

1)避坑:全部节点搭完才开始运行

搭建流程花费两三个小时,一个劲拖拽和复制粘贴,已经消耗自己的很多耐心和精力;结果最后一「运行」大面积飘红,即打击积极性又对多处飘红无处下手:此刻就很容易放弃。

2)应该:阶段性调试

针对复杂的单一节点:单节点试运行

试运行的输入,通过「AI 补全」就不用自己造输入的用例,还是非常方便的。通过单节点运行对节点的代码或逻辑进行测试,尽早的暴露问题。

小心得:代码节点务必要单节点试运行。

阶段性的联调:完成一个功能模块后就进行联调

将整个流程拆分成如下 5 个阶段进行联调,每个阶段有各自的目的,如图红色框所示:

下面以第一个阶段为例,具体说下联调到底是联调什么?需要确认大模型的输出项是否合理(别文不对题):

  • content: 书评内容的合理性
  • keywords: 关键词的合理性

所以在联调时,我会输入一本我比较熟悉的书籍《影响力》,让自己有评判合理性的能力:

  • 通过预览快速通读输出参数「content」的内容,如下左图
  • 点击展开输出参数「keywords」的内容进行核对,如下右图

❤️ 四勾项目实操心法 ❤️

应该阶段性调试运行,及时给予自己正反馈,才能越干越起劲:是一种享受,而不是折磨。

3、勤问 AI 🙋‍♂️

代码节点报错的 case 特别适合问 AI,下面以「计算时长」代码块为例:

下左图:单节点试运行后,代码报错(大家先不要慌)

下右图:截图并框选报错信息,打开豆包,丢给它,让豆包帮忙修改代码

下左图:豆包修改完成之后,将豆包的代码粘贴到扣子里的节点,重新试运行

下右图:输出正常,试运行成功(有一次让豆包连续修改 3 次才通过,大家一定要有耐心)。

❤️ 四勾项目实操心法 ❤️

AI 是最好的老师,我们要从开始努力尝试用 AI,逐渐养成善用 AI;AI 不仅专业而且还能实时给与反馈。

4、不要过于追求高级工具 ⚡️

应该:先尝试免费或自己过去使用熟练的工具,比如豆包或 DeepSeek(毕竟使用门槛低)

不用:听别人说 Claude 是编程最厉害的工具,就开始折腾 Claude 充值等,半天又过去了

  • 如果说豆包尝试多次依旧解决不了,那就需要找更高级的工具了
  • 自己明明已经在使用 Claude,也没必要去尝试豆包了

❤️ 四勾项目实操心法 ❤️

不要过于追求高级的 AI 工具,先从自己容易上手的工具开始尝试,快速解决问题才是关键。

5、遇到问题如何自己解决 🎯

1)首先检查高频原因:入参或出参设置的是否正确

tips:用截图软件截取手册上的参数配置图,然后置顶在扣子的配置页面,一项一项的核对,主要核对:

  • 变量名是否正确,下图左边红框
  • 变量值的类型是否正确,下图中间红框
  • 变量值的引用是否正确,下图右边红框:因为有些引用比较长,手册上的图片是无法展示完整的,我们只能尽可能的去核对

2)其次根据错误提示找问题

比如下图,错误提示:没有余额了,请充值

复制错误信息的链接,充值后再次运行就成功了。

❤️ 四勾项目实操心法 ❤️

不要害怕问题,遇到问题后首要要冷静,其次根据报错信息尽可能去尝试解决问题,需要逐渐学会解决问题的能力(咱们海航有教练指导,但以后要搭建自己的工作流,就没有人来专门来答疑,还是得靠自己)。

三、通过复盘知其所以然

全流程运行成功后,我依旧还有如下疑惑:

  • 最开始大模型输出的 keyword 出现在视频哪里?
  • 分割文案的作用是什么?
  • 背景音中的翻书声和 BGM 是怎么来的?
  • 为什么还要判断书籍名称的字数?

可以通过事后的复盘来解答我们自己的疑问。

1、视频成果物中核心元素的拆解

分为「开场」和「正文」两部分来逐一拆解

1)开场

  • 元素
  • 底部模糊的书籍封面
  • 中间书籍封面 + 翻书转场动画
  • 拆解
  • 书籍封面(底部的模糊封面和翻书的封面是同一张图片)
  • 翻书转场动画
  • 书籍封面模糊特效

  • 元素

  • 朗读:今天要分享的是经济学的思维方式
  • 背景音:前面是翻书声,后面是 BGM
  • 拆解
  • 朗读的部分是由写死的文案「今天要分享的是」+ 书名
  • 背景音:翻书声和 BGM 都是固定的音频文件

2)正文

  • 右上角标题文案:书名 + 作者
  • 背景图:通过大模型生成提示词 》调用文生图插件
  • 书名字幕:就是书名,一直在中间不动
  • 书评字幕:不断的变动
  • 星火特效:从右下角往左上角飘动的星星

那么核心的问题是:每屏显示的不同的书评字幕是怎么来的?

举例说明,书籍《经济学的思维方式》的前几屏的书评依次是:

  • P1:读《经济学的思维方式》
  • P2:最深刻的感受是它打破了对经济学的刻板印象
  • P3:这不是一堆公式或数据
  • P4:而是一套帮人看清生活本质的思考工具

第一步:大模型生成「原始长篇书评」,如下(是整个书评的前半部分)

《经济学的思维方式》不是一本堆满公式的教科书,更像一位蹲在巷口聊家常的智者,用最朴素的语言拆穿生活里那些被忽略的经济逻辑。书里反复在说,经济学的本质是‘思维工具’,就像作者说的:‘经济学不提供答案,只教你如何像经济学家一样思考。’

第二步:用文本处理组件,用「。」分割成多个小段书评,如下 2 段

《经济学的思维方式》不是一本堆满公式的教科书,更像一位蹲在巷口聊家常的智者,用最朴素的语言拆穿生活里那些被忽略的经济逻辑

上面是第一段,下面是第二段

书里反复在说,经济学的本质是‘思维工具’,就像作者说的:‘经济学不提供答案,只教你如何像经济学家一样思考

第三步:用代码将书评小段分割成「每屏的书评字幕」,就将第一段分段分割成了我们视频中看到的 P1-P4

  • 元素
  • 朗读:书评字幕的朗读,并且朗读和书评字幕时间线需要能对齐
  • 背景音:BGM
  • 拆解
  • 朗读的部分以「小段书评」为单位,每个小段书评对应一个 MP3 文件
  • 背景音:和开场的 BGM 是同一个音频文件

那么问题是:音频文件是以「小段书评」为单位,而「书评字幕」是小段书评分割而来的,那么如何让字幕和音频对齐呢?

真是一个插件就可以解决的事情,我们只需要知道哪个插件能搞定对齐即可,不用去深究对齐的原理。

2、节点和核心元素的关联

1)作者和书籍封面

  • 书籍封面(底部的模糊封面和翻书的封面是同一张图片):来自于上图中的标记 1

  • 朗读的部分是由写死的文案「今天要分享的是」+ 书名:来自于上图中的标记 5

  • 右上角标题文案:书名 + 作者:来自于上图中的标记 3

  • 背景图:通过大模型生成提示词 》调用文生图插件:来自于上图中的标记 7
  • 书名字幕:就是书名,一直在中间不动:来自于「开始」节点的输入参数「book_name」

2)正文书评字幕

  • 书评字幕:来自于上图中的标记 2

  • 朗读的部分以「小段书评」为单位,每个小段书评对应一个 MP3 文件:来自于上图中的标记 3,并且通过标记 4 对齐书评的音频和字母

最后,调用插件将正文书评写入剪映草稿中,如下图:

3)组合结构

接下来最核心的节点「组合结构」,因为是代码块,我们初学者只需要了解它大概的作用即可,不用深究。

开场翻书动画和正文背景图

上面 2 者被合成一条时间线,通过调用插件写入剪映草稿中。

开场模糊特效和正文星火特效

上左图:开场的模糊特效

上右图:星火特效视觉冲击相对小一些,最开始我也没注意到,后面还是仔细看完剪映时间线才明白,大家可以留意正文中从左下角往右上角飘动的星星,就是星火特效。

开场的翻书声和正文的 BGM 背景音

  • BGM 背景音

上面 2 者被合成一条时间线,通过调用插件写入剪映草稿中。

四、想要在项目实操中快速跑通,咱们需要坚守什么

在我们的项目实操中常见的几种拦路虎,阻碍我们最终的上岸。

1、没时间 ⌛️

我们毕竟大都有自己的主业,利用自己工作之外的业余时间在项目实操,时间上面确实需要合理的规划。

首先,管理好自己的时间预期,每个项目计划 2-3 个小时左右,不是仅仅半个小时就能搞定的。

其次,规划好自己的时间,工作之外无非就是:工作日的早晚,和周末,比如每周一规划好当周的计划:

项目 开始时间 时长
火柴人视频 Coze 自动生成 周一晚上 10 点 1 小时
火柴人视频 Coze 自动生成 周二晚上 9 点 2 小时
自动化生成小红书爆款图文笔记 周四晚上 9 点 1 小时
自动化生成小红书爆款图文笔记 周五晚上 10 点 2 小时
AI 视频自动化工作流 周六下午 2 点 4 小时

tips:记得,设置好闹钟 ⏰️

2、太难学不会 😧

尝试搭建一两个节点后,觉得:太难了,自己不会。

首先,我们得相信的教练的能力,项目实操本来就是面向小白用户,咱们教练内容的设计一定是普通的人都可以操作的,你需要做的是:

  • 相信教练,你一定能学得会
  • 要有耐心,先让自己保证投入的时间足够,再说学不学得会的问题

3、被问题卡住 🏗️

遇到问题,自己潜潜地尝试几次后,就默默无声的放弃了。

咱们是有教练热心指导的,有专门的项目实操群,那可能咱又有问题:

  • 我担心问的问题太简单被人笑话 》管他呢,反正是线上,也没人认识你
  • 我问了啊,但是没人回我啊 》没人回就 at 教练、at 领队,或者私聊志愿者,大家都是非常乐意帮助的,用上你追男女朋友死缠乱打的本领出来

4、难坚持 🏃‍➡️🏃‍➡️🏃‍➡️

及时且持续的正反馈,就能让我们顺利的坚持下去,那么正反馈怎么来呢?

  • 项目实操好事:上榜,下左图
  • 教练点评优秀日志,下右图

五、感谢「利 TA」的大家庭

特别感谢教练:拔刀刘、二进制刀仔、骄阳

  • 感谢教练们的无私奉献,凌晨一两点还在群里答疑,着实感人 🙏🙏🙏
  • 感谢拔刀刘教练对智能体 IP 的路径规划指导,让我更加明确了自己接下来要走的路 🌹🌹🌹

特别感谢:领队海伦和志愿者凡

  • 感谢海伦领队对复盘的指导,同时也给与我更好的展示机会 🙏🙏🙏
  • 感谢凡每天的提醒,深刻记得一天晚上 11 点多还来提醒,那天差点忘记打卡

最后,感谢我们,是给予我们聚在一起的机会,给予我们年入百万的希望

继续加油 💪🏻 💪🏻 💪🏻

干就完了 👍👍👍