从 6.5 号开始,6 个工作日一共大概花费 15 个小时完成 7 个工作流 👏👏👏
- day 1(2 小时):火柴人视频 Coze 自动生成
- day 2(2-3 小时):自动化生成小红书爆款图文笔记
- day 3 + day 4(4-5 小时):AI 视频自动化工作流
- day 5(2 小时)口播短视频的二创改写
- day 6(4 小时)
- 搭建自己的「今日热榜」,定时推送
- 网页监控并实时推送到 QQ 或微信
- 资讯摘要定时推送助手
因为本次项目实操自己是带着较高的预期和严格的自我要求,是自己短视频 IP 规划的源点,所以不管是坚持的毅力还是投入度都是非常高;每天努力实操和认真撰写项目实操日志,竟可能学到更多技能。
同时,也尽自己的能力,在群里积极解答其他船员的问题,因为作为船员的我深知:遇到问题多次尝试无果的痛苦 😧🥲,以及问题能及时被解决的愉悦 😄😆。
接下来就以我自己认为较难的项目「AI 视频自动化工作流」为例,和大家一起聊聊:
- 航行中的锲而不舍
- 复盘后的欣喜若狂
一、航行中的心路历程
1、我是认真好学的(👀 有点小自负的样子 👀),绝对不会直接复制代码,肯定得自己一步步搭建
所以就直接无视下面红框内容,开始一步一步的搭建。
2、看到密密麻麻的节点,惊讶 🥺 🥺:这也太复杂了吧,我能搭建出来吗?💔💔💔(心已经凉了一大截)
3、正式开始搭建,逢代码节点是必报错,对代码已经有心理阴影💥💥💥
复制出来的代码大都有中文全角符号
刚开始很傻的,通过「Ctrl + F」一个个符号的批量替换
后来群里有人提醒,先将代码丢给豆包,让豆包帮忙检查;豆包会自动替换掉这类全角符号问题,大大提升了效率(具体如何操作,后面会详细讲到)。
4、搭建过程中,不住的复制粘贴,即使节点通过,自己也是一脑子浆糊 😮💨😮💨😮💨
后面在复盘的时候,我自己想知道每一步的「所以然」,打开剪映时间线,一段一段的对比,终于明白了节点里的核心参数的作用,复盘完后再回过来看每个节点,就非常清晰了。
5、经过 2 个半天的努力,终于搭建完毕
长舒一口气😩😩😩,终于搞定了,再也不想看了,赶紧关电脑回家 💤💤💤。
二、苦苦折腾 2 天跑通 AI 视频自动化工作流后的经验和心得
1、先熟悉成品和全貌图,再开始搭建
假如:从手册的第一行开始,看一段实操一段,看一段实操一段,会有几个弊端
- 遇到问题,只能问,因为不知道为什么要做一步,很难自己去解决问题
- 即使侥幸全部运行成功,自己也是晕乎乎,自己脑子里也回忆不起来自己都做了什么
总结:身体勤快,头脑简单,收益减半;因为自己完全没有思考过。
1)拆解成品视频的核心元素
- 标记 1:右上角标题文案,书名 + 作者
- 标记 2:底部一张背景图
- 标记 3:书名字幕,就是书名,一直在中间不动
- 标记 4:书评字幕,不断的变动
经过简单的元素拆解,能知晓大概需要哪些元素,后面在搭建时能映射得上,搭建思路更加清晰,而不是仅仅是「身体勤快」,同时也会大大提升自己的搭建速度。
2)浏览工作流全貌图
- 知晓流程的复杂度,管理好自己的预期
- 通过节点名称和刚才拆解的元素的匹配,大概知晓哪几个是核心节点
❤️ 四勾项目实操心法 ❤️
学习还是需要讲究方法,知晓重点是什么,哪些内容是贯穿始终的,才能事半功倍。
2、务必要学会阶段性调试 🔬
1)避坑:全部节点搭完才开始运行
搭建流程花费两三个小时,一个劲拖拽和复制粘贴,已经消耗自己的很多耐心和精力;结果最后一「运行」大面积飘红,即打击积极性又对多处飘红无处下手:此刻就很容易放弃。
2)应该:阶段性调试
针对复杂的单一节点:单节点试运行
试运行的输入,通过「AI 补全」就不用自己造输入的用例,还是非常方便的。通过单节点运行对节点的代码或逻辑进行测试,尽早的暴露问题。
小心得:代码节点务必要单节点试运行。
阶段性的联调:完成一个功能模块后就进行联调
将整个流程拆分成如下 5 个阶段进行联调,每个阶段有各自的目的,如图红色框所示:
下面以第一个阶段为例,具体说下联调到底是联调什么?需要确认大模型的输出项是否合理(别文不对题):
- content: 书评内容的合理性
- keywords: 关键词的合理性
所以在联调时,我会输入一本我比较熟悉的书籍《影响力》,让自己有评判合理性的能力:
- 通过预览快速通读输出参数「content」的内容,如下左图
- 点击展开输出参数「keywords」的内容进行核对,如下右图
❤️ 四勾项目实操心法 ❤️
应该阶段性调试运行,及时给予自己正反馈,才能越干越起劲:是一种享受,而不是折磨。
3、勤问 AI 🙋♂️
代码节点报错的 case 特别适合问 AI,下面以「计算时长」代码块为例:
下左图:单节点试运行后,代码报错(大家先不要慌)
下右图:截图并框选报错信息,打开豆包,丢给它,让豆包帮忙修改代码
下左图:豆包修改完成之后,将豆包的代码粘贴到扣子里的节点,重新试运行
下右图:输出正常,试运行成功(有一次让豆包连续修改 3 次才通过,大家一定要有耐心)。
❤️ 四勾项目实操心法 ❤️
AI 是最好的老师,我们要从开始努力尝试用 AI,逐渐养成善用 AI;AI 不仅专业而且还能实时给与反馈。
4、不要过于追求高级工具 ⚡️
应该:先尝试免费或自己过去使用熟练的工具,比如豆包或 DeepSeek(毕竟使用门槛低)
不用:听别人说 Claude 是编程最厉害的工具,就开始折腾 Claude 充值等,半天又过去了
- 如果说豆包尝试多次依旧解决不了,那就需要找更高级的工具了
- 自己明明已经在使用 Claude,也没必要去尝试豆包了
❤️ 四勾项目实操心法 ❤️
不要过于追求高级的 AI 工具,先从自己容易上手的工具开始尝试,快速解决问题才是关键。
5、遇到问题如何自己解决 🎯
1)首先检查高频原因:入参或出参设置的是否正确
tips:用截图软件截取手册上的参数配置图,然后置顶在扣子的配置页面,一项一项的核对,主要核对:
- 变量名是否正确,下图左边红框
- 变量值的类型是否正确,下图中间红框
- 变量值的引用是否正确,下图右边红框:因为有些引用比较长,手册上的图片是无法展示完整的,我们只能尽可能的去核对
2)其次根据错误提示找问题
比如下图,错误提示:没有余额了,请充值
复制错误信息的链接,充值后再次运行就成功了。
❤️ 四勾项目实操心法 ❤️
不要害怕问题,遇到问题后首要要冷静,其次根据报错信息尽可能去尝试解决问题,需要逐渐学会解决问题的能力(咱们海航有教练指导,但以后要搭建自己的工作流,就没有人来专门来答疑,还是得靠自己)。
三、通过复盘知其所以然
全流程运行成功后,我依旧还有如下疑惑:
- 最开始大模型输出的 keyword 出现在视频哪里?
- 分割文案的作用是什么?
- 背景音中的翻书声和 BGM 是怎么来的?
- 为什么还要判断书籍名称的字数?
可以通过事后的复盘来解答我们自己的疑问。
1、视频成果物中核心元素的拆解
分为「开场」和「正文」两部分来逐一拆解
1)开场
- 元素
- 底部模糊的书籍封面
- 中间书籍封面 + 翻书转场动画
- 拆解
- 书籍封面(底部的模糊封面和翻书的封面是同一张图片)
- 翻书转场动画
-
书籍封面模糊特效
-
元素
- 朗读:今天要分享的是经济学的思维方式
- 背景音:前面是翻书声,后面是 BGM
- 拆解
- 朗读的部分是由写死的文案「今天要分享的是」+ 书名
- 背景音:翻书声和 BGM 都是固定的音频文件
2)正文
- 右上角标题文案:书名 + 作者
- 背景图:通过大模型生成提示词 》调用文生图插件
- 书名字幕:就是书名,一直在中间不动
- 书评字幕:不断的变动
- 星火特效:从右下角往左上角飘动的星星
那么核心的问题是:每屏显示的不同的书评字幕是怎么来的?
举例说明,书籍《经济学的思维方式》的前几屏的书评依次是:
- P1:读《经济学的思维方式》
- P2:最深刻的感受是它打破了对经济学的刻板印象
- P3:这不是一堆公式或数据
- P4:而是一套帮人看清生活本质的思考工具
第一步:大模型生成「原始长篇书评」,如下(是整个书评的前半部分)
《经济学的思维方式》不是一本堆满公式的教科书,更像一位蹲在巷口聊家常的智者,用最朴素的语言拆穿生活里那些被忽略的经济逻辑。书里反复在说,经济学的本质是‘思维工具’,就像作者说的:‘经济学不提供答案,只教你如何像经济学家一样思考。’
第二步:用文本处理组件,用「。」分割成多个小段书评,如下 2 段
《经济学的思维方式》不是一本堆满公式的教科书,更像一位蹲在巷口聊家常的智者,用最朴素的语言拆穿生活里那些被忽略的经济逻辑
上面是第一段,下面是第二段
书里反复在说,经济学的本质是‘思维工具’,就像作者说的:‘经济学不提供答案,只教你如何像经济学家一样思考
第三步:用代码将书评小段分割成「每屏的书评字幕」,就将第一段分段分割成了我们视频中看到的 P1-P4
- 元素
- 朗读:书评字幕的朗读,并且朗读和书评字幕时间线需要能对齐
- 背景音:BGM
- 拆解
- 朗读的部分以「小段书评」为单位,每个小段书评对应一个 MP3 文件
- 背景音:和开场的 BGM 是同一个音频文件
那么问题是:音频文件是以「小段书评」为单位,而「书评字幕」是小段书评分割而来的,那么如何让字幕和音频对齐呢?
真是一个插件就可以解决的事情,我们只需要知道哪个插件能搞定对齐即可,不用去深究对齐的原理。
2、节点和核心元素的关联
1)作者和书籍封面
-
书籍封面(底部的模糊封面和翻书的封面是同一张图片):来自于上图中的标记 1
-
朗读的部分是由写死的文案「今天要分享的是」+ 书名:来自于上图中的标记 5
-
右上角标题文案:书名 + 作者:来自于上图中的标记 3
- 背景图:通过大模型生成提示词 》调用文生图插件:来自于上图中的标记 7
- 书名字幕:就是书名,一直在中间不动:来自于「开始」节点的输入参数「book_name」
2)正文书评字幕
-
书评字幕:来自于上图中的标记 2
-
朗读的部分以「小段书评」为单位,每个小段书评对应一个 MP3 文件:来自于上图中的标记 3,并且通过标记 4 对齐书评的音频和字母
最后,调用插件将正文书评写入剪映草稿中,如下图:
3)组合结构
接下来最核心的节点「组合结构」,因为是代码块,我们初学者只需要了解它大概的作用即可,不用深究。
开场翻书动画和正文背景图
上面 2 者被合成一条时间线,通过调用插件写入剪映草稿中。
开场模糊特效和正文星火特效
上左图:开场的模糊特效
上右图:星火特效视觉冲击相对小一些,最开始我也没注意到,后面还是仔细看完剪映时间线才明白,大家可以留意正文中从左下角往右上角飘动的星星,就是星火特效。
开场的翻书声和正文的 BGM 背景音
- BGM 背景音
上面 2 者被合成一条时间线,通过调用插件写入剪映草稿中。
四、想要在项目实操中快速跑通,咱们需要坚守什么
在我们的项目实操中常见的几种拦路虎,阻碍我们最终的上岸。
1、没时间 ⌛️
我们毕竟大都有自己的主业,利用自己工作之外的业余时间在项目实操,时间上面确实需要合理的规划。
首先,管理好自己的时间预期,每个项目计划 2-3 个小时左右,不是仅仅半个小时就能搞定的。
其次,规划好自己的时间,工作之外无非就是:工作日的早晚,和周末,比如每周一规划好当周的计划:
| 项目 | 开始时间 | 时长 |
|---|---|---|
| 火柴人视频 Coze 自动生成 | 周一晚上 10 点 | 1 小时 |
| 火柴人视频 Coze 自动生成 | 周二晚上 9 点 | 2 小时 |
| 自动化生成小红书爆款图文笔记 | 周四晚上 9 点 | 1 小时 |
| 自动化生成小红书爆款图文笔记 | 周五晚上 10 点 | 2 小时 |
| AI 视频自动化工作流 | 周六下午 2 点 | 4 小时 |
tips:记得,设置好闹钟 ⏰️
2、太难学不会 😧
尝试搭建一两个节点后,觉得:太难了,自己不会。
首先,我们得相信的教练的能力,项目实操本来就是面向小白用户,咱们教练内容的设计一定是普通的人都可以操作的,你需要做的是:
- 相信教练,你一定能学得会
- 要有耐心,先让自己保证投入的时间足够,再说学不学得会的问题
3、被问题卡住 🏗️
遇到问题,自己潜潜地尝试几次后,就默默无声的放弃了。
咱们是有教练热心指导的,有专门的项目实操群,那可能咱又有问题:
- 我担心问的问题太简单被人笑话 》管他呢,反正是线上,也没人认识你
- 我问了啊,但是没人回我啊 》没人回就 at 教练、at 领队,或者私聊志愿者,大家都是非常乐意帮助的,用上你追男女朋友死缠乱打的本领出来
4、难坚持 🏃➡️🏃➡️🏃➡️
及时且持续的正反馈,就能让我们顺利的坚持下去,那么正反馈怎么来呢?
- 项目实操好事:上榜,下左图
- 教练点评优秀日志,下右图
五、感谢「利 TA」的大家庭
特别感谢教练:拔刀刘、二进制刀仔、骄阳
- 感谢教练们的无私奉献,凌晨一两点还在群里答疑,着实感人 🙏🙏🙏
- 感谢拔刀刘教练对智能体 IP 的路径规划指导,让我更加明确了自己接下来要走的路 🌹🌹🌹
特别感谢:领队海伦和志愿者凡
- 感谢海伦领队对复盘的指导,同时也给与我更好的展示机会 🙏🙏🙏
- 感谢凡每天的提醒,深刻记得一天晚上 11 点多还来提醒,那天差点忘记打卡
最后,感谢我们,是给予我们聚在一起的机会,给予我们年入百万的希望
继续加油 💪🏻 💪🏻 💪🏻
干就完了 👍👍👍