还在熬夜写PPT讲稿?两种姿势让AI帮你自动搞定初稿!

关注我~第一时间学习如何更好地使用AI。

重要的不是我们是否会被AI替代,

而是我们要比被替代的人更懂AI。

痛点

之前我们已经探索过利用Coze的工作流自动生成特定主题PPT的方案:PPT自由!Coze工作流 X iSlide插件-小白也能看懂的节点参数配置原理详解

假设我们完全使用AI来创作PPT,那我们可能需要先自己熟悉一下PPT的内容,梳理下逻辑,才能给别人讲解。

更一般的情况下,当PPT的创作者与讲述者分离的时候(比如牛马跟领导),由于讲述者必然不会像创作者那样对PPT的内容、逻辑了然于心,加上PPT材料的内容一般会以简洁、清爽的方式呈现,只保留核心的重点,而由讲述者在分享过程中去补充细节,因此,讲述者可能非常需要一个跟PPT配套的讲稿来提升分享的质量

由于写讲稿又是一个工作量巨大的事,既然PPT都能自动出了,那PPT讲稿能自动出吗?

答案当然是没问题~

姿势一:直接利用多模态模型完成讲稿

鉴于一些具有视觉功能的多模态模型具有优秀的读图能力,如果你的PPT比较简单,页数不多,那么我建议不要搞复杂,直接使用多模态模型对PPT截图进行内容识别、分析,并根据提取的信息来组织撰写讲稿。

这里我用通过Coze空间生成的一份主题为奢侈品的PPT中的一页来展示下效果:

实现这个方案,只需要用到Cherry Studio,一个多模态模型,以及一段Prompt即可,简单直接。

工具说明

首先,打开Cherry Studio,点击设置进入模型服务,在你常用的模型服务提供商中找到有绿色小眼睛标记的模型,确保其能使用。视频中我使用的是通过OpenRouter调用的Qwen2.5 VL 72B Instruct,该模型目前可免费使用。

picture.image

接着,你需要编写一个符合你需求的Prompt,参考如下:

  
## 任务  
根据用户提供的PPT截图,生成对应的讲稿  
  
## 工作流  
1.你应当首先通篇阅读PPT截图中的全部内容,充分理解内容之间的逻辑关系;  
2.根据你理解的内容的逻辑框架,撰写对应的讲稿。  
  
## 要求  
- 直接给出讲稿,不要输出思考过程。  
- 行文风格自然不生硬  
- 一页PPT讲稿的字数控制在1000字以内

另外,你还可以根据模型的输出情况,将分页的讲稿合并,再让一个擅长文稿撰写的模型来进行整合与润色。

就这么简单。

姿势二:Vibe Coding编写PPT讲稿自动生成应用

如果你的PPT页数非常多,内容也很复杂,又或者你根本就懒得去手动截图,那么你可以考虑让AI 帮忙编写一个python脚本,甚至应用程序。

对于简单脚本来说,可以直接在Cherry Studio中向擅长编程的模型(如Claud-Sonnet系列、Qwen3-Coder等)提出你的需求,然后直接获得完整的脚本代码。

如果需求比较复杂,那么建议使用Cursor、Trae等专用AI编程工具来进行有架构的应用开发。

比如我们这里的PPT讲稿自动生成这个需求,从工作流来看,涉及了PPT文件信息的读取、大模型处理PPT信息、大模型生成讲稿等多个环节,因此我选择了使用Cursor来进行开发。

Step1:编写应用开发文档

对于vibe coding来说,其实重点还是在Prompt的编写上,只不过这个Promp的表现形式为产品需求文档(Product Requirements Document, PRD)、技术设计文档(Technical Design Document, TDD)、UI/UX设计文档等等。

只有我们能将内心的需求,以比较标准的应用开发文档的形式呈现出来,AI才更容易在我们期望的方向上进行开发。这时候,我们和AI的关系,就等同于产品经理和开发人员的关系,只有产品经理讲清楚了要求,开发人员才能开发出正确的功能。

对于不熟悉软件开发的朋友来说,首先强烈推荐去看一些相关的资料,比如《软件方法》《大话软件工程——需求分析与软件设计》《软件需求最佳实践》等等,认知上对软件开发形成一个大概的概念。

然后从着手实践的角度,可以先跟AI 就产品需求、技术设计、UI设计等进行充分的沟通,让AI协助你写出符合你需要的开发文档,看得多了,也就越来越有感觉。

刚好,Cherry Studio内置有一个产品经理的Prompt,就非常适合来干这个活。

picture.image

回到我们的PPT讲稿自动生成应用。我首先对这个应用构思一些初步的想法,比如基本的功能、技术方案要求等,简单写了一些细节,然后作为Prompt的参考内容提供给我们的“产品经理”。

  
帮我编写一个标准的“PPT讲稿自动生成应用”的产品需求文档,细节可参考以下内容:  
{## 问题背景与目标  
- 我们需要开发一个简单的应用,实现利用大语言模型的文本理解与生成能力,自动根据用户提交的PPT,生成配套的讲稿。  
  
  
## 基本功能要求  
- 用户只需要上传PPT,待应用的工作完成之后可下载txt格式的讲稿。  
- 输出的讲稿应当写明与每页PPT的对应关系。  
- web应用界面风格应该美观、简约。  
  
## 技术方案  
- 程序语言为Python  
- 使用poetry进行项目环境和依赖管理(pyproject.toml模板已建好,可以直接修改)  
- 大模型调用方面应使用LangChain,确保能通过OpenRouter来调用需要的大模型API  
- 默认模型设置为:qwen/qwen2.5-vl-72b-instruct:free  
- 使用streamlit框架,构建成一个web应用。  
  
## 应用工作流结构  
1.分页读取每张PPT内容;  
2.大模型理解每页PPT内容的结构和逻辑;  
3.大模型根据读取的信息和理解撰写当页的PPT讲稿;  
4.拼接讲稿内容;  
5.大模型对合并后的讲稿整体进行最终的润色和调整,保证内容在逻辑、风格上的连续、一致性。}

然后就得到了一个比较标准的PRD,再根据自己的需求进行调整。

picture.image

有的朋友可能担心,自己对技术一窍不通,怎么办?

这个只能一方面多看相关的材料,学习基本的知识,一方面多跟AI沟通,打破砂锅问到底。

Step2:代码开发与测试

文档准备好,我们就可以着手让AI进行代码开发了。在Cursor中,我们可以通过@或者将文档拖拽到对话框的方式,明确让模型根据我们的文档进行开发。

picture.image

由于篇幅限制,本篇主要是带大家感受一下Vibe Coding的大致过程,不会详细介绍Cursor的具体操作方法,但基本的思路始终是,出现任何的问题、报错,直接将相关信息提交给Cursor,告诉它存在这个情况,要求解决。

但这里可能会有个问题。受限于你所使用的模型能力强弱,AI可能会在这次bug修改的过程中,把其他没问题的部分页一并进行不必要的修改,反而产生你不希望的效果,甚至新的bug,这时候最好使用git工具,做好代码的版本管理。

由于git的使用也需要一定的知识基础,这里也暂不展开,好在对于简单的脚本而言,这个问题不算太严重。

下面来看看最终成品的效果:

是不是还蛮有意思的~ 后续我会探索一些Vibe Coding方面的实践,再跟大家分享一些有价值的学习心得。

好了,以上就是本期的主要内容。祝大家玩得开心~!

—— END——

往期精华:

1.MCP探索

Excel-MCP应用 | 自动提取图片数据到Excel的极简工作流手把手教程

markitdown-mcp联动Obsidian-mcp | 一个极简知识管理工作流

【15合1神器】不会代码也能做高级图表!这个MCP工具让我工作效率翻了不止三倍!

【效率翻倍】Obsidian自动待办清单实现:MCP联动Prompt保姆级教程(萌新3分钟上手)

萌新靠MCP实现RPA、爬虫自由?playwright-mcp实操案例分享!

高德、彩云MCP全体验:让Cherry Studio化身私人小助理的喂饭版指南!

2.Workflow编排

Coze工作流编排指南6:聊天陪伴类智能体基本工作流详解-快来和玛奇玛小姐姐谈心吧~

Agent | 工作流编排指南5:长文扩写自由 — Coze循环节点用法详解

Agent | 工作流编排指南4:萌新友好的Coze选择器节点原理及配置教程

AI工作流编排手把手指南之三:Coze智能体的工作流

AI工作流编排手把手指南之二:Coze智能体的插件添加与调用

AI工作流编排手把手指南之一:Coze智能体的创建与基本设置

3.Prompt设计

打工人看了流泪的Prompt设计原理,如何用老板思维让AI一次听懂需求?

不会Prompt还敢说自己会用DeepSeek?别怕!10分钟让你成为提示大神!

0
0
0
0
评论
未登录
暂无评论