Gemini 3 Pro加持！这款开源神器 Clipsketch AI，帮你自动抓帧、画图、写爆文！ - 文章 - 开发者社区

大家都能深刻体会到，在自媒体极其内卷的今天，「视频转图文」是一个巨大的流量入口。

但是，简单的视频截图已经无法满足观众挑剔的审美了。大家喜欢有风格、有调性、有信息增量 的东西。

最近，我在 GitHub 搜罗到了一个专为视频创作者、二创博主打造的开源项目：clipsketch-ai 。

picture.image

它的核心功能非常炸裂：

给定一条 B 站或🍠的视频链接，它能自动提取关键帧，利用 AI 将其重绘为极具质感的手绘故事板，并自动生成适配社交平台的爆款文案。

AI 模型是基于当下最火热的 Gemini 3 Pro 大语言模型和 Nano Banana Pro 生图模型进行实现。

直接把「视频理解 + AI 绘画 + AI 写作」三个大模型能力串成了一条自动化的流水线。

在介绍功能之前，我们先聊聊创作者的痛点。

Clipsketch AI 就是为了解决这些问题而生的。它利用 Google 最新的 Gemini 3 Pro 系列模型，把这些步骤全部自动化了。

1、强大的视频解析，关键帧提取

2、引入帧标记功能

picture.image

3、提供AI艺术创作室

picture.image

4、全平台适配

作为一个开源项目，想要尝鲜的朋友需要一点点动手能力。

你需要有 Nodejs 前端环境和一个 Gemini API-Key。

安装部署步骤如下：

① 克隆项目


 
 
 
 
   
git clone https://github.com/RanFeng/clipsketch-ai.git  
cd clipsketch-ai

② 安装依赖


 
 
 
 
   
npm install

③ 配置环境变量

在根目录创建 .env.local 文件并填入您的 API Key：


 
 
 
 
   
GEMINI\_API\_KEY=your\_api\_key\_here

④ 启动服务


 
 
 
 
   
npm run dev

打开浏览器访问 http://localhost:3000 即可开始使用。

clipsketch-ai 它没有去卷大模型的参数，而是敏锐地捕捉到了自媒体创作者的具体痛点，把 Video-to-Image 和 Image-to-Text 的技术完美缝合在了一起。

解决的是：从「看视频」到「把视频结构化、视觉化、内容化」。

它代表了 AI 工具的一个主流趋势：从“单一功能”走向“工作流闭环”。未来的 AI 工具，一定不是让你做选择题，而是直接把成品端到你面前。

如果你是内容创作者，或者你是想学习如何利用 Gemini 多模态能力的开发者，这个项目绝对值得你 Star ⭐️ 一下。

GitHub:

https://github.com/RanFeng/clipsketch-ai

picture.image

如果本文对您有帮助，也请帮忙点个赞👍 + 在看哈！❤️

在看你就赞赞我！

picture.image