你是否已经习惯了这样的 AI 工作模式:
- 在浏览器里打开一个 DeepSeek对话网站。
- 输入你的问题或指令。
- 从网页上复制 AI 生成的代码、文本或命令。
- 切换到你的编辑器、文档或终端里,然后粘贴。
- 如果代码有问题或文本不满意,再切回浏览器,重复这个循环。
不停切换、复制、粘贴,感觉自己成了给AI 的搬运工,不仅繁琐,而且效率低下。
AI 能自动操作电脑文件和项目文件吗?
有人可能会说用 Cursor,但是毕竟一个月 20 美金的费用也不算低。那么,有没有其他免费的方案呢?
有! Gemini CLI (命令行工具) ,谷歌开源的命令行 Agent 产品!
https://github.com/google-gemini/gemini-cli
CLI可以直接在你电脑上听从指令、执行任务的 AI 助理。而且配置了 google 的gemini-2.5-pro,每分钟有最多进行 60 次模型请求,每天最多进行 1,000 次模型请求额度;
它的核心优势在于:
-
无缝集成:它就住在你的终端里,这是开发者、分析师和高级用户最常待的地方。无需切换窗口,你的想法和指令可以被立即执行。
-
文件系统访问:这是它的“超能力”。它可以读取、创建、修改你电脑上的文件和目录。这意味着它可以帮你整理文档、重构代码、生成报告,而不仅仅是提供文本建议。
-
自动化工作流:它可以将多个步骤串联起来。你可以让它“读取这份报告,总结要点,然后把总结保存成一个新的 Markdown 文件”,一气呵成。
-
安全可控:它在执行任何危险操作(如修改或创建文件)前,都会征求你的许可,确保一切尽在你的掌控之中。
虽然“命令行”听起来可能有点技术门槛,但它的安装和使用远比你想象的要简单。接下来,让我们一起解锁这个强大的生产力工具。
前提条件: 确保您已安装 Node.js 版本 20 或更高版本。
推荐使用以下方式安装:
npm install -g @google/gemini-cligemini
选择一个颜色主题
接下来,难点来了,当系统提示时,使用您的个人 Google 账户登录。很多人都会卡在 Google 账号登录界面。
就像下面这张图的样子:
OK,解决方法很简单,你只需要打开你 VPN的“增强模式”或“TUN模式”即可。这样你的 VPN 就能代理浏览器和电脑内的软件了。
OK,接下来退出重新认证,先按 ESC 按钮退出当前认证状态。
再按两次 Ctrl+C,退出CLI。
重新输入 gemini 指令;
然后,输入 /auth,再次进入认证状态。
然后选择 Google 账户认证登录。
ok,已经能正常使用 GeminiCLI 了。
简单测试一下,让 CLI写一个贪吃蛇游戏。
CLI每一次都会询问是否允许创建文件、打开文件。
我全部无脑信任,让 CLI 自动创建文件夹、文件、自动打开html,很快,浏览器内打开了一个可以玩的贪吃蛇游戏。
查看一下本地文件夹列表,在安装 CLI 的同级文件夹下,已经自动创建了 snake_game 文件夹,同时还有三个文件,分别是 .html,.js,.css。
让我们来看几个更接地气的玩法,看看这个免费的“AI助理”怎么在我们的日常工作和生活中“大显神通”。
【新媒体小编 & 市场打工人】一键“洗稿”,还带热门标签
最近在死磕 AndrewNG 的 MachineLearningYearning,我想把学习成果做个总结,发到小红书上引流。
在终端里敲一行字:
@/Users/mulele/Library/Mobile Documents/com~apple~CloudDocs/Documents/5-学习资料/3-机器学习/Ng\_MachineLearningYearning.pdf 把这份文档第一章的内容,改成 5 条适合发小红书的文案,关键技术细节需要引用原文图片,文风符合小红书平台特性,文案需要文字+配图,完成后直接保存成 .docs格式的 word 文档。
不过,CLI 老实跟我说,当前命令行工具在PDF读取和文件生成上是有一些缺陷的。
在开始之前,我需要向您说明两个小小的“技术限制”: 1. 我无法直接从 PDF 中提取图片:我的工具可以读取 PDF 的文本内容,但无法像人一样把里面的图片单独抠出来。 2. 我无法直接生成带格式的 `.docx` 文件:我的工具创建的是纯文本文件。虽然我可以生成 Word 文档的文本内容,但无法嵌入图片并设置好格式。
当然,它也提供了其他的解决方案。
不过,别担心!我们可以换个方式完美达成目标: 我将为您完成核心的创意工作: 1. 阅读 Ng\_MachineLearningYearning.pdf 第一章的文本内容。 2. 为您创作 5 篇完全符合小红书风格的文案。 3. 在文案中,我会用明确的文字标记(如 `[请在此处插入第一章的图1:模型流程图]`),告诉您应该在这里配上原文的哪张图。 4. 最后,我会将这些精心撰写的文案保存为一个 Markdown (`.md`) 文件。您只需要用截图工具把原文的图片截取出来,然后替换掉我的文字标记,就可以直接发布了!
还有一个技术细节,为了控制 CLI 对本地文件的操控权限,CLI 只能对安装 ta 的目录文件下文件夹生效。
我们需要把 ta 要操作的文件放到指令目录下。
完成文件存放后,重新告知 CLI,很快,剩下的工作都是自动化完成的了!
ok,这个文件已经自动完成了。
如果要发小红书,肯定还是不够的。接下来,创建 svg 文件。也是全自动完成。
其他更多的功能,可以通过/查看GeminiCLI 功能列表,逐个尝试。
好了,关于 CLI,还有什么其他想了解的呢?欢迎评论区留言。
