正式开始前先回答一个问题,可能也是大家都关心的问题:
为什么要用 AI,为什么要用国产 AI ?
-
关于为什么用 AI,咱们前面也聊过了,AI 已经对我们每个人的生活和工作都产生了潜移默化的影响,可以说每个人的身边都已经有 AI 的存在,借用那句被说了很多次的话“取代你的不是 AI,而是会用 AI 的人”,这句话放在我们自己身上,和我们的孩子身上都适用,而且随着 AI 的发展,等我们的孩子长大后,会用 AI 可能会变得更加重要。
-
那为什么要用国产 AI 呢?ChatGPT 不是最强的 AI 吗?是的,ChatGPT/Gemini/Claude 这三个 AI 的能力是目前全球 AI Top3,至少截至目前是。但是他们的 AI 模型和产品,无一能在中国国内正常访问,对于普通用户来讲,也就有了使用门槛,具体是什么门槛,就不用细说了吧。因为这个门槛,也倒逼了国产 AI 模型的发展,一年多时间国产 AI 模型也有了很大的进步,虽然整体还有差距,但满足大家的日常生活和工作需求,问题不大。
-
国产 AI 能像 ChatGPT 一样好用吗,只知道 ChatGPT 懂得很多,聊天很厉害,国产 AI 助手该拿来做什么用,哪个 AI 助手最好用呢?这就是咱们今天跟大家一起探讨的内容了。
国产AI的发展现状
- 新生力量
如十年前的中国 AI 四小龙(旷视、商汤、云从、依图),近两年中国新生 AI 力量形成了新六小龙(零一万物、MimiMax、百川智能、智谱华章、阶跃星辰、月之暗面)。
他们有些是基于开源 Llama 模型训练,有些是自己的模型架构,发展到现在整体模型能力差异在不断缩小,公司发展策略也逐渐清晰,2C or 2B,开源 or 闭源,这些在国内的招投标数据、App 和网站流量数据中都能看出一二了。
- 老牌团队
作为中国曾经的BAT和新兴的宇宙厂Bytedance,百度、阿里、腾讯、字节跳动都推出了自己的 AI 助手。
其中百度的文心模型推出的最早但后继乏力、阿里的 Qwen 开源模型表现最好但 App 运营投入不足、字节跳动的豆包继承了字节跳动 App 工厂的优良基因(流量运营做的真好)。
- 使用量对比
-
豆包遥遥领先:60M,增长17%
-
文小言/Kimi在第二梯队:约13M,但Kimi增长最快(27%)
-
智谱清言/讯飞星火在第三梯队:约6M,其中智谱增长较好(22%)
-
通义规模较小:3.9M,增长平稳(3.5%)
-
腾讯元宝推出最晚,暂未上榜
- 共同点和优势
作为中国团队、面向中国用户,就无一例外要遵守中国的内容审核要求。一方面是涉黄涉恐涉政等常规内容,另一方面是 AI 模型的对齐。
什么是 AI 模型的对齐,咱们简单来说,面对某些敏感问题时,它是代表西方观点、中国的观点,还是中立的观点,这就是对齐的一种,也有些像意识形态层面的问题。
国内的 AI 模型在这方面都经过了严格的对齐和审查,只要是大家能在国内正常使用的 AI 产品,都经历了算法备案,在网络信息安全方面有所保障。
另外,国产 AI 模型还有一个独特的优势:对中文的理解。
ChatGPT 等模型的训练数据,大多来自国外的网络和 Wiki、图书等,会包含英语等多种语言,但不会对中文做特殊的优化处理。而国产 AI 模型的训练数据中,会增加中文的占比,也会对类似古文、古诗等有更好的表现。
七个国产AI助手体验对比
七个国产AI助手简介
通过对国内 AI 团队的了解、App 下载排行的观察和朋友们的推荐,咱们首批选择了七个国产 AI 助手 App,一起来做初步体验对比。
为什么选择 App 而不是网页呢?主要还是考虑到大家的日常使用场景,App 在拍照、语音、交互便捷性等方面都会更好。
| 豆包 | ||||||
| 文小言 | ||||||
| Kimi | ||||||
| 智谱清言 | ||||||
| 讯飞星火 | ||||||
| 通义 | ||||||
| 腾讯元宝 | ||||||
|
|
|
|
|
|
|
(备注:排名不分前后,截图放大查看)
接下来从几个角度来体验对比
- 是否能免费使用
咱们看一个 App 时,首先会关心的还是它是否收费,我免费能不能用?
- 免费使用全部功能:
豆包、Kimi、讯飞星火、通义、腾讯元宝
- 免费但有会员订阅升级:
智谱清言、文小言
- 支持语音输入和上传文件吗?
结果:都支持
结果和预想一致,国产 AI 助手能力范围逐渐趋同,打字聊天、语音输入、与 AI 语音实时聊天、拍摄和选择图像让 AI 识别理解,还可以上传 PDF 等文件让 AI 解析解读。
区别:豆包的默认 AI 对话人物,回答问题默认播放语音和文字回复,且语音声音自然度更高。其他六个 App 默认文字回复,提供语音播放的选项,不过从实时性和语音自然度方面,稍后差距。
- 支持智能体吗?
首先咱们来看,什么是智能体?它的英文原文是 Agent,可以给 AI 模型提供规划、记忆和行动能力等,用一句通俗的解释:
Agent 就像是一个能独立完成任务的"数字助手"- 你告诉它你想要什么结果,它会自己规划步骤、使用工具、克服困难来帮你达成目标,而不需要你事事亲力亲为。
比如,我想问 AI 助手某个城市今天的天气,它会根据今天的日期和城市,自己调用天气查询接口,再把天气返回给我。而这些是 AI 模型本身不具备的能力,因为 AI 模型是预训练模式,它的知识是固化的、有截止日期的。
再比如,我想让我的 AI 助手有特定的身份和知识背景,以特定的回答方式来回答我的问题。
结果:都支持智能体的基础选择。
-
Kimi 不支持新建智能体、可选智能体中也没有声音选项,更多是用途场景的选择。
-
智谱清言支持新建智能体,但不支持切换不同声音。
-
其他 5 个 App 都支持设定身份和语音,其中豆包、文小言、腾讯元宝还支持克隆你自己的声音。
-
智能体的丰富程度方面,豆包是最高的。
一些区别:
-
我询问天气时,文小言会尝试向我申请地理位置权限,获得后准确定位所在地区。
-
豆包和腾讯元宝能直接定位到我所在的城市和地区,不确定是因为和默认地点相同,还是有其他方法获取,比如通信信息等。
-
其他 App 会给出更通用的全国预报等,提示我输入更具体的城市。
-
支持画图(生成图像)吗?
画图可能不是咱们生活中的常用需求,但是对小朋友却是很常见的需求,比如他想看“钢铁侠和蜘蛛侠战斗”、“老虎和狮子打架”、“奥特曼穿着超人的衣服”,这些可能都不是图片搜索可以解决的,但确实 AI 图像生成可以做的很好的,通过图像也可以让孩子对很多概念有更直观的理解。
结果:Kimi 目前不支持,其他 App 都支持。Kimi 目前还更偏文本生成能力,对多模态输出支持比较少。
- AI对这些AI怎么看?
因为初步体验更多是能力范围的对比,为了给大家提供更多参考,我们看看 AI 结合全网实时信息搜索后,如何看这些国产 AI 助手产品,以下是 Perplexity(目前最火的 AI 搜索产品)返回的结果。
结论
从面向 C 端的产品能力和 App 下载使用量来看,豆包是最高的,也是发展和进化最快的,智能体的丰富程度、使用体验都更好,所以普通的生活和办公场景,国内建议使用豆包。
如果是文件、报表的解析方面有特别要求,或对图像生成质量和风格等有偏好,以及对模型回答准确度等有较高要求,除了参考对比评测外,建议大家多使用几个 AI 助手,一段时间内交叉对比,找到最适合自己场景的助手。
因为这些 AI 助手都有“记忆”功能,一方面是记忆你的偏好,一方面是记忆你们对话的历史,所以可以通过更多的使用调教和构建自己的智能体和 AI 助手培养更好的默契。
