我们应该如何拥抱AI

大模型向量数据库机器学习

春节临近,这是年前的最后一篇文章。在最近两年里,我相信不少同学对于AI的迅猛发展有着或多或少的焦虑感,担心自己的工作某一天会不会被AI取代,我也一样,但与其被动焦虑,我们更应该做的是主动学习和应用,于是我今年和团队一起花了不少精力去深入学习和实践了AI,也经历了不少挑战和收获。借此机会,也和大家分享下我的心路历程,希望能为那些正在或准备拥抱AI的朋友提供一些思路和启发。

转变心态

首先,我们的心态一定要转变,AI真的不再是高高在上的科技领域的事情,而是真实的已经开始渗透到各行各业,例如AI客服、AI面试机器人、AI编程等等,它已经正在、或在不远的将来重塑我们的工作模式,所以我们不能还是保持着之前的惯性模式去工作,而是要积极的去了解、学习和应用AI。关于对未来的畅想,可以详读我之前的一篇文章:《AGI 前夜:Exa CEO 对 o3 的深度剖析与未来畅想》

要了解AI,最基础的方法就是看网上的各种资讯。但是现在AI资讯太多了,信息质量参差不齐,很多都是噪音(垃圾)信息,无目的的随意浏览效率很低。于是,我们挑选了一批优质的渠道,通过一些手段每天自动收集、整理出高质量的AI资讯形成AI日报,这样我们就迈出了第一步,快速了解和掌握AI相关进展( 整理的过程也是用AI来自动化完成,因为有了内容后还需要去结构化提取、过滤无关内容、总结内容摘要、分类、去重等工作)。

picture.image

积极使用

转变心态,并主动去了解AI的最新进展后,我们需要开始在工作、生活中积极使用各类AI工具来帮我们提效,以便对AI的能力有一个具象的认知。比如AI辅助编程,我相信程序员朋友们用过之后再也不想失去它了,具体也可以看看我之前的文章:《AI 编程助手的技术与交互变迁:从 GitHub Copilot 到 Cursor,再到 Windsurf》

除了编程,AI在数据分析方面也有很大帮助。过去,我们需要通过各种繁杂的操作才能整理出想要的数据并进行分析,现在只需用自然语言描述需求,AI就能帮我们搞定。比如,你只要输入“帮我分析一下上季度的营业数据”,AI就能自动生成报表并提供有价值的洞察。

AI家教现在也是一个热门场景。现在有很多AI英语老师和AI数学老师,比如豆包中的AI辅导工具,已经成为不少家长手机里的必备应用。它们不仅可以根据孩子的学习进度提供个性化的辅导,还能实时解答疑问,为家长减负的同时也能提升学习效果。

还有,AI生图和AI生成视频对设计师和需要多媒体素材的朋友来说简直是福音。通过这些工具,我们可以快速生成创意草图,甚至制作出高质量的图片和视频内容,节省了大量的时间和精力。例如我上周的文章中,《优化电商视觉!用AI轻松替换商品背景,提升销量不是梦》就是通过AI帮助做电商的朋友快速实现商品背景图的替换。

类似的还有许多其他的工具及应用场景,我们结合生活和工作中的场景持续去发现和使用,慢慢的就能体会到AI给我们带来的改变。

深度赋能

当我们在日常工作和生活中使用各种AI工具,切身感受到它们带来的好处,对AI的能力有了更直观的认识后,就会开始思考团队和业务中一些常规方法难以解决的问题,是否可以通过设计AI工作流来应对,甚至利用AI快速拓展业务场景,实现真正的赋能。这时,不再只是使用现成的AI软件或工具,而是需要深入理解业务,抽象出一套适合的AI工作流,相当于开发一套专属于我们业务场景的AI工具,从使用者转变为开发者。

这一阶段需要更深入地了解AI的能力,比如如何设计一个多AI角色(Agent)协同完成复杂任务的系统,如何在任务执行过程中保证AI的稳定性,抑制“幻觉”问题。

今年,我和团队一起完成了一系列AI项目,有的是为了解决研发过程中的各类效率问题,有的是为业务的发展赋能。包括但不仅限于:

  • AI CodeReview: 这不是简单的将代码片段交给AI模型,让它给出建议,而是需要设计一套完整的工作流,与现有的研发流程深度集成,并采用各种策略让AI提出更多有价值的建议,减少提出错误的建议。这其中涉及许多细节和策略的调优。现在我们的AI CodeReview的采纳率在55%到60%之间,仍在持续优化中。
  • AI故障定位: 以前业务出现故障时,我们需要查代码、看日志、调试,花费大量时间。现在,通过设计AI排障工作流,当故障发生时,AI能快速定位故障范围,自动从相关信息源拉取分析数据,推理出排查步骤,并自动执行排障步骤中的每一步,直到得出结论。整个流程需要高稳定性和可观测性。我们的AI排障系统上线并经过一系列调优后,准确率达到了92%以上,一个之前可能需要一个小时的故障定位现在只需要几分钟。其中部分用到的思路可以看看之前的文章:《如何用好o1:用深度推理能力搞定复杂任务》
  • AI需求文档转测试用例: 这是一个很好的为测试团队赋能的场景。但如何生成高准确率的用例集合( 尤其是当需求文档质量不佳时),甚至补充出需求可能影响的其他业务模块的用例,是一件非常有挑战性的工作。这涉及通过AI快速生成大量准确的业务知识库,再设计一套AI工作流,将需求进行模块提取、需求润色(结合业务知识库纠正不严谨的表达)、依赖分析和补充(结合业务知识库分析这个需求可能影响其它哪些模块)、测试点提取、测试用例生成。我们设计了一个多AI角色(Agent)系统,每个步骤都需要优化稳定性,最终实现快速生成对测试团队有价值的用例集合。
  • AI辅助快速开发小游戏: 这是一个典型的为业务赋能的场景。通过趣味性强的小游戏模式呈现业务中的运营场景,能够提高用户活跃和留存。传统游戏开发需要组建团队,周期长,难以满足运营时效。而AI能力提升后,一个普通的业务开发团队也能快速上手开发小游戏。我们研究了一套结合AI的小游戏开发工作流,作为业务运营的有力工具。今年年底,我们用这套工作流快速开发了一款结合业务形态的小游戏,流程还在实践中持续磨合以实现效率的极致提升。具体思路可以看我之前的文章:《从创意到上线:用ChatGPT + Winsurf 快速开发HTML5小游戏的实战指南》

随着我们不断探索,对AI能力的边界理解也越来越深。在面对更复杂的应用场景时,我们处理起来也越来越得心应手。

回归本质:知其然,也要知其所以然

作为程序员,追求本质一直是我们践行的准则。对待AI也应该如此。为什么现在的各种ChatGPT类大模型这么智能?为什么给大模型的提问还有长度限制?为什么不同的提问组织方式AI回复的效果差距很大?这些问题都值得我们深入的研究和思考,透过现象看本质,进行更深刻的理解。

今年在学习AI的过程中,我利用业余时间翻译并开源了一本英文电子书 《Build a Large Language Model (From Scratch)》:https://github.com/skindhu/Build-A-Large-Language-Model-CN,这本书通过从零开始编码的方式,带我们了解如何准备和清理训练数据、分词、词嵌入、实现Transformer架构、模型微调以及指令遵循等内容。对理解大模型的原理和运作机制非常有帮助。

picture.image

通过深入学习这些技术细节,我们不再只是依赖网上那些海量但杂乱的信息,也不再对大模型偶尔出现的不稳定表现感到困惑。了解多了背后的原理后,我们可以更好地利用AI,同时也能更有效地解决使用过程中遇到的问题。

继续前行

拥抱AI的旅程并没有在这里结束,反而才刚刚开始。作为一个已经工作了将近13年、并且早已跨过互联网35岁危机的中年人,我深知不能因为年龄增长、生活琐事增多而失去对新事物的好奇心。我们要始终保持对新技术、新工具的好奇和开放,快速适应技术的变化和市场的需求,这样才能持续保持竞争力。

最近DeepSeek-V3火出圈,它达到了堪比GPT-4o和Claud 3.5-Sonnet等国外一线模型的效果,训练成本却降低了十几倍( 2048张H800 GPU集群上花了不到2个月的时间)。看了前一段时间暗涌对DeepSeek创始人梁文峰的专访,个人比较认可,其中一些论点分享给大家:

暗涌: 互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。
梁文锋: 我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

暗涌: 但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。
梁文锋: 创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

暗涌: 但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?
梁文锋: 我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

暗涌: 很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?
梁文锋: V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

暗涌: 所以你对这件事也是乐观的?
梁文锋: 我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论