闫俊杰,1980年出生于中国河南省的一个小县城。他从小在较落后的地区长大,很多东西需要靠自己领悟,这种成长经历使他形成了独立解决问题的能力。闫俊杰的外公曾想写一本书,但因不会打字和书写而放弃,这激发了他对通用人工智能的信仰,认为AI可以帮助普通人解决实际问题。他是一位在人工智能领域具有深厚背景的创业者和科学家,教育经历如下:
本科:东南大学数学专业
硕士:重庆邮电大学信息与通信工程专业
博士:中科院自动化所
博士后:清华大学计算机系
毕业后,闫俊杰在商汤科技任职,最终做到副总裁、研究院副院长及智慧城市事业群CTO,负责深度学习工具链和底层算法的搭建以及通用智能技术的发展。2021年12月,他离开商汤创立了MiniMax,致力于通用人工智能(AGI)的研发和应用。在创立MiniMax后,他带领团队推出了多款AI产品,包括国内首个MoE大语言模型abab 6和万亿参数的abab 6.5模型,多个AI应用:星野、海螺AI等,显著提升了用户体验和渗透率。此外,MiniMax还与高济健康合作打造了智能患者管理系统“高济神农”,该系统基于MiniMax的大语言模型,构建了包含数亿条医学专家指南和共识的肿瘤知识库。MiniMax在短短两年内完成了A+轮融资,估值突破25亿美元,成为AI领域的独角兽企业。
闫俊杰对AI的观点如下:
- AGI的愿景
闫俊杰认为,AGI(通用人工智能)应该成为日常生活的一部分,为普通人服务,而不是高高在上的大杀器。他强调AGI的价值在于服务普通人,通过产品化的方式让更多人使用AI技术。 - AI发展阶段
闫俊杰将AI的发展分为三个阶段:
第一阶段(2021年之前):AI主要作为业务和产品中的某个环节存在。
当前阶段:AI具备通用能力,可以独立驱动一些产品。
未来阶段:AI能力稳定超过普通个体,用户在线时长大于传统产品。 - 技术路线
闫俊杰在技术路线选择上非常激进,主要包括以下几个方面:
MoE模型:选择混合-多专家模型(MoE)以应对高推理成本和延时问题。他认为这是通向更好模型的必要条件。
多模态融合:整合文字、声音、图像和视频等多模态能力,以提升用户体验和渗透率。
Scaling Laws:通过小规模实验预测大规模实验结果,优化数据质量和算力分配。 - 降低错误率
闫俊杰认为,降低大模型的错误率是当前的核心问题。他指出,GPT-4这一代的模型在各类评测和很多真实场景中大概有20-30%的错误率。未来的拐点是模型错误率再降低一个数量级,应用规模再大两个数量级。 - 用户共创
闫俊杰强调与用户共创技术,认为用户的创造力和反馈是技术进步的重要驱动力。他认为AI不仅体现在一个模型上,还可以体现在用户的创造上,通过用户反馈不断优化模型和产品。 - 技术与产品结合
闫俊杰主张技术和产品并重,认为创业公司要做出用户量巨大的to C产品。他强调技术进步需要依赖用户的反馈,并通过产品化的方式实现技术的广泛应用。 - 中国AGI的未来
闫俊杰对中国在AGI领域的未来充满信心,尽管短期内存在算力和资源的差距,但通过用户驱动和持续迭代有望缩小差距。他预计未来全球将有五家AGI公司,其中至少有两家中国公司。 - 组织管理
闫俊杰在组织管理方面强调以下几点:
团队协作:关注团队成员在重要项目中的合作能力。
科学方法:采用数据科学的方法快速识别有效的东西。
组织创新:通过组织创新持续提升团队能力。
人才选择:选择能提升团队整体输出的人才。
高效决策:在决策时果断高效,专注于技术进步的效率。
轻量化组织:保持组织结构简单,注重研发效率。 - 技术进步与商业化
闫俊杰认为技术进步是核心竞争力,商业化是实现技术价值的途径。MiniMax通过自研大模型和开发多款应用,形成技术与产品的正向循环,推动技术普惠大众。 - 未来展望
闫俊杰对未来五年、十年中国在AGI领域的前景充满信心。他认为,通过技术创新和用户参与,中国有望在全球AGI格局中占据重要位置。他强调降低模型错误率和多模态融合是未来发展的关键。
闫俊杰认为,AGI(通用人工智能)是未来发展的唯一道路,尽管这条道路非常艰难。他认为,AI应用的商业化不是当前最重要的关注点,而是将技术提高到广泛可用的程度。此外,他指出,AI企业需要在降价的同时保持更好的效果,以找到好的商业模式。