AI人物传:智谱AI公司CEO张鹏

大模型算法数据库

张鹏,清华大学计算机系1998级本科、2002级硕士、2018级创新领军工程博士,现任北京智谱华章科技有限公司(简称“智谱AI”)的首席执行官。他于1998年进入清华大学,开始他的学术生涯,并在2002年获得硕士学位后继续攻读博士学位。张鹏在学术和科研领域有着深厚的背景,特别是在文本数据挖掘和语义分析、知识图谱构建和应用取得了显著的成就。张鹏作为主要研究人员参与欧盟第七合作框架跨语言知识抽取、国家863计划“海量知识库建设与构建关键技术及系统”、科技情报分析挖掘平台AMiner(https://aminer.cn)等项目的研发工作,并参与设计和研发了国内首个中英文平衡的跨语言知识图谱系统XLORE(http://xlore.org),在ICML、ISWC等顶级会议上发表10余篇文章。张鹏曾任中国新闻信息标准化分会委员,电子学会标准化工作委员会机器人技术委员会委员。长期致力于将知识图谱研究理论应用于实际需求,在语义大数据分析、智能问答、辅助决策等应用领域拥有丰富的实践经验。

picture.image

张鹏在2014年至2020年间攻读清华大学计算机科学与技术系博士学位,2018年获得了创新领军工程博士学位,于2020年成为清华大学自动化系博士后,随后担任助理研究员。

智谱AI公司成立于2019年6月,由清华大学计算机系知识工程实验室(KEG)孵化而来,其技术成果源自于清华大学的科研团队。公司的创始人团队包括清华大学计算机系教授唐杰、CEO张鹏以及总裁王绍兰,他们均具有深厚的清华背景。

张鹏在AI领域的观点:

  1. 通用大模型的发展
    智谱AI不做中国的ChatGPT,而是致力于通用大模型的发展。他强调,只有一定规模的通用大模型才能实现类人的认知能力涌现。智谱AI提出了全新的GLM(通用语言模型)路径,打破了西方的路径垄断,致力于提高模型的训练效率和理解复杂场景的能力。
  2. 多模态和类人认知能力
    下一代的技术应该是认知智能,强调多模态和多任务能力。他认为,认知智能技术要解决的问题与上一代的感知智能不同,需要更大的数据量、更类人智能的能力以及多任务、多场景的通用化能力。
  3. 技术与商业化并重
    技术能力的提升和商业化并不矛盾,必须坚持两条路线共同发展。他指出,智谱AI在技术方面从底层算法到预训练框架都进行了自主研发,同时在商业化方面,智谱AI总结出了API、云端私有化和本地私有化三种主要商业模式,覆盖了智能汽车、金融、咨询、数字营销等多个领域。
  4. 自主可控的技术创新
    中国必须建立具有独立自主知识产权、安全可控的国产大模型。他认为,大模型是AI技术设施的关键底座,竞争是国家科技战略竞争的一部分。智谱AI在底层算法、预训练框架、团队搭建和国产化硬件适配方面都实现了自主研发,完全自主可控。
  5. 大模型的应用与技术创新
    大模型技术的进步曲线仍然非常陡峭,尚未出现放缓的迹象。他指出,生成式AI不再依赖于具体的任务和场景,而是具有更强的泛化能力和通用性。这种技术进步将催生前所未有的新空间和新市场,推动AI技术的革命性发展。
  6. 开源与生态建设
    智谱AI开源了多个基础大模型,如GLM-130B,提供了一个繁荣的社区和生态,社区的活力能保证产品的迭代和创新力。同时,商业化模型版本则会给有需求的客户提供更好的服务,比如更稳定、安全。两者各有优势,可以互相弥补。
  7. 多样化的商业模式
    中国的AI公司更多采用定制化服务,商业模式不同于美国的AI公司。他认为,这与市场环境和文化背景有关,中国客户更倾向于个性化的定制服务和数据的物理隔离。中国人工智能发展具有两大核心优势:移动互联网普及带来的数据优势以及庞大的网民数量带来的用户优势。这些优势为AI产业提供了丰富的资源和市场潜力。
  8. 技术路线的选择
    智谱AI选择GLM作为技术路线,是为了打破西方的路径垄断。他指出,GLM的训练效率比GPT更高,能够理解更复杂的场景。智谱AI在参数规模达到千亿规模时,GLM对人类输入意图和常识类信息的理解能力出现了意想不到的表现。
  9. 大模型的商业化挑战
    张鹏指出,国产大模型在商业化过程中面临算力困境。为此,智谱AI在国产算力适配方面进行了大量投入,并在GLM系列模型中支持多种国产硬件生态。他强调,解决算力问题是大模型商业化的关键。
  10. 未来展望 :张鹏认为,AGI(通用人工智能)是未来的重要方向,智谱AI致力于推动AGI的发展。他指出,大模型技术的创新依旧在快速推进,未来将解决更多实际问题。智谱AI在商业化和技术创新上均有显著进展,致力于成为国际领先的AI企业。
0
0
0
0
相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论