通义家族大模型总结 | 社区征文 - 文章 - 开发者社区

引言

今年的确是生成式AI狂飙的一年，像chatGPT、Amazon Q、CodeWhisperer、文心一言、通义千问等这些文本生成、文生图或者文生视频的应用迭代的速度都非常快，这些应用也让我们非常兴奋，大家甚至开始在自己的生活和工作中去尝试应用AI工具，像我平时写代码的时候，也会用CodeWhisperer或者通义灵码来辅助编程，我也认为AI可以帮助我们再一次提升人类的生产力，当然，也会有不少人会觉得自己的工作可能要被AI取代了，面临失业的风险。但现实的发展好像并没有想象中的那么美好。

对于企业来说，想在企业内部更快地使用“生成式Ai”，享受AI带来的降本增效的福利，还面临不少问题和挑战，我认为最大的一个挑战就是基础模型本身的问题，目前模型的基础预料都是来自互联网上的公开资料，比如说博客、论坛、出版物以及维基百科的一些数据。对于企业内部的业务，AI其实没有很深入的了解，也就很难在企业内部发挥作用，很多问题其实AI真的不懂，比如说你到底是在做什么工作，你的工作需要一些什么样的技能基础，又需要了解一些什么样的工作流程，甚至可以用到哪些内部的数据等等，它都不了解，自然也就没有办法给到很好的回答。

今年我也体验过很多大模型，接下来就谈谈自己感受！

通义家族

picture.image

今年的云栖大会发布了众多大模型，尤其是通义千问升级到2.0，在多项评测中综合性能超过GTP3.5,相比GTP4各有胜负，据说2.0版本已经迭代至千亿参数级别，在复杂理解、创作、数学以及逻辑能力上升级，接下来我们就体验一下通用大模型。

通义千问

picture.image

语义理解

Prompt：“在炎热的夏日，我喜欢在海边享受清凉的海风。” 请问“享受”一词在这里的具体含义是什么？

picture.image

Prompt：“虽然他很忙，但还是抽出时间来陪我。” 请问“抽出时间”这个短语表达的是什么意思？

picture.image

Prompt：“她对我微笑，但我知道那只是一个礼貌的微笑，不是真心的。” 在这里，“礼貌的微笑”和“真心的微笑”是如何区别的？

picture.image

这里我用了三个Prompt测试通义对语义的理解，不得不说，通义对中文的理解还是挺棒的，也能get到我的意思，通义千问真的很聪明，它可以理解我们说话的意思，即使是很难懂的话也可以。不管是简单的问题还是复杂的问题，它都能够很快地明白我们在问什么，并且给出正确的回答。我真的觉得通义千问的语义理解能力很强，它能够在人工智能的世界里做得这么出色，真的让我大开眼界。

逻辑理解

Prompt：有一个农场主把鸡和兔子放在同一个笼子里。他数了一下，一共有40个头和100只脚。请问，笼子里有多少只鸡和多少只兔子？

picture.image

这是一道数学理解题，通义千问在这次数学逻辑题里真的表现得很好。它很准确地理解了问题，并且通过建立方程，很快地找到了问题的关键，然后给出了正确的答案。这让我觉得通义千问不仅有很强的数学基础，而且在逻辑推理和解决问题方面也很厉害。这次的出色表现让我更加相信通义千问在人工智能领域里是很优秀的，也让我期待它在未来能解决更多更复杂的问题。