通义家族大模型总结 | 社区征文

2023总结
引言

今年的确是生成式AI狂飙的一年,像chatGPT、Amazon Q、CodeWhisperer、文心一言、通义千问等这些文本生成、文生图或者文生视频的应用迭代的速度都非常快,这些应用也让我们非常兴奋,大家甚至开始在自己的生活和工作中去尝试应用AI工具,像我平时写代码的时候,也会用CodeWhisperer或者通义灵码来辅助编程,我也认为AI可以帮助我们再一次提升人类的生产力,当然,也会有不少人会觉得自己的工作可能要被AI取代了,面临失业的风险。但现实的发展好像并没有想象中的那么美好。

对于企业来说,想在企业内部更快地使用“生成式Ai”,享受AI带来的降本增效的福利,还面临不少问题和挑战,我认为最大的一个挑战就是基础模型本身的问题,目前模型的基础预料都是来自互联网上的公开资料,比如说博客、论坛、出版物以及维基百科的一些数据。对于企业内部的业务,AI其实没有很深入的了解,也就很难在企业内部发挥作用,很多问题其实AI真的不懂,比如说你到底是在做什么工作,你的工作需要一些什么样的技能基础,又需要了解一些什么样的工作流程,甚至可以用到哪些内部的数据等等,它都不了解,自然也就没有办法给到很好的回答。

今年我也体验过很多大模型,接下来就谈谈自己感受!

通义家族

picture.image

picture.image

今年的云栖大会发布了众多大模型,尤其是通义千问升级到2.0,在多项评测中综合性能超过GTP3.5,相比GTP4各有胜负,据说2.0版本已经迭代至千亿参数级别,在复杂理解、创作、数学以及逻辑能力上升级,接下来我们就体验一下通用大模型。

通义千问

picture.image

语义理解

Prompt:“在炎热的夏日,我喜欢在海边享受清凉的海风。” 请问“享受”一词在这里的具体含义是什么?

picture.image

Prompt:“虽然他很忙,但还是抽出时间来陪我。” 请问“抽出时间”这个短语表达的是什么意思?

picture.image

Prompt:“她对我微笑,但我知道那只是一个礼貌的微笑,不是真心的。” 在这里,“礼貌的微笑”和“真心的微笑”是如何区别的?

picture.image

这里我用了三个Prompt测试通义对语义的理解,不得不说,通义对中文的理解还是挺棒的,也能get到我的意思,通义千问真的很聪明,它可以理解我们说话的意思,即使是很难懂的话也可以。不管是简单的问题还是复杂的问题,它都能够很快地明白我们在问什么,并且给出正确的回答。我真的觉得通义千问的语义理解能力很强,它能够在人工智能的世界里做得这么出色,真的让我大开眼界。

逻辑理解

Prompt:有一个农场主把鸡和兔子放在同一个笼子里。他数了一下,一共有40个头和100只脚。请问,笼子里有多少只鸡和多少只兔子?

picture.image

这是一道数学理解题,通义千问在这次数学逻辑题里真的表现得很好。它很准确地理解了问题,并且通过建立方程,很快地找到了问题的关键,然后给出了正确的答案。这让我觉得通义千问不仅有很强的数学基础,而且在逻辑推理和解决问题方面也很厉害。这次的出色表现让我更加相信通义千问在人工智能领域里是很优秀的,也让我期待它在未来能解决更多更复杂的问题。

文学创作

在文学创作方面,要求通义千问描写黄河,但是不能出现“黄河”二字,并且起个优美的题目,从创作内容看,通义千问采用拟人的手法描述了黄河的壮观,没有出现黄河,符合提议

picture.image

然后加大难度,给了一篇高考作文题目,写一篇符合题意要求的作文,说实话,写的确实可以,挺不错的。

Prompt:好的故事,可以帮我们更好地表达和沟通,可以触动心灵、启迪智慧;好的故事,可以改变一个人的命运,可以展现一个民族的形象……故事是有力量的。 以上材料引发了你怎样的联想和思考?请写一篇文章。 要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

picture.image

图片解析

在新的版本中,通义千问还上线了图片解析的功能,我上传了一张多啦A梦的图片,它精准的识别出图片的内容,包括什么部位、是什么东西、是什么颜色

picture.image

我顺便问了一句这动漫人物叫什么名字,没想到它也能知道,惊叹到我了,哈哈

picture.image

不过通义千问目前是不支持文生图的,要体验文生图需要去通义万相才行,其它的大模型都是将这些功能融入到一起的,但是阿里却分的很细,我觉得这点也不错的。

通义万相

picture.image

通义万相是我最喜欢的产品之一,它是可以进行人工智能艺术创作的大模型,并且提供了一些优秀的作品,我们复用他人的创意在新画作中调整文本,风格,比例进行再创作。

每天每个账号都会有50点灵感值,次日会更新重置

  • 复用创意

picture.image

通过这个按钮,我们可以复用他人的创意进行二次创新,非常简单方便

picture.image

云栖大会上,针对通义万相的创作能力进一步提升,新增涂鸦作画虚拟模特以及写真馆

涂鸦作画

这个功能很有意思,我们可以自己随意涂鸦,根据涂鸦绘制作品,然后添加一段描述,下图是根据我绘制的树枝头上的鸟绘制的图片,是不是很美

picture.image

虚拟模特

picture.image

首先我们需要选择一张人像展示商品图的照片,用以下图片:

picture.image

上传后,随后选择男模特,一键生成即可

picture.image

picture.image

可以对比生成的结果,是不是很好看,简直是购物商城作图神器,完全看不出P图的痕迹

写真馆

另外不得不说写真馆功能,我们可以用自己的照片生成属于自己的写真照片,再也不去照相馆了

picture.image

picture.image

通义灵码

在云栖大会上,我们得知了一个对于我们开发者来说超级棒的消息,那就是通义灵码的正式发布!哇,真的,这东西简直就是一把编码的瑞士军刀。你想写冒泡排序、解释代码、生成代码解释或者单元测试,只要点一下,它都能给你生成出来。

首先我们需要进行安装,在vscode上搜索通义灵码

picture.image

  • 生成1-100的随机数函数

picture.image

你知道吗,除了能编写代码,它还能帮我们省下很多繁杂的工作时间,比如信息检索、工具切换、写单元测试等等,这样我们就能更专心地投入到技术逻辑里去了。我觉得在这个AI大行其道的时代里,通义灵码真的扮演了一个非常重要的角色。

通义星尘

picture.image

通义星尘是阿里推出的个性化角色对话平台,提供了几种不同AI角色的二次元人物,我们还可以自定义角色

我选择了一只小泰迪,一上来就要跟我一起玩

picture.image

picture.image

通义星尘提供了侦探推理、情感树洞、睡前故事、职场陪练、恋爱陪伴等多种应用场景,整体来说可玩性比较强。

通义智文

通义智文作为一款基于通义大模型的AI阅读助手,同样面向多格式、多模态和长文本场景,支持文档对话、摘要、解析等功能。

picture.image

我们随便在网上找一篇新闻的链接,就可以导入到通义智文中,帮我们生成导读、问答以及笔记,在阅读文章的过程中,遇到不会的知识点还可以向AI随时提问。

picture.image

通义听悟

picture.image

自从有了通义听悟,再也不会因为会议太多发愁了!通义听悟会帮我完整记录沟通细节,还能总结会议速览、待办事项,两个小时的会议5分钟就能写完纪要,简直是解放生产力的会议器。不仅如此,通义听悟不仅能把录音批量转文字,还能提取访谈回答,总结大纲和重点,节省精力让我投入更有创造力的工作。

最近通义听悟上线了发现模块,我们可以订阅播客频道,边听边看边写笔记。

picture.image

目前大模型处于百花齐放百家争鸣的时刻,在我们生活的方方面面都可以看到大模型的影子,相信在不久的将来,大模型可以为我们的生活再次提升生产力。

InfoQ 首发文章的原文链接:https://xie.infoq.cn/article/c6c008486f77325a002322009

299
75
0
3
关于作者
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论