向AI转型的程序员都关注了这个号👇👇👇
这是ChatGPT给的回答
来一起看看官方放出的case吧:
帮人Debug代码,并进行多轮询问:
识别出危险问题并拒绝回答,但用户说明意图后给出了更好的回复:
执行指令,甚至改很多遍也不生气:
还有个指代消解的case太长就不放了,OpenAI在最后还拿InstructGPT做了对比,可以看到InstructGPT只是冰冷地执行指令,而ChatGPT则更有温度一些。
从上面的例子可以看到,对比今年其他厂的对话工作,ChatGPT有几项明显的优点:
基于GPT3.5,有着更多样的训练数据,别的我不知道,反正debug代码有点东西
强大的多轮上下文理解能力,从指代消解、写信的例子看出来的,如果对历史消息没有很好的记忆理解,可能就新起一个话题了
更像人。目前大部分模型都是直接回答,而ChatGPT显然跟用户有一个「Chat」的过程,比如debug代码的时候,上来先回复「很难说,再多给点信息」
更像人的对话策略,是很难做出来的,因为我们不知道怎么才算「像个人」。谷歌为了解决这个问题,曾经拆分出了一堆指标。
而这次OpenAI则是采用了和DeepMind Sparrow[2]一样的策略,既然不知道用哪些维度衡量对话的好坏,那直接基于用户的反馈去训练,让模型自己学就好了。
基于反馈的训练,那不就是宇宙的终点强化学习吗。
ChatGPT的制作分为如下几步:
用监督数据基于GPT3.5训练一个对话模型,训练数据是标注人员手把手写出来的
人工标注模型生成的多个结果,训练一个给对话回复打分的模型
用打分模型作为反馈,基于PPO算法训练一个对话模型
上面的步骤其实跟DeepMind的工作很像,也很直觉,但DeepMind额外针对黄赌毒对话做了些训练,目前还不知道ChatGPT是怎么实现的,不过以他们LM一把梭的性格,有可能全是数据堆出来的。。。
当然,ChatGPT还是有一些局限的,比如:
说一些不明所以毫无疑义的话
重复问相同的问题,或者轻微调整后答案变化很大
很啰嗦,从case里也看出来了,这主要是训练数据带来的偏差,标注同学会更倾向长句子
也不是所有模糊情况都会反问
有些黄赌毒问题还是没法识别,作者们在打算用API解决
目前,为了让大家给出更多的反馈,OpenAI顺势在11.30-12.30之间举行了一个反馈比赛,感兴趣的同学可以积极参与。
准备
代理,要求是韩国,日本,印度,新加坡,美国这几个地址。
准备一个国外手机号,如果没有用接码平台也行,解码平台地址sms-activate.org
开始
第一步 准备接码
打开接码平台 sms-activate.org,注册一个账号
注册
充值,这里单位是卢布
接码OpenAi的一次费用是大概30卢布,人民币来看差不多是3块钱,不过只能充美金,充值0.5美元即可,支持支付宝等国内APP。
充值完成需要等一会,就先放着,直接进行下一步。
第二步骤 注册OpenAI账号
首先是打开ChatGPT的账户注册页面https://beta.openai.com/signup
谷歌注册或者邮箱注册都可以,无所谓,这里用邮箱注册作为例子。
用邮箱注册后有个验证邮件,进去邮箱,点开链接。
现在开始一步步走就行了。
当然,有一些人会在这里遇到一个问题,会出现提示说不能在当前国家服务:Not available OpenAI's services are not available in your country.
出现这种问题,就是因为你的代理没有全局,或者位置不对。香港的代理是100%无法通过的。
但是又有个非常神奇的问题,只要你出现了这个提示,那么你接下来怎么切换代理,都是没用的。现在教你一招解决。
解决地区问题
首先,你要把你的代理切换到不是香港的地区,我这里选韩国。
然后,先复制下面这段代码
window.localStorage.removeItem(Object.keys(window.localStorage).find(i=>i.startsWith('@@auth0spajs'))
接着在地址栏里输
javascript:
注意,这里一定要输入,因为你复制的话是粘贴不了的。
然后再粘贴我们第一段复制的内容
最后结果是这样
然后按下回车键,接着刷新页面,如果你的代理没问题,就可以正常看到注册页面了。
填写手机号
然后到我们的接码网站上去。在左侧搜索OpenAi,然后选择巴西
点击小黄车购买。
然后我们复制这个号码,粘贴过去。然后我们点击发送验证码就完事了。
等一会网站会提示验证码,我们复制粘贴。
这样就成功了,随便点一个进去完事。
使用ChatGPT
注册完后,我们去ChatGPT网站去登录。
https://chat.openai.com/auth/login
参考
ChatGPT注册试用全攻略
https://blog.ittutorial.top/ai-ChatGPT/
注册ChatGPT全攻略
除了ChatGPT,还可以体验最新Stable diffusion-v2绘画模型,免注册,免安装,不用显卡,在线体验,有网就行!
AI绘图在线体验
二次元绘图
在线体验地址:Stable Diffusion
模型包括:
NovelAI,NovelAI的模型训练使用了数千个网站的数十亿张图片,包括 Pixiv、Twitter、DeviantArt、Tumblr等网站的作品。
Waifu,waifu的模型可用于生成二次元的卡通形象,可以生成独有的二次元动漫小姐姐和主人公
Stable diffusion-v2,以英文为输入的通用图像生成模型
中文输入绘图
在线体验地址:Stable Diffusion
http://taiyi.aiartwork.online/
太乙模型,首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练。
机器学习算法AI大数据技术
搜索公众号添加: datanlp
长按图片,识别二维码
阅读过本文的人还看了以下文章:
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
