OpenAI发布了GPT-4的官方使用指南,这可是一份大家期待已久的宝贵资料!这份指南虽然只有六大策略 ,但每个细节都讲得很清楚。今天我们开始第二课- 提供参考文本
GPT-4作为当今最强的自然语言生成模型,表现超出许多人得想象,但也有不足和难题。比如,它可能回答不了一些专业或常识问题,以及最广为人道的人工智能幻觉 。为了让GPT-4更好更可信,我们可以用一些技巧和方法来引导和限制它的输出。本文将介绍一种有效的方法,就是提供参考文本 。
什么是参考文本?
参考文本是指在输入中给模型提供一些和问题有关的可信信息,例如网页链接、书籍摘录、数据表格等,让模型根据这些信息来组织回答。这样做的好处是可以让模型有更多的依据和支持来生成回答,避免模型凭空想象或胡乱猜测。同时,也可以提高模型的回答质量和可信度,让用户更加满意和信任模型的输出。
参考文本可以有多种形式和来源,例如:
- 网页链接:可以提供一些权威或专业的网站或网页的链接,让模型从中获取相关信息。
- 书籍摘录:可以提供一些出版或学术的书籍或文章的摘录或引用,让模型从中获取相关信息。
- 数据表格:可以提供一些统计或科学的数据表格或图表,让模型从中获取相关信息。
- 其他形式:除了上述三种常见的形式外,还可以根据问题和场景提供其他形式的参考文本,例如图片、视频、音频、地图等。只要能够给模型提供一些有用和可信的信息,就可以作为参考文本。
如何使用参考文本?
使用参考文本有两种主要的方式:参照 和引用 。下面我们分别介绍这两种方式。
让模型参照参考资料进行回答
让模型参照参考资料进行回答是指在输入中给模型提供一些和问题有关的可信信息,并且让模型根据这些信息来组织回答,但不一定要直接引用参考资料中的内容。这样做的好处是可以让模型有更多的自由度和创造力来生成回答,同时也可以保持回答的连贯性和流畅性。
例如,如果我们想让模型回答一个关于中国历史的问题,我们可以在输入中给模型提供一个关于中国历史的网页链接,如下所示:
Q: 中国历史上哪个朝代最长?请简要说明原因。
A: 参考资料:https://zh.wikipedia.org/wiki/%E4%B8%AD%E5%9C%8B%E6%AD%B7%E5%8F%B2
然后,我们可以让模型根据这个链接中的内容来生成回答,如下所示:
A: 根据参考资料中的内容,中国历史上最长的朝代是周朝。周朝从公元前1046年开始,到公元前256年结束,共历经了790年。周朝之所以能够持续这么长时间,主要有以下几个原因:
- 周朝采用了分封制度,将各地方国家赋予一定的自治权和贡赋义务,使得周王室能够维持对全国的统治。
- 周朝建立了周礼制度,规范了社会秩序和人伦关系,使得周朝社会相对稳定和和谐。
- 周朝推崇天命观念,认为周王室是天所授予的正统统治者,使得周朝能够获得各地方国家和民众的尊重和拥护。
- 周朝经历了春秋战国时期的百家争鸣,催生了各种思想和文化的发展,使得周朝能够适应时代的变化和挑战。
从上面的例子可以看出,模型根据参考资料中的内容,生成了一个比较完整和准确的回答,同时也引用了参考资料中的一些关键词和数据,增加了回答的可信度和权威性。
让模型引用参考资料进行回答
让模型引用参考资料进行回答是指在输入中给模型提供一些和问题有关的可信信息,并且让模型直接引用参考资料中的一些内容来进行回答。这样做的好处是可以让模型更加精确和客观地回答问题,避免模型对参考资料中的内容进行误解或曲解。同时,也可以让用户更加清楚和方便地查看和验证模型的回答来源和依据。
例如,如果我们想让模型回答一个关于美国总统的问题,我们可以在输入中给模型提供一个关于美国总统的数据表格,如下所示:
Q: 美国历史上哪位总统任期最短?请给出具体的数字和来源。
A: 参考资料:https://en.wikipedia.org/wiki/List_of_presidents_of_the_United_States_by_time_in_office
然后,我们可以让模型根据这个表格中的内容来生成回答,并且引用表格中的具体数据和来源,如下所示:
A: 根据参考资料中的表格,
- 美国历史上任期最短的总统是威廉·亨利·哈里森(William Henry Harrison)。
- 他于1841年3月4日就任第9任美国总统,但在就职仅31天后(1841年4月4日)因肺炎去世,成为美国历史上唯一一个在任期内死亡的总统。
- 他的任期只有31天(744小时),是美国历史上最短的。
- 这一数据和来源可以在参考资料中的表格第2行第5列和第6列找到。
从上面的例子可以看出,模型根据参考资料中的表格,生成了一个非常精确和客观的回答,并且引用了表格中的具体数据和来源,让用户可以很容易地查看和验证模型的回答。
总结
提供参考文本是一种非常有效的方法,可以提高GPT-4模型的生成质量和可信度。通过给模型提供一些和问题有关的可信信息,我们可以指示或约束模型根据这些信息来组织或引用回答。
在下一篇文章中,我们将介绍另一种非常有效的方法,就是设置输出格式 。通过给模型指定输出内容的类型、长度、风格等要求,我们可以进一步控制和优化模型的输出效果。敬请期待!
今天的内容就到这里,如果老铁觉得还行,可以来一波三连,感谢!
PS
:
AI小智技术交流群(技术交流、摸鱼、白嫖课程为主)又不定时开放了,感兴趣的朋友,可以在下方公号内回复:666,即可进入。
老规矩
,道友们还记得么,
右下角的 “在看” 点一下
, 如果感觉文章内容不错的话,记得分享朋友圈让更多的人知道!