OpenAI年终大戏第一场发布了: o1正式版 , 200美刀/月的ChatGPT Pro会员 ,以及只有Pro会员才能用的 o1 pro新功能 。
o1 pro 模式 ,这是o1 的一个版本,它使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案。
那么,200美刀一个月的OpenAI o1-pro到底效果如何尼?
200美元就这? 新的 OpenAI o1-pro 模型给出了奇怪的答案,并且经常失去注意力。根本没用……
也刚刚订阅OpenAI 200美元/月,现场直播测试结果的,结果一测一个懵圈,o1-pro回答各种不知道,以及超长思考~
对于9.11与9.8哪个大的问题,网友吐槽:付更多钱并不能解决这个问题
200美元一个月到底值不值,网友们也展开了讨论:
- 不适合大多数人
- 解决的问题往往价值很高:系统设计、复杂问题解决、财务分析或其他用途。
OpenAI官方的评测,与 o1 和 o1-preview 相比, o1 pro 模式在数学、科学和编码等具有挑战性的 ML 基准测试中表现更佳 。
为了突出 o1 pro 模式 的主要优势( 提高可靠性 ),使用更严格的评估设置:只有当模型在四次尝试中有四次能够正确回答问题(“4/4 可靠性”),而不是一次,才被认为解决了问题。
https://openai.com/index/introducing-chatgpt-pro/
https://x.com/thegarrettscott/status/1864821209344438637
https://x.com/emollick/status/1864741492327133271
https://x.com/youraimarketer/status/1864707407521120516
https://x.com/pranavmarla/status/1864776741023064426
推荐阅读
- • 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
- • 2024:ToB、Agent、多模态
- • RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
- • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。