200美刀/月的OpenAI o1-pro,一测一个不吱声~

大模型向量数据库云安全

OpenAI年终大戏第一场发布了: o1正式版200美刀/月的ChatGPT Pro会员 ,以及只有Pro会员才能用的 o1 pro新功能

o1 pro 模式 ,这是o1 的一个版本,它使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案。

那么,200美刀一个月的OpenAI o1-pro到底效果如何尼?

picture.image

200美元就这? 新的 OpenAI o1-pro 模型给出了奇怪的答案,并且经常失去注意力。根本没用……

picture.image

也刚刚订阅OpenAI 200美元/月,现场直播测试结果的,结果一测一个懵圈,o1-pro回答各种不知道,以及超长思考~ picture.image

picture.image

picture.image

picture.image

picture.image

对于9.11与9.8哪个大的问题,网友吐槽:付更多钱并不能解决这个问题

picture.image

picture.image

200美元一个月到底值不值,网友们也展开了讨论:

  • 不适合大多数人
  • 解决的问题往往价值很高:系统设计、复杂问题解决、财务分析或其他用途。

picture.image

picture.image

OpenAI官方的评测,与 o1 和 o1-preview 相比, o1 pro 模式在数学、科学和编码等具有挑战性的 ML 基准测试中表现更佳

picture.image

为了突出 o1 pro 模式 的主要优势( 提高可靠性 ),使用更严格的评估设置:只有当模型在四次尝试中有四次能够正确回答问题(“4/4 可靠性”),而不是一次,才被认为解决了问题。

picture.image


            
https://openai.com/index/introducing-chatgpt-pro/
            
https://x.com/thegarrettscott/status/1864821209344438637
            
https://x.com/emollick/status/1864741492327133271
            
https://x.com/youraimarketer/status/1864707407521120516
            
https://x.com/pranavmarla/status/1864776741023064426
        

推荐阅读


欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
VikingDB:大规模云原生向量数据库的前沿实践与应用
本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何在多模态信息检索、RAG 与知识库等领域进行合理的技术选型和规划。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论