猴哥的第 78 期分享,欢迎追看
尽管各大 LLM 厂商百花齐放,OpenAI 的 GPT 系列依然一骑绝尘!
虽然 OpenAI 官网已将 GPT4o 开发给免费用户使用,受限于网络原因,国内很多小伙伴依然没有用上免费纯正的 GPT4o~
即便克服了网络障碍,免费用户每3小时也只能使用 GPT-4o 10次。
今天看到一个项目- Chatbot Arena
,可以无限白嫖 GPT-4o,分享给大家!
- Chatbot Arena 简介
❝ 在线体验:https://arena.lmsys.org/
Chatbot Arena 是伯克利的LMSYS组织在 2023 年就搭建的一套评测各大 LLM 的平台,简称 大模型竞技场
。
这个组织的另外两项工作也非常有影响力:
- LlaMa 系列开源大语言模型,最新版已到了 LlaMa3.1,还没体验过的小伙伴可以参考: 全网刷屏的 LLaMa3.1 还没用上?2分钟带你尝个鲜
- Vicuna 系列开源多模态大模型,底座的大语言模型也是用的 LlaMa。
相对而言,Chatbot Arena 影响力不如上面两项。那么,Chatbot Arena 到底干了啥?
一个基于人类偏好评估 LLM 的开放平台。其采用成对比较方法,利用不同用户的输入,积累用户对不同 LLM 回答偏好的投票。
结果表明,众包投票与专家投票高度一致,因此 Chatbot Arena 的可信度非常高,一跃成为最受引用的 LLM 排行榜之一,被领先的 LLM 开发人员和公司广泛引用。
- 大模型排行榜
主页选择 Leaderboard
,可以看到最新的大模型排行榜。ChatGPT-4o 依旧遥遥领先,确实强。
- 大模型 PK
主页选择 Arena(side-by-side)
,可以任意选择两个大模型进行 PK,哪个好用选哪个~
- 白嫖 GPT-4o
当然,对于绝大部分用户而言,根本不关心排行榜,就是想白嫖下 GPT-4o 对吧。
主页选择 Direct Chat
,尽情开启 GPT-4o 的白嫖之旅吧。
不过,高峰期时,白嫖 chatgpt-4o-latest
可能会遇到 MODEL_HOURLY_LIMIT (chatgpt-4o-latest): 2000
。
那就换一个 GPT-4o 的版本试试吧,毕竟榜一大哥被薅的太狠,官方服务器怕是扛不住~
写在最后
今天给大家安利了 LLM 界的"奥林匹克" - Chatbot Arena!
不仅能看到最新的 LLM 排行榜,还能亲自上阵让两个 LLM 互掐,看谁更厉害。
不过这些都不重要,最重要的是 - 它为我们白嫖 GPT-4o,提供了一种可能。
如果本文对你有帮助,不妨点个免费的赞 和收藏 备用。
👇 关注猴哥,快速入门AI工具
# AI 工具:
# AI应用** :**
视频生成 EasyAnimate-v3 实测,阿里开源,5 分钟带你部署体验,支持高分辨率超长视频
# 效率工具: