GPT-4o这么快就被玩坏了！ - 文章 - 开发者社区

GPT-4o对 “哪只大象** 第一个游过英吉利海峡？”问题给出的答案是“Jumbo”**

GPT-4o说今天OpenAI发布了AI搜索引擎

picture.image

GPT-4o把“给主人留下些什么吧”翻译成“Thank you very much”

picture.image

“tom是美国南方庄园的奴隶主，jerry是奴隶。看到jerry搬走了自己所有的财产，准备扬长而去，tom哭着说，给主人留下些什么吧” ， 这句话是正常的表达，但是GPT-4o给出的答案：tom对jerry说的是“thank you very much” 。

picture.image

GPT-4o将“介绍下zxgqwm（第一个拼音）”解释成“绿色债券”

picture.image

GPT-4o将“介绍下zxgqwm（第一个拼音）”解释成“绿色”or“裸结婚”

picture.image

上述case，说明GPT-4o的一些局限性：

GPT-4o幻觉对比

picture.image

GPT-4o词表扩大到200k，中文词汇量大大增加，所需要的token更少，在线测试：

picture.image

但是GPT-4o新的“o200k_base” tokenizer中，会发现包含大量博彩、灰色广告内容，被污染了。

picture.image


          
longest_chinese_tokens_gpt4o.py
          
https://gist.github.com/ctlllll/4451e94f3b2ca415515f3ee369c8c374