🚀󠄿󠅠󠅕󠅞󠄱󠄹󠇕󠆠󠅶󠇖󠆄󠆮󠇕󠆔󠆗󠇖󠅻󠆋󠄐󠄷󠅀󠅄󠄝󠄥󠇕󠅵󠅽󠇘󠆤󠆩󠇖󠆇󠆐󠇙󠆉󠆀󠇔󠆭󠆯󠇗󠆄󠆘󠇟󠆬󠆊󠇙󠆒󠅴󠇘󠆞󠆑󠇕󠅷󠆐󠇔󠆨󠆚󠇖󠆌󠅸󠇕󠅶󠅵󠇖󠅾󠆘󠇕󠅷󠆪
你以为这只是一个表情吗?
不!
他其实藏了277个token~
这是来自 @Paul Butler 大神的一个发现,实际上,我们可以在任何 Unicode 字符中隐藏数据,不止是表情,任何字符内都可以藏下任意长度的内容。
这个原理,是利用Unicode的变体选择器(Variation Selectors)来实现。 这是一个特殊字符,本身不显示,但可以改变前面字符的显示样式。不同的变体选择器,可能显示不同的字体样式,但大多数情况下,这些选择器会被忽略,但会被保留在数据中。
然后,整活开始!
@karpathy 大神将一些信息注入进字符中,表面上看没啥区别,但里面可以表达各种隐藏信息。结果直接问懵DeepSeek和ChatGPT。对于善于思考的模型,就会很容易受到这个方法的影响。
DeepSeek R1思考过程就像这样