快手发布并开源了KAT-V1 自动思考 AutoThink 大模型,这是一款融合思考与非思考能力、并且可以根据问题难度自动切换思考形态的模型。
KAT-V1模型共有40B和200B(目前未开源)两个版本。在自动思考模式下,40B版本的性能可追平今年5月发布的新版DeepSeek-R1(参数量为6850亿)。而200B版本的模型,则在多项基准测试中超过Qwen、DeepSeek和Llama这三大开源模型家族中的旗舰模型。
多了一个judge过程,judge用来分析输入以决定是否需要思考。
200B的模型是否会开不开源,暂不确定