QwQ-Max-Preview下周会开源

大模型机器学习数据库

今天凌晨,俊旸兄发x,说下周一定会开源,但现在正在进行更多的RL实验,所以最后开的模型有多强,还不知道,但一定会开源一些东西。

期待一手Qwen开源。

同时值得注意的一点是,现在qwen.ai上的QwQ-max-Preview模型的推理收益,应该更多来自于SFT过程,因为还没有充分进行RL。

QwQ-Max-Preview如果是在Qwen2.5-Max上训练的,那么也会是一个MoE模型。

因为这周太卷了,一直在跟DeepSeek的开源内容,还没来得及给大家实测,下周一定测!!!

最后,NLP工作站 4群 成立啦!欢迎入群交流!

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
边缘计算在视频直播场景的应用与实践
视频直播作为当前视频行业的核心场景之一,对于高清化、实时性、交互性要求较高,需要强大算力保障用户流畅观看与互动体验。本次分享主要从视频直播场景需求切入,介绍基于边缘计算的视频直播场景方案及其架构、应用与实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论