豆包送来新年礼物,开源SOTA模型!

大模型向量数据库数据库

字节开源 UI-TARS 模型! 2B & 7B & 72B 3个尺寸的模型。

  • Arxiv: https:// arxiv.org/abs/2501.12326
  • GitHub: https:// github.com/bytedance/UI-TARS

picture.image

一次性开源了3个SOTA模型(2B、7B和72B),加一个PC/MacOS应用程序,用于用vLMS控制你的电脑。在 10 个基准测试中击败了 GPT-4o 和 Claude、SOTA。

picture.image

功能

  • 由VLM驱动的自然语言控制
  • 屏幕截图和视觉识别支持
  • 精准鼠标和键盘控制
  • 跨平台支持(Windows/MacOS)
  • 实时反馈和状态显示

picture.image

支持PC和移动端

picture.image

最后提供了,中文部署教程:https://bytedance.sg.larkoffice.com/docx/TCcudYwyIox5vyxiSDLlgIsTgWf#U94rdCxzBoJMLex38NPlHL21gNb

0
0
0
0
关于作者
相关资源
从 ClickHouse 到 ByteHouse
《从ClickHouse到ByteHouse》白皮书客观分析了当前 ClickHouse 作为一款优秀的开源 OLAP 数据库所展示出来的技术性能特点与其典型的应用场景。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论