豆包送来新年礼物,开源SOTA模型!

大模型向量数据库数据库

字节开源 UI-TARS 模型! 2B & 7B & 72B 3个尺寸的模型。

  • Arxiv: https:// arxiv.org/abs/2501.12326
  • GitHub: https:// github.com/bytedance/UI-TARS

picture.image

一次性开源了3个SOTA模型(2B、7B和72B),加一个PC/MacOS应用程序,用于用vLMS控制你的电脑。在 10 个基准测试中击败了 GPT-4o 和 Claude、SOTA。

picture.image

功能

  • 由VLM驱动的自然语言控制
  • 屏幕截图和视觉识别支持
  • 精准鼠标和键盘控制
  • 跨平台支持(Windows/MacOS)
  • 实时反馈和状态显示

picture.image

支持PC和移动端

picture.image

最后提供了,中文部署教程:https://bytedance.sg.larkoffice.com/docx/TCcudYwyIox5vyxiSDLlgIsTgWf#U94rdCxzBoJMLex38NPlHL21gNb

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
高性能存储虚拟化方案 NVMe over Fabric 在火山引擎的演进
在云计算中,虚拟化存储扮演着重要角色,其中 iSCSI 协议在业界开放、流行多年。近年来,拥有更优性能的 NVMe over Fabrics 协议也得到了发展。本次分享介绍了 NVMe over Fabrics 在云原生和虚拟化方向的演进工作和成果。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论