豆包送来新年礼物,开源SOTA模型!

大模型向量数据库数据库

字节开源 UI-TARS 模型! 2B & 7B & 72B 3个尺寸的模型。

  • Arxiv: https:// arxiv.org/abs/2501.12326
  • GitHub: https:// github.com/bytedance/UI-TARS

picture.image

一次性开源了3个SOTA模型(2B、7B和72B),加一个PC/MacOS应用程序,用于用vLMS控制你的电脑。在 10 个基准测试中击败了 GPT-4o 和 Claude、SOTA。

picture.image

功能

  • 由VLM驱动的自然语言控制
  • 屏幕截图和视觉识别支持
  • 精准鼠标和键盘控制
  • 跨平台支持(Windows/MacOS)
  • 实时反馈和状态显示

picture.image

支持PC和移动端

picture.image

最后提供了,中文部署教程:https://bytedance.sg.larkoffice.com/docx/TCcudYwyIox5vyxiSDLlgIsTgWf#U94rdCxzBoJMLex38NPlHL21gNb

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎 EMR 基于 Proton 的存算分离实践
EMR 团队针对这些挑战自研了 Proton 加速引擎,深度优化对象存储读写能力,与 Hive/Spark/Trino 等计算引擎集成后,在不改变用户使用习惯的前提条件下,可提供对象存储数据集的透明加速服务。在离线场景下,其性能基本持平存算一体架构。本次分享将介绍 Proton 技术能力和最佳实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论