NLP前沿
NLP前沿
开源大模型向量数据库数据库
字节开源 UI-TARS 模型! 2B & 7B & 72B 3个尺寸的模型。Arxiv: https:// arxiv.org/abs/2501.12326GitHub: https:// github.com/bytedance/UI-TARS一次性开源了3个SOTA模型(2B、7B和72B),加一个PC/MacOS应用程序,用于用vLMS控制你的电脑。在 10 个基准测试中击败了 GPT-
3
0
0
0
AI大模型向量数据库云安全
OpenAI 在 Anthropic 的同类产品发布 3 个月后,昨晚推出了他们的计算机使用Agent。在OSWorld/WebArena 上评测获得了比较大的提升,说明还是存实际意义的模型进步,而不仅仅是 ui/product 包装。原理也很常规,端到端。@SullyOmarr 发表了关于operator的初印象。初次使用 operator 的感受:对演示用例来说还算不错(不过我个人大概不会用它
1
0
0
0
AI大模型向量数据库机器学习
昨天都在喊过年了!kimi难得出技术报告,瞧瞧技术细节。技术报告在这里:https://github.com/MoonshotAI/Kimi-k1.5首先还是kimi一贯的宣传特色,长上下文,所以问题来了,如果我们给模型更长的《思考空间》,它是否能自然地学会规划和推理?其次不得不说,这张图太会玩了。推理模型对比普通模型,AIME楞了好久(单指这张图)。3个阶段:预训练&SFT -> RL ->
20
0
0
0
大模型大模型向量数据库机器学习
模型昨天开源,已经发过了,今天简单聊聊技术报告有几个有意思的地方。啊哈时刻训练过程中,模型突然出现了一个有意思的"顿悟"模型会突然停下来说"等等,等等,等等", 然后用拟人化的语气说"这是一个我可以标记的顿悟时刻",接着主动重新评估和思考解决问题的方法。这种行为完全是自发形成的,不是人为设计的。思考时间会自主进化模型在训练过程中自然学会了延长思考时间, 从最初的简短回答,逐渐发展到生成数百到数千个
8
0
0
0
大模型大模型数据库机器学习
它来了,它来了。preview版本,在代码基准测试LiveCodeBench排名第三,表现与OpenAI o1接近。值得一提的试,deepseek还帮助他们解决了评测的一些bug问题。并且附上了最新的R1模型的推理思考过程。DeepSeek-R1-Lite-Preview使用强化学习训练,推理含大量反思和验证,遵循新的Scaling Laws——推理越长,表现越强。网友们测试,在某些情况下,模型似
4
0
0
0
音视频视频服务视频云机器学习
github trending今天排名第一,MoneyprinterV2 (中文,印钞机)项目地址:https://github.com/FujiwaraChoki/MoneyPrinterV2MoneyPrinterV2项目是MoneyPrinter项目的新版本。对旧项目的完全重构,重点在于支持更多的功能和更模块化的架构。只需提供一个视频主题或关键词,就可以全自动生成视频的文案、素材、字幕以及背
3
0
0
0
开源大模型向量数据库云存储
MiniMax-Text-01和MiniMax-VL-01开源。用到了线性注意力,所以在处理长输入的时候有非常高的效率,接近线性复杂度。支持4M上下文的大海捞针。并且得益于新架构,所以推理更快,在其他模型处理256K tokens的时间,Minimax的模型可以处理高达1000k tokens的信息。456B的模型,每次激活参数为45.9B,结构图如下:效果对齐第一梯队。长文有领先优势。模型地址:
9
0
0
0
开源大模型向量数据库机器学习
MiniCPM-o 2.6开源,总参数量为 8B。性能上比 MiniCPM-V 2.6 有显著提升,并引入了实时语音对话和多模态视频的新功能。符合小钢炮定位,榜单已冲烂,午睡起来看智谱也发了新的模型,似乎这些榜上已经准备开始甩飞Openai、anthropic的顶尖模型一截了。下边是智谱GLM-4V-Plus 的评测榜单,看起来极度的优秀。开源上比较有特色的应该是这2个新能力?之前应该没有这种模型
3
0
0
0
AI大模型向量数据库云存储
首先这个prompt只针对o1有效。最早由推友@python_xxt 提出metaprompt:后续被推友 @howie.serious 做了大量的测试,逐渐完善。其次这个有区别于前2天,关于o1正确用法的帖子。一个是针对内容prompt,一个是针对非内容prompt的。这个鸡血prompt可以显著提升生成内容的质量的。这条 meta prompt 有效的前提,是 o1 和 o1 pro 在本质上
19
0
0
0
AI大模型向量数据库机器学习
刚刚,百度新推出“AI搜”功能,入口在正常的搜索栏下边,上面的标签页也有一个有创作,画图,智能体的能力,右侧还会有类似思维导图一样的结构化栏,可以点击。中文搜索还行,海外的信息差点意思。可以@选择智能体。跟豆包这些比较类似,所以他要怎么收费,怎么加广告呢?
6
0
0
0
开源向量数据库大模型机器学习
上周五,新开源的一个嵌入模型,Kalm-embedding 主张通过优质训练数据带来更强的嵌入模型。相比于之前的SOTA模型,用到了更多的数据。model: https://huggingface.co/HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1.5code: https://github.com/HITsz-TMG/KaLM-Embe
2
0
0
0
AIGPU数据库容器
上午,2025 CES消费电子展(1月7日至10日,美国拉斯维加斯)开幕。黄仁勋身着一件新皮衣亮相,黄仁勋手持RTX 50系列显卡,在舞台灯光下格外闪耀。公布新一代 Blackwell GPU 家族产品,包含 RTX 5090、RTX 5080、RTX 5070 Ti 与 RTX 5070上代旗舰卡 RTX 4090 美元定价为 1599 美元。新一代 RTX 5070 就能达到 RTX 4090
3
0
0
0
开源大模型向量数据库机器学习
微软 Phi4 开源。Phi系列, 它不像许多模型那样依赖自然数据,而是大量采用了高质量的合成数据。然后在各个任务上都获得了不错的效果,虽然打不过qwen 2.5~hf: https://huggingface.co/microsoft/phi-4paper: https://arxiv.org/pdf/2412.08905数据处理要点:合成数据:通过 Multi-Agent 和 self-rev
8
0
0
0
云原生大模型向量数据库云存储
一篇新文章,Search-o1: Agentic Search-Enhanced Large Reasoning Models,项目地址: https://github.com/sunnynexus/Search-o1像 o1 这些的 LRMs 在给出结果之前会进行大量的思考(推理过程),推理过程中,往往会出现大量不确定性的词,比如说 "perhaps"、"alternatively" 。就是说,
5
0
0
0
开源大模型向量数据库云安全
Open Canvas 汲取了 OpenAI “Canvas” 的灵感,但又有所创新,为你带来更强大的功能和更灵活的体验。
11
0
0
0
AI大模型向量数据库云存储
GPT-5 进行了>=2 次大规模训练。第一次代号是“Arrakis”,其计算能力是 GPT-4 的两倍。第二次代号是“Orion”,从 2024 年 5 月持续到 11 月。
18
0
0
0
AI智能语音交互机器学习数据库
还记得openai直播12天里边,这只能说会道的麋鹿吗?它能听懂声音,流畅的语音交流。对,它的硬件SDK,刚刚被开源了!这个项目,可以理解成一个智能体,放到各种玩具,小家电里边,让它具备语音互动能力。https://github.com/openai/openai-realtime-embedded-sdkSDK 已经在 esp32s3 和 Linux 上完成了测试。如果用 Linux 系统,无需
35
0
0
0
AI大模型向量数据库机器学习
DeepSeek V3 预览版低调发布,但是非常牛逼。https://huggingface.co/deepseek-ai/DeepSeek-V3-Base这是世界上第二好的非推理 LLM,仅次于 Gemini Exp 1206,并且是迄今为止最好的开放重量级 LLM。编码能力超强,仅次于o1, Aider评测全精度仅需要 1.5TB 的 RAM 即可运行。只要llama.cpp 支持了,可以用
49
0
0
0
AI大模型向量数据库机器学习
凌晨,Google对着Openai贴脸开大!相较于此前的1.5 Pro版本,新版本在性能和功能方面均实现了显著提升。Gemini 2.0在核心性能指标上较前代提升了近一倍,特别是在多模态处理方面取得突破性进展。2.0 Flash击败1.5 Pro。同时也击败了LMArena上的o 1 preview(但仍然落后于Gemini-Exp-1206,疑似2.0 Pro型号)。同时,他们还免费开放flas
12
0
0
0
AI大模型机器学习数据库
Hugging Face 上有超过 100 万个 AI 模型,实际上我们可以用本地代码,无需GPU,免费运行它们。随便打开一个模型,可以看到HuggingFace提供了一个Inference API,可以view code确认如何调用这个模型。点开之后,可以选请求方式,或者是否是流式的,代码很简单。即使是多模态的也没问题。比如下图为flux模型这一切都是免费的,但是有次数限制,每个注册账号,可以有
26
0
0
0