小窗幽记机器学习
小窗幽记机器学习
9
0
0
0
大模型大模型向量数据库机器学习
引言 ========芳树无人花自落,春山一路鸟空啼。小伙伴们好,我是微信公众号<小窗幽记机器学习>的小编 吃黄焖鸡的打工人。近日,谷歌DeepMind团队升级Gemma正式发布Gemma 3家族。Gemma 3是多模态大模型,支持长达128K上下文和多高达140种语言,该系列分别有1B、4B、12B和27B四种规模,其中27B版本性能卓越,击败DeepSeek V3 671B,是仅次于DeepS
10
0
0
0
AI机器学习算法大数据
小荷才露尖尖角,早有蜻蜓立上头。大家好,我是微信公众号《小窗幽记机器学习》的小编「卖热干面的小女孩」——因项目需要深入目标检测领域,今日为大家全景解析计算机视觉基石性技术:YOLO系列从v1到v12的十年演进图谱。计算机视觉领域中,目标检测技术举足轻重,广泛应用于安防、自动驾驶等关键场景。其中,YOLO 系列模型表现最为卓越。2015年,YOLOv1横空出世,此后十年,YOLO 系列持续迭代,各版
1185
1
0
2
AI大模型向量数据库云通信
今天要推荐的这份资料是近日(2025年2月19日)由Huggingface发布的一份关于从 1 到 1000 多个 GPU 训练集群上训练 LLMs 的全面指南。包括硬件配置、软件工具(例如 PyTorch、Hugging Face 库)、优化策略等方方面面。系统地讲解如何将大语言模型训练从单GPU扩展到数千 GPU 规模让复杂的分布式训练技术变得更容易理解和实践弥补当前开源领域中分布式训练知识零
82
0
0
0
AI大模型向量数据库机器学习
月上柳梢头,人约黄昏。小伙伴们,元宵节快乐!我是微信公众号<小窗幽记机器学习>的小编扔炮仗的小男孩。新年伊始,继往开来。延续之前的2024年年度AI论文盘点(上): 盘点2024年最值得关注的AI研究报告(上篇) 。今天这篇小作文是关于2024年人工智能研究亮点系列文章的第二部分,主要回顾了7月至12月期间值得关注的AI研究论文。这篇年度(下半年)回顾文章涵盖了从混合专家模型到新的LLM精度缩放定
59
0
0
0
AI大模型向量数据库机器学习
行到水穷处,坐看云起时。大家好,我是卖热干面的小女孩。今天与大家分享的是DeepSeek系列模型家族的技术创新。DeepSeek 横空出世并迅速走红,在全球科技圈引发强烈震动,直接致使NVIDIA股价暴跌 18%,全球科技股市市值蒸发近1万亿美元。特朗普出人意料地公开称赞DeepSeek 的崛起具有 “积极意义”,还表示这给美国敲响了 “警钟”。Anthropic一方面对DeepSeek 的成就予
468
0
0
0
AI大模型向量数据库机器学习
爆竹声中一岁除,春风送暖入屠苏。大家新年好,我是卖热干面的小女孩。很高兴能与小伙伴们分享人工智能领域的前沿技术和思考。在大语言模型(LLMs)蓬勃发展的当下,推理能力成为衡量模型优劣的关键指标。DeepSeek-R1 系列模型凭借强化学习在这一领域取得了令人瞩目的成果。承接之前DeepSeek R1的粗浅解读:推理模型专题 | DeepSeek开源版o1比肩OpenAI满血o1,小编继续深度阅读了
430
0
0
0
AI向量数据库大模型数据库
前文: Search-o1技术解读-智能RAG助力O1推理模型突破知识盲区 提到的智能RAG其实就是Agentic RAG,那么Agentic RAG与传统RAG有什么不同?今天这篇小作文简要介绍2者的差异。RAG 是一种结合信息检索与生成模型的技术,主要分为传统 RAG 和 Agentic RAG 两种形式。它们在设计、应用和能力上存在显著区别。1、 基本概念 : 传统 RAG 通过将文档向量化
166
0
0
0
AI大模型向量数据库机器学习
引言 ========昭昭若日月之明,离离如星辰之行。小伙伴们好,我是玩冲天炮的小男孩。今天这篇小作文主要介绍DeepSeek刚发布的O1类模型:DeepSeek-R1。简介 ========这篇论文介绍了一系列名为DeepSeek-R1-Zero和DeepSeek-R1的推理模型,着重探讨了强化学习(RL)在提升大型语言模型(LLMs)推理能力上的应用。DeepSeek-R1-Zero是一个直接
274
0
0
0
大模型大模型向量数据库云安全
引言 ========清风明月本无价,近水远山皆有情。小伙伴们好,我是扔炮仗的小男孩。今天这篇小作文主要解读人大和清华联合提出的Search-o1框架。大型推理模型(LRMs,即O1类模型)凭借强大的逐步推理能力在复杂问题解决中展现出巨大潜力,但其受限于静态知识储备的局限性。Search-o1通过创新的agentic RAG机制和文档推理模块,使模型能够在推理过程中动态获取并整合外部知识。附此前O
141
0
0
0
AI大模型向量数据库机器学习
今天这篇小作文主要介绍 如何利用收集到的数据 训练GUI Agent专用的LLM及其升级版的大型动作模型(LAM),此外还介绍该领域当前主流模型。
165
0
0
0
云原生大模型向量数据库机器学习
时人不识凌云木,直待凌云始道高。小伙伴们好,我是微信公众号"小窗幽记机器学习"的小编卖席梦思的刘皇叔。延续前文:GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:GUI Agent核心组件GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI
180
0
0
0
AI大模型向量数据库云通信
人生自是有情痴,此恨不关风与月。小伙伴们好,我是卖铁观音的小男孩。延续前文:GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:深度解读GUI Agent的核心组件及其最新进展GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI Agent综述
141
0
0
0
AI大模型向量数据库机器学习
本文是之前GUI Agent综述系列的合订本。GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:深度解读GUI Agent的核心组件及其最新进展GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI Agent综述-7:GUI Agent 模型
384
0
0
0
AI向量数据库大模型数据库
本文作为GUI Agent综述的第6篇,主要介绍用以优化 GUI Agent 的相关数据集。
323
1
0
1
AI大模型向量数据库数据安全
忽然一夜清香发,散作乾坤万里春。小伙伴们好,我是小编卖玉玺的汉室宗亲。延续前文:GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-1:总览GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-2:三大技术基石GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-3:发展历程今天这篇小作文主要剖析组成GUI Agent的核心组件及其最新进展。后续还有以下5个章回,感兴趣的小伙伴
550
0
0
0
AI大模型向量数据库云通信
本文是GUI Agent综述的第5篇文章,主要介绍LLM驱动下的各种GUI Agent框架。
199
0
0
0
AI大模型机器学习数据库
OpenAI O1模型引发业界对大规模推理模型(large reasoning models ,LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错,甚至超越部分闭源产品。今天这篇小作文将全面介绍Marco-o1的技术细节。
490
0
0
0
AI大模型向量数据库机器学习
小伙伴们好!我是微信公众号“小窗幽记机器学习”的小编卖风火轮的哪吒。很高兴能与小伙伴们分享人工智能领域的前沿技术和思考。今天的主题聚焦于一个激动人心的领域—— 大型语言模型(LLM)驱动的图形用户界面(GUI)智能体(Agent) 。想象一下,通过自然语言发出指令,计算机便能像贴心助手一样完成复杂操作。LLM驱动的GUI Agent正在让这一场景从梦想走向现实。这一领域融合了人工智能、人机交互和软
187
0
0
0
大模型大模型机器学习向量数据库
冰雪林中著此身,不同桃李混芳尘。小伙伴们好,我是微信公众号"小窗幽记机器学习"的小编卖龙椅的汉室宗亲。延续前文:GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-1:总览GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-2:三大技术基石今天这篇小作文主要追溯 LLM 驱动 GUI Agent的演进历程。后续还有以下6个章回,感兴趣的小伙伴可以留意下:GUI Agent综述:4-
153
0
0
0