We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
小窗幽记机器学习
文章
专栏
问答
小窗幽记机器学习
一文纵览DeepSeek模型家族:从LLM到R1
AI
大模型
向量数据库
机器学习
行到水穷处,坐看云起时。大家好,我是卖热干面的小女孩。今天与大家分享的是DeepSeek系列模型家族的技术创新。DeepSeek 横空出世并迅速走红,在全球科技圈引发强烈震动,直接致使NVIDIA股价暴跌 18%,全球科技股市市值蒸发近1万亿美元。特朗普出人意料地公开称赞DeepSeek 的崛起具有 “积极意义”,还表示这给美国敲响了 “警钟”。Anthropic一方面对DeepSeek 的成就予
142
0
0
0
小窗幽记机器学习
推理模型专题|DeepSeek-R1如何用强化学习、冷启动和蒸馏,开启大模型训练新思路?
AI
大模型
向量数据库
机器学习
爆竹声中一岁除,春风送暖入屠苏。大家新年好,我是卖热干面的小女孩。很高兴能与小伙伴们分享人工智能领域的前沿技术和思考。在大语言模型(LLMs)蓬勃发展的当下,推理能力成为衡量模型优劣的关键指标。DeepSeek-R1 系列模型凭借强化学习在这一领域取得了令人瞩目的成果。承接之前DeepSeek R1的粗浅解读:推理模型专题 | DeepSeek开源版o1比肩OpenAI满血o1,小编继续深度阅读了
203
0
0
0
小窗幽记机器学习
传统 RAG 和 Agentic RAG有什么不同?
AI
向量数据库
大模型
数据库
前文: Search-o1技术解读-智能RAG助力O1推理模型突破知识盲区 提到的智能RAG其实就是Agentic RAG,那么Agentic RAG与传统RAG有什么不同?今天这篇小作文简要介绍2者的差异。RAG 是一种结合信息检索与生成模型的技术,主要分为传统 RAG 和 Agentic RAG 两种形式。它们在设计、应用和能力上存在显著区别。1、 基本概念 : 传统 RAG 通过将文档向量化
75
0
0
0
小窗幽记机器学习
推理模型专题 | DeepSeek开源版o1比肩OpenAI满血版o1(技术报告解读)
AI
大模型
向量数据库
机器学习
引言 ========昭昭若日月之明,离离如星辰之行。小伙伴们好,我是玩冲天炮的小男孩。今天这篇小作文主要介绍DeepSeek刚发布的O1类模型:DeepSeek-R1。简介 ========这篇论文介绍了一系列名为DeepSeek-R1-Zero和DeepSeek-R1的推理模型,着重探讨了强化学习(RL)在提升大型语言模型(LLMs)推理能力上的应用。DeepSeek-R1-Zero是一个直接
180
0
0
0
小窗幽记机器学习
推理模型专题 | Search-o1技术解读-智能RAG助力O1推理模型突破知识盲区
大模型
大模型
向量数据库
云安全
引言 ========清风明月本无价,近水远山皆有情。小伙伴们好,我是扔炮仗的小男孩。今天这篇小作文主要解读人大和清华联合提出的Search-o1框架。大型推理模型(LRMs,即O1类模型)凭借强大的逐步推理能力在复杂问题解决中展现出巨大潜力,但其受限于静态知识储备的局限性。Search-o1通过创新的agentic RAG机制和文档推理模块,使模型能够在推理过程中动态获取并整合外部知识。附此前O
88
0
0
0
小窗幽记机器学习
GUI Agent综述 : 7-GUI Agent 模型优化
AI
大模型
向量数据库
机器学习
今天这篇小作文主要介绍 如何利用收集到的数据 训练GUI Agent专用的LLM及其升级版的大型动作模型(LAM),此外还介绍该领域当前主流模型。
80
0
0
0
小窗幽记机器学习
GUI Agent综述 : 8-如何评测GUI Agent?有哪些评测基准?
云原生
大模型
向量数据库
机器学习
时人不识凌云木,直待凌云始道高。小伙伴们好,我是微信公众号"小窗幽记机器学习"的小编卖席梦思的刘皇叔。延续前文:GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:GUI Agent核心组件GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI
83
0
0
0
小窗幽记机器学习
GUI Agent综述 : 9-GUI Agent应用与未来
AI
大模型
向量数据库
云通信
人生自是有情痴,此恨不关风与月。小伙伴们好,我是卖铁观音的小男孩。延续前文:GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:深度解读GUI Agent的核心组件及其最新进展GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI Agent综述
71
0
0
0
小窗幽记机器学习
5万字长文全面解读GUI Agent的前世今生
AI
大模型
向量数据库
机器学习
本文是之前GUI Agent综述系列的合订本。GUI Agent综述-1:总览GUI Agent综述-2:三大技术基石GUI Agent综述-3:发展历程GUI Agent综述-4:深度解读GUI Agent的核心组件及其最新进展GUI Agent综述-5:GUI Agent框架百家争鸣GUI Agent综述-6:汇总GUI Agent训练数据集GUI Agent综述-7:GUI Agent 模型
134
0
0
0
小窗幽记机器学习
GUI Agent综述 : 6-汇总GUI Agent训练数据集
AI
向量数据库
大模型
数据库
本文作为GUI Agent综述的第6篇,主要介绍用以优化 GUI Agent 的相关数据集。
156
1
0
1
小窗幽记机器学习
GUI Agent综述 : 4-万字长文深度解读GUI Agent的核心组件及其最新进展
AI
大模型
向量数据库
数据安全
忽然一夜清香发,散作乾坤万里春。小伙伴们好,我是小编卖玉玺的汉室宗亲。延续前文:GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-1:总览GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-2:三大技术基石GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-3:发展历程今天这篇小作文主要剖析组成GUI Agent的核心组件及其最新进展。后续还有以下5个章回,感兴趣的小伙伴
222
0
0
0
小窗幽记机器学习
GUI Agent综述 : 5-GUI Agent框架百家争鸣
AI
大模型
向量数据库
云通信
本文是GUI Agent综述的第5篇文章,主要介绍LLM驱动下的各种GUI Agent框架。
128
0
0
0
小窗幽记机器学习
推理模型专题 | 开源类O1:Marco-o1技术全面解读
AI
大模型
机器学习
数据库
OpenAI O1模型引发业界对大规模推理模型(large reasoning models ,LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错,甚至超越部分闭源产品。今天这篇小作文将全面介绍Marco-o1的技术细节。
375
0
0
0
小窗幽记机器学习
GUI Agent综述 : 揭秘GUI智能体的前世今生-1 : 总览篇-启程
AI
大模型
向量数据库
机器学习
小伙伴们好!我是微信公众号“小窗幽记机器学习”的小编卖风火轮的哪吒。很高兴能与小伙伴们分享人工智能领域的前沿技术和思考。今天的主题聚焦于一个激动人心的领域—— 大型语言模型(LLM)驱动的图形用户界面(GUI)智能体(Agent) 。想象一下,通过自然语言发出指令,计算机便能像贴心助手一样完成复杂操作。LLM驱动的GUI Agent正在让这一场景从梦想走向现实。这一领域融合了人工智能、人机交互和软
106
0
0
0
小窗幽记机器学习
GUI Agent综述 : 3-GUI Agent的发展历程
大模型
大模型
机器学习
向量数据库
冰雪林中著此身,不同桃李混芳尘。小伙伴们好,我是微信公众号"小窗幽记机器学习"的小编卖龙椅的汉室宗亲。延续前文:GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-1:总览GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-2:三大技术基石今天这篇小作文主要追溯 LLM 驱动 GUI Agent的演进历程。后续还有以下6个章回,感兴趣的小伙伴可以留意下:GUI Agent综述:4-
89
0
0
0
小窗幽记机器学习
GUI Agent综述 : 2-GUI Agent的三大技术基石
AI
大模型
向量数据库
机器学习
疏影横斜水清浅,暗香浮动月黄昏。小伙伴们好,我是微信公众号"小窗幽记机器学习"的小编卖龙袍的汉室宗亲。延续前文:GUI Agent综述:9部曲揭秘下一代人机交互的前世今生-1:总览今天这篇小作文主要介绍铸就GUI Agent的 三大技术基石 。后续还有以下7个章回,感兴趣的小伙伴可以留意下:GUI Agent综述:3-GUI Agent的发展历史GUI Agent综述:4-GUI Agent关键组
84
0
0
0
小窗幽记机器学习
多模态大模型 | Google最新开源多模态:PaliGemma 2 简介&实战
AI
大模型
向量数据库
云通信
简要介绍Google DeepMind最新的多模态成果:PaliGemma 2,并从实战角度实测对比PaliGemma 2、Qwen2-VL、MinCPM-V在各个真实场景下的效果。
97
0
0
0
小窗幽记机器学习
多模态系列 | Google开源多模态:PaliGemma 2技术全面解读
AI
大模型
向量数据库
机器学习
引言 ========江寒水不流,鱼嚼梅花影。小伙们好,我是卖热干面的小女孩,继续 多模态大模型系列 。紧随前文: 多模态系列 | Google最新开源多模态:PaliGemma 2 简介&实战 ,今天这篇小作文全面解读PaliGemma 2的技术细节。PaliGemma 2是基于Gemma 2语言模型的开源视觉语言模型, 通过结合不同规模的模型和分辨率,微调后的模型在多项任务上取得SOTA。它扩
100
0
0
0
小窗幽记机器学习
多模态系列 | 多模态微调实战:以Google多模态PaliGemma 2为例
AI
大模型
向量数据库
机器学习
孤村落日残霞,轻烟老树寒鸦,一点飞鸿影下小伙们好,我是卖热干面的小女孩,继续 多模态大模型系列 。紧随前文:多模态系列 | Google最新开源多模态:PaliGemma 2 简介&实战多模态系列 | Google开源多模态:PaliGemma 2技术全面解读今天这篇小作文以多模态模型PaliGemma 2微调为例,从实战角度介绍如何微调多模态大模型。完整的代码请到微信公众号《小窗幽记机器学习》上
90
0
0
0
小窗幽记机器学习
如何白嫖最强O1:Gemini-2.0-flash-thinking?
AI
大模型
向量数据库
机器学习
鉴于前文评测显示Gemini-2.0-flash-thinking模型推理能力强劲且无需绑定信用卡,以下简要介绍如何通过API调用该模型。若仅需体验,可通过官方入口等多种网络渠道访问:https://aistudio.google.com/prompts/new_chat?。 请注意,访问可能需要一定的网络技巧。白嫖额度: 每分钟 10次 请求,每天免费API调用 1500次 。开始前先注册一个G
518
0
0
0