We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
刘聪NLP
文章
专栏
问答
刘聪NLP
Deepseek-R1 & Kimi-1.5读后有感 | 大道至简的o1
大模型
大模型
向量数据库
机器学习
去年九月份就有人告诉我们:Don't Teach, Incentivize!显然,Deepseek 和 Kimi 是听进去了。
68
0
0
0
刘聪NLP
学以致用 | 被早餐店老板坑了1块钱后,用大模型做了个早餐防骗算价器
大模型
大模型
向量数据库
云存储
学以致用,可以多多利用大模型能力,来解决身边有趣的事务,并且代价也不大,不失为一种乐趣!
10
0
0
0
刘聪NLP
Kimi发布最新模型k1.5,技术报告也干货满满
大模型
大模型
向量数据库
云通信
解读k1.5论文中的部分内容。
66
0
0
0
刘聪NLP
回顾 LLM 领域的一些热词,哪些你不知道?
大模型
大模型
向量数据库
数据安全
关于热词的30多篇精选 Paper 春节期间可以给大鱼大肉解解腻吧
18
0
0
0
刘聪NLP
Agent的亲身经历,从开始到放弃
AI
大模型
向量数据库
容器
但总归我是很快就要弃坑了。
40
0
0
0
刘聪NLP
RLHF 常见的思维误区
AI
大模型
机器学习
数据库
主要分享下我在学习和实践 RLHF 时,曾经陷入过的一些思维误区。这些误区的产生大多和我的强化基础知识理解不到位有关,我建议非强化出身的同学都耐心读读下面这些文章。
104
0
0
0
刘聪NLP
实测书生系列开源的最新模型-InternLM3-8B
开源
大模型
向量数据库
云通信
2025年才过了半个月,开源社区持续躁动,这两天已经有4家又开源了新模型!
71
0
0
0
刘聪NLP
开源多模态大模型是红绿色盲吗?
开源
大模型
向量数据库
机器学习
你觉得开源多模态大模型能通过红绿色盲测试吗?
24
0
0
0
刘聪NLP
如何让 RLHF 训练更稳定?
AI
大模型
向量数据库
机器学习
不知不觉做 RLHF 已经一年多了,跳了很多坑,也慢慢累积了一些经验。 这一年中最大的感触是:RL 是一门需要被非常深入理解的学科,而可视化是深入理解的第一步。
61
0
0
0
刘聪NLP
LLM实战系列 | 大模型的多Lora部署,将显存节省到极致
大模型
大模型
向量数据库
机器学习
不会还有人不知道,可以同一底座加载多Lora模型吧!!!对于没有太多显卡资源的朋友,这个操作可以极大的节省显存资源,同时部署多个模型,让资源利用最大化。
80
0
0
0
刘聪NLP
从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码
大模型
大模型
向量数据库
云安全
本文尝试用一条通用公式,带你以最简洁的方式彻底理解ROPE及其演化的变种逻辑
80
0
0
0
刘聪NLP
Search-o1:赋予推理模型主动搜索的能力
AI
大模型
向量数据库
机器学习
Search-o1,通过自主检索来补足O1推理模式中知识不足的问题。
62
0
0
0
刘聪NLP
长文 | 大模型Post-Training总结
大模型
大模型
向量数据库
机器学习
汇总Llama3.1、DeepSeek-V3、TÜLU 3和Qwen2.5的后训练Post-Training技术。
464
1
0
0
刘聪NLP
回顾2024:与LLM又相伴一年的经历与思考
开源
大模型
向量数据库
数据安全
又到了一年一度年终总结时刻,不过今年这篇总结,跟往年的不同,今年只聊LLM。
118
0
0
0
刘聪NLP
微软论文爆出GPT-4o参数为200B,而GPT-4o-mini 只有8B参数
大模型
大模型
向量数据库
云安全
2025年第一瓜!!!
131
0
0
0
刘聪NLP
LLM 预训练到头了吗?
大模型
大模型
向量数据库
机器学习
Pretraining as Ilya knows it will end, but not for us.
89
0
0
0
刘聪NLP
技术人该积累什么,才能避免被AI淘汰?
AI
大模型
数据库
机器学习
即使没有 o3,大部分的技术人也一定会被淘汰,这就是当下程序员圈不可避免的困局。
444
0
0
0
刘聪NLP
LLM 又过了一年!!!
大模型
大模型
向量数据库
数据中台
LLM 的第二年就要结束了,如果 2023 年的主题叫“从零到一”,那么 2024 年的主题无疑是“颠覆认知”。
253
0
0
0
刘聪NLP
QVQ-72B,如期而至!继QWQ后,通义千问又开源视觉推理大模型!
大模型
大模型
向量数据库
云安全
QWQ之后,千问团队又开源了视觉推理大模型QVQ
303
0
0
0
刘聪NLP
多模态大模型在表格解析任务上效果如何?亲身经历全是泪!
大模型
大模型
向量数据库
火山方舟
前段时间一直都在尝试用多模态大模型进行落地应用,除了问答之外,那么最容易想到的就是文档解析了。但实验下来,全是眼泪!痛,太痛了!
342
0
0
0