刘聪NLP
刘聪NLP
大模型大模型向量数据库机器学习
去年九月份就有人告诉我们:Don't Teach, Incentivize!显然,Deepseek 和 Kimi 是听进去了。
68
0
0
0
大模型大模型向量数据库云存储
学以致用,可以多多利用大模型能力,来解决身边有趣的事务,并且代价也不大,不失为一种乐趣!
10
0
0
0
大模型大模型向量数据库云通信
解读k1.5论文中的部分内容。
66
0
0
0
大模型大模型向量数据库数据安全
关于热词的30多篇精选 Paper 春节期间可以给大鱼大肉解解腻吧
18
0
0
0
AI大模型向量数据库容器
但总归我是很快就要弃坑了。
40
0
0
0
AI大模型机器学习数据库
主要分享下我在学习和实践 RLHF 时,曾经陷入过的一些思维误区。这些误区的产生大多和我的强化基础知识理解不到位有关,我建议非强化出身的同学都耐心读读下面这些文章。
104
0
0
0
开源大模型向量数据库云通信
2025年才过了半个月,开源社区持续躁动,这两天已经有4家又开源了新模型!
71
0
0
0
开源大模型向量数据库机器学习
你觉得开源多模态大模型能通过红绿色盲测试吗?
24
0
0
0
AI大模型向量数据库机器学习
不知不觉做 RLHF 已经一年多了,跳了很多坑,也慢慢累积了一些经验。 这一年中最大的感触是:RL 是一门需要被非常深入理解的学科,而可视化是深入理解的第一步。
61
0
0
0
大模型大模型向量数据库机器学习
不会还有人不知道,可以同一底座加载多Lora模型吧!!!对于没有太多显卡资源的朋友,这个操作可以极大的节省显存资源,同时部署多个模型,让资源利用最大化。
80
0
0
0
大模型大模型向量数据库云安全
本文尝试用一条通用公式,带你以最简洁的方式彻底理解ROPE及其演化的变种逻辑
80
0
0
0
AI大模型向量数据库机器学习
Search-o1,通过自主检索来补足O1推理模式中知识不足的问题。
62
0
0
0
大模型大模型向量数据库机器学习
汇总Llama3.1、DeepSeek-V3、TÜLU 3和Qwen2.5的后训练Post-Training技术。
464
1
0
0
开源大模型向量数据库数据安全
又到了一年一度年终总结时刻,不过今年这篇总结,跟往年的不同,今年只聊LLM。
118
0
0
0
大模型大模型向量数据库云安全
2025年第一瓜!!!
131
0
0
0
大模型大模型向量数据库机器学习
Pretraining as Ilya knows it will end, but not for us.
89
0
0
0
AI大模型数据库机器学习
即使没有 o3,大部分的技术人也一定会被淘汰,这就是当下程序员圈不可避免的困局。
444
0
0
0
大模型大模型向量数据库数据中台
LLM 的第二年就要结束了,如果 2023 年的主题叫“从零到一”,那么 2024 年的主题无疑是“颠覆认知”。
253
0
0
0
大模型大模型向量数据库云安全
QWQ之后,千问团队又开源了视觉推理大模型QVQ
303
0
0
0
大模型大模型向量数据库火山方舟
前段时间一直都在尝试用多模态大模型进行落地应用,除了问答之外,那么最容易想到的就是文档解析了。但实验下来,全是眼泪!痛,太痛了!
342
0
0
0