MemTensor
传统文献调研有多反人类?
科研汪们,是时候放下手里的咖啡和掉发梳了!文献综述——这个让博士生狂喜(崩溃)、让导师沉默(抓狂)的学术苦力活,终于被AI「革命」了!
近日,由记忆张量牵头,上海算法创新研究院、上海交通大学等机构联合推出了基于大语言模型(LLMs)的学术调研自动化系统SurveyX ,标志着自动化综述技术迈上了全新的高度
项目开源相关信息
代码仓库:
https://github.com/IAAR-Shanghai/SurveyX
相关Paper:
https://arxiv.org/abs/2502.14776
开源内容:
核心算法框架,包括文献组织、检索,生成过程等
体验地址:
话不多说,我们先来看看SurveyX生成的效果:
经常写文献综述的都知道,评估一篇文献综述的内容质量高低 要从以下5个角度:
-
覆盖率(Coverage): 评价综述是否涵盖了主题的所有相关方面,包括核心和外围内容。
-
结构(Structure): 评价综述的逻辑组织结构和各部分的连贯性。
-
相关性(Relevance): 评价综述内容与主题的契合程度,以及是否保持了清晰的焦点。
-
综合分析(Synthesis): 评价综述是否能够将不同研究联系起来,识别出更广泛的模式和矛盾,并构建一个超越单个总结的连贯的智力框架。
-
批判性分析(Critical Analysis): 评价综述对现有研究的批判性分析的深度,包括识别方法论局限性、理论不一致性和研究空白。
作者委托了10多位博士生对SurveyX生成的综述质量进行了评估,评估结果如下:
可以看到,SuryveX在各个方面都已经 超过了现有模型 ,并以较小的差距逼近人类水平的综述标准。
除了人工评估,SurveyX也进行了机器评估,评估结果如下:
SurveyX以较高的差距拉开了现有方法的结果,并且在引用准确性 上略微超过了人类专家水平。可以看出,SurveyX较好的解决了LLM的幻觉问题,充分保证了引文内容的正确性。
功能亮点
如果把SurveyX比作宇宙飞船 ,带你穿越文献虫洞直达核心综述,那么这艘飞船有如下黑科技:
01
生成关键词和大纲——自动驾驶+用户精调
用户只需要在SurveyX输入标题,就可以自动生成逻辑大纲与关键词,但还不止于此!真正的突破在于:用户可以像舰长一样调整生成逻辑,让AI听懂用户偏好。
-
权重化关键词:筛选和添加自定义关键词,为重要的关键词设置10分权重,SurveyX将自动强化相关章节的文献密度与论证深度,驱动AI聚焦核心研究方向。
-
自由拖拽大纲:自动生成二级大纲架构,支持拖拽重组/跨级迁移,修改任意节点后AI动态重构上下文逻辑。支持标题排序和增删,文章结构和篇幅由用户自定义。
关键词生成/添加
大纲生成/拖拽
02
打通「本地文献库」与「云端数据库」
——双引擎驱动
用户上传本地文献后,同步开启智能联网搜索,SurveyX即可根据关键词和大纲同步抓取全球最新研究成果,自动补全文献缺口。
- 海量本地文献直传:支持200篇文献上传,总容量300MB,自动解析核心内容并存入个人文献库。
- 智能联网检索填补空白:自动激活全球学术数据库检索,依据主题、关键词与文献结构,实时补充高质量研究成果,确保主题覆盖无遗漏。针对不同版权情况,系统将智能判断获取方式——可直接获取的文献将自动归档,受限内容则清晰标注,提示用户按需获取。
联网搜索
03
从文字到图表,多模态输出「期刊级」排版——首家科研级图表工坊
传统文献综述工具止步于文字生成,SurveyX则让数据自己说话,丰富综述的表达形式,图文并茂,提高可读性和信息传递效率。
- 业内首创深度语义可视化:SurveyX将“图表自动生成”从简单统计图跃升到知识结构级表达——系统在解析海量文献后,自动抽取核心概念、方法流与数据关系,输出思维导图、知识图谱等复杂可视化图表,而非柱状/折线等基础图形。
- 图文联动:点击图表自动跳转到对应文章内容。
04
自动引用参考文献——格式化武器
通过智能化的引用管理系统,实现从文献收集到格式输出的全流程自动化,让学术写作告别繁琐的手工操作。
- 实时引文校验矩阵:校验本地上传文献数量,缺失时触发警告并推荐补传策略。
- 溯源可视化系统:导出文档嵌入智能书签,点击任一引用直接跳转至参考文献。
- 自定义参考文献格式:一键生成正确格式,再也不用调格式调到头秃。
绿框跳转到原文
SurveyX三大算法创新点
接下来,就让我们看看如此优秀的SurveyX是如何诞生的吧。
SurveyX主要分为两个部分:准备阶段和生成阶段。
准备阶段,SurveyX通过高效的检索与信息抽取流程,模拟人类专家的文献准备过程。首先,采用KeywordExpansion算法覆盖所有相关文献,并结合粗细粒度语义过滤去除无关内容,确保参考文献全面且高质量。然后,借助属性树模板对文献进行结构化信息抽取,显著提升信息密度和下文利用效率,为后续综述撰写奠定基础。
生成阶段,SurveyX以大纲设计、正文生成和后处理优化三步确保综述质量与结构性。先基于属性树信息自动归纳综述框架,生成一、二级大纲,并通过去冗余与重排优化结构。再依据撰写思路与属性树顺序生成各章节正文。最后,通过RAG校验引用内容、章节重写提升连贯性,并结合多模态模型自动生成图表,增强文章可读性与专业性。
01
检索词迭代扩充——不放过每篇文献
通过对检索词的迭代扩充,每轮除了用户输入的检索词外,采用对召回文献聚类提取关键词方式进行扩充。
该算法能够根据给定主题自动扩展关键词,从而显著扩大检索范围,获取更多相关文献:
第一步利用嵌入模型进行粗粒度筛选,第二步利用LLM进行细粒度筛选,确保最终获取的文献与主题高度相关,从而提高综述的全面性和质量。
这样做的好处:
- 动态平衡广度与精度:通过语义聚类和关键词迭代扩展,既避免遗漏边缘文献(如新兴研究方向),又通过两步过滤(嵌入模型粗筛+LLM精筛)剔除噪声。
- 权重设计:在语义距离计算中,赋予主题T双倍权重,确保扩展方向始终围绕核心主题。
- 实验验证:对比传统固定关键词检索,SurveyX在IoU(文献覆盖重叠率)指标上达到55%,接近人工专家水平。
02
参考文献属性树——拆解读懂更多的参考文献
- 属性树(AttributeTree)预处理:针对不同类型的文献(Survey Paper,Method Paper,Benchmark Paper, Theory Paper)设计不同的属性树模板,高效提取关键信息。
- RAG-Based重写模块:将所有文献的属性树组合成属性森林,提高信息密度,有效利用大型语言模型的上下文窗口。基于检索增强生成(RAG),用段落内容查询属性森林,动态补充高相关引用并删除无关引用,为生成高质量的综述奠定基础。
- 分而治之,再组织:首先利用属性树生成提纲线索,再根据线索生成二级提纲,最后去除冗余,生成逻辑严谨、结构清晰的综述提纲。
- 提示引导:通过线索引导大型语言模型更好地理解文献内容,并进行信息整合和组织,提高二级提纲的生成质量。
03
首次实现多图表的理解与生成 ——突破纯文本局限
与其他文献综述AI相比,除了文本内容,SurveyX还能够生成图表和表格。丰富综述的表达形式,提高可读性和信息传递效率。
模板驱动信息提取:
- 预定义模板:针对不同图表类型(如技术演进时间轴、方法对比表)设计信息提取模板,来生成图片和表格的latex代码。
- LLM信息抽取:基于模板,从属性树(结构化文献数据库)中提取关键字段,缺失数据由LLM推理补全,填到模板代码里面,跟随latex一起编译生成。
多模态增强(MLLM):
- 对每个子章节,使用多模态大模型扫描参考文献中的现有图表。
- 通过图文相似度计算,选择最能帮助综述表意的插图,插入到survey中。
这样做的好处:
-
动态适配性:模板化设计支持灵活扩展图表类型,适应不同学科需求。
-
混合生成策略:结合LLM生成图表与文献既有图表,兼顾学术严谨性与可视化多样性。
结语
SurveyX不仅将文献综述从两周压缩到3小时内,更以多模态图表和精准引用 ,让学术成果的呈现直抵专业标准——这不是替代,而是解放。
“AI不会替代科研工作者,但它能让创造的过程更自由。” ——技术的终极目标,或许是让人类专注于发现与创新,而将繁琐交给机器。
最后说句大实话:AI当然替代不了研究者的创造力,但至少——那些熬夜查文献的日子,该翻篇了。
下一步技术迭代:
基于MemOS引入专家级记忆管理系统
下一版SurveyX将深度接入MemOS ,为系统新增“专家级记忆管理”能力:把每次检索到的高质量文献、结构化属性和图表结果沉淀为可回溯的记忆块,支持版本回溯、跨主题迁移与智能复用。届时,用户不再从零开始重复抓取文献,而是站在累积知识之上快速更新综述,显著降低检索成本、提升引用准确度,并让跨学科综述像“加载记忆包”一样轻松高效。
同时,我们将陆续发布领域专用记忆库 (Expert Memory Packs):
- 由真实领域专家参与标注与校验,覆盖热门研究方向(如NLP、CV、医学AI、绿色能源等)。
- 按需下载,一键加载到SurveyX工作区,即刻继承专家级知识与推理能力。
- 支持版本回溯与增量更新,让综述写作从“从头开始”变为“基于记忆快速迭代”。
借助MemOS的长期记忆+版本管理,SurveyX将把研究综述的效率和准确性再推上一个新台阶。
注:MemOS(记忆操作系统)是由记忆张量主导,上海交通大学、上海算法创新研究院、中国人民大学等单位协同参与的开源项目。该系统首次以“操作系统”的视角将记忆设定为LLM的核心资源,覆盖从表示结构、生命周期治理到多类型融合的全链路记忆管理,填补了当前语言模型在“结构化、持久性、自适应记忆能力”上的关键空白。
附:MemOS开源框架社区群,扫码入群,获取第一手开源信息。
招贤纳才
记忆张量(上海)科技有限公司是上海算法创新研究院孵化的新型大模型公司,由中科院院士担任首席科学顾问。公司聚焦基本原理驱动的系统性创新,以“低成本、低幻觉、高泛化”为核心特色,致力于探索符合中国国情的大模型发展新路径,推动AI应用更广泛落地。公司持续围绕大模型记忆增强与管理框架进行技术迭代,自主研发的基于记忆分层架构的“忆³”大模型已实现商业化落地,业务稳步增长,获得招商证券、中国银行、中国电信等头部国央企业认可。
公司近期刚完成数千万元天使轮融资,发展势头迅猛,团队热烈欢迎对于大模型训练、强化、应用算法/工程感兴趣的同学参与到这轮AI的热潮中来。团队当前持续招聘中,全面覆盖实习生、校招、社招队伍,团队HC充足,成长空间巨大,欢迎投递。
我们想要的你
- 热衷探索: 对大模型、强化学习、检索或系统工程有强烈好奇心。
- 动手能力: 能将paper idea快速原型化并迭代成产品,具备优秀的极客精神。
- 自驱成长: 乐于在不确定环境中寻找突破口,与团队共创零到一。
- 协作精神: 跨学科背景加分,愿与算法、工程、产品多角色高效沟通。
我们能给你的
- 顶尖专家指导: 院士顾问+一线大厂/顶会背景导师,Code Review、Reading Club常态化。
- 快速成长路径: 技术Ladder&管理双通道,不设天花板的晋升与期权激励。
- 落地是第一生产力: 研发节奏“需求-原型-迭代”三步走,我们鼓励MVP版本快速试错。
- 开放研究氛围: 鼓励顶会投稿与开源贡献,成果署名按实际贡献排名。
- 高效工作效率: 团队Base上海,扁平化管理,任何事情畅所欲言,虽小但美。
投递邮箱
实习/校招/社招:HR@memtensor.cn
邮件主题请注明“应聘岗位+姓名+来源”。如有代表性项目 / 论文 / GitHub,请一并附上。
扫码加入 SurveyX 用户反馈交流群