尽管AI在科学研究中的应用取得了显著进展,但目前仍缺乏对AI在科学研究(AI4Research)中应用的全面综述,为了填补这一空白,提出了一个全面的AI4Research调查,旨在提供一个统一的视角,并系统地分类AI在研究中的应用。
AI4Research的主流流程和分类,可以分为五个关键领域:(1)用于科学理解的AI,(2)用于学术调查的AI,(3)用于科学发现的AI,(4)用于学术写作的AI,以及(5)用于学术同行评审的AI。这些领域各自有助于提升AI融合研究与出版的有效性和效率。
AI在研究中的分类(AI4Research)被划分为五个关键领域。每个领域进一步细分为具体任务,突出了AI在整个研究过程中多样化的角色。
一、用于科学理解的AI
AI能够从科学文献中提取、解释和综合信息,加速人类知识获取和自动分析效率。这包括文本科学理解(如半自动和全自动科学理解)以及表格和图表科学理解。
-
文本科学理解
-
半自动科学理解 :AI在人类指导下逐步深入理解复杂科学文献。例如,LaMAI通过提问澄清用户查询中的模糊点,减少误解;SciAgent通过调用计算器和公式评估器提供精确推理。
-
全自动科学理解 :AI独立阅读和理解科学文献,无需人类干预。例如,通过生成文章总结来增强对长篇科学文本的整体理解,或通过自我提问和反思来深化对科学内容的理解。
-
表格和图表科学理解
-
表格理解 :AI通过数据增强和推理范式增强来提取、解释和推断表格中的数据。例如,Chain-of-Table通过逐步构建和更新表格来提高对复杂表格的理解。
-
图表理解 :AI能够直接处理和解释图表图像,支持基于图表内容的问题回答和总结。例如,ChartQA和ChartX用于训练端到端和流水线模型,FDV提供图表的结构化文本表示,以实现更深入的理解。
二、用于学术调查的AI
AI技术可以系统地回顾和总结科学文献,帮助研究人员快速了解研究领域的最新进展。这包括相关工作检索和概述报告生成。
-
相关工作检索
-
语义引导检索 :通过匹配用户查询的语义表示与文献中的术语来检索相关文献。例如,GTSLNet通过基于关键词的相似性学习网络提高检索的准确性;
-
图引导检索 :将学术实体(如论文、作者、引用)建模为图结构,基于节点类型和粒度进行检索。
-
LLM增强检索 :利用LLM的能力提升检索系统的性能。例如,单智能体检索直接使用LLM完成检索任务;多智能体检索通过多个专业智能体简化检索过程;深度研究则进一步向更自主的“深度研究”方向发展,AI智能体能够从探索和综合到生成引用丰富的报告。
-
概述报告生成
-
研究路线图绘制 :对大量文献进行清理、整合,描绘研究主题的发展轨迹。例如,CHIME通过迭代人类-AI协作细化LLM生成的结构;HiReview使用多层树结构进行系统知识组织;SurveyEval提供层次化标题树,用于评估综述生成的分布和引用准确性。
-
章节级相关工作生成 :生成相关工作章节,与实际论文结构对齐。
-
文档级调查生成 :自动生成系统性文献综述。例如,AutoSurvey通过提示词引导LLM完成阶段性生成过程;
三、用于科学发现的AI
AI用于生成新的科学假设、理论或模型,并验证其有效性。这涉及想法挖掘、新颖性和重要性评估、理论分析和实验设计。
-
想法挖掘 :AI从内部知识、外部信号和团队讨论中生成新科学假设或想法。
-
新颖性与重要性评估 :AI评估想法的新颖性和重要性,结合传统方法、LLM增强和人机协作。
-
理论分析 :AI验证科学假设的合理性,包括主张形式化、证据收集、验证分析和定理证明。
-
科学实验开展 :AI设计、执行和分析科学实验,涵盖实验设计、前估计、管理、执行和分析。
-
全自动发现 :AI实现从假设生成到实验验证的全流程自动化,形成闭环科学发现过程。
四、用于学术写作的AI
AI工具协助研究人员撰写、编辑和格式化科学论文,提高写作质量和效率。这包括在论文准备、撰写和完成阶段的辅助。
-
半自动学术写作
-
写作准备阶段 :AI帮助生成论文标题、优化结构、确保内容连贯性,例如通过MoDeST和LLM-Rubric等工具生成多领域科学标题。
-
写作阶段 :AI协助绘制图表、生成公式、推荐引用,例如FigGen和SciCapenter等工具支持从文本到图表的生成,ScholarCopilot等工具实现智能引用推荐。
-
写作完成后阶段 :AI进行语法纠错、表达和逻辑修订,例如通过AWE系统和AAAR-1数据集提供写作质量评估,Wikipedia Revision Histories数据集帮助优化语言表达。
-
全自动学术写作
AI独立完成从草稿撰写到最终稿件生成的全过程,无需人工干预。例如,AI Scientist和Agent Laboratory等系统通过模拟同行评审和反馈循环,优化生成的论文内容,但目前尚未完全消除人工编辑的需求,特别是在正确引用方面。
五、用于学术同行评审的AI
AI自动化和增强同行评审过程,提供结构化、客观和建设性的评审。这包括预评审、评审和后评审阶段。
- 预评审 :AI在桌面评审阶段快速评估稿件是否符合要求,并在审稿人匹配中实现精准分配,同时避免利益冲突。
- 正在评审 :AI生成评审意见和综合评审报告,提升评审质量和效率,减少主观性和偏见。
- 后评审 :AI预测论文影响力并生成宣传材料,提升论文的可见度和影响力。
AI在研究中的多学科应用:(a)自然科学中的AI,涵盖物理学、生物学与医学以及化学与材料科学等领域;(b)应用科学与工程中的AI,重点关注机器人技术和软件工程;(c)社会科学中的AI,包括社会学和心理学等学科。
https://arxiv.org/pdf/2507.01903
AI4Research: A Survey of Artificial Intelligence for Scientific Research
Projects: https://ai-4-research.github.io
Code Repository: https://github.com/LightChen233/Awesome-AI4Research
推荐阅读
- • 动手设计AI Agents:(编排、记忆、插件、workflow、协作)
- • DeepSeek R1 + Agent 的下半场
- • 单智能体(Agent):企业员工AI助理
- • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent ”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。