NeurIPS 2025！采样成本降 50%+ 准确率提升！南大等团队的 RPC 方法刷新 LLM - 文章 - 开发者社区

NeurIPS 2025！采样成本降 50%+ 准确率提升！南大等团队的 RPC 方法刷新 LLM 推理上限

picture.image

论文标题：A Theoretical Study on Bridging Internal Probability and Self-Consistency for LLM Reasoning

作者团队：南京大学、瑞士苏黎世联邦理工学院

发布时间：2025 年 10 月 17 日

✅Lab4AI 平台提供 AI 导读和 AI 翻译等工具，辅助论文阅读。您还可以投稿复现这篇论文~

⭐ 核心贡献

理论框架：首次提出用于分析 LLM 推理中采样式测试时缩放方法的理论框架，将推理误差分解为估计误差和模型误差。
方法创新：提出 RPC 方法，融合自洽性和内部概率的优势，通过 Perplexity Consistency 和 Reasoning Pruning 组件解决现有方法的局限性。
实证验证：在多个基准数据集上验证 RPC 的有效性，显著降低采样成本并提升推理性能。

误差分解理论：将推理误差分解为估计误差（与采样规模和置信度估计策略相关）和模型误差（由 LLM 固有推理能力决定）。
现有方法分析：自洽性估计误差收敛慢（线性），困惑度模型误差大且估计误差优势在低概率路径下退化。
RPC 方法设计：
- Perplexity Consistency：将 LLM 内部概率融入自洽性框架，以指数级速率降低估计误差。
- Reasoning Pruning：通过混合威布尔分布建模概率分布，自动过滤低概率路径，防止估计误差退化。

⭐ 研究结果