法律行业大模型交流观点整理

火山方舟向量数据库大模型

写在前面

大家好,我是刘聪NLP。

今天给大家带来一篇《法律行业大模型交流观点》,来自知乎@锦瑟无端(已授权)。本文整理了与媒体朋友对法律大模型进行深入交流后的相关观点。


          
知乎原文:https://zhuanlan.zhihu.com/p/669509425  

      

观点一:法律领域的大模型本质是复杂决策,而非仅仅是开放式对话模型

  • 需要具备丰富的专业知识:法学知识、各案由下的行业知识、审判流程和法律法规制度等;
  • 需要推断各类复杂案件场景,如在证据三性认定中进行合法性主体合法性、证据形式和证据流程的认定;
  • 需要具备预见未知事物的能力,例如发现新案件的能力;
  • 需要具备综合任务的拆解能力,类似于项目经理,将目标分解为每个里程碑,将法律工作划分为各个阶段;
  • 需要具备宏观态势的研判能力,案件分析需要从整体考虑,涉及原告证据、被告证据、法律规定等各个方面,以实现风险预判和提醒。

观点二:法律领域的应用方向包括律师行业、司法、法院、检察部门和当事人应用

  • 面向核心的内容,例如法院、律师办案等,提供全流程办案辅助、证据交换分析、法官助理等服务,自动化操作审限机器人以及智能统一的门户,以对话模式进行交流;
  • 在管理和监督方面,包括审务督察和检查监督等方面的应用;
  • 在日常办公方面,包括各类通知的智能应用和各类专业文稿的初步撰写;
  • 在智能服务方面,例如自动分析案件事实、分析审查要点等应用,可以协助生成基础律师、基础书记员和法官助理等工作内容,以减轻人力外包的压力。

这个地方比较水,其实探讨的更多的是做产品要充分考虑宏观规划、市场竞争、自己的优势,不要忙的训练个模型。

观点三:法律行业的数据要素价值

  • 目前司法行业有结构化的数据标准,初步规定了办案关键数据和交换数据的内容,不过在法律知识方面有缺失。
  • 数据标签体系建设:法律数据标签体系包含结构化内容、法律方面内容、分析类的内容。
  • 法律行业的数据后期可探讨数据要素化,进入数据要素流程等研究。

观点四:提升大模型在法律行业的行业认知能力的方法

  • 设计合理的模型架构,构建大模型、专有模型、小模型的融合智慧模型架构;
  • 大模型结合知识图谱技术,应用在大模型的学习阶段和推理阶段;
  • 结合外部知识库,适用于一定精确下的应用场景;
  • 结合现有应用系统,实现精准类应用场景;
  • 研究提示工程,这个是目前较快实现业务的技术手段。

观点五:大模型应用落地对企业的挑战

  • 数据层面:有效的数据内容是非常重要的,它可以提供大模型所需的基础知识和信息。在法律领域,结构化的法律数据、案例数据库、法律标准和规范等都可以作为大模型的数据来源,以支持其决策和分析能力的提升,高质量数据的收集是目前挑战性的高问题。
  • 技术层面:大模型的是一种新的应用范式需要不断探索和创新,目前技术的迭代速度很快,在推理加速、训练加速、agent、各类技术框架等变化很快,对研究和跟进提出很高要求。
  • 人员层面:目前大模型相关的技术人员相对稀缺,这给大模型的应用带来了一定的不确定性。
  • 模型应用开发体系建设:建立一个完善的开发体系也是挑战之一。大模型应用的设计、开发、训练、测试和部署流程的规范化,以及合理的模型更新和维护机制,如何解决与传统软件开发流程不同的方式,这些都要探索。
  • 应用创新层面:大模型的应用需要找到合适的爆点,结合用户真正的痛点来进行创新。可以探索更多的应用场景,目前大部分在原有应用做加法尚未有爆点应用。

观点六:法律大模型应该具备的特点及能力

  • 法律大模型具备语言理解、文书生成、知识问答、逻辑推理这四个方面能力。
  • 语言理解能力主要包括法律文书检查、法律要素抽取、文书摘要和法律案例分析。
  • 文本生成能力主要包括辅助法律文书和文件的撰写、生成合同/协议和法律文书、个性化定制法律文件、辅助法律研究和文献撰写,以及生成法律报告和分析
  • 知识问答能力主要包括高质量的法律条款解释、快速回答法律问题、大规模法律知识库的整合以及持续更新和学习能力。
  • 逻辑推理能力主要包括法律风险评估、法律政策分析和法律改革评估、证据链分析、法律论证和案情分析,以及司法决策推理。

观点七:大模型系统项目实施观点

  • 经济性原则:大模型的实施应该考虑成本效益,力求在硬件设备上实现高性能和低成本。例如,使用消费级显卡进行推理可以降低成本。
  • 构建合理的训练体系:由于涉及私有数据的问题,构建合理的训练体系非常重要。需要遵循数据隐私和安全的原则,确保数据的合法性和保密性,并采取适当的数据脱敏和匿名化措施。
  • 应用模式多样性:大模型的应用可以多样化,可以作为工具类软件提供给用户使用,也可以提供特定能力供其他系统接入和调用。通过多样的应用模式,可以满足不同用户和场景的需求。
  • 部署方式灵活:大模型可以根据业务类型和需求采取不同的部署方式,如私有化部署或云部署。私有化部署可以保护数据的安全和隐私,而云部署可以提供灵活的计算资源和扩展能力。

观点八:研究内容不等于产品

  • 目前做了刑期预测、要素提取、证据分析、案件事实分析、审查要点分析、法律文书检查、文书摘要、法律问答等方面的发模型应用研究,不等于都要用到现有产品中,替换现有产品是有代价的。在产品设计中需要按照产品的理念去做设计,考虑产品用户定位、能够解决问题等,比如在案件事实分析等可以考虑用在服务方面,做做实习或初级书记员/法官助理等方面的工作,而不要一定给法官应用,做到有效使用提高他们的生产力,做到工作效率提升。使用法律大模型应该保持相对谨慎的态度不要一切All In 。

观点九:业务链模式提出

  • 在法律大模型应用方面可基于法律业务链模式进行,将法律问题或案件处理过程分解为多个环节或阶段,并按照逻辑顺序将这些环节或阶段连接起来的一种思维模式。在法律业务链中,每个环节或阶段对应着具体的法律任务或功能,其输出将作为下一个环节或阶段的输入,以实现整个法律问题的处理和解决。以案件事实要素分析需要从何事、何时、何地、何情、何故、何物、何人分析来构成了一个完整的案件事实,基于这种模式构建一个业务链,使用Agent来完成业务链应用。(感觉最近Agent研究有点变味呢。)

写在最后

我们对大模型的态度是:研究是认真的负责任的,拥抱实用不迷信。

欢迎多多关注公众号「NLP工作站」,欢迎加入交流群,有问题的朋友也欢迎加我微信「logCong」私聊,交个朋友吧,一起学习,一起进步。我们的口号是“生命不止,学习不停”。

PS:新书已出《ChatGPT原理与实战》,欢迎购买。

往期推荐:

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动客户端性能优化最佳实践
在用户日益增长、需求不断迭代的背景下,如何保证 APP 发布的稳定性和用户良好的使用体验?本次分享将结合字节跳动内部应用的实践案例,介绍应用性能优化的更多方向,以及 APM 团队对应用性能监控建设的探索和思考。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论