决赛落地,FinGLM 开源 | 我们致力于打造有含「金」量的开源项目

技术

picture.image

ChatGLM 金融大模型挑战赛

决赛 & 开源

SMP 2023 ChatGLM 金融大模型挑战赛」于 9 月 23 日落下帷幕,然而这仅仅是

FinGLM 项目 的开始,我们将:

  • 把比赛转为学习赛,任何人都可以学习使用
  • 把比赛相关数据全部开源,供学习、研究使用
  • 把参与复赛和决赛的部分项目开源,供落地使用
  • 开发相关课程,供学习使用
  • 长期维护优化 FinGLM 项目,为大家提供便捷方案

SMP 2023 ChatGLM金融大模型挑战赛(The Evaluation of Large Model of Finance Technology,SMP2023-ELMFT)由中国中文信息学会社会媒体处理专委会主办,智谱 AI、安硕信息、阿里云、魔搭社区、北京交通大学联合承办,天池平台为指定赛事平台。

第十一届全国社会媒体处理大会(SMP 2023)将于2023年11月在合肥召开。

SMP 大会专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,SMP 2023 由中国中文信息学会社会媒体处理专委会主办,安徽大学、中国科学技术大学和合肥工业大学联合承办。


决赛落地

自去年 12 月 ChatGPT 发布以来,大模型在各行各业的应用迅速扩展,尤其在金融领域,一直走在大模型技术的前列。然而,虽然当前的 AI 系统在文本对话上已经取得了显著的进步,但在更细粒度、更具挑战性的金融场景交互上,其性能仍有待提高。

为此,在中国中文信息学会社会媒体处理专委会(SMP)的指导下,智谱 AI、安硕信息、阿里云、魔搭社区以及北京交通大学共同提出:能否在现有开源小模型的基础上进行能力增强,通过微调大模型、大小模型协同、向量数据库等先进方法,提升 AI 模型的性能?

此外,我们也希望能为大家提供一个大模型技术 PK 的平台。

因此在 7 月组织并公开了「SMP 2023 ChatGLM 金融大模型挑战赛」。我们希望这是一场实实在在的比赛,能让大家在技术上真真正正地卷一卷。

为此,我们整理了 70G、11588 份上市公司年报,并人工标注了 10000 条评测数据。为了提高大家的积极性,我们拿出了一个 ChatGLM-12B 模型授权,40w 的算力,以及 10 万元现金作为奖励。阿里云还给所有的参赛选手提供了算力支持。

picture.image

我们很荣幸,本次比赛发布之后,受到金融领域和大模型领域许多开发者的热烈关注。在约 20 天的初赛阶段,我们吸引了超过 2000 个团队报名参赛,并收到了 298 个有效项目。

picture.image

经过严格筛选,我们选出了 38 个优秀团队进入复赛。为了推动大家在大模型技术上取得更高的成就,我们在复赛阶段举办了 A、B、C 三轮评测,使得参赛选手的分数从最高 75 分提升至有 15 支队伍超过 80 分。最终,共有 9 支队伍成功晋级决赛。

picture.image

9 月 23 日,我们举办了决赛答辩,并评选出了获奖团队。具体获奖名单如下:

picture.image

恭喜各个获奖团队。

picture.image

本次决赛答辩,受到社会各界人士的广泛关注。我们把决赛答辩相关资料公开给大家,供大家参考。

视频回放:

https://space.bilibili.com/3493270982232856

汇报PPT:

https://pan.baidu.com/s/1VkC7OoAxMBWwDrIvHWrDyQ?pwd=adzd

提取码: adzd

picture.image

FinGLM 开源计划

比赛并非我们的终点。

我们希望构建一个开放的、公益的、持久的金融大模型项目,利用开源开放来促进「AI+金融」领域的发展。

我们没有宏大的口号,以下是我们的行动:

1. 赛事转型

比赛将在天池平台转变为持续性学习赛,鼓励更多人参与和贡献。

2. 数据开源

我们将把比赛当中涉及到的所有数据,包括 年报数据、评测数据、评测代码等全部开源 ,供大家学习、研究使用。后续我们也将根据项目需求,持续迭代更新数据。

3. 方案/代码/模型开源

经过征询同意,馒头科技、南哪都队、结婚买房代代韭菜、nsddd、Chatglm反卷总局、小打小闹、东北大土豆、安硕硕眼探企等团队的 项目方案、代码和模型将完全开源,加入到 FinGLM 项目当中。

开源地址——

Github:https://github.com/MetaGLM/FinGLM

魔搭社区:https://modelscope.cn/organization/finglm

以上团队成员将共同维护 FinGLM项目,确保项目持续迭代。我们也欢迎更多团队来共同贡献开源 —— 问题和方案。

4. 学习教程

基于FinGLM项目的开发,我们将整合并制作以下(包含且不限于)学习教程:

  • 数据预处理教程
  • 数据库使用教程
  • GLM的使用教程
  • Prompt编写教程
  • 模型微调数据准备
  • 模型微调技巧和步骤
  • 全流程落地

5. 项目资金池

为了维持项目的健康发展,部分项目组织者(个人和企业) 提供 10 万元作为开源项目资金池,以及提供项目算力、数据和模型支持。

我们欢迎所有受益于本项目的个人或单位来赞助本项目,包括且不限于以上内容。欢迎联系我们。

6. 开放申请,严格审核

FinGLM 开源项目出于完全公益目的,欢迎所有开发者申请加入,当然我们会进行严格审核。

相关联系和申请方式,请参考项目 Repo:https://github.com/MetaGLM/FinGLM


37
0
0
0
关于作者
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论