CCF大数据与计算智能大赛 - 文章 - 开发者社区

CCF大数据与计算智能大赛（CCF Big Data & Computing Intelligence Contest，简称CCF BDCI）由中国计算机学会于2013年创办，迄今已成功举办八届，累计吸引全球1500余所高校、1800家企事业单位及80余所科研机构的12万余人参与，已成为中国大数据与人工智能领域最具影响力的活动之一，是中国大数据综合赛事第一品牌。

伴随着数智化的持续加深，网络安全、数据安全风险遍布于所有场景之中，包括工业生产、能源、交通、医疗、金融，以及城市和社会治理，安全被重新定义为“大安全”。面向未来安全的不确定性、复杂性和脆弱性，不仅需要发挥数据、智能、网络的基础作用，还需要广泛协作、开放创新。

为此，中国计算机学会大数据与计算智能大赛（CCF-BDCI）组委会、大数据协同安全技术国家工程实验室，联合首度开设大安全领域的专题赛道——“CCF大数据与计算智能大赛·数字安全公开赛”。赛道以“悬赏未来安全最优解”为主题，提出人工智能安全、数据安全、工业互联网安全等数字化场景中的新型风险问题，设置数据算法赛题，促进安全数据开源共享，广邀各路英雄揭榜挂帅，探索应对“大安全”风险的最优解！

大赛所产生的公开数据集、优秀解题思路、相关学术成果将同步沉淀在安全大脑国家新一代人工智能开放创新平台上。

基于人工智能的恶意软件家族分类

赛程规划：
报名开启 ：2021年8月19日选手可登录大赛官网报名参赛
初赛阶段：2021年8月23日10:00:00-9月29日23:59:59 选手下载数据、提交作品，每日最多提交2次作品（9月27日23:59:59截止报名组队）
提交代码复现材料：10月8日23:59:59前
入围决赛资格审核：10月9日-10月22日
发布决赛名单：10月24日
决赛答辩：11月6日（具体时间地点另行通知）

赛题背景：
近年来，各种勒索软件、木马、病毒、恶意挖矿程序等多种形式恶意软件不断涌现，恶意软件作者为逃避检测，在恶意软件组件中引入了多态性。虽然属于同一恶意软件“家族”的恶意文件具有相同形式的恶意行为，但由于编写者使用了各种策略不断修改和/或混淆，原本隶属同一家族的文件看起来像许多不同的文件，给检测识别的准确性带来了高度挑战。为提升海量恶意软件分析的高效性，我们需要对恶意软件的家族进行区分。

赛题任务 ：
本赛题中，参赛团队将设计算法对恶意软件进行识别和家族分类，选手需要通过分析训练集中各家族恶意软件的特点，构建AI模型，对测试集中各个家族的恶意软件进行区分。

比赛链接：https://www.datafountain.cn/competitions/507

面向黑灰产治理的恶意短信变体字还原

赛程规划 ：
报名开启：2021年8月19日选手可登录大赛官网报名参赛
初赛A榜：2021年8月23日10:00:00-9月27日23:59:59 此阶段可报名、组队，选手下载数据、提交作品，每日最多提交2次作品；此阶段可报名、组队
初赛B榜：2021年9月29日（10:00:00–23:59:59）选手最多提交2次作品
提交代码复现材料：10月8日23:59:59前
入围决赛资格审核：10月9日-10月22日
发布决赛名单：10月24日
决赛答辩：11月6日（具体时间地点另行通知）

赛题背景 ：
恶意短信一直是黑灰产引流的重要渠道，信息中携带的微信号、QQ号、网址更是非法信息传播的主要入口，业界通常做法是利用违法或不良信息检测引擎在手机终端实现自动拦截。然而不法分子为逃避检测，通过使用变体字发送恶意短信绕过拦截规则的情况越来越多。由于变体字变换方式多，变换速度快，单纯通过规则进行变体词发现的效果有限，配套人工审核成本高且具有滞后性。如何精准和高效地还原变体字文本，提高非法信息的抽取能力，以及新型变体字还原的泛化性和时效性，就成为了解决这一难题的“关键之钥”。

赛题任务 ：
参赛团队通过设计算法，实现对恶意短信中变体字的还原。参赛团队需要对训练集中的短信样本进行分析，采用深度学习建模的方法将测试集中新出现的短信变体字还原为正常信息文本，即不含有变体字、干扰字符，所有变体字部分应使用常见简体汉字、字符来表示，同时需要保证不包含变体字的正常文本不受影响。

比赛链接：https://www.datafountain.cn/competitions/508

工业安全生产环境违规使用手机的识别

赛程规划 ：
报名开启：2021年8月19日选手可登录大赛官网报名参赛
初赛A榜：2021年8月23日10:00:00-9月27日23:59:59 此阶段可报名、组队，选手下载数据、提交作品，每日最多提交2次作品
初赛B榜: 2021年9月29日（10:00:00–23:59:59）选手最多提交2次作品
提交代码复现材料：10月8日23:59:59前
入围决赛资格审核：10月9日-10月22日
发布决赛名单：10月24日
决赛答辩：11月6日（具体时间地点另行通知）

赛题背景 ：
现今，手机已成为人们生活和工作的必需品。但在工业生产环境中，工作人员违规使用手机，屡屡造成安全生产事故，甚至引起人员伤亡。因此，基于工业安全生产和员工人身安全考虑，越来越多的工厂建立起员工手机使用管理规范，限制或禁止员工在生产过程中使用手机。目前，传统的管理手段有两种：一是禁止将手机带入厂区，二是人员监督核查。两种办法均会耗费大量人力，且无法高效、准确地发现员工违规使用手机的情况。如果引入人工智能技术，对设置在生产工区内摄像头采集的视频图片进行分析，快速、准确识别员工违规使用手机的行为，并进行提示和规范，可有效加强安全生产监管，实现降本、提质、增效，加速数字化转型进程。

赛题任务 ：
由于工业场景特性，存在目标过小、物体区分度不明显、周围背景复杂等问题，给正确识别带来较大的挑战，目前，业界平均识别正确率维持在80%左右，存在进一步优化和提升的空间。参赛团队需要结合提供的数据训练集，识别判断图片上的人物是否存在使用手机行为，提高识别的正确率。方法不限，分类方法、目标检测方法等均可。
1.问题定义、举例说明
图片数据为人体区域数据，每个图片判断是否存在使用手机行为。图片示例如下。

2.难点分析
实际工厂环境中，各种机器或者类手机办公用品，在与手部重叠时，AI算法会很难分辨是手机还是其他物体，这也是本任务的挑战之一。

谢谢大家观看，如果有学习或者喜欢数据分析的朋友可以通过下面的方式加入群里一起交流学习。 q q 群号 : 7 6 3 9 8 9 3 5 8

扫码关注我们

picture.image

C h a l l e n g e H u b

picture.image .jpg")

微信公众号

picture.image

微信交流群