2021 年我的NLP技术应用“巡径”之旅|社区征文

社区征文NLP

我的技术回顾与展望- 2021 年我的NLP技术应用“巡径”之旅


开启文本挖掘的AI探索

随着建筑数字化概念的兴起,我所研究领域之一:建筑设施智能化应用今年来也开始从基础建筑信息化建设向基于人工智能、大数据分析为核心的智能化、数字化场景的进化过程中。在建筑设施智能化数据应用过程中每天都会产生大量文本数据诸如:维保工单、应急指南、维修手册之类文本数据,如果将公司数据类型80%的文本数据进行应用,通过文本向量特征提取、文本实体关系抽取、文本类型识别等自然语言分析实现建筑设施运维AI场景落地是我2021年所开启新的应用领域。关于建筑运维这个传统行业如何应用自然语言NLP技术,实现机器能真正理解人类语言的技术途径,我认为作为产业界由2条技术途径可以考虑,一是,基于开源平台进行深度的开发和定制形成一个符合自己要求的AI应用平台。二是,基于成熟商业化AI平台上端侧应用开发实现企业AI应用的落地。在考察国外的Pytorch、tesorflow和国内PaddlePaddle、Volcengine等AI框架后,我将目标锁定在Volcengine 引擎基础的自然语言处理模块。选择Volcengine引擎的原因是不同于基础科研工作,企业AI应用更强调快速和经济化规模化的部署,而Volcengine 引擎丰富的垂类生态场景应用非常符合产业界AI应用的需求。

与“火山引擎”的知识巡径过程

关于“火山引擎”这条技术路线,说实在的在2021年以前,我还只知道Pytorch、tesorflow 等框架的应用模式。对“火山引擎”技术路线知之甚少。对 “火山引擎” 了解我想是从几次“meetup”开始的,对于“meetup”这样线上交流形式,我个人认为是非常适合初次接触 “火山引擎”小白们的,通过“meetup”我逐步了解“火山引擎”的技术框架、核心算法和前沿应用模式,对我了解 “火山引擎”能做什么有了概念上认知。同样每次“MeetUp”内容都会在官网上发布便于回顾。同样官网上开发社区内容一些业界大咖的文章也非常有启发性,使我对“火山引擎”的知识体系和框架的构建起到很好的引导作用。


1.png

关于企业应用AI的一些感悟

2021年是我踏入AI应用的元年,在这年中我对企业AI应用落地模式有了更深刻的认识,不同与AI学术研究侧重于算法优化和改进,较少考虑产业界AI落地的难点:大规模预训练过程中存在数据量少,数据标注量大; AI产业垂类场景应用案例少;预测模型鲁棒性不够等问题。而火山引擎的云原生平台的生态社区建设模式或将助力产业界 AI 应用落地。

 

关于NLP

  NLP是我AI 应用研究方向,相对于视频、图像、语音AI 应用其难度更大,预训练过程更复杂,目前在企业商用落地的NLP技术难度很大。但我个人还是看好未来NLP的技术发展,从应用上,对于建筑运维领域其在:设备自动故障诊断报告生成、建筑设施维保工单自动分类、建筑运维知识图谱的自动构建、NLP+OCR技术融合形成多模态环境下的建筑数据自动采集上都有着应用场景的需求。从技术上,基于NLP的无监督、半监督、有监督的深度学习,Bert神经网络,图神经网络在NLP方向应用研究相信将是未来研究的前沿,我相信未来围绕NLP技术的AI应用将更能提升技术赋能业务的目标的实现。

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论