【TextIn大模型加速器 + 火山引擎】大测TextIn对52种语言的支持与额外语种的施压

AI解决方案最佳实践技术解析

picture.image

目录

前言

测试图片·多语种场景测评分析

应用技术选型——通用文字识别52种支持语言测试

非官方52种语言的额外语种的施压

效果指标说明·文字识别深度分析

100%解析证据

复制结果功能

总结分析


前言

前两天我看到了个TextIn的活动,在看活动中有这么一条,支持50+中语言,那也就是对50多种语言的翻译是没有问题的,并且还能返回20+种格式,真的的好厉害,我对这点产生了浓厚的兴趣,所以今天我就来实打实的测评一下,好坏都有可能,这是一篇纯理性的测评文输出,希望能对大家产生一定的价值。

picture.image

测试图片·多语种场景测评分析

我找到了官方支持的语种文档,特意的都看了看国家,知道的国家基本都是印欧的,也就是说以印欧语言为主,根据官方的支持文档,我转成了表格,截取图片都放在这里了,这是官方给的支持语言列表,我们根据这个进行具体的测试。

picture.image

应用技术选型——通用文字识别52种支持语言测试

https://www.textin.com/console/dashboard/overview

登录后就直接能进来了,我们需要根据我们的需求来选择功能接口。

我们的需求是将图片中的信息读取出来,那么也就是通用文字识别即可,工作台全部产品处有一个搜索功能,并且下方显示的热门产品中第一个就是通用文字识别,我们直接点击使用这个功能,这个功能可以说为【通用文档解析】。

picture.image

有在线使用,我们直接去测评,这样效率更高。

picture.image

先上传图片,然后等着分析。

这里我随便截取了一部分进行识别,很直接的就能看到效果,都是识别成功的,并且是多语种的同步识别,没有进行拆分,这点就很强大了呢。

picture.image

我这里根据语种源头进行分类:

所属国家 / 地区语言名称语种源头所属国家 / 地区语言名称语种源头
中国简体中文汉藏语系汉语族挪威挪威语印欧语系日耳曼语族
台湾、香港、澳门繁体中文汉藏语系汉语族匈牙利匈牙利语乌拉尔语系芬兰 - 乌戈尔语族
美国、英国、澳大利亚、加拿大、新西兰等英语印欧语系日耳曼语族越南越南语南亚语系孟 - 高棉语族
日本日语日本 - 琉球语系南非南非荷兰语印欧语系日耳曼语族
韩国韩语朝鲜语系芬兰芬兰语乌拉尔语系芬兰 - 乌戈尔语族
法国、比利时、瑞士、加拿大等法语印欧语系罗曼语族丹麦丹麦语印欧语系日耳曼语族
德国、奥地利、瑞士等德语印欧语系日耳曼语族阿尔巴尼亚阿尔巴尼亚语印欧语系阿尔巴尼亚语族
葡萄牙、巴西等葡萄牙语印欧语系罗曼语族西班牙巴斯克地区巴斯克语孤立语系(无归属)
西班牙、墨西哥、阿根廷等西班牙语印欧语系罗曼语族西班牙加泰罗尼亚地区加泰罗尼亚语印欧语系罗曼语族
意大利意大利语印欧语系罗曼语族克罗地亚克罗地亚语印欧语系斯拉夫语族
荷兰荷兰语印欧语系日耳曼语族捷克捷克语印欧语系斯拉夫语族
瑞典瑞典语印欧语系日耳曼语族爱沙尼亚爱沙尼亚语乌拉尔语系芬兰 - 乌戈尔语族
冰岛冰岛语印欧语系日耳曼语族拉脱维亚拉脱维亚语印欧语系波罗的语族
爱尔兰爱尔兰语印欧语系凯尔特语族立陶宛立陶宛语印欧语系波罗的语族
无特定国家拉丁语印欧语系罗曼语族马来西亚、印度尼西亚等马来语南岛语系马来 - 波利尼西亚语族
无特定国家世界语人工构造语(基于罗曼语族)波兰波兰语印欧语系斯拉夫语族
西班牙加利西亚地区加利西亚语印欧语系罗曼语族罗马尼亚罗马尼亚语印欧语系罗曼语族
菲律宾菲律宾语南岛语系马来 - 波利尼西亚语族斯洛伐克斯洛伐克语印欧语系斯拉夫语族
俄罗斯俄语印欧语系斯拉夫语族斯洛文尼亚斯洛文尼亚语印欧语系斯拉夫语族
保加利亚保加利亚语印欧语系斯拉夫语族肯尼亚、坦桑尼亚等斯瓦希里语尼日尔 - 刚果语系班图语族
北马其顿马其顿语印欧语系斯拉夫语族土耳其土耳其语阿尔泰语系突厥语族
乌克兰乌克兰语印欧语系斯拉夫语族英国威尔士威尔士语印欧语系凯尔特语族
塞尔维亚塞尔维亚语印欧语系斯拉夫语族马耳他马耳他语亚非语系闪米特语族
希腊希腊语印欧语系希腊语族塞舌尔、毛里求斯等克里奥尔语混合语系(基于法语等)
亚美尼亚亚美尼亚语印欧语系亚美尼亚语族印度尼西亚印度尼西亚语南岛语系马来 - 波利尼西亚语族
阿塞拜疆阿塞拜疆语阿尔泰语系突厥语族

我总结的看了看,汉语系就是我们周边的国家,其它的基本都属于印欧语系列,中东语系基本不支持所以出现了对应的问题,只要在这52中语言内都是可以正常识别的。

我又再次测试了一些特殊字体,可以看到也都成功的识别并显示了。

picture.image

这就代表能力肯定是没有问题的了,且我测试的是靠后的几种语言。

非官方52种语言的额外语种的施压

下面的两张图片是我从孩子的书上拍的,可以看到有各种各样的语言,反正我是不认识。

但是我看了一下大致的国家都是中东那边的。

picture.image

picture.image

那么用TextIn来看看是否能用一些不认识的语言呢。

picture.image

分析结果大小字都进行了识别,好多非52种支持语言的不认识的内容并没有给出对应的字符显示,然后我看到有【新语种体验】的选项,我进去试试。

picture.image

看到了有两种语言支持,不是获取所有的语言。可能是我们选择有问题,我们看看有没有其他对应的功能选项,看来没有不认识语言的识别,我们继续强行试试。

picture.image

我接下来单独获取一部分文字来判断一下。

picture.image

picture.image

看来的确得在识别库里,其它的语种不行了。

我们再试试其它功能。

picture.image

虽然没有对这些语言进行支持,可以不妨碍我提交一个工单,希望产品越做越好。

picture.image

效果指标说明·文字识别深度分析

虽然没有给句具体的显示,但是我们也可以强行的深入分析一下看看。

picture.image

通过深入分析我了解到:

  1. 文字识别范围精准
  2. 文字进行100%读取
  3. 图片转文本失败由于无法正常显示对应语言的文字。

总结一下,我觉得应该是自己的问题,毕竟我电脑没有安装那么多语言包,所以想打印也无法打印出来,但是我又想,毕竟是Web返回回来的,应该在服务器上是支持这些多语种的,但是依然没有正常显示,所以我就有点凌乱了。

100%解析证据

我这里在韩语这里找到了100%解析的证据,一点没错,说明是很OK的,识别上没有任何问题,但是这里应该加上一个翻译功能,类似与使用QQ的截图功能,有一个翻译的功能,如果有这种多语言翻译的能力,这样的接口肯定超级好用啊。

picture.image

复制结果功能

效果大致如图,因为复制出来的内容是根据选择对应的返回结果来返回的,内容太多,我就不直接粘贴了,可从图片上看到。

picture.image

选择方法:

picture.image

总结分析

本次测评可能比较偏激,我针对的是整体的多种语言进分析,可以理解到难度超级的大,但是从整体的表现上来看,TextIn的技术团队能将所有的文本识别出来已经很强大了,对应的模型库如果是全语种文档的效果肯定会非常好,我们在效果指标说明中专门的解释了一下,并且对对应的语种进行了标注,可以清晰的看到进行了完整的解析,社会在发展,技术在迭代,相信不远的未来TextIn会支持更多的语种以及同步翻译的功能。


有想法测试一下的快来感受吧:https://www.textin.com/

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论