持续发力AI领域搜狗刷新ICDAR2019榜单三项新记录_江西萍乡网

当前位置：主页 > 经济观察 > 正文

持续发力AI领域搜狗刷新ICDAR2019榜单三项新记录
日期：2020-11-26 点击：次 字体：[ 大中小 ]

　　11月8日电近日，搜狗在OCR识别权威比赛ICDAR2019挑战中，刷新了任意形状文字识别(ArT)中检测、识别、端到端三项任务的新记录，充分体现了搜狗在文字识别领域的领先优势。

　　ICDAR国际文档分析与识别比赛是图像领域文本检测与识别的权威赛事，备受业界关注。ICDAR2019-ArT是在2019年提出的新任务，因其任务的高挑战性，吸引了旷视、华为、阿里等传统强队参与。与往年的赛事任务不同的是，2019年的数据集旨在推动任意形状文字检测和识别技术的发展与创新，因此数据层面聚焦在任意形状，特别是不规则场景文字的检测与识别，这就要求算法框架具有更高的鲁棒性。而且，该数据集为自然场景图像，场景类型覆盖面大、背景复杂，同时存在大量非规则形状文字，是目前业界最大的任意形状场景文字数据集，复杂性和难度更大。

　　在本次任务中，搜狗采用了基于实例分割的文字检测方法，训练及测试过程中引入了掩码融合、打分机制优化、多尺度等技术。针对文字识别，搜狗以主流的Encoder-Decoder技术作为框架，以SE-ResNet作为Encoder骨干网络，引入薄板样条插值算法(TPS)和通道注意力机制(Channel-Attention)，创新性地将残差思想引入多层Bi-LSTM中，不同层的LSTM特征通过残差连接进行特征融合，增强了模型的鲁棒性。在Decoder模块中，采用注意力解码机制实现对特征解码识别。

　　文字检测与识别技术在实际生活中有广泛的应用，如扫描录入、拍照搜题、拍照翻译、路标识别等。搜狗OCR技术在众多垂直领域落地，满足着广大用户多样化、个性化需求，帮助用户提升输入的效率，在搜狗翻译及输入法等产品中得到用户的广泛使用和好评，并同时为vivo等合作伙伴赋能。

　　搜狗此次刷新ICDAR2019-ART榜单的成绩，是其在OCR领域持续耕耘的结果，也是在AI领域的能力体现。未来，搜狗还将不断扩展技术成果的落地场景，带给用户更多切实便利及惊喜体验。
区块网

------------------------随机阅读--------------------------------------------------------------------------------------------------------------------------------------------------

发改委主任何立峰：今年我国经济总量将超80万亿

青海—河南±800千伏特高压直流工程开工

7月试点商业健康险个税税前扣除,最高全年可少缴千元

串起万里黄金水道的新使命——长江经济带三大城市群的“对话”

“一带一路”撬动产业新支点万亿蛋糕待分享

快速理赔诠释生命速度

大事件：不老奇迹滋补蒸鸡再爆全城 ——金秋养生季半价吃鸡震撼来袭

山东省人民政府与上海证券交易所签署战略合作备忘录

巴西金融市场下调今年经济增长预期

首列沃尔沃汽车整车进口班列抵达中国最大陆路口岸