默认搜索
当前位置:主页 > 经济观察 > 正文
  • 持续发力AI领域 搜狗刷新ICDAR2019榜单三项新记录
  • 日期:2020-11-26   点击:次   字体:[ ]

  11月8日电 近日,搜狗在OCR识别权威比赛ICDAR2019挑战中,刷新了任意形状文字识别(ArT)中检测、识别、端到端三项任务的新记录,充分体现了搜狗在文字识别领域的领先优势。

  ICDAR国际文档分析与识别比赛是图像领域文本检测与识别的权威赛事,备受业界关注。ICDAR2019-ArT是在2019年提出的新任务,因其任务的高挑战性,吸引了旷视、华为、阿里等传统强队参与。与往年的赛事任务不同的是,2019年的数据集旨在推动任意形状文字检测和识别技术的发展与创新,因此数据层面聚焦在任意形状,特别是不规则场景文字的检测与识别,这就要求算法框架具有更高的鲁棒性。而且,该数据集为自然场景图像,场景类型覆盖面大、背景复杂,同时存在大量非规则形状文字,是目前业界最大的任意形状场景文字数据集,复杂性和难度更大。

  在本次任务中,搜狗采用了基于实例分割的文字检测方法,训练及测试过程中引入了掩码融合、打分机制优化、多尺度等技术。针对文字识别,搜狗以主流的Encoder-Decoder技术作为框架,以SE-ResNet作为Encoder骨干网络,引入薄板样条插值算法(TPS)和通道注意力机制(Channel-Attention),创新性地将残差思想引入多层Bi-LSTM中,不同层的LSTM特征通过残差连接进行特征融合,增强了模型的鲁棒性。在Decoder模块中,采用注意力解码机制实现对特征解码识别。

  文字检测与识别技术在实际生活中有广泛的应用,如扫描录入、拍照搜题、拍照翻译、路标识别等。搜狗OCR技术在众多垂直领域落地,满足着广大用户多样化、个性化需求,帮助用户提升输入的效率,在搜狗翻译及输入法等产品中得到用户的广泛使用和好评,并同时为vivo等合作伙伴赋能。

  搜狗此次刷新ICDAR2019-ART榜单的成绩,是其在OCR领域持续耕耘的结果,也是在AI领域的能力体现。未来,搜狗还将不断扩展技术成果的落地场景,带给用户更多切实便利及惊喜体验。
区块网


------------------------随机阅读--------------------------------------------------------------------------------------------------------------------------------------------------
  • 发改委主任何立峰:今年我国经济总量将超80万亿
  • 青海—河南±800千伏特高压直流工程开工
  • 7月试点商业健康险个税税前扣除,最高全年可少缴千元
  • 串起万里黄金水道的新使命——长江经济带三大城市群的“对话”
  • “一带一路”撬动产业新支点 万亿蛋糕待分享
  • 快速理赔 诠释生命速度
  • 大事件:不老奇迹滋补蒸鸡再爆全城 ——金秋养生季 半价吃鸡 震撼来袭
  • 山东省人民政府与上海证券交易所签署战略合作备忘录
  • 巴西金融市场下调今年经济增长预期
  • 首列沃尔沃汽车整车进口班列抵达中国最大陆路口岸
    --------------------TAG热门标签-------------------------------------------------------------------------------------------------------------------------------------------------
    血战 埃塞俄比亚 题为 冲突 以外 狱警 勃起 澳大利亚队 玻璃门 走私 三石 害处 环顾 东莞市 叹息 折起 反贪 意义 荒诞 忌日 金州 妻女 梦露 吹箫 古天乐 夜游 孕育 整整 独角 杜伊 爆冷 音乐奖 肌肉 温婉 深度 骨子 喂食 牧羊人 不合理 私生 天籁 查尔顿 管理处 利人 之中 网上中介 无偿献血 管理办法 首先 凝聚力 运算 球员 中人 男女 望江 刺猬 玛利亚 门楣 著作权法 健身器材 里奥 伊莎贝拉 天音 西华 植入 公投 游记 建行 换取 校园 毫无 招标 晚期 崛起 挂号 新进 姗姗 丰盛 新书 废塑料 燃料油 猛兽 报恩 巩义市 壮观 发怒 综合治理 摄影报道 喜剧之王 南路 指挥员 合肥百货 新风 家族