ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形状场景文字识别)国际学术竞赛将于2019年3月1日正式开赛。
ICDAR (International Conference on Document Analysis and Recognition) 是全球文档图像分析识别领域公认的权威学术会议,从1991年起每两年召开一次,今年是第15届,将于2019年9月20-25日在澳大利亚悉尼市举行。
自2003 年ICDAR 设立“Robust Reading Competitions”系列学术竞赛以来,该竞赛就成了评测和检验自然场景/网络图片文本自动提取与智能识别最新技术研究进展的重要国际赛事及标准,竞赛中的诸多方法对光学字符识别(Optical Character Recognition,OCR)技术发展具有强大推动力。场景文字识别具有广泛应用场景,例如:拍照翻译、图像检索、街景地标识别、室外场景理解等。但由于自然场景图像中的文字字体多样、排列不规范、形状及色彩多变、背景复杂、图像对文字的干扰大等等因素,使得场景文字检测与识别仍然是计算机视觉及文档图像分析与识别领域中一个极具挑战的研究热点问题。高技术难度、高实际应用性,也使该系列竞赛受到科研院校、科技公司的广泛关注,至今已有119个国家的7821多支队伍参与。
本次ICDAR 2019-ArT国际学术竞赛将聚焦任意形状特别是不规则场景文字的检测与识别,旨在进一步推动自然场景下任意形状文字识别算法与技术突破。
ICDAR2019-ArT 数据集数据集由 Total-Text、SCUT-CTW 1500和百度非规则文字数据集组成,累计新增7千张任意形状数据,总计10176张,是目前业界最大的任意形状场景文字数据集。
现有 ICDAR 文字数据集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)大多只包含水平、四边形文字框等规则文字标注,ICDAR2019-ArT 数据集中每张图像至少含有一个非规则形状文字(irregular text instances),并采用多边形多点对任意形状文字包围框进行精确标注(如下图所示)。
▲ICDAR2019-ArT 部分数据示例
本次大赛设置如下三个任务(选手可任意选一个任务参赛、也可同时参加三个比赛任务):
任务1:文字检测
任务2:文字识别
任务3:端到端文字识别
2019年2月21日- 3月31日:注册报名通道开放
2019年2月25日:竞赛官网完整正式版上线
2019年3月1日:竞赛正式开赛;训练集开放下载
2019年4月9日:报名截止;第一批测试数据(2277张)开放下载;结果提交开放;竞赛方法描述报告(1页左右)提交开放
2019年4月20日:第二批测试数据(2296张)开放下载
2019年4月30日:结果提交截止
2019年5月10日:竞赛方法描述报告提交截止
2019年9月20-25日:竞赛结果宣布
1. 大赛面向全球开放,ICDAR 2019-ArT所有主办方的相关人员禁止参赛。
2. 大赛以组队或个人形式报名参赛。
3. 任何作弊行为会被取消参赛资格,包括:提交手工标注结果,利用测试数据标注后训练模型,虚假信息报名,比赛方法描述中有虚假内容。
详细见竞赛官网http://rrc.cvc.uab.es/?ch=14,或扫描如下二维码:
任务1(文字检测)奖金:
· 冠军:奖金 $1700.00 美元
· 亚军:奖金 $800.00 美元
· 季军:奖金 $400.00 美元
任务2(端到端文字识别)奖金:
· 冠军:奖金 $1700.00 美元
· 亚军:奖金 $800.00 美元
· 季军:奖金 $400.00 美元
任务3(端到端文字识别)奖金:
· 冠军:奖金 $1700.00 美元
· 亚军:奖金 $800.00 美元
· 季军:奖金 $400.00 美元
百度
马来亚大学
华南理工大学
西班牙巴塞罗那自治大学计算机视觉中心
中国图象图形学学会文档图像分析与识别专委会(CSIG-DIAR)
联系客服