Warning: copy(): open_basedir restriction in effect. File() is not within the allowed path(s): (/www/wwwroot/hongsong.cn/:/tmp/) in /www/wwwroot/hongsong.cn/caches/configs/system.php on line 61
手写识别发展背景与应用
近年来应用于移动终端的“手写识别”技术,其原理是将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码。手写识别技术已经应用到到我们的日常生活中了,也应用到了很多的行业,对于这些行业提高了工作效率。

手写识别发展背景与应用


20世纪60年代,IBM开始研究印刷体汉字的模式识别。1996年,Casey和Nag通过模板匹配方法成功识别了1000个印刷体汉字,并在世界范围内开展了汉字识别工作。正是在这个时候,研究界也掀起了汉字识别的高潮。
 

由于汉字在日语中占有一定的地位,手写汉字识别(HCCR)最早是由日本人尝试研究的,80年代,中国就开始了对手书写汉字的研究,因为汉语作为我们的母语,汉字在我国广泛使用,主要是对汉字的种类、内涵、构词原则等国内情况比较深入,所以关于手写体汉字识别的进一步研究主要集中在国内。
 

由于数据采集方法的不同,手写体汉字识别可分为脱机手写体汉字识别和联机手写体汉字识别。联机手写汉字识别处理的手写文本是作者通过物理设备(如数码笔、数字平板或触摸屏)在线书写获得的文本信号,并通过定时采样将书写轨迹输入计算机。然而,脱机手写文本识别所处理的手写文本是由扫描仪或相机等图像采集设备采集的手写文本的二维图像。
 

由于识别对象的不同,这两种手写体识别技术所采用的方法和策略也不同。前者的识别对象是一系列按时间顺序采样的点信息,而后者则是丢失了笔画顺序信息的二维像素信息,由于没有笔画顺序信息,而在不同的光线下,由于光扫描设备的条件、分辨率、书写纸张等条件下,数字化会带来一定的噪声干扰,一般来说,脱机手写体字符识别比联机手写体字符识别更为困难。

 

手写体汉字识别是一个具有挑战性的模式识别和机器学习问题,主要表现在:

1)书写风格随意、不规则,不能满足印刷要求;

2)汉字层次复杂多变;

3)许多汉字外观相似,容易混淆;

4)需要大量的训练数据,但难以采集,特别是随机的、非约束性的笔迹,使得相应的数据库建设显得不足。
 

可见,手写体汉字识别还有很大的改进空间,需要综合各种技术来增加训练样本数据,提高识别率。


以上就是手写文字识别的基本背景,当然前我们的手写体识别技术可以应用于哪些行业呢?接下来看一看。
 

一、可用于教育行业,批量批改作业
 

手写识别可以用于批量批改作业,现在已经有一些软件可以做到了,比如翌学就是比较成功的一个例子。翌学是以教师为核心,帮助老师减负、为学校增效为出发点的一款面向学校教师及学生的智慧服务SaaS平台。

利用手写识别系统帮助老师减清负担,为学校增高了效率,帮助教育事业的改革起到了一定的作用。
 

二、手写识别在大规模数据统计中的应用:
 

在大规模的数据统计中(如:行业年检、人口普查等),需要投入大量的数据,以前完全是手工输入,需要耗费大量的人力物力。近年来,

在这类工作中采用OCR技术已成为一种趋势。

因为在这个应用程序中,数据输入是集中组织的,所以通常可以通过

专门设计表格,并对书写施加限制,以便于机器自动识别。目前国内大部分实际系统都要求用户按照规定的规格填写。此外,这些系统经常被采用适当的用户界面对识别结果进行全面检查,最终确保结果正确。可以由此可见,这是一种比较容易应用的,对核心算法的识别要求比较低,目前是国内许多单位应用开发热点。
 

三、手写数字识别在财务、税务、金融领域的应用:
 

财务、税务、金融是手写识别的另一个有希望的领域。随着我国经济的的快速发展,越来越多的财务报表、税务报表、支票、付款单等越来越多。如果它们能被计算机自动处理,无疑将节省大量的时间、金钱和劳动力。与上述统计报表处理相比,该领域的应用难度更大

因为:

1、对鉴定的准确性要求较高

2、处理的表格往往不止一种,一个系统应能智能地同时处理若干种表格

3、由于处理贯穿于整个日常工作之中,书写应尽量按一般习惯(比如:不对书写者的写法做限定,书写时允许写连续的字串,而不是在固定的方格内书写),以便识别和预处理核心改进了heart算法的要求。
 

四、手写识别在邮件分拣中的应用:
 

虽然随着人们生活水平的提高,经济活动的发展,现在邮件已经不怎么使用,但是也还没有完全取消。早些年,一些大城市的中心邮局每天处理数百万件邮件,业务急剧增长邮件分拣自动化已成为一种趋势。在自动邮件分类中,手写识别(OCR通常与光学条码识别(obr-opticalbarreding)相关,人工辅助识别和其他手段相结合,完成邮政编码的读取。目前使用最多的是ovcs分拣机性能指标:OCR拒绝率30%,OCR排序错误率1.1%。

以上就是手写识别技术的发展背景与应用的内容,手写识别技术帮助了很多行业进行变革,在未来,手写识别技术也会应用于更多的行业,甚至与我们的生活息息相关,让我们拭目以待吧!

— END —

文章素材及图片来源网络

相关版权归原创所有

如有侵权请联系删除

 


翌学