立志去伪存真,发奋识辨天下
“天下之大,唯有识也。”自古以来,人类就很重视以“识”来“辨方向,明道理”。现如今人类走入科技智能化社会,“识”在计算机、电子工业等科技手段日益发展的背景下被赋予了更多的功能含义,而清华大学电子工程系刘长松副教授就是利用现代科技手段,以“识”辨天下的科技工作者之一。
刘长松,1969年出生,分别于1992、1995、2007年获得清华大学学士、硕士和博士学位,现任清华大学电子工程系副教授。他的研究方向包括文本图象处理、模式识别、自然语言处理等。1998年以后,刘长松主持了清华TH-OCR2000、紫光、文通笔、清华文通通用表格识别、增值税发票识别等软件系统的研制,并分别于1999,2004、2008年三次获得国家科技进步二等奖,发表文章40余篇。他开发的产品取得了“文通笔手写输入系统”、TH—OCR MF7.50综合集成汉字识别系统”、TH-OCR 2000自动电子出版物制作系统”、H-PlateID车牌自动识别系统”等多项软件著作权,衍生出众多实际产品。这些产品目前在市场上有广泛的影响,取得了很大的经济与社会效益。
文字识别、图像识别、牌照识别,钞票、税票识别……一步步走来,刘长松的研究几乎都与“识别”有关。他有个心愿:立志去伪存真,发奋识辨天下。
自古以来,汉字以她深邃的魅力和丰富的内涵向世人传递着华夏儿女的精神文明。在信息技术高速发展的今天,如何把古老的汉字和高新信息技术和谐地连接起来,成了引人深思的问题。然而,汉字识别同时也是被世界公认为最困难的模式识别问题之一。
刘长松最突出的贡献即是在文字识别理论研究、技术应用和产品化方面取得的突出成绩。围绕这一公认难题,十年问,他和团队成员一起展开了攻坚之战,承担和参加了多项“863”计划和国家自然科学基金等重要研究课题,并参与国家标准GB/T18790—2002”联机手写汉字识别技术要求与测试规程”的制定,在文字识别的研究领域里积淀了丰富的经验和较高的水平,其研究成果在“863”专家组组织的评测中多次摘取桂冠。
其参与开发的THOCR97综合集成汉字识别系统,在推广应用上收获了良好的社会效益和经济效益,刘长松也因此荣获了1998年度教育部科技进步一等奖和1999年度国家科技进步二等奖;另外,他的用于手机、PDA的嵌八式联机手写中文识别系统已广泛应用于三星、波导、联想、NEC等手机上;手写公式识别系统已在Nokia手机中的手写计算器中应用:基于PC的联机手写输入系统,在Wacom、清华紫光,清华文通等许多硬件和小灵鼠、腾讯QQ输入法等软件产品中应用。
近年来,在字符识别核心技术的基础上,他和团队进一步解决具体应用中存在的实际问题,成功形成多种实用系统,其中联机手写整句识别系统一改一般联机手写输入系统每次只能输入一个字,导致输入率低、错误率高的缺点,尝试利用词典指导下的字符切分算法,以及字符形状信息、识别可信度信息与语言模型信息相结合的动态规划算法,大大提高了连续输入词语或整句时的识别正确率,并提出了一套简单实用的识别结果编辑修改方法,使手写输入真正跨入整句输入的新阶段,大大提高了输入速度。该系统已经授权给Nokia和腾讯公司,不久将会在平板电脑、大屏幕手机等设备上广泛应用。
在汉字识别领域取得的杰出成绩,使刘长松更多了份前行的底气,坚定了他进一步扩展识别领域技术层面的决心,识别之门由此开启。
伪钞泛滥不仅危及国内经济,更是影响人民生计。对于普通人来说,遭遇假钞可能是最挑战人性的常规事件之一。事实上,随着伪钞制作技术的不断提高,假钞泛滥已经成为阻碍国民经济发展的“硬伤”。为此,刘长松及其团队利用他们在识别领域的专业特长,展开了一场钞票的“维权之战”,收效甚广。
2010年9月26日,新发布的国家标准GBl6999-2010《人民币鉴别仪通用技术条件》大大加强了对点钞机的技术要求。值得一提的是,刘长松及团队开发的基于图像识别钞票防伪技术与系统已经能够实现新国标的规定。该系统是一个光、机、电一体的嵌入式系统,解决了图像采集,分割,畸变校正、币值/币种/版本/朝向识别、真伪判别、号码识别等众多软件问题,以及大量的硬件设计与控制问题。它不仅能够识别假币、而且能够识别拼凑币,变造币,能够分辨钞票的版本号、破损程度、新旧程度等,同时还能够使用多光谱图像传感器得到高分辨率的多种波长的光照射下的图像,准确识别钞票的序列号,且可以全面追踪假币的来源以及钞票在全国的流通情况,对于货币的管理具有重大意义。不仅如此,该系统还能支持美元、英镑、港币、澳元、加拿大元,日元,韩元等多种钞票,性能国内领先,目前已经成功嵌入国内知名企业梓昆科技有限公司的点钞机中上市销售,中标多家银行。
同时,基于图像识别的钞票防伪技术也是ATM机、自动贩卖机等一切收取纸币的机械上的最重要的核心技术,而我国之前在该领域完全依赖进口,该系统的推广将会改善这一情况。刘长松表示,他们会继续完善此项技术,争取成为这一领域的技术领导者。
与钞票一样,税票防伪也是关乎国民经济安全及国家尊严的一项重要工作。作为负责人,刘长松成功研制了增值税发票扫描识别系统,解决了国家金税工程核心难题之一。该系统可以通过自动识别发票上的字符,为防伪税控系统判别增值税发票的真伪提供依据,从而使整个增值税发票防伪税控系统具有可行性。该系统2000年通过国家税务总局主持的评测,技术领先。如今数万套系统已经广泛工作在全国各地的各级国税局内部,无疑为防止虚开、伪造增值税发票,保证国家税收增长做出了重大贡献。在此基础上,增值税发票扫描识别系统也逐渐发展到直接应用在企业端。企业把该系统的识别结果通过网络上传到国税局,就可以直接完成发票认证的工作,而不用去国税局排队,大大提高了效率。到2009年底,企业端的用户已经超过50万。据统计,增值税发票扫描识别系统带动的扫描仪销售产生的直接经济效益就超过7亿元,其社会效益更是极其巨大。
科研只有惠及民众才能真正实现其价值。刘长松在钞票及税票真假辨别上所做的努力,相当于是为民众装上了能去伪存真的法眼,更是一场利国利民的正义之战。
“慧眼识辨天下”大概是所有人可望而不可及的梦想,而对刘长松来说,梦想真真正正就在脚下。尽管辨识天下之路,还很长,但他一直在做着努力。
在印刷体及脱机手写文字识别领域,他作为主要研究人员,参与研制了高性能东方文字文档智能全信息数字化系统,为纸质文档转化为电子出版物提供了最佳的解决方案,以此制作了人民日报、南方周末,深圳特区报等大量优秀的电子出版物。另外,他参与开发了文通e-Card名片识别系统,以及运行于手机上的名片识别模块:开发了通用表格识别核心技术,广泛用于银行票据识别,手写考卷评阅等领域。他还研制了身份证,护照,港澳通行证件等信息的识别系统,在海关、宾馆等广泛使用。
他的多国车牌照识别系统开发也达到了极高的识别率,目前已经支持中国大陆、香港、澳门地区的车牌,并研制成功基于PC、DSP、手持电脑、Linux嵌入平台等应用系统,已经在海关口岸、移动交通稽查、高速公路收费等领域推广使用。同时,他的集装箱号码识别系统也成功应用在美国纽约等地的港口。
刘长松还参与了许多同Intel,IBM、诺基亚、西门子、Xerox,Scansoff,Microsoft等公司的国际合作项目,并做出重要贡献。比如,中日韩文识别引擎已用于亚洲语言版本的Microsoft Word软件中。
当然,“见瓶水之冰,不一定识天下之寒”,深谙此意的刘长松以此告诫自己,以在辨识之路上,走得更远,更踏实。
上一篇:银行会计结算存在的问题及风险防范
下一篇:中国通信传天下 海角天涯若比邻