印刷包装网_印刷包装_机械设备_行业动态_展会信息

  • 用戶名
  • 密碼
  • 產(chǎn)品
供應(yīng)
求購(gòu)
公司
資訊
展會(huì)
評(píng)論訪談專題話題印搜動(dòng)態(tài)
國(guó)內(nèi)國(guó)際環(huán)保視頻產(chǎn)品導(dǎo)購(gòu)
活動(dòng)展會(huì)設(shè)備印品世界
行業(yè)動(dòng)態(tài)企業(yè)動(dòng)態(tài)營(yíng)銷電子商務(wù)政策法規(guī)統(tǒng)計(jì)商機(jī)
印前印中印后包裝器材耗材油墨
膠印數(shù)碼標(biāo)簽CTP紙箱創(chuàng)意絲印柔印其他
展會(huì)專題企業(yè)專題資訊專題技術(shù)專題
文化人物社會(huì)
展會(huì)預(yù)告會(huì)議預(yù)告展會(huì)資訊國(guó)內(nèi)展會(huì)國(guó)際展會(huì)推薦展會(huì)
印刷包裝絲印
印刷包裝絲印
印刷包裝絲印
您當(dāng)前位置: CPP114首頁(yè)> 正文

  • 今日排行
  • 本周排行
  • 本月排行

膠印油墨
膠印材料
絲印材料

印刷體文字的識(shí)別研究方法分類介紹

2010-12-06 15:17 來(lái)源:中國(guó)中部印刷網(wǎng) 責(zé)編:江佳

摘要:
 識(shí)別方法是整個(gè)系統(tǒng)的核心。用于漢字識(shí)別的模式識(shí)別方法可以大致分為結(jié)構(gòu)模式識(shí)別、統(tǒng)計(jì)模式識(shí)別及兩者的結(jié)合。下面分別進(jìn)行介紹。
   【CPP114】訊:識(shí)別方法是整個(gè)系統(tǒng)的核心。用于漢字識(shí)別的模式識(shí)別方法可以大致分為結(jié)構(gòu)模式識(shí)別、統(tǒng)計(jì)模式識(shí)別及兩者的結(jié)合。下面分別進(jìn)行介紹。

  結(jié)構(gòu)模式識(shí)別

  漢字是一種特殊的模式,其結(jié)構(gòu)雖然比較復(fù)雜,但具有相當(dāng)嚴(yán)格的規(guī)律性。換言之,漢字圖形含有豐富的結(jié)構(gòu)信息,可以設(shè)法提取含有這種信息的結(jié)構(gòu)特征及其組字規(guī)律,作為識(shí)別漢字的依據(jù),這就是結(jié)構(gòu)模式識(shí)別。

  結(jié)構(gòu)模式識(shí)別是早期漢字識(shí)別研究的主要方法。其主要出發(fā)點(diǎn)是漢字的組成結(jié)構(gòu)。從漢字的構(gòu)成上講,漢字是由筆劃(點(diǎn)橫豎撇捺等)、偏旁部首構(gòu)成的;還可以認(rèn)為漢字是由更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對(duì)漢字加以描述,就像一篇文章由單字、詞、短語(yǔ)和句子按語(yǔ)法規(guī)律所組成一樣。所以這種方法也叫句法模式識(shí)別。識(shí)別時(shí),利用上述結(jié)構(gòu)信息及句法分析的方法進(jìn)行識(shí)別,類似一個(gè)邏輯推理器。

  用這種方法來(lái)描述漢字字形結(jié)構(gòu)在理論上是比較恰當(dāng)?shù)模渲饕獌?yōu)點(diǎn)在于對(duì)字體變化的適應(yīng)性強(qiáng),區(qū)分相似字能力強(qiáng);但是,在實(shí)際應(yīng)用中,面臨的主要問(wèn)題是抗干擾能力差,因?yàn)樵趯?shí)際得到的文本圖象中存在著各種干擾,如傾斜,扭曲,斷裂,粘連,紙張上的污點(diǎn),對(duì)比度差等等。這些因素直接影響到結(jié)構(gòu)基元的提取,假如結(jié)構(gòu)基元不能準(zhǔn)確地得到,后面的推理過(guò)程就成了無(wú)源之水。此外結(jié)構(gòu)模式識(shí)別的描述比較復(fù)雜,匹配過(guò)程的復(fù)雜度因而也較高。所以在印刷體漢字識(shí)別領(lǐng)域中,純結(jié)構(gòu)模式識(shí)別方法已經(jīng)逐漸衰落,句法識(shí)別的方法正日益受到挑戰(zhàn)。

  統(tǒng)計(jì)模式識(shí)別

  統(tǒng)計(jì)決策論發(fā)展較早,理論也較成熟。其要點(diǎn)是提取待識(shí)別模式的的一組統(tǒng)計(jì)特征,然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。

  漢字的統(tǒng)計(jì)模式識(shí)別是將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這個(gè)整體上經(jīng)過(guò)大量的統(tǒng)計(jì)而得到的。統(tǒng)計(jì)特征的特點(diǎn)是抗干擾性強(qiáng),匹配與分類的算法簡(jiǎn)單,易于實(shí)現(xiàn)。不足之處在于細(xì)分能力較弱,區(qū)分相似字的能力差一些。常見(jiàn)的統(tǒng)計(jì)模式識(shí)別方法有:

  (1) 模板匹配。模板匹配并不需要特征提取過(guò)程。字符的圖象直接作為特征,與字典中的模板相比,相似度最高的模板類即為識(shí)別結(jié)果。這種方法簡(jiǎn)單易行,可以并行處理;但是一個(gè)模板只能識(shí)別同樣大小、同種字體的字符,對(duì)于傾斜、筆劃變粗變細(xì)均無(wú)良好的適應(yīng)能力。

  (2)利用變換特征的方法。對(duì)字符圖象進(jìn)行二進(jìn)制變換(如Walsh, Hardama變換)或更復(fù)雜的變換(如Karhunen-Loeve, Fourier,Cosine,Slant變換等),變換后的特征的維數(shù)大大降低。但是這些變換不是旋轉(zhuǎn)不變的,因此對(duì)于傾斜變形的字符的識(shí)別會(huì)有較大的偏差。二進(jìn)制變換的計(jì)算雖然簡(jiǎn)單,但變換后的特征沒(méi)有明顯的物理意義。K-L變換雖然從最小均方誤差角度來(lái)說(shuō)是最佳的,但是運(yùn)算量太大,難以實(shí)用。總之,變換特征的運(yùn)算復(fù)雜度較高。

  (3)投影直方圖法。利用字符圖象在水平及垂直方向的投影作為特征。該方法對(duì)傾斜旋轉(zhuǎn)非常敏感,細(xì)分能力差。

  (4)幾何矩(Geometric Moment)特征。M. K. Hu提出利用矩不變量作為特征的想法,引起了研究矩的熱潮。研究人員又確定了數(shù)十個(gè)移不變、比例不變的矩。我們都希望找到穩(wěn)定可靠的、對(duì)各種干擾適應(yīng)能力很強(qiáng)的特征,在幾何矩方面的研究正反映了這一愿望。以上所涉及到的幾何矩均在線性變換下保持不變。但在實(shí)際環(huán)境中,很難保證線性變換這一前提條件。

  (5)Spline曲線近似與傅立葉描繪子(Fourier Descriptor)。兩種方法都是針對(duì)字符圖象輪廓的。Spline曲線近似是在輪廓上找到曲率大的折點(diǎn),利用Spline曲線來(lái)近似相鄰折點(diǎn)之間的輪廓線。而傅立葉描繪子則是利用傅立葉函數(shù)模擬封閉的輪廓線,將傅立葉函數(shù)的各個(gè)系數(shù)作為特征的。前者對(duì)于旋轉(zhuǎn)很敏感。后者對(duì)于輪廓線不封閉的字符圖象不適用,因此很難用于筆劃斷裂的字符的識(shí)別。

  (6)筆劃密度特征。筆劃密度的描述有許多種,這里采用如下定義:字符圖象某一特定范圍的筆劃密度是在該范圍內(nèi),以固定掃描次數(shù)沿水平、垂直或?qū)蔷方向掃描時(shí)的穿透次數(shù)。這種特征描述了漢字的各部分筆劃的疏密程度,提供了比較完整的信息。在圖象質(zhì)量可以保證的情況下,這種特征相當(dāng)穩(wěn)定。在脫機(jī)手寫(xiě)體的識(shí)別中也經(jīng)常用到這種特征。但是在字符內(nèi)部筆劃粘連時(shí)誤差較大。

  (7)外圍特征。漢字的輪廓包含了豐富的特征,即使在字符內(nèi)部筆劃粘連的情況下,輪廓部分的信息也還是比較完整的。這種特征非常適合于作為粗分類的特征。

  (8)基于微結(jié)構(gòu)特征的方法。這種方法的出發(fā)點(diǎn)在于,漢字是由筆劃組成的,而筆劃是由一定方向,一定位置關(guān)系與長(zhǎng)寬比的矩形段組成的。這些矩形段則稱為微結(jié)構(gòu)。利用微結(jié)構(gòu)及微結(jié)構(gòu)之間的關(guān)系組成的特征對(duì)漢字進(jìn)行識(shí)別,尤其是對(duì)于多體漢字的識(shí)別,獲得了良好的效果。其不足之處是,在內(nèi)部筆劃粘連時(shí),微結(jié)構(gòu)的提取會(huì)遇到困難。
分享到: 下一篇:2011年中國(guó)印工協(xié)重要活動(dòng)信息發(fā)布
  • 【我要印】印刷廠與需方印務(wù)對(duì)接,海量印刷訂單供您任意選擇。
  • 【cpp114】印刷機(jī)械、零配件供求信息對(duì)接,讓客戶方便找到您。
  • 【我的耗材】采購(gòu)低于市場(chǎng)價(jià)5%-20%的印刷耗材,為您節(jié)省成本。
  • 【印東印西】全國(guó)領(lǐng)先的印刷品網(wǎng)上采購(gòu)商城,讓印刷不花錢。
主站蜘蛛池模板: 上饶建盛建设,建盛建设,上饶市建盛建设工程质量检测有限公司-房屋鉴定 | 新中式家具,广东新中式家具,广州新中式家具,佛山新中式家具,顺德新中式家具,乐从新中式家具,新中式家具厂家直销--唐明雅居 | 威学一百-专注国际学校择校备考-DSE-A-level-雅思-托福-OSSD-港澳台联考-AP-IGCSE-IB-AMC-多邻国-PTE-SAT-SSAT-小语种(如日语,韩语,德语,法语,西班牙语,意大利语,俄语,泰语)等考试培训,为出国留学学生提供个性化定制性学习方案,线下实体面授+线上网络课程, 提供一对一,小班课等多种班型 | 泥浆振动筛|卧式泥浆搅拌器|泥浆离心机|泥浆处理固控设备_沧州宏宇石油机械有限公司 | 山东宝沣新材料有限公司| 河北万岁药业有限公司| 锌铝合金压铸-深圳压铸加工-铝挤压拉伸-压铸模具厂-广东誉格精密技术有限公司 | 圆柱模板_圆柱木模板_方柱加固件_建材板材网 | 金刚石砂轮_树脂砂轮片厂家_CBN砂轮批发-华昱金刚石工具 | 三相干式变压器|三相隔离变压器|上海盖能电气有限公司官方网站|上海干式变压器生产厂家 | 秦皇岛天视影像有限公司,宣传片创意拍摄制作,商业广告拍摄公司,影视影像服务商 - 秦皇岛天视影像有限公司,宣传片创意拍摄制作,商业广告拍摄公司,影视影像服务商 秦皇岛市信恒电子科技有限公司 秦皇岛市华谊彩印有限公司 | 秦皇岛市华谊彩印有限公司| 辽宁鑫宇实验室系统工程有限公司| 河南反渗透设备-河南EDI超纯水设备-郑州纯净水设备-郑州友邦水处理设备有限公司 | 湖南九农王机电设备有限公司官网 | 首页 网络安全与数据治理(原《信息技术与网络安全》) | 长春互联网运营值选星广传媒,长春短视频运营,长春新媒体运营,长春互联网运营,长春抖音运营,吉林视频号代运营,吉林快手代运营,短视频推广公司,公众号运营,微博运营,新媒体运营 | 木屑烘干机|酒糟烘干机|果渣烘干机_郑州东鼎机械 | 西安鸿仁汇智软件公司是高新技术企业,专业为企业及高校提供智慧化管理一站式解决方案 | 立式加工中心_龙门加工中心_卧式加工中心-山东威达重工股份有限公司 | 振动筛|不锈钢振动筛|振动筛生产厂家-新乡市大汉振动机械有限公司 | 吉林省创智汇成包装有限公司,长春高档礼盒,长春包装盒厂家,长春精品包装盒 | 西安泰富西玛电机_西玛电机_西安西玛电机 | 名嘉宴会【官网】_宁波冷餐_宁波茶歇_宁波酒会_宁波自助餐_宁波盛世名嘉宴会服务有限公司 | 金属探测机_食品金属探测仪_食品金属探测器_广东善安金属检测机 金属剪切机,金属打包机,废钢剪切机,废铁压块机,金属压块机,废纸打包机,重废龙门剪,废钢龙门剪,箱式剪,液压剪切机-瑞顿机械装备制造江阴有限公司 | 南京空压机出租,发电机租赁,南京牧德田空压机租赁回收公司 | 江阴月子会所-江阴月子中心-江阴坐月子、月子护理哪家好-乐茵月子中心 | 南京文化墙设计公司,南京包装设计制作印刷,南京PPT设计公司,导视制作公司,企业logo设计 | 内蒙古天奇生物科技有限公司——OEM代工|ODM定制|原料供应|骨肽|片剂|胶囊剂|口服液 | 金属剪切机,金属打包机,废钢剪切机,废铁压块机,金属压块机,废纸打包机,重废龙门剪,废钢龙门剪,箱式剪,液压剪切机-瑞顿机械装备制造江阴有限公司 | 中派康明斯发电机_玉柴发电机厂家_静音移动拖车发电机-深圳市斯坦福电力设备有限公司 | 涂料分散剂_水墨分散剂-厚洹化学水性色浆助剂厂家 | 线宽测试仪丨光调制分析仪丨调制器 卓越光子-专注于光电解决方案 | 讨债公司_要债公司_要账公司[18年讨债要债经验]讨账公司 | 郑州建网站,郑州做网站,郑州网站建设,郑州网站制作,郑州高端定制网站,郑州APP开发 | 上海互动多媒体公司_上海触摸屏软件开发_上海互动投影开发_上海VR虚拟现实制作_上海全息投影制作_上海互动轨道屏制作—盟邑数字 上海浩斌信息科技有限公司RFID读写器,IC卡读卡器,手持机,数据采集终端,电力仓库管理软件开发,固定资产软件,纱管标签,试剂管理,RFID试剂柜,档案管理,档案柜,智能货架 | 内蒙古发电机厂家_呼和浩特发电机租赁_销售_维修_回收_置换|盈弘发电设备有限责任公司 | 杀菌剂_除藻剂_杀菌灭藻剂_1227杀菌剂_中北精细化工 | 申江储气罐厂家,储气罐批发价格,储气罐规格-上海申江压力容器有限公司(厂) | 气泡膜机_气垫膜机_缠绕膜机_瑞安市优特机械厂 | 意优教育|意大利留学中介_意大利留学费用_意大利申请条件_北京意大利语培训学校 |