圖紙圖象掃描分析論文

時(shí)間:2022-06-20 04:44:00

導(dǎo)語:圖紙圖象掃描分析論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

圖紙圖象掃描分析論文

摘要工程圖紙掃描圖象的圖文分割是一個(gè)重要問題。本文在構(gòu)建單義域鄰接圖基礎(chǔ)上來提取字符及其特征。圖文分離先從單義域中篩選字符筆劃域,進(jìn)行初步分離。然后,以字符筆劃域?yàn)槠瘘c(diǎn),遍歷鄰接圖來搜索鄰接字符筆劃域,提取字符域,分析特性作進(jìn)一步篩選。以字符域鄰近與共線為判據(jù)來組合字符串域,字符域鄰近是用其外接膨脹矩形相交來判定。利用共串字符域外接矩形中心及所附圖形對(duì)字符域進(jìn)行定向。對(duì)非水平字符域旋轉(zhuǎn)至水平,并構(gòu)建其單義域鄰接圖,以表達(dá)幾何與拓?fù)涮卣鳎瑸楹罄m(xù)識(shí)別作準(zhǔn)備。實(shí)例表明,本算法可以較好地處理字符與圖形的粘連問題,提取效果很好,且能夠描述字符整體特征。

1引言

工程圖紙掃描圖象的識(shí)別與理解是目前學(xué)術(shù)界和工程界研究的熱點(diǎn),在機(jī)械、電子、建筑及地理信息系統(tǒng)等應(yīng)用領(lǐng)域中具有重要的實(shí)際意義。圖樣中有兩部分信息,一是圖形,由幾何圖素組成,用來表達(dá)產(chǎn)品形體;二是文字,用來定義產(chǎn)品尺寸及描述其它信息,有的附于圖形,如尺寸數(shù)字等,也有獨(dú)立存在的,如技術(shù)要求等。文字是圖樣中非常重要的信息。因此,工程圖紙掃描圖象的字符提取與識(shí)別是一個(gè)重要問題,對(duì)進(jìn)一步的尺寸理解、圖像理解等高層次理解都有較大作用。工程圖樣中的文字包括多種字符,如漢字、數(shù)字、字母及符號(hào)等。字符情況較為復(fù)雜,有自己的一些特點(diǎn):字符多為手寫,具有一定的隨意性,不同于印刷體;具有多種方向,不僅有水平書寫,而且有的垂直放置,還有其它各種角度的斜向;有直體與斜體;有時(shí)字符與字符及圖形粘連,增加了圖文分割及字符提取的難度;位置分散,大小不一。上述情況在字符的分割及識(shí)別時(shí)都必須考慮。所以,工程圖樣字符提取及識(shí)別是一個(gè)十分困難的問題。

鑒于工程圖樣字符的特點(diǎn),其處理方法與光柵文檔具有很大差別,一般的處理過程是:先標(biāo)識(shí)連通體,從中選出字符域,再根據(jù)字符域鄰近和共線來生成字符串域,并判斷方向,然后分割字符域,最后進(jìn)行字符識(shí)別及校正。經(jīng)過多年研究,工程圖樣字符的分割及識(shí)別算法已有多種:一是基于連通體[1];二是基于輪廓跟蹤[2],利用同步邊緣特性檢測(cè)進(jìn)行輪廓跟蹤,分離字符輪廓,采用鄰域搜索來生成字符串,最后通過分類樹進(jìn)行字符識(shí)別,并根據(jù)專業(yè)知識(shí)作校正;三是行程編碼匹配法[3],采用圖分割集方法來分割與字符及圖形粘連的字符。

本文提出一種基于單義域鄰接圖的圖文分割方法,在二值圖象水平黑游程編碼基礎(chǔ)上,以相關(guān)游程線寬和拓?fù)涞囊恢聻榧s束生成條形域,對(duì)其中多義域作分裂獲得單義域:線段域和圓弧域,并建立其鄰接圖。字符筆劃可以表示為一個(gè)或多個(gè)單義域。字符筆劃的長度較小,線寬一致。根據(jù)這些特點(diǎn),從單義域中篩選字符筆劃域,進(jìn)行初步圖文分離。字符筆劃多是鄰接的,以字符筆劃域?yàn)槠瘘c(diǎn),通過遍歷鄰接圖搜索鄰接的字符筆劃域,來提取字符域。字符結(jié)構(gòu)與圖元差別較大,根據(jù)字符域特性實(shí)現(xiàn)字符進(jìn)一步篩選。采用字符域外接矩形來標(biāo)識(shí)字符的大小和位置。根據(jù)字符域外接矩形相交來判定字符鄰近,再加上字符共線為判據(jù)來生成字符串域。圖樣中字符串多是附于圖形的,單義域可以很容易獲取方向,即可得圖形方向。利用共串字符外接矩形中心及所附圖形對(duì)字符進(jìn)行定向。然后將非水平字符域旋轉(zhuǎn)至水平,并重新進(jìn)行水平黑游程編碼,以單義域鄰接圖來表達(dá)字符的結(jié)構(gòu)特征,為后續(xù)識(shí)別作準(zhǔn)備。下面進(jìn)行詳細(xì)介紹。

2圖象的單義域鄰接圖描述

在工程圖形中,既有圖元又有字符。圖元有多種,如線段、圓弧、圓、箭頭等,而且圖元多為相交。不同圖元需要用一種結(jié)構(gòu)來統(tǒng)一描述,然后通過分析其幾何與拓?fù)涮卣鞔_定類型來進(jìn)行矢量化。交點(diǎn)信息對(duì)提取同一圖元及不同圖元之間拓?fù)潢P(guān)系具有重要指導(dǎo)意義。字符是由筆劃組成的,在提取筆劃的基礎(chǔ)上進(jìn)行識(shí)別是一種很好的方法。但筆劃的提取難度較大。現(xiàn)有對(duì)圖樣字符的識(shí)別多是處理數(shù)字和字母,較少涉及漢字,而我國圖紙均有大量漢字信息,還有數(shù)字及字母等。因此,需要建立一種模型,既能表達(dá)幾何數(shù)據(jù),還可以描述拓?fù)潢P(guān)系,便于各種特征提取。

現(xiàn)有圖文分離算法多是以象素為單元,進(jìn)行連通體生成。而連通體對(duì)后續(xù)識(shí)別貢獻(xiàn)較小,尤其是對(duì)圖元的識(shí)別。這就要求采用一種模型能夠統(tǒng)一描述圖形和文字的幾何與拓?fù)湫畔ⅰ;趩瘟x域鄰接圖的描述模型,可以統(tǒng)一描述圖元和文字,不但能提取圖元,還為字符識(shí)別的筆劃特征提取提供啟發(fā)。下面給出單義域鄰接圖的建立方法。

對(duì)圖象作水平黑游程編碼,這時(shí)對(duì)圖象的分析單元由象素變?yōu)橛纬蹋纬踢B通性反映了圖形拓?fù)潢P(guān)系。如圖1.b所示。通過分析游程的拓?fù)潢P(guān)系,可以獲取具有轉(zhuǎn)折意義的游程[4]。這些關(guān)鍵游程為圖元分割提供線索。相關(guān)游程基于寬度和拓?fù)湟恢滦钥梢跃酆蠟橐粋€(gè)集合,來表達(dá)某一幾何與拓?fù)湟饬x,稱之為條形域。條形域具有較強(qiáng)的整體性和宏觀性[5]。但是,有的條形域具有多義性,即由線段域和圓弧域組成,對(duì)多義域需作分裂得單義域。這時(shí),圖象的表達(dá)單元變?yōu)閱瘟x域,如圖1.c所示。而單義域首末游程的拓?fù)鋭t表達(dá)了單義域的拓?fù)潢P(guān)系。單義域鄰接圖可以完整地表達(dá)圖象中圖元與字符的幾何與拓?fù)湫畔ⅰH鐖D2所示。

3字符提取

圖文分離算法已有多種,主要是基于連通域。多數(shù)字符是一個(gè)連通域,數(shù)字、字母及漢字多是連通的,或是由幾個(gè)連通域構(gòu)成的,而且字符域具有許多與幾何圖元域不同的特征。在實(shí)際中多以象素八鄰域來進(jìn)行字符提取,且輔以多種字符屬性判斷,確認(rèn)是字符域而不是圖形域,并生成其最小外接矩形,用以標(biāo)識(shí)字符域的大小與位置。上述算法主要是分析連通域的特征來確定字符,在生成連通體時(shí),對(duì)于圖文粘連情況,勢(shì)必形成一體,需要后續(xù)分割或造成圖文誤分。這主要是因?yàn)樵谛纬蛇B通體時(shí)只是基于象素。如果能夠在確定筆劃域的基礎(chǔ)上進(jìn)行圖文分割及字符提取,則毫無疑問會(huì)提高分割及提取效果。

根據(jù)制圖規(guī)則,圖樣中的漢字、數(shù)字、字母的字體均有規(guī)定,在一定掃描率下,可以確定字符的范圍閾值,從而確定字符筆劃的長度,而字符筆劃線寬又是基本一致的,根據(jù)這兩個(gè)條件從單義域中選取字符筆劃域。鄰接的字符筆劃域?yàn)橐粋€(gè)字符,或是一個(gè)字符的部分筆劃。字符提取是以字符筆劃域?yàn)榛A(chǔ)的,遍歷鄰接圖搜索鄰接的字符筆劃域來完成。下面給出具體算法:

(1)取出未訪問字符筆劃域,設(shè)為當(dāng)前域,新建字符域及其外接矩形,將當(dāng)前域插入字符域。

(2)如果當(dāng)前域無鄰接的可訪問域,則轉(zhuǎn)到(4),否則,取當(dāng)前域鄰接的未訪問字符筆劃域,設(shè)為當(dāng)前域,插入字符域,字符域外接矩形生長。

(3)返回(2)。

(4)得一字符。

字符結(jié)構(gòu)與圖元差別較大,根據(jù)字符域特性[1]實(shí)現(xiàn)字符進(jìn)一步篩選。圖3.a給出圖1.a的字符提取結(jié)果,采用外接矩形標(biāo)識(shí)。

4字符串生成

工程圖紙中字符多以串的形式存在,組成字符串來表達(dá)語義。分析字符的字符串歸屬能夠?yàn)樽址R(shí)別提供方向及上下文等信息。由于圖樣字符的多向性,字符的方向確定也需從字符串中獲取。對(duì)于小象素群究竟是小數(shù)點(diǎn)還是噪聲,只有置身于字符串的上下文中才能作出正確判斷。因此,字符串的組合是繼字符提取之后的必然要求。

字符串成組通常采用的方法有兩種,一種是利用Hough變換進(jìn)行共線檢測(cè)[6];另一種是相鄰檢測(cè),即字符串的生成就是將鄰近字符組合在一起。第二種方法有多種作法:一種是以字符外接矩形的中心距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串。一般先進(jìn)行水平、垂直兩個(gè)方向字符串搜索,再進(jìn)行斜方向,以字符外接矩形的中心距為判定值,對(duì)不同方向采用不同閾值[2]。另一種是以字符外接矩形的角點(diǎn)距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串[7]。閾值與方向的關(guān)系較大,有時(shí)需要同時(shí)處理多種情況。

上述方法即使對(duì)同一字體由于方向不同(水平、垂直、斜向)需采取不同閾值,對(duì)方向較為敏感。本文采用一種矩形求交方法來進(jìn)行字符鄰近判斷,可以較好地解決字符鄰近判斷問題,無需預(yù)先設(shè)定方向。

4.1字符組合

在圖樣中,不同大小文字之間的行列間距是不同的,文字列間距與其大小具有一定對(duì)應(yīng)關(guān)系。本文根據(jù)字符域外接矩形自適應(yīng)求得字間距,通過膨脹字符外接矩形,即字符外接矩形按字列間距擴(kuò)大生成膨脹矩形,對(duì)膨脹矩形進(jìn)行求交運(yùn)算來判定兩個(gè)字符是否鄰近。同一字符串的字符不但是鄰近的,而且還應(yīng)共線(第三個(gè)字符起)。下面給出字符組合步驟:

(1)取出未訪問字符域i,設(shè)為當(dāng)前域,新建字符串域,將當(dāng)前域插入字符串域。

(2)如果當(dāng)前域無鄰近且共線的可訪問域,則轉(zhuǎn)到(4),否則,取當(dāng)前域鄰近且共線的未訪問字符域,設(shè)為當(dāng)前域,并插入字符串域。

(3)返回(2)。

(4)得一字符串。

圖3.b可以看出,矩形求交方法可以較好解決字符組合問題,在字符串的生長中無需預(yù)設(shè)方向。

4.2字符串定向及旋轉(zhuǎn)

工程圖樣中字符是多向的,其定向問題直接影響識(shí)別精度。字符串的方向?yàn)槠鋾鴮懙幕€方向。多數(shù)方法以字符中心連線來確定方向,但,如果字符較少,則誤差較大。在工程圖紙中,多數(shù)字符串附于圖形,尤其是線段,而其基線方向與其所附線段的方向一致,如機(jī)械圖樣中的尺寸數(shù)字。由于采用單義域鄰接圖來描述圖象中圖形和文字,從單義域中可以很容易獲得圖形的方向信息。對(duì)于附于圖形的字符串定向,可以采用比較字符串中心線與所附線段來確定字符串的基線方向。如果字符串鄰近的某一單義域(線段域)的方向與字符串中字符域中心連線方向一致,則采用線段域方向作為字符串方向。而獨(dú)立字符串的定向問題可采用文獻(xiàn)[1]方法。

對(duì)于水平字符串,可以直接取出每個(gè)字符進(jìn)行識(shí)別。而對(duì)其它方向的字符串,需先對(duì)每個(gè)字符根據(jù)其方向旋轉(zhuǎn)至水平然后進(jìn)行識(shí)別。圖3.b給出字符串標(biāo)識(shí)。圖3.c給出旋轉(zhuǎn)后結(jié)果。

5字符單義域表示

我國圖紙多是中西文混合,字符識(shí)別的特征提取必須考慮漢字特點(diǎn),筆劃特征明顯。字符識(shí)別的特征提取方法很多,如果能夠提取筆劃,則必定會(huì)大大提高識(shí)別效果[8]。采用單義域鄰接圖可以較好地提取、表達(dá)字符的幾何與拓?fù)湫畔ⅰD4給出字符單義域表示實(shí)例。

6結(jié)束語

本文采用單義域鄰接圖來表達(dá)圖象信息,在確定筆劃域的基礎(chǔ)上進(jìn)行圖文分割及字符提取,整體性很強(qiáng)。本研究算法已被應(yīng)用于我們開發(fā)的工程圖紙掃描圖象識(shí)別與理解系統(tǒng)之中,字符提取效果較好。但仍需進(jìn)一步完善,研究各種復(fù)雜情況,以提高字符及其筆劃特征提取精度,尤其是研究各種結(jié)構(gòu)漢字,進(jìn)行以筆劃為基礎(chǔ)的中西文識(shí)別。

參考文獻(xiàn)

[1]鄒榮金,蔡士杰,張福炎等.字符粘連及字線相交的分割與識(shí)別方法.軟件學(xué)報(bào),1999,10(3):241-247

[2]胡友蘭,黃樹槐,常明.工程圖中字符分離和標(biāo)注字符串生成技術(shù).華中理工大學(xué)學(xué)報(bào),1997,25(3):30-33

[3]陳勇,朱林,常明.工程圖中粘連字符的提取與分割.華中理工大學(xué)學(xué)報(bào),1996,24(4):23-26

[4]S.DiZenzo,L.Cinque,andS.Levialdi.Run-BasedAlgorithmsforBinaryImageAnalysisandProcessing.IEEETransactionsonPatternAnalysisandMachineIntelligence,1996,18(1):83-89

[5]王金鶴.基于條形域結(jié)構(gòu)的掃描圖樣識(shí)別理論與方法研究(博士學(xué)位論文).大連,大連理工大學(xué),1999.6

[6]江早,劉積仁,劉晉軍.工程圖紙圖象圖文自動(dòng)分割工具SegChar.軟件學(xué)報(bào),1999,10(6):589-594

[7]李偉青,彭群生.一種新的字符提取和組合算法.工程圖學(xué)學(xué)報(bào),1997,No.2-3:38-45

[8]L.Y.TsengandC.T.Chuang.AnefficientKnowledge-BasedStrokeExtractionMethodforMulti-FontChineseCharacters.PatternRecognition,1992,25(12):1445-1458

AnAlgorithmofExtractingCharactersfromScannedImageofEngineeringDrawingsUsingPrimitiveRegionAdjacencyGraph

AbstractItisaimportantissuehowtoseparatetextfromscannedimageofengineeringdrawings.ThepaperpresentsanalgorithmtoextractcharactersandtheirfeaturesfromimagesusingPrimitiveRegionAdjacencyGraph.Wecaneasilygetcharacterstrokeregionsfromprimitiveregions.Atstartofacharacterstrokeregion,acharacterregiongrowsbytraversingthegraphforadjacentcharacterstrokeregions.Afteranalyzingfeaturesofcharacterregions,wecangetrealcharacterregions.Astringcanbegotthroughcombiningthosenearandcollinearcharacterregions.Ifrectanglesinflatedoftwocharacterregionsareintersected,theyarenear.Thedirectionofastringregionisattainedbythecenterpointsofenclosedrectanglesofcharacterssharedbythestringandfiguresattached.Thencharactersnothorizontalarerotatedtohorizontal.APrimitiveRegionAdjacencyGraphcanrepresentgeometricalandtopologicalfeaturesofacharacterregion,whichishelpfultoextractfeaturesofacharacterregion.Someapplicationsshowthatthealgorithmcandealwithadherenceofcharacterstographics,andiseffectiveandrobust.

KeywordsPrimitiveRegionAdjacencyGraph,text-graphicsseparation,characterstrokeregions,characterextraction,featureextraction