語義信息論文:小議語義的信息空間關系
時間:2022-01-28 02:58:39
導語:語義信息論文:小議語義的信息空間關系一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
本文作者:劉偉顧和和工作單位:江蘇師范大學測繪學院
地理信息除了在數據結構上存在異構,在語義上也存在異構。地理信息語義上的異構可以分為空間數據的異構和非空間數據的異構,以下分別對這兩種語義異構進行討論。2.1空間數據語義分析與空間關系構建地理信息中空間數據的語義關系在本文主要可分為以下3種。1)拓撲關系:本文中拓撲關系主要指地理對象間相離(DT)、相接(TO)、重疊(OV)、覆蓋(CO)、包含(CT)、相等(EQ)、被覆蓋(CB)、在內部(IN)八種關系。其中覆蓋(CO)與被覆蓋(CB),包含(CT)與在內部(IN)為逆反關系。2)方位關系:方位關系主要指一個地理實體相對于另一個地理實體的方向關系。眾所周知的8個方位關系為:北(N)、西北(NW)、西(W)、西南(SW)、南(S)、東南(SE)、東(E)、東北(NE)。本文中以圖形(像)中央的地理實體作為第一個起始位置來確定其它地理實體相對于此起始位置地理實體的方位關系;然后以第一個起始位置為圓心,在周圍找一個地理實體作為參照,依此類推,確定地理實體之間的相互位置關系。如圖1所示,首先選A作為第一個起始參照實體,建立其他地理實體與A地理實體的空間方位關系;然后在地理實體(F、G、H)中在選擇一個作為下一個參照實體,本文依順時針方向選擇F作為第二個參照實體,建立其他地理實體(除去已經建立方位關系的A實體)與F地理實體之間的空間方位關系,依此類推,用同樣的方法建立地理實體之間的空間方位關系。ABCDEGFHB/東北B/東B/東南B/南B/西南B/西B/西北B/北A北東南西北北南南西西東東東北西南東南西北東北西南圖1地理實體的參照關系圖2空間方位之間的推理關系在方位關系中,A實體和B實體的空間方位存在以下關系,如圖2所示。①若B位于A的北方向,則A位于B的南方向;②若B位于A的西北方向,則A位于B的東南方向;③若B位于A的西方向,則A位于B的東方向;④若B位于A的西南方向,則A位于B的東北方向;⑤若B位于A的南方向,則A位于B的北方向;⑥若B位于A的東南方向,則A位于B的西北方向;⑦若B位于A的東方向,則A位于B的西方向;⑧若B位于A的東北方向,則A位于B的西南方向。以上方位關系在空間推理時會用到。用OWL建立其相互關系后,就可以用Jena(/)推理出相互關系。3)距離關系:通常人們用遠、近、較遠和較近等來形容兩個地理實體之間的距離,但這樣的形容不準確且容易引起歧義。本文中對于距離關系,我們采用對象質心之間的標準歐氏距離。針對上述空間數據的語義異構問題,我們提出用屬性關系圖(ARG)來描述地理實體及其空間關系信息。參照圖3的圖形和它的ARG,ARG的結點標有對象的標號。兩個結點之間的邊標有兩個結點間的關系信息。結點N1與N2之間的邊標有(N1,D,203,8.9,N2),這表明N1與N2之間的拓撲關系為相離(Disjoint),它們之間的角度為203˚(按照逆時針、結點下標遞增順序測量(結點下標遞增順序測量:假設N1為起始參照實體(可以是點或面中心),首先量算N1與N2、N3等的方位,然后是N2與N3、N4等的方位,依次類推,直至建立完整的方位關系。)),它們之間的距離為8.9個單位。N1N2N3N1N2N3AGR(N2,CO,315,2.3,N3)(N1,D,203,8.9,N2)(N1,D,274,10.7,N3)(N1,D,D,SW,SW,8.9,10.7,N2,CO,SE,2.3,N3)特征點圖3圖形與其屬性關系圖ARG的映射過程為每幅圖形創建ARG之后,ARG要映射到特征空間的一個多維點,特征空間中的點按照某種預先指定的順序進行組織(本文中以中央地理實體為第一個起始參照實體)。首先是第一個地理實體,其后是該地理實體與所有其它地理實體之間的關系;然后是第二個地理實體以及第二個地理實體與隨后所有地理實體間的關系,依此類推,直至建立完整的ARG。在這個階段,對象之間的方位角也轉換為方位謂詞。如圖3,N1與N2之間的角度203˚就映射為西南方位(SW)。2.2非空間數據語義分析與關系構建非空間數據中的語義異構主要由于人們對同一或相同類的地理實體在表述概念上存在差異,如對于南京,有人稱之為金陵,又有人稱之為石頭城;而一些國家地理劃分中的州在中國等同于省的概念。非空間數據中表示相等或相似的語義關系又稱為同主體語義關系。非空間數據的語義異構一般分為以下兩種:異形同義詞,既不同的詞匯表達同一個含義,如南京,又可稱為金陵或石頭城;同形異義詞,即同一個詞匯表達不同的含義。其中同形異義詞間的關系可以用OWL中的以下語義標簽描述:differentFrom(個體不同),兩個個體可以顯式聲明為不同;allDifferent(全不同)和distinctMembers(不同成員),這兩個詞配合使用表示一定數量的個體兩兩不同。異形同義詞的關系可以用以下標簽描述:equivalentClass(等價類),兩個類可以聲明為等價,即使它們盡管名字不同,但擁有相同的實例,等價類可以用來創建同義類;sameAs(個體相同),兩個個體可以聲明為相同,用它可以創建一系列指向同一個個體的不同名字。對于一些屬性關系可以用equivalentProperty(等價屬性),inverseOf(逆反屬性),TransitiveProperty(傳遞屬性),SymmetricProperty(對稱屬性),FunctionalProperty(函數屬性),inverseFunctionalProperty(反函數屬性)等來描述。在建立非空間數據的語義關系時,本文按照ARG中地理實體出現的順序構建非空間數據語義關系,這樣便于利用第3部分的算法自動生成應用本體實例。
數據提取與本體實例生成
分別建立起空間數據的屬性關系圖ARG和非空間數據的語義關系后,可以參照圖4所示的應用本體實例生成算法AOGA自動生成應用本體實例。創建一個空OWL文檔按特征空間中特征點的先后順序抽出一個空間對象如N1該空間對象是何種地理實體創建該空間對象對應地理實體的一個實例從該空間對象對應的特征點中抽取一個屬性創建這個幾何屬性對應的實例從該空間對象對應的非幾何屬性中抽取一個屬性創建這個非幾何屬性對應的實例有新空間對象輸出創建的OWL文檔有新屬性有新屬性是否是否否是圖4應用本體實例生成算法AOGA首先創建一個新OWL空文檔并在其中插入根結點;然后按ARG的特征空間中特征點的先后順序抽出一個空間對象如N1,根據這個空間對象的類型創建新節點并插入到根節點下,在創建空間對象節點的同時,需要創建這個空間對象的屬性:從該空間對象N1對應的特征點中抽取一個幾何屬性,并創建這個幾何屬性對應的實例插入到新節點N1下,進行判斷直至所有的空間屬性創建完畢,同理創建這個空間對象的非空間屬性,直至所有的非空間屬性創建完畢。一旦空間對象創建完畢后,還需要進行判斷,看是否還有其他空間對象。如果還有其他空間對象未創建,則重復上述過程,直至所有的地理對象和相應的空間屬性與非空間屬性全部轉換成應用本體實例。應用本體實例創建完畢后,將所創建的OWL文檔輸出,第四部分將要使用生成的OWL文檔。
試驗說明
下面以具體試驗來說明,由算法生成的大連灣區域(DALIANRegion)土地利用應用本體實例描述了大連灣地區土地利用方面的信息,包含空間數據和非空間數據的語義信息,圖5是對應土地利用本體的樹狀結構圖。本體構建過程參照《國家資源環境遙感宏觀調查土地資源分類系統》和中國科學院地理科學與資源研究所數據中心土地利用本體分類體系。當用戶提出查找在大連灣東北方向,并位于大連灣50km內包含湖泊的所有林地地理實體時,此查詢語句較為復雜包括方位關系(大連灣東北方向)、距離關系(大連灣50km內)、拓撲關系(林地包含湖泊)和語義關系(林地是有林地、灌木林、疏林地和宜林地的父類)。傳統的方法很難實現這種復雜的查詢請求,通過創建DALIANRegion應用本體就可以很好的解決這種復雜的查詢請求。本試驗是基于Jena和ArcServer開發的,首先在服務器端調用編寫的本體查詢函數(用Jena解析),利用應用本體實例中的空間語義關系進行推理。如圖5,“有林地”、“灌木林”、“疏林地”和“宜林地”是林地的子類,宜林地和草山草坡是同義關系,灌木林和疏林地是林間草地的父類。利用Jena工具很容易就可以把對林地的查詢自動的推理到“有林地”、“灌木林”、“疏林地”、“宜林地”、“草山草坡”和林間草地中去;對空間關系的查詢,應用本體中已經描述了拓撲關系(Contain)、方位關系(EastNorth)和距離關系(11.7,36.5)只需要用Xpath、Xquery查詢語言進行查詢轉換即可。然后將查詢到的DALIANRegion土地利用應用本體的結果,組織成SQL語句傳遞給ArcServer的GetFeatureClass類,由ArcServer返回查詢結果,在客戶端顯示。5結束語空間信息的查詢與檢索是空間信息共享的前提條件。但由于用戶認知和概念世界中的概念與系統模型中的概念之間存在語義異質性,用戶檢索出來的數據往往并不是他們真正想要的。通過建立等價關系、繼承關系、逆反關系以及拓撲、方位和距離等空間關系的地理本體并將之用于檢索請求可以解決這種語義異質性,從而實現更高級別的檢索。本文在檢索處理過程中,以空間數據的屬性關系圖ARG作為描述地理實體空間關系的基礎,基于應用本體實例生成算法AOGA和語義推理工具Jena實現異構消解和語義擴展,極大地提高了檢索準確率。以下是本解決方案的優點和將來的工作。①提出了描述空間關系的ARG模型,利用ARG可以方便的查詢任意兩個地理實體的空間關系,改進以往空間關系查詢時SQL擴展的不便性;②建立了非空間數據之間的語義關系,可以更全面的檢索出所需數據;③提出了應用本體實例生成方法,可以較為方便的生成所需應用本體實例。作為將來的工作,我們將集中在以下兩點:①建立ARG模型時,需花費大量的時間,且容易出錯,下一步我們將研究更自動化的方法建立所需的ARG;②本體建立層次還較低,只是建立到大類,后續工作,需要在建立地理本體時,建立到具體地理實例一級,要具體到地理實體的名稱。
- 上一篇:信息定位論文:當代信息公開的環境評論與提議
- 下一篇:金融倫理的構建與功能