高新技術制造業的模型研究
時間:2022-03-22 10:52:29
導語:高新技術制造業的模型研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
其建模需求主要表現在以下幾個方面:(1)知識層次性。分析知識的種類及構成,利用本體表達不同類型的知識,利用不同層次的知識完成不同的功能,通過相互之間的關聯,體現知識模型的完備性。(2)語義一致性。高新技術制造業企業的業務過程與產品構成,需要在企業內部與產業鏈配套企業間保持語義的一致性,需要構建在某一高新技術制造業領域內部公認的、具有確定語義的企業領域本體,包括業務過程、設計術語和產品相關知識等。(3)標準化與模塊化知識表達。高新技術制造業企業在設計生產及產業合作中存在大量的標準化知識與模塊化知識,需要借助知識表達模型對其進行規范化管理,以促進與企業合作過程中的知識共享與集成。(4)降低知識本體構建難度。當前,文獻研究中所涉及的知識管理系統的運行與維護,大多需要知識管理專家對知識管理的全程參與,需要員工和知識用戶對知識管理及其技術有深入了解。然而在實踐中,企業知識管理的實施往往缺乏相關的專業人才,因此需要提高知識本體構建與維護的自動化程度,降低知識維護的難度。(5)知識組織結構清晰。高新技術制造業企業涉及眾多領域,在各自產業領域內所處理的知識也各不相同。知識組織結構是理解與共享知識的基礎,因此構建在制造業與高新產業內公認的、清晰的知識組織結構至關重要。高新技術制造業企業的知識管理復雜而豐富,如何規范化地描述和表達知識及其關系結構,是學者一直關注的熱點。在將面向人類處理的語義表達轉向面向機器處理的形式化語義的過程中,必須消除人類語義的模糊性,并且構建支持自動推理的、明確的、形式化和規范化的語義關系。分析知識的形式化構成是構建知識表達模型的重要基礎,可將企業知識模式的形式化表達式描述如下:K=F+R+C其中,K為知識(Knowledge),代表某一項知識。F(Fact)為事實知識,是指人們對客觀世界事物及其狀態、屬性、特征和關系的事實描述。R為規則(Rules),即對事實的一種規范約束或表達在前提事實與結論事實之間的一種因果關系。C為概念(Concepts),是指事實中基本術語(概念)的含義及其語義規則說明等。模型認為,一項知識并不是單獨孤立的,而是由對現實世界的觀察、對概念的抽象理解以及對關系與規則的推演而構成的。由上述描述可知,知識具有層次性,一般包括事實、概念、規則和啟發4個層次,其中啟發知識是關于規則的知識,是對前三者的綜合,利用啟發知識可得到問題的解[19]。其意義在于,將知識轉化為面向計算機處理的表示形式,需要把上述事實知識、規則知識和概念知識等本體表達出來。顯然,單一類型的本體不能完成,需要運用不同類型的本體表達并通過不同本體的相互結合才能形成知識的表達模型,進而表示與存儲知識。綜上所述,參考Perez和Benjamins等歸納出的10種本體及其它企業知識建模的研究成果,本文提出面向高新技術制造業企業知識管理的多層次本體知識表達模型(見圖1)。模型架構整體分為3個層次:知識表示層、概念規則層、知識組織層。按照知識模型的分類,不同層次表達的知識類型也各不相同。其中,知識層的知識本體主要表達事實知識,領域知識層的知識本體主要表達概念與規則知識,而知識組織層的產品生命周期知識地圖主要明確知識架構與知識集成。多層次本體知識表達模型體現了知識層次性與不同本體的結構關系,能夠滿足高新技術制造業企業知識表達的需求。不同層次的本體根據知識表達需求分別描述事實知識、概念關系、規則知識、知識組織結構以及相互之間所形成的概念或語義映射等,如知識本體在表示知識的過程中所使用的概念術語,通過概念映射到領域知識,再利用領域知識對概念及其關系進行描述,從而可以利用推理規則進行知識推理,或者利用知識地圖集成到整體的知識框架中。知識模板針對高新技術制造業企業標準化與模塊化知識的需求,對標準化和規范化知識利用領域的知識概念構建知識模板,在產生相應知識的過程中,按照知識模板結構建構新的知識本體,從而在相同類型的知識本體間形成統一的知識結構,以便能夠更好地為理解和共享知識提供技術支撐。
知識本體構建
在現實應用中,企業所處理的知識來源種類豐富、格式繁多,且存在多種形式,但在具體處理知識表達來源時,可將其歸納為文本和非文本兩類。其中文本是一種半結構化的知識來源,是企業目前重要的知識存儲形式,它主要包括企業資料、報告、總結、說明和以網頁形式存在的知識;非文本知識來源既包括結構化的產品數據和報表,也包括非結構化的圖紙、流程和音視頻。本本主要構建具有可擴展性的知識本體的定義,并針對文本和非文本源的特點,分析知識本體的構建方式。使用文本形式保存的知識是企業中最常見的一種知識保存形式,但在其應用中因主要依靠關鍵字或分類方式進行檢索和共享而存在諸多弊端。基于本體的知識管理系統需要抽取文本知識的特征信息,將其自動或半自動地轉化為符合前述知識本體定義的知識本體,從而增強知識管理的語義理解能力和知識應用能力。一般而言,文本保存的大都是半結構化的文本,而半結構化的文本內容和結構是混在一起的,通常結構不固定且沒有清晰的描述。根據文本的一般表現形式,可將文本的特征信息歸納為以下3類:①文件特征。文本文件屬性可以提供的信息包括文件的創建時間、最后修改時間、創建者和文件路徑等;②形式特征。包括文本的長度、顯示字體的大小、顏色、位置和特殊標識等;③結構特征。包括分段、并列、標題級別、表格與圖表的特殊表達結構等。因此,基于文本的知識抽取主要包括:①文本屬性的抽取,如文本的創建時間、創建者、版本號、權限、修改時間和次數等基本屬性信息;②本文內容信息的抽取,如文本的標題、作者、摘要和關鍵字等;③文本的語義信息抽取,如文檔分類和語義特征等。知識本體的構建是從文本知識中抽取相應的語義信息,并按照知識本體的定義,采用本體描述語言構成本體文檔的過程。可以針對上述文本知識的特征,通過模式匹配自動抽取部分語義信息,不能抽取的部分語義信息需要由知識管理員工來補全。通過模式匹配抽取信息的過程主要包括文本的預處理、文本截取和模板匹配等(見圖2)。圖2本文知識語義抽取過程(1)文檔預處理。文檔格式不同不利于信息的處理,因此需要對文檔進行預處理并提取其中的文本信息和格式信息等。XML文檔具備同時存儲各種信息的能力,其結構化的形式也有利于信息處理。因此,首先將企業文檔轉化成XML文檔,這一過程存在諸多轉換工具和第三方插件,不僅能保留文檔文本,也能保存段落和字體等信息。然后,利用文本截取工具,將文本分割成多個子字符串(包含文本特征)的集合,字符串的分割由段落、格式、標點和字體等因素進行設定,上述過程使文檔變為一個字符串的集合,可將其定義為檔的字符串集合T通過li所包含的匹配模式h1i,h2i,…,hni進行匹配,并根據上述計算公式計算li的權重,然后抽取下一個文檔匹配模板li+1,循環計算匹配模板的權重,選擇權重最高者為文檔的匹配模板,并保存匹配到的文本信息。按照知識本體的定義,采用OWL語言進行描述,形成本體文檔。企業文檔匹配模板是一個不斷積累和完善的過程,文檔匹配庫的復雜程度與企業文檔信息格式的多樣性有關。非文本知識來源既包括結構化的產品數據和報表,也包括非結構化的圖紙、流程和音視頻等數據。目前,企業對于非文本知識的保存和利用方式主要有以下幾種:①利用關系數據庫保存產品數據,在使用中采用數據庫管理系統對上述數據進行查詢和適用;②利用添加文本描述的方式,為設計圖紙、流程圖表和各種音視頻文件增加自然語言描述;③利用文檔分類方式,將非文本文檔的知識特征通過目錄層級表達出來,并在使用過程中通過目錄(知識特征)從大到小縮小語義范圍,以便進行知識檢索。根據高新技術制造業企業知識管理實踐的需求,本文將非文本知識對象分為兩類:一類是非結構化的知識,主要指不具有固定組成結構的知識,如設計圖紙、生產流程和音視頻等;另一類是結構化的知識,主要指擁有固定組織結構的企業非文本知識,如產品數據和報表等。非文本知識的共同特點包括:①一般以獨立的文檔形式存在,少數以網頁形式表示;②從可抽取的語義信息來看,包括文檔的基本屬性,如文件名、目錄信息和創建時間等;③非結構化的知識結構特征不明顯,而結構化的知識結構特征明顯,需要從中提取相應的語義信息。與前述的文本信息不同,非文本知識的語義信息自動提取應用效果有限,因此可以在知識本體構建或者知識應用過程中借助人工算法不斷修正。由上述分析可知,非結構化知識本體的構建需要抽取的信息具體包含3類:①對文檔基本信息的抽取。因為非結構化知識的主要存儲方式是文檔,因此可以通過文檔信息的讀取獲得文件名(標題)、文檔創建/修改時間和創建者等信息;②對語義信息的抽取,如知識分類與領域本體映射的信息。因為無法利用文本分析和模式匹配等方式,所以效果難以保證,因而需要較多地依賴人工維護;③對知識特征的提取,如對于采用網頁形式保存的信息,可以通過前述模式匹配的方法,獲取網頁的編輯時間、導航層次和網頁標題。如果是帶有描述性的文字,也可以利用前述知識特征提取方式構建知識特征向量;如果是僅以分類目錄形式保存的文檔,則可以通過讀取文件目錄體系,通過模式匹配方法抽取其中的知識特征,其基本流程見圖3。圖3非結構化知識本體構建主要流程為分析非結構化的文件屬性并提取相應信息,同時從目錄信息或文檔網頁描述信息中,按照上述方式提取知識特征。在提取知識特征向量的過程中,可以用自動提取與人工提取相結合的方式。語義信息的加入主要依靠知識用戶從文檔中抽取和審核。上述3種獲取的語義信息按照知識本體的定義,采用本體描述語言進行描述,并構成知識本體文檔。與非結構化知識構建本體的方式類似,結構化知識本體的構建主要體現在兩個方面:①企業中結構化信息的主要存儲方式是關系數據庫或者報表(也可以存儲到關系數據庫中)。對于關系數據庫而言,每一行都是一個實體,每一列都是實體中的一個屬性,每一行都是一個知識項,每一列都是知識項擁有(Has)的屬性。因此,在結構化知識本體的構建過程中,需要識別和分析信息結構;②結構化信息的知識特征根據信息來源的不同有不同的提取方式,從數據庫中提取的信息一般不存在層次目錄信息,可將提取到的屬性項作為知識特征的一部分。
本文主要研究符合高新技術制造業企業要求的知識表達方式,構建了基于本體的知識表達模型。針對高新制造業企業的需求和知識特點,分析了信息抽取與知識本體的兩種構建方式:文本與非文本的知識本體構建模式,為高新技術制造業企業的知識管理提供了理論借鑒。然而,知識本體并不是一成不變的,還需要不斷修正和完善,這將是未來研究應進一步關注的方向。
本文作者:鄭雙怡閆培寧工作單位:中南民族大學
- 上一篇:高新技術營銷管理的戰略分析
- 下一篇:基于區域比較的產業發展研究
精品范文
10高新區發展建議