中醫(yī)藥數(shù)據(jù)狀況及發(fā)展
時間:2022-10-19 11:00:00
導(dǎo)語:中醫(yī)藥數(shù)據(jù)狀況及發(fā)展一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1科學(xué)數(shù)據(jù)共享工程
美國政府自20世紀(jì)90年代以來,在科學(xué)數(shù)據(jù)方面實行了“國有科學(xué)數(shù)據(jù)完全與開放共享國策”,聯(lián)邦財政設(shè)立專項資金連續(xù)支持?jǐn)?shù)據(jù)中心群的建設(shè),利用法律手段保障其信息暢通。據(jù)有關(guān)資料統(tǒng)計,在數(shù)據(jù)共享國策實施的10年間,美國平均年經(jīng)濟(jì)增長率后5年比前5年增長了1.1%,其中0.5%是由于數(shù)據(jù)和信息的流通和應(yīng)用所產(chǎn)生的。目前,我國由各行業(yè)部門產(chǎn)生和積累的海量科學(xué)數(shù)據(jù),得不到有效共享和利用,制約了我國科技創(chuàng)新和社會經(jīng)濟(jì)發(fā)展的進(jìn)程。在這種時代背景下,面對中國社會和科技發(fā)展的需要,2002年,我國開始實施“國家科學(xué)數(shù)據(jù)共享工程”。科學(xué)數(shù)據(jù)共享工程是在國家科技基礎(chǔ)條件平臺統(tǒng)一規(guī)劃、政策調(diào)控和相應(yīng)法規(guī)的保障下,應(yīng)用現(xiàn)代信息技術(shù),整合離散的科學(xué)數(shù)據(jù)資源,構(gòu)建面向全社會的網(wǎng)絡(luò)化、智能化的管理與共享服務(wù)體系,實現(xiàn)對科學(xué)數(shù)據(jù)資源的規(guī)范化管理及其高效利用,從而為科技進(jìn)步與創(chuàng)新、政府決策、經(jīng)濟(jì)增長、社會發(fā)展和國家安全提供科學(xué)數(shù)據(jù)資源的強(qiáng)有力支撐。它具有公益性、基礎(chǔ)性、持續(xù)性和基于現(xiàn)代信息技術(shù)的數(shù)據(jù)內(nèi)容服務(wù)的明顯特征,是國家科技基礎(chǔ)條件平臺的重要組成部分,是國家創(chuàng)新體系中急需發(fā)展的現(xiàn)代科技基礎(chǔ)設(shè)施之一。
國家科學(xué)數(shù)據(jù)共享工程建設(shè)的指導(dǎo)思想是圍繞全面提升國家科技創(chuàng)新能力,實現(xiàn)推進(jìn)現(xiàn)代化建設(shè)的國家目標(biāo),以科技創(chuàng)新為動力,以需求為導(dǎo)向,以政策、法規(guī)為保障,充分發(fā)揮國家長期布局的數(shù)據(jù)采集系統(tǒng)和各類國家科技計劃項目產(chǎn)生與積累的科學(xué)數(shù)據(jù)資源優(yōu)勢,構(gòu)建面向全社會的共享服務(wù)體系,實現(xiàn)科學(xué)數(shù)據(jù)資源的規(guī)范化管理與高效利用。以共享促進(jìn)應(yīng)用,最大限度地發(fā)揮科學(xué)數(shù)據(jù)的潛在價值,強(qiáng)化對科技進(jìn)步與創(chuàng)新的支撐能力。
醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)在國家科技部統(tǒng)一部署下,由四個主管部門聯(lián)合推薦,六大科研院所聯(lián)合申報,2003年在科技部立項,2004年4月正式啟動。其總體目標(biāo)是建立一個物理上分布,邏輯上高度統(tǒng)一的醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)管理與共享服務(wù)系統(tǒng),為政府衛(wèi)生決策、科技創(chuàng)新、醫(yī)療保健、人才培養(yǎng)、百姓健康和企業(yè)發(fā)展提供數(shù)據(jù)共享和信息服務(wù)。科學(xué)數(shù)據(jù)中心是數(shù)據(jù)集匯交、儲存和提供數(shù)據(jù)共享服務(wù)的物理中心,到2006年已經(jīng)啟動的4個數(shù)據(jù)中心和依托單位分別是:基礎(chǔ)醫(yī)學(xué)科學(xué)數(shù)據(jù)中心——中國醫(yī)學(xué)科學(xué)院基礎(chǔ)所、臨床醫(yī)學(xué)科學(xué)數(shù)據(jù)中心——解放軍總醫(yī)院和北京協(xié)和醫(yī)院、預(yù)防醫(yī)學(xué)科學(xué)數(shù)據(jù)中心——中國疾病預(yù)防控制中心、中醫(yī)藥科學(xué)數(shù)據(jù)中心——中國中醫(yī)科學(xué)院。
2中醫(yī)藥科學(xué)數(shù)據(jù)中心的現(xiàn)狀
中醫(yī)藥科學(xué)數(shù)據(jù)中心是國家醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)的成員單位之一。自科學(xué)數(shù)據(jù)共享工程實施以來,圍繞構(gòu)建國家科學(xué)數(shù)據(jù)管理與共享服務(wù)體系、制定和完善科學(xué)數(shù)據(jù)共享政策、法規(guī)與標(biāo)準(zhǔn)體系、增強(qiáng)中醫(yī)藥科學(xué)數(shù)據(jù)資源積累,促進(jìn)中醫(yī)藥科學(xué)數(shù)據(jù)增值的整合體系的目標(biāo),堅持“統(tǒng)一領(lǐng)導(dǎo),統(tǒng)籌規(guī)劃,統(tǒng)一標(biāo)準(zhǔn)”的指導(dǎo)方針,確定以中醫(yī)藥科學(xué)數(shù)據(jù)資源的規(guī)劃為出發(fā)點,將資源的組織、分析、獲取、調(diào)度、整合和共享服務(wù)工作貫徹工程建設(shè)始末。
2.1頂層設(shè)計
以醫(yī)學(xué)衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)為依托,在中醫(yī)藥科學(xué)數(shù)據(jù)匯交平臺基礎(chǔ)上研制中醫(yī)藥科學(xué)數(shù)據(jù)共建平臺與中醫(yī)藥科學(xué)數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)平臺,整合與建立中醫(yī)藥科學(xué)數(shù)據(jù)主體數(shù)據(jù)庫群,形成中醫(yī)藥科學(xué)數(shù)據(jù)共享平臺,提供優(yōu)質(zhì)的中醫(yī)藥科學(xué)數(shù)據(jù)服務(wù)。全體系需要科學(xué)數(shù)據(jù)共建與共享的運行機(jī)制與管理;全工程需要信息網(wǎng)格的技術(shù)支撐。見圖1。
2.2中心建設(shè)
按照科學(xué)數(shù)據(jù)共享工程的建設(shè)規(guī)則,由中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所承擔(dān)中醫(yī)藥科學(xué)數(shù)據(jù)共享與服務(wù)的物理中心。依托國家中醫(yī)藥管理局中醫(yī)藥文獻(xiàn)檢索中心機(jī)構(gòu)基礎(chǔ)與國際互聯(lián)網(wǎng),在全國選擇與建立了若干個分中心,形成了中醫(yī)藥科學(xué)數(shù)據(jù)建設(shè)虛擬專業(yè)隊伍。到2006年底,由全國中醫(yī)藥院校與研究單位組建了20余家分中心,專業(yè)人員約300余人。物理中心與虛擬中心共同承擔(dān)了中醫(yī)藥科學(xué)數(shù)據(jù)中心的建設(shè)。
2.3建立快速高效數(shù)據(jù)集成平臺
為適應(yīng)中醫(yī)藥信息化、數(shù)字化的需求,中醫(yī)藥主體數(shù)據(jù)庫群組必須向多類型、多結(jié)構(gòu)、快速信息存儲與高度集成方向發(fā)展,最終形成全方位的系統(tǒng)工程。在不同優(yōu)劣硬件設(shè)備上,利用同樣的軟硬件環(huán)境、建立統(tǒng)一的加工界面、采用一致的加工方式,整合來源統(tǒng)一,這樣即保證數(shù)據(jù)信息的正確統(tǒng)一,又大幅減少重復(fù)勞動、節(jié)約信息采集費用,實現(xiàn)高速率的數(shù)據(jù)集成。所有成員單位基于統(tǒng)一平臺,實現(xiàn)無障礙的所有數(shù)據(jù)信息交流與共享,信息及時存儲與獲得更新;數(shù)據(jù)加工采用統(tǒng)一格式,避免管理方式多種多樣,節(jié)約大量的信息格式轉(zhuǎn)換費用;所有參建單位基于相同的信息質(zhì)量控制平臺進(jìn)行項目管理,極大縮短參建各方的技術(shù)水平差距,提高整個項目的管理水平,同時降低對管理人員的素質(zhì)要求。利用數(shù)據(jù)共建平臺,實現(xiàn)了中醫(yī)藥科學(xué)數(shù)據(jù)的快速集成。
2.4建立主體數(shù)據(jù)庫
主體數(shù)據(jù)庫是中醫(yī)藥科學(xué)數(shù)據(jù)中心的基本任務(wù),是提供權(quán)威、可靠的數(shù)據(jù)內(nèi)容服務(wù)的基本單元。它是通過整合集成科學(xué)數(shù)據(jù)資源和整合改造已有數(shù)據(jù)庫而構(gòu)成的。中醫(yī)藥數(shù)據(jù)庫資源的主體數(shù)據(jù)庫分為中藥數(shù)據(jù)體系、中醫(yī)數(shù)據(jù)體系、針灸數(shù)據(jù)體系與古代文獻(xiàn)數(shù)據(jù)體系。目前,中醫(yī)藥科學(xué)數(shù)據(jù)中心數(shù)據(jù)存儲量約120G,現(xiàn)代文獻(xiàn)數(shù)據(jù)庫收集年代跨越50年。
2.5標(biāo)準(zhǔn)和規(guī)范研究
規(guī)范化、標(biāo)準(zhǔn)化的建設(shè)是科學(xué)數(shù)據(jù)共享的前提,不僅可以保證工程建設(shè)伊始就能夠自上而下地遵循規(guī)范化途徑有序進(jìn)行,還為科學(xué)數(shù)據(jù)的高度共享及其與其它應(yīng)用系統(tǒng)的高速通信、聯(lián)網(wǎng)創(chuàng)造必要的條件。
中醫(yī)藥科學(xué)數(shù)據(jù)中心研制中醫(yī)藥語言系統(tǒng),集成中醫(yī)藥術(shù)語近11萬條;修訂了中醫(yī)藥主題詞表8千條;研制了共建平臺固化的標(biāo)準(zhǔn)詞表29張。同時,制定了中醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享元數(shù)據(jù)標(biāo)準(zhǔn)與中醫(yī)藥科學(xué)數(shù)據(jù)分類標(biāo)準(zhǔn)。
2.6數(shù)據(jù)與共享體系
以多個大型數(shù)據(jù)庫群與數(shù)據(jù)檢索、統(tǒng)計能力為支撐,利用先進(jìn)的計算機(jī)技術(shù),構(gòu)造了一個能夠在Internet環(huán)境下融合各個自治、異質(zhì)異構(gòu)的中醫(yī)藥數(shù)據(jù)資源的,并能為用戶提供一個統(tǒng)一的全局范圍內(nèi)數(shù)據(jù)檢索環(huán)境的信息共享平臺,以支持?jǐn)?shù)據(jù)庫資源的共享、綜合利用與開發(fā)。支持?jǐn)?shù)據(jù)庫共享的主要數(shù)據(jù)為中藥、針灸、突發(fā)公共衛(wèi)生、古代文獻(xiàn)等主體數(shù)據(jù)庫群。其中中藥數(shù)據(jù)占本領(lǐng)域數(shù)據(jù)量的80%以上。中醫(yī)藥科學(xué)數(shù)據(jù)中心可以實現(xiàn)的服務(wù)功能包括:對分布式數(shù)據(jù)庫和數(shù)據(jù)集的統(tǒng)一管理、目錄服務(wù)、數(shù)據(jù)服務(wù)、延伸服務(wù)等。
數(shù)據(jù)管理是利用分布式數(shù)據(jù)庫技術(shù)、數(shù)據(jù)倉庫管理技術(shù)、元數(shù)據(jù)技術(shù)和網(wǎng)絡(luò)技術(shù),建立以分布式為主、集成式為輔的數(shù)據(jù)管理系統(tǒng),開展數(shù)據(jù)匯交、整理加工、存儲和數(shù)據(jù)更新,實現(xiàn)對科學(xué)數(shù)據(jù)資源的有效管理。
目錄服務(wù)是以元數(shù)據(jù)為核心的目錄查詢,它將通過元數(shù)據(jù)標(biāo)準(zhǔn)的核心元素將信息以動態(tài)分類的形式展現(xiàn)給用戶。用戶通過瀏覽門戶網(wǎng)站提供的元數(shù)據(jù)摘要可以快速確定自己所需的信息范圍,然后要求門戶網(wǎng)站在該范圍內(nèi)進(jìn)一步搜索。
數(shù)據(jù)服務(wù)是在目錄服務(wù)基礎(chǔ)上的數(shù)據(jù)內(nèi)容服務(wù),所提供的數(shù)據(jù)類型是多樣的,能夠?qū)Ω鞣N空間、非空間數(shù)據(jù)以及結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)提供瀏覽、查詢、下載和脫機(jī)服務(wù)等多種功能。
延伸服務(wù)是為用戶提供一系列工具,以便在眾多來源的海量數(shù)據(jù)中進(jìn)行數(shù)據(jù)搜索、多源數(shù)據(jù)整合、數(shù)據(jù)挖掘,及時發(fā)現(xiàn)所需要的知識,提高科學(xué)數(shù)據(jù)的利用率。針對自身的優(yōu)勢,構(gòu)建其有特色的服務(wù)體系,例如專題查詢、統(tǒng)計分析等等。
2.7共享策略與運行機(jī)制
本著共建共享的原則,建立中醫(yī)藥科技數(shù)據(jù)的分布與集中管理方式,合理劃分共享數(shù)據(jù)的有償與無償。逐步制定數(shù)據(jù)開發(fā)與管理分級制度。
3中醫(yī)藥科學(xué)數(shù)據(jù)中心的發(fā)展
當(dāng)代科學(xué)技術(shù)突破頻頻誕生于學(xué)科交叉的前沿領(lǐng)域表明,科學(xué)技術(shù)向著多學(xué)科綜合交叉的方向發(fā)展,而學(xué)科交叉與滲透需要多學(xué)科領(lǐng)域的知識、信息和數(shù)據(jù)的支持。在工程項目深入發(fā)展與技術(shù)需求強(qiáng)烈時,提出了若干值得思考的問題。
3.1中醫(yī)藥科學(xué)數(shù)據(jù)中心的功能擴(kuò)充
中醫(yī)藥科學(xué)數(shù)據(jù)中心的定位決定了應(yīng)該具備的功能。國家共享工程基礎(chǔ)目標(biāo)是現(xiàn)有的數(shù)據(jù)資源盡可能的實現(xiàn)共享與利用。但是,隨著中醫(yī)藥信息資源的累積與增加,數(shù)據(jù)需求從量變發(fā)展到質(zhì)變;從單純的數(shù)據(jù)發(fā)現(xiàn)轉(zhuǎn)變?yōu)橹R發(fā)現(xiàn),從數(shù)據(jù)應(yīng)用到創(chuàng)新集成應(yīng)用;這給數(shù)據(jù)中心發(fā)展提出了新的要求,特別是國家“”、“973”等重大科學(xué)研究項目,對于知識發(fā)現(xiàn)與挖掘的需求更加強(qiáng)烈。這種需求變更不僅是中醫(yī)藥科學(xué)數(shù)據(jù)中心面臨的問題,而且是具有一定代表性的問題。
科學(xué)數(shù)據(jù)共享中心功能細(xì)化為三個方面:一為資源整合管理,包括數(shù)據(jù)資源調(diào)查、匯交整合與共建管理;二為技術(shù)研究,包括信息標(biāo)準(zhǔn)與語言系統(tǒng)研究、數(shù)據(jù)分析與挖掘研究、計算機(jī)技術(shù)研究;三為服務(wù)管理,包括數(shù)據(jù)利用與服務(wù)研究、網(wǎng)絡(luò)平臺服務(wù)以及共享分級研究。
3.2中醫(yī)藥科學(xué)數(shù)據(jù)中心的工程技術(shù)
中醫(yī)藥科學(xué)數(shù)據(jù)中心的功能實現(xiàn),離不開工程技術(shù)的支撐,主要是計算機(jī)技術(shù)與信息工程技術(shù),從數(shù)據(jù)資源整合與共建,到數(shù)據(jù)存儲、服務(wù)、傳送的全過程,需要完整的、流暢的工程技術(shù)保障。領(lǐng)域?qū)I(yè)人員與專職計算機(jī)人員的緊密結(jié)合是工程實施的必要保證。
3.3優(yōu)質(zhì)品牌數(shù)據(jù)庫的建立
當(dāng)越來越多的系統(tǒng)建立起來的時候,可能并不是越多越好,反而會導(dǎo)致信息重疊、資源浪費、結(jié)果不統(tǒng)一,甚至相互矛盾。
建立數(shù)據(jù)庫評價體系,科學(xué)評價數(shù)據(jù)庫與數(shù)據(jù)質(zhì)量,促進(jìn)優(yōu)質(zhì)品牌數(shù)據(jù)庫的建立,是解決數(shù)據(jù)有效應(yīng)用的關(guān)鍵。提倡共建與聯(lián)盟也是科學(xué)數(shù)據(jù)合理分布、有效管理的方法。中醫(yī)藥數(shù)據(jù)中心需要建立優(yōu)質(zhì)數(shù)據(jù)庫與優(yōu)質(zhì)數(shù)據(jù)質(zhì)量的評價方法與機(jī)制。
在建立優(yōu)質(zhì)數(shù)據(jù)庫的評價體系的同時,應(yīng)該建立科學(xué)數(shù)據(jù)共享平臺評價體系,包括從共建、共享、服務(wù)、應(yīng)用、發(fā)展等多方面進(jìn)行科學(xué)評價。
3.4科學(xué)數(shù)據(jù)匯交機(jī)制
科學(xué)實驗與科學(xué)研究的有效數(shù)據(jù)匯交是一個大問題,需要依靠政府與制度的保障,同時也需要科學(xué)數(shù)據(jù)中心對科學(xué)數(shù)據(jù)有效評價與認(rèn)定。科學(xué)實驗數(shù)據(jù)匯交與提交級別的認(rèn)定、不同研究專業(yè)提交數(shù)據(jù)的具體原則,都是數(shù)據(jù)中心需要認(rèn)真研究的,需要最大限度保障數(shù)據(jù)提交,又嚴(yán)格審查數(shù)據(jù)質(zhì)量,有效篩選。
3.5促進(jìn)全球科學(xué)數(shù)據(jù)共享
空間因素對信息資源共享活動的根本制約,誘發(fā)了人們利用信息資源觀念的深刻變革,標(biāo)志著中醫(yī)藥信息資源共享建設(shè)時代到來。中醫(yī)藥科學(xué)數(shù)據(jù)的共享目標(biāo)與共享范圍的設(shè)定直接影響共享的分級。在保證我國科研人員充分利用科學(xué)數(shù)據(jù)的同時,也為全球科學(xué)數(shù)據(jù)共享做出貢獻(xiàn),需要建立一種嶄新的共享管理理念。