ML自動化信息方案

時間:2022-03-11 11:04:00

導語:ML自動化信息方案一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

ML自動化信息方案

[摘要]信息是任何電子商務和電子政務網站必須解決的技術問題,本文介紹了一種基于Xml的信息自動化方案,方案中無需引入數據庫管理系統,降低了網站建設成本,提高了信息的效率。

[關鍵詞]信息XML電子商務電子政務

一、引言

隨著Internet的飛速發展和普及,電子商務和電子政務網站已經成為企事業單位重要的信息平臺,也是人們快速獲取各種信息的重要途徑。目前國內很多公司都建立了自己的門戶網站和部門網站,來各類新聞和通知等信息。

當前信息大致有兩種方式:第一種是通過固定的模板來信息,即根據已有的HTML格式的信息模板,通過簡單的內容替換來生成靜態的頁面,然后通過FTP上傳到服務器,再修改主頁上的連接進行;第二種是將信息數據保存到數據庫或者文件中,當用戶閱讀具體信息的時候,從數據庫或文件中調出數據,動態生成顯示頁面。

第一種方式,信息格式靈活,顯示速度較快,但整個過程很繁瑣,維護起來非常麻煩;第二種方式,信息的和管理比較方便;本文主要介紹一種基于XML的自動化信息方案,無需引入數據庫系統,將靜態HTML頁面顯示速度快的特點和文件存儲節省成本和便于維護的特點相結合,提供一種便捷的信息和維護方式,尤其適用于中小型網站信息。

二、XML技術的特點

XML(extensibleMarkupLanguage)是W3C在1998年9月設計的一個SGML(StandardGeneralizedMarkupLanguage標準通用標記語言)的簡化版本。XML是一種簡單而有效的通用語言規范,屬于元標記語言。XML文檔是用純文本編寫的,可以用多種方法創建和編輯。XML文檔允許用戶根據自己的需要,靈活定義數據組織方式。采用XML技術進行數據存儲具有以下特點:

通用性:XML是開放的國際化標準,W3C正式批準的,具有標準的名域說明方法,支持文檔對象模型標準、可擴展類型語言標準、可擴展鏈接語言標準和XML指針語言標準。使用XML可以在不同的計算機系統間交換信息。

易用性:XML對SGML進行了精簡,它拋棄了SGML中不常用的部分,方便用戶編寫Web頁面同時也給設計人員實現XML瀏覽器降低了困難。

跨平臺性:由于XML本身具有良好的跨平臺性,只要數據存儲為XML格式,那么這些數據就可以被任何其他語言或系統識別。

高性價比的存儲方案:相比于普通的文件,XML文檔在數據定位和修改等操作方面具有明顯的優勢,具有較好的速度和效率;XML文檔可以代替數據庫實現常用的數據操作,無需單獨安裝數據庫系統軟件,使得系統的整體成本得以降低。

目前,處理XML文檔的方式主要有SAX與DOM兩種。SAX(SimpleAPIforXML)是一種基于流的,以事件處理方式工作的接口。DOM(DocumentObjectModel)則是在對XML文檔進行分析后,在內存中建立起一個完整的樹結構,然后在此基礎上進行各種操作。簡單地比較來看,SAX對系統資源要求低,速度快,但對文檔的操作是只讀的;DOM的處理能力強大!但要求大量的系統資源,尤其是對于大的文檔。而后還出現了Xpath和XPointer用以完成XML的搜索和轉換;XSML和XSLT和SOAP用以完成XML的遠程對象訪問,XMLQueryLanguages的出現使XML查詢語言可用于任何XML文檔。

三、基于XML的信息方案

公司網站的信息不僅包括新聞,還包括通知,公告,招聘信息和各種動態信息,其整體流程為:系統管理員為信息者設置權限,信息者根據自己的用戶名和口令登錄到信息界面,進行信息的和管理,部分信息在前還需要系統管理員進行審批。本方案以新聞信息為例進行說明:

1.總體設計方案

根據Web軟件B/S結構的特點,方案中新聞數據的存儲采用XML文件格式,開發工具選擇ASP[根據實際需要,可以自由選擇其他語言工具(如JSP,PHP等)與XML文件自由組合]。

為了充分利用傳統信息中靜態HTML頁面前臺顯示速度快的優點,在新聞數據寫入XML文檔的同時,由程序根據約定模板自動生成當前新聞的靜態HTML頁面,采用當前時間作為文件的名稱(如20080201091011.html,此命名方式在新浪網等門戶網站大量使用),同時為了避免XML文件過大造成解析過慢,新聞分為近期新聞和早起新聞,對于近期新聞采用XML文件和靜態HTML頁面雙重存儲格式,XML文件用于支持對新聞數據的修改,修改后重新生成靜態HTML頁面用于前臺顯示;早期新聞只保留靜態HTML頁面供瀏覽,XML文件中不進行數據保存,不提供修改操作。管理員可以通過管理界面將當前的近期新聞轉為過期新聞,轉換的同時將XML文件中對應的數據刪除。同時考慮到新聞中經常出現的多媒體信息(如圖片,音頻和視頻數據),根據其數據量大,獨立引用的特點,只保存多媒體文件的名字,當新聞瀏覽時通過多線程的方式直接到指定目錄進行加載。新聞流程如下圖:

信息系統包括前臺新聞顯示部分和后臺新聞和維護部分。核心功能簡介如下:

(1)新聞管理。提供新聞,刪除,編輯,近期新聞轉為過期新聞等管理操作。

(2)權限管理。引入角色組的概念,它是權限控制的單位,每個角色組具有對網站部分資源的控制權限。

(3)用戶管理。提供用戶添加,刪除和修改等操作入口。每個用戶必須歸屬于某個角色組。

(4)模板管理。對新聞的靜態HTML模板進行添加,修改和刪除等操作。

(5)文件上傳。將新聞中可能需要鏈接的各種文件上傳到服務器指定目錄。

2.XML文檔設計

XML文檔主要用于保存新聞中的非多媒體信息,多媒體信息則保存目錄信息。每個新聞節點中包含了構成新聞的各個要素,內容正文部分按段落錄入,為了區分普通的文本內容和多媒體內容,每段還包括了段落的標識和段落的內容。下面是一個保存新聞內容的XML文檔部分內容示例:

<?xmlversion="1.0"encoding="gb2312"?>

<?xml:stylesheettype="text/xsl"?>

<document>

<news>

<title>新聞的標題</title>

<date>新聞錄入的時間</date>

<link>新聞對應HTML靜態頁面鏈接</link>

<class>新聞的類別</class>

<keyWords>新聞的關鍵字</keyWords>

<author>新聞的作者</author>

<segment>

<segmentTag>段落內容的標識</segmentTag>

<segmentContent>段落內容數據</segmentContent>

</segment>

</news>

</document>

3.關鍵技術的研究與實現

(1)新聞模板設計。典型的新聞內容中包含新聞的關鍵字,新聞標題,日期,單位,者,正文等要素,信息的關鍵在于正文數據已何種形式寫入到XML文件中。本方案中將新聞的具體內容分段進行處理,一則新聞的正文部分由若干段組成,每一段的內容可以是單一的文本,圖片或者其他允許的多媒體,也可以是多種文件按照一定順序和空間排列的組合形式。信息的初始狀態每段只有一欄,者可以根據實際需要對某一段落進行分欄,每一欄內放置單一的文件內容。從而使得新聞內容的組合方式更靈活,簡單,實用。(2)面向對象的編碼實現。方案中服務器端采用VBScript進行編碼,該腳本支持面向對象的編碼,為了充分發揮其面向對象的可重用性,靈活高效的特點,在對系統整體進行編碼進行研究和分析之后,引入了面向對象的知識,設計了用于操作XML文件的類。操作主要包括以節點為單位的獲取,修改,刪除,增加等操作。該類的主要描述如下:

ClassCls_News

‘屬性變量的定義

…………

PublicPropertyGetnewsId

''''獲取XML文件中節點具體屬性的值

EndProperty

…………

PublicFunctionGetInfoFromXml(objXmlDoc)

''''從Xml中讀取指定節點的數據,并填充各個屬性

EndFunction

PublicFunctionAddToXml(objXmlDoc,xmlFile)

''''添加信息到XML文件中

EndFunction

PublicFunctionEditToXml(objXmlDoc,xmlFile)

''''編輯當前XML文件中信息

EndFunction

PublicFunctionDeleteFromXml(objXmlDoc,xmlFile)

''''從XML文件中刪除數據

EndFunction

…………

EndClass

四、總結

本文介紹的技術已經在中小型的電子商務網站中有了初步的應用,高性價比的存儲方案獲得了單位的充分肯定。當然使用過程中我們也發現一些問題需要改進,這其中包括加快大數據量XML文檔的解析速度,探索XML文檔的檢索方式和增強信息模板的靈活性等幾個方面的內容,這些將是我們后續研究的主要工作。總之,采用XML技術進行信息的自動化具有很高的實用意義,尤其是對于中小型電子商務和電子政務網站的信息,能夠提供高性價比的內容存儲和方案。

參考文獻:

[1]吳志剛等:基于Web的信息資源模型.計算機應用研究,2000,17(3)

[2]張海永等:精通ASP+XML+CSS網絡開發混合編程.電子工業出版社,2006

[3]魏英:Internet環境下自動新聞系統.計算機應用,2004年第24卷

[4]楊友河等:XML技術在電子商務的數據中的應用研究.機械,2004年z1期

[5]萬靜等:鐵路貨運電子商務信息規范-tfbXML注冊中心模式研究.商場現代化,2007年18期