Web數(shù)據(jù)開(kāi)發(fā)在遠(yuǎn)程教學(xué)中的使用

時(shí)間:2022-05-04 11:48:00

導(dǎo)語(yǔ):Web數(shù)據(jù)開(kāi)發(fā)在遠(yuǎn)程教學(xué)中的使用一文來(lái)源于網(wǎng)友上傳,不代表本站觀(guān)點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

Web數(shù)據(jù)開(kāi)發(fā)在遠(yuǎn)程教學(xué)中的使用

【摘要】本文對(duì)webmining在遠(yuǎn)程教育中應(yīng)用進(jìn)行了研究,并通過(guò)對(duì)遠(yuǎn)程教育Web日志的分析,獲得關(guān)于學(xué)生學(xué)習(xí)的信息,根據(jù)其接受教育的對(duì)象存在著很多個(gè)性差異,基于Web數(shù)據(jù)挖掘提出了一個(gè)個(gè)性化遠(yuǎn)程學(xué)習(xí)系統(tǒng)的框架結(jié)構(gòu)和個(gè)性化服務(wù)的主要理念,使用WebUseMining技術(shù)對(duì)web日志信息進(jìn)行挖掘,并利用這些信息建立起一個(gè)智能化、個(gè)性化基于web數(shù)據(jù)庫(kù)的遠(yuǎn)程教育系統(tǒng),從而更好地改進(jìn)遠(yuǎn)程教育的服務(wù)。

【關(guān)鍵詞】Web數(shù)據(jù)挖掘,遠(yuǎn)程教育,個(gè)性化學(xué)習(xí),個(gè)性化服務(wù)

1、引言

隨著互聯(lián)網(wǎng)應(yīng)用技術(shù)的深入發(fā)展,人們對(duì)于各種網(wǎng)絡(luò)應(yīng)用的需求正在急劇增加,同時(shí)各類(lèi)網(wǎng)絡(luò)服務(wù)的競(jìng)爭(zhēng)也日益加劇。如何為用戶(hù)提供更好的服務(wù),是當(dāng)今網(wǎng)絡(luò)應(yīng)用服務(wù)商們所急需解決的問(wèn)題。基于這種需求,個(gè)性化的Web服務(wù)研究正成為目前的一個(gè)研究熱點(diǎn)。

遠(yuǎn)程教育以其便利、快捷、隨意的時(shí)間安排和廉價(jià)的收費(fèi)正逐漸成為人們接受教育的一種新興的途徑,遠(yuǎn)程教育作為一種學(xué)習(xí)手段,適用于高等教育、職業(yè)教育和成人教育。其教育對(duì)象存在著極大的差異性,主要體現(xiàn)在:個(gè)人學(xué)習(xí)目標(biāo)的不同、學(xué)習(xí)能力的不同、認(rèn)知風(fēng)格不同。所以就需要針對(duì)性的提供差異性的教學(xué)內(nèi)容和教學(xué)安排。而在現(xiàn)代遠(yuǎn)程教育模式下,學(xué)生學(xué)習(xí)的過(guò)程就是在遠(yuǎn)程教育網(wǎng)站頁(yè)面中跳轉(zhuǎn)活動(dòng)的過(guò)程,他們的每個(gè)活動(dòng)都是以教育網(wǎng)站上的一個(gè)頁(yè)面對(duì)象的點(diǎn)擊操作,這些點(diǎn)擊操作都能被完整地記錄在系統(tǒng)日志中,通過(guò)對(duì)日志的分析挖掘,一方面可以找出學(xué)生行為模式;另一方面,可以分析出遠(yuǎn)程教育網(wǎng)站的結(jié)構(gòu)組織是不是符合學(xué)生和教師學(xué)習(xí)和教學(xué)的規(guī)律。所以,將Web挖掘運(yùn)用于遠(yuǎn)程教育系統(tǒng)中,使之量身定做地為每個(gè)個(gè)體提供個(gè)性化的學(xué)習(xí)方案,從而進(jìn)一步指導(dǎo)網(wǎng)站建設(shè),是遠(yuǎn)程教育獲得進(jìn)一步發(fā)展的一個(gè)重要手段.

2.遠(yuǎn)程教育與WebMining

2.1遠(yuǎn)程教育

現(xiàn)代遠(yuǎn)程教育是當(dāng)代社會(huì)經(jīng)濟(jì)和科技發(fā)展到一定程度以后所出現(xiàn)的一種新的遠(yuǎn)程教育模式。它是在計(jì)算機(jī)和網(wǎng)絡(luò)、衛(wèi)星系統(tǒng)的支持下,實(shí)現(xiàn)異地同步的圖像、聲音以及教學(xué)雙方的交流互動(dòng)教學(xué)對(duì)傳統(tǒng)的教育模式帶來(lái)了一場(chǎng)全新的革命,其顯著特點(diǎn)是:

1)完全動(dòng)態(tài):各種學(xué)習(xí)資源是動(dòng)態(tài)的,能夠采用多種交互方式進(jìn)行上下傳,最新的教學(xué)信息也可以及時(shí)地反映到網(wǎng)上;

2)實(shí)時(shí)交互:能與教師、專(zhuān)家進(jìn)行即時(shí)交流;

3)易于協(xié)作:學(xué)習(xí)者能夠按照某種劃分方式組成各種類(lèi)型的小組,相互協(xié)作完成一定的課題項(xiàng)目,而且能夠在需要的時(shí)候得到教師、專(zhuān)家的幫助;

4)適應(yīng)性學(xué)習(xí)方式:學(xué)習(xí)者可以根據(jù)個(gè)人的程度和喜好按排制定自己的學(xué)習(xí)計(jì)劃,教學(xué)內(nèi)容能根據(jù)其選擇動(dòng)態(tài)構(gòu)建;

5)新穎全面:學(xué)校提供了豐富的而且不斷更新升級(jí)的學(xué)習(xí)資源,學(xué)生能夠很方便取得最好最新的學(xué)習(xí)資源,并以自己喜歡的格式展現(xiàn)出來(lái)。

這些特點(diǎn)反映了這樣一個(gè)趨勢(shì),學(xué)習(xí)者不再是被動(dòng)的接收教師的知識(shí),他會(huì)主動(dòng)去獲取相關(guān)信息其自主能力越來(lái)越強(qiáng),由此對(duì)遠(yuǎn)程教育系統(tǒng)提出了越來(lái)越高的要求,遠(yuǎn)程教育系統(tǒng)應(yīng)該也是一個(gè)能夠根據(jù)學(xué)習(xí)者行為信息不斷學(xué)習(xí)變化的系統(tǒng),于是如何能夠從眾多的訪(fǎng)問(wèn)者的大量訪(fǎng)問(wèn)記錄中提取其行為信息來(lái)指導(dǎo)系統(tǒng),從而提供更加完善服務(wù)就成為我們必須考慮的問(wèn)題。

2.2WebMining

Internet的蓬勃發(fā)展使WebMining成為一個(gè)熱點(diǎn)。WebMining就是針對(duì)包括Web頁(yè)面內(nèi)容、頁(yè)面之間的結(jié)構(gòu)、用戶(hù)訪(fǎng)問(wèn)信息等在內(nèi)的各種Web數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘方法提取抽象的、潛在的、有用的知識(shí)。Web站點(diǎn)中主要有三類(lèi)數(shù)據(jù):內(nèi)容數(shù)據(jù)、結(jié)構(gòu)數(shù)據(jù)、使用數(shù)據(jù)。同時(shí)WebMining是指在WWW上挖掘有趣的、潛在的、有用的模式和信息的過(guò)程。也分成三類(lèi):WebContentMining、WebStructureMining、WebUsageMining。

WebContentMining是對(duì)Web頁(yè)面內(nèi)容進(jìn)行挖掘,從Web數(shù)據(jù)中發(fā)現(xiàn)信息。盡管人們可以直接從網(wǎng)上通過(guò)抓取建立索引,實(shí)現(xiàn)檢索服務(wù)來(lái)獲得資源,但是大量的“隱藏”信息只能通過(guò)內(nèi)容挖掘來(lái)自動(dòng)挖掘。

WebStructureMining是對(duì)Web頁(yè)面之間的結(jié)構(gòu)進(jìn)行挖掘。在整個(gè)Web空間,有用的知識(shí)不僅包含在頁(yè)面的內(nèi)容中,而且也包含在頁(yè)面的結(jié)構(gòu)中。Web結(jié)構(gòu)挖掘主要針對(duì)的就是頁(yè)面的超鏈接結(jié)構(gòu),如果有較多的超鏈接指向它,那么該頁(yè)面就是重要的,發(fā)現(xiàn)的這種知識(shí)可用來(lái)改進(jìn)搜索路徑等。

WebContentMining和WebStructureMining的對(duì)象都是網(wǎng)絡(luò)上的原始數(shù)據(jù),而WebUsageMining不同于它們。它面對(duì)的是用戶(hù)和網(wǎng)絡(luò)交互過(guò)程中抽取出來(lái)的二手?jǐn)?shù)據(jù),這些數(shù)據(jù)主要是用戶(hù)在訪(fǎng)問(wèn)Web時(shí)在Web日志(logs)里留下的信息,以及其它一些交互信息,包括:訪(fǎng)問(wèn)日期、時(shí)間、用戶(hù)IP地址、服務(wù)器IP地址、方法、所請(qǐng)求URL資源、服務(wù)器響應(yīng)狀態(tài)、用戶(hù)、發(fā)送字節(jié)等。WebUsageMining就是對(duì)ServerLogs、ErrorLogs、CookieLogs等日志信息,以及用戶(hù)的注冊(cè)數(shù)據(jù)等進(jìn)行挖掘,以發(fā)現(xiàn)有用信息,并對(duì)學(xué)生訪(fǎng)問(wèn)留下的日志文件進(jìn)行分析提取,獲得關(guān)于學(xué)生學(xué)習(xí)的信息,作為對(duì)學(xué)生提供教學(xué)服務(wù)的依據(jù)。

學(xué)生在訪(fǎng)問(wèn)網(wǎng)站時(shí)會(huì)留下許多信息。WebUsageMining技術(shù)能對(duì)這些信息進(jìn)行挖掘,并利用這些信息建立起一個(gè)智能化的、個(gè)性化的遠(yuǎn)程教育系統(tǒng)。這個(gè)系統(tǒng)通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)行為的分析和研究,了解和掌握學(xué)生學(xué)習(xí)的情況、需求、能力、進(jìn)度、興趣等,及時(shí)調(diào)整學(xué)習(xí)計(jì)劃,呈現(xiàn)符合個(gè)性的學(xué)習(xí)資源,使得每一個(gè)學(xué)生身邊仿佛有了能針對(duì)自身特點(diǎn)進(jìn)行教學(xué)的“老師”而獲得個(gè)性化的教學(xué)服務(wù)

Web使用記錄挖掘的主要目標(biāo)則是從Web網(wǎng)站的訪(fǎng)問(wèn)日志記錄中獲取感興趣的模式,每個(gè)Web服務(wù)器都能有訪(fǎng)問(wèn)日志文件,它記錄了訪(fǎng)問(wèn)者的訪(fǎng)問(wèn)和交互的信息。通過(guò)分析這些數(shù)據(jù)可以幫助網(wǎng)站管理者理解用戶(hù)的行為和Web結(jié)構(gòu),從而改進(jìn)站點(diǎn)的設(shè)計(jì)。

3、WebUsageMining技術(shù)

個(gè)性化的遠(yuǎn)程教育系統(tǒng)有許多可實(shí)現(xiàn)的方案和技術(shù),基于WebMining系統(tǒng)的數(shù)據(jù)輸入一般有系統(tǒng)日志文件、用戶(hù)與系統(tǒng)交互數(shù)據(jù)(如學(xué)生注冊(cè)信息、考試成績(jī)等),但WebUsageMining技術(shù)主要用于對(duì)系統(tǒng)日志信息的挖掘。雖然WebUsageMining在具體實(shí)現(xiàn)時(shí)采用的結(jié)構(gòu)和技術(shù)各不相同,但其主要過(guò)程都包括預(yù)處理、模式發(fā)現(xiàn)和模式分析。

3.1.預(yù)處理

預(yù)處理是Web挖掘中最關(guān)鍵的一個(gè)環(huán)節(jié),其質(zhì)量關(guān)系到使用挖掘過(guò)程和模式分析過(guò)程的質(zhì)量。預(yù)處理包括數(shù)據(jù)清洗、用戶(hù)識(shí)別、會(huì)話(huà)識(shí)別、路徑補(bǔ)充和事件識(shí)別。

數(shù)據(jù)清洗其目的在于把日志文件中一些與數(shù)據(jù)分析、挖掘無(wú)關(guān)的項(xiàng)清除掉,如剔除CS-Uri-Stem項(xiàng)。還可剔除用戶(hù)請(qǐng)求訪(fǎng)問(wèn)失敗的記錄,及用戶(hù)請(qǐng)求方法中不是GET的記錄。

用戶(hù)識(shí)別這是預(yù)處理的第二步,因?yàn)槿罩疚募皇怯涗浟酥鳈C(jī)或服務(wù)器的IP地址,而要識(shí)別每一個(gè)用戶(hù),則可采用Cookie技術(shù)和用一些啟發(fā)規(guī)則來(lái)幫助識(shí)別。

會(huì)話(huà)識(shí)別在時(shí)間區(qū)段較大的Web服務(wù)器日志中,用戶(hù)有可能多次訪(fǎng)問(wèn)該站點(diǎn)。會(huì)話(huà)識(shí)別的目的就是將用戶(hù)的訪(fǎng)問(wèn)記錄劃分成單個(gè)的會(huì)話(huà)。一般采用超時(shí)識(shí)別,如果用戶(hù)請(qǐng)求的頁(yè)面之間的時(shí)間超過(guò)一定間隔,則認(rèn)為用戶(hù)開(kāi)始了一個(gè)新的會(huì)話(huà)。

路徑補(bǔ)充確認(rèn)Web日志中是否有重要的頁(yè)面訪(fǎng)問(wèn)記錄被遺漏,這個(gè)問(wèn)題的產(chǎn)生是由于Cache的存在所致。路徑補(bǔ)充的任務(wù)就是將這些遺漏的請(qǐng)求補(bǔ)充到用戶(hù)會(huì)話(huà)文件之中,也可以根據(jù)引用日志和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)提供的信息把路徑補(bǔ)充完整。

事件識(shí)別事件識(shí)別是與要挖掘什么樣的知識(shí)有關(guān),將用戶(hù)會(huì)話(huà)針對(duì)挖掘活動(dòng)的特定需要進(jìn)行事件定義。識(shí)別事件的方法有二:一個(gè)是ReferenceLength,一個(gè)是MaximalForwardReference。

3.2.模式發(fā)現(xiàn)(挖掘算法)

這個(gè)過(guò)程主要用一些挖掘算法來(lái)挖掘出規(guī)則、模式等。WebUsageMining中用到的Web日志分析及用戶(hù)行為模式的挖掘方法,主要用了統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)、序列模式等技術(shù)。

統(tǒng)計(jì)分析是分析用戶(hù)行為最常用的方法。通過(guò)求出現(xiàn)率、求平均、求中值等,統(tǒng)計(jì)最常訪(fǎng)問(wèn)的網(wǎng)頁(yè),每頁(yè)平均訪(fǎng)問(wèn)的時(shí)間,瀏覽路徑的平均長(zhǎng)度等,以獲得用戶(hù)訪(fǎng)問(wèn)站點(diǎn)的基本信息。除此,還能提供有限的低層次的錯(cuò)誤分析,比如檢測(cè)未授權(quán)入口點(diǎn),找出最常見(jiàn)不變的URL等。在遠(yuǎn)程教育系統(tǒng)中,可以分析該學(xué)生的訪(fǎng)問(wèn)次數(shù),總停留時(shí)間;該學(xué)生訪(fǎng)問(wèn)的課程數(shù);該學(xué)生對(duì)哪些課程停留時(shí)間較長(zhǎng)等,還可統(tǒng)計(jì)網(wǎng)站某個(gè)時(shí)間段內(nèi)訪(fǎng)問(wèn)的次數(shù),訪(fǎng)問(wèn)次數(shù)最多的URL地址等。

關(guān)聯(lián)規(guī)則是通過(guò)分析用戶(hù)訪(fǎng)問(wèn)網(wǎng)頁(yè)間的潛在聯(lián)系而歸納出的一種規(guī)則。關(guān)聯(lián)規(guī)則是如下的一種形式規(guī)則,如80%的用戶(hù)訪(fǎng)問(wèn)Web頁(yè)面/company/product1時(shí),也訪(fǎng)問(wèn)了/company/product2,即只要訪(fǎng)問(wèn)頁(yè)面A就有可能訪(fǎng)問(wèn)B(或C……),在WebUsageMining中,人們經(jīng)常使用的就是Apriori算法或其變形算法。在遠(yuǎn)程教育系統(tǒng)中,關(guān)聯(lián)規(guī)則可發(fā)現(xiàn)用戶(hù)會(huì)話(huà)中經(jīng)常被學(xué)生一起訪(fǎng)問(wèn)的頁(yè)面集,這些頁(yè)面之間并沒(méi)有順序關(guān)系,我們可以根據(jù)這些學(xué)生群的相同興趣進(jìn)行教學(xué)安排。同時(shí),關(guān)聯(lián)規(guī)則還可作為啟發(fā)規(guī)則為遠(yuǎn)程學(xué)生預(yù)取可能請(qǐng)求的頁(yè)面,以減少等待時(shí)間,建立起一個(gè)方便有效的學(xué)習(xí)環(huán)境。

聚類(lèi)是把一組組個(gè)體按照相似性歸并成若干類(lèi)別。在WebUsageMining領(lǐng)域包含著兩種聚類(lèi),即用戶(hù)聚類(lèi)和頁(yè)聚類(lèi)。“頁(yè)聚類(lèi)”將內(nèi)容相關(guān)的頁(yè)面歸在一個(gè)網(wǎng)頁(yè)組,對(duì)網(wǎng)上搜索引擎及提供上網(wǎng)幫助很有用;“用戶(hù)聚類(lèi)”是將具有相似訪(fǎng)問(wèn)特性的用戶(hù)歸在一起,在電子商務(wù)的市場(chǎng)分割和為用戶(hù)提供個(gè)性化服務(wù)中,能發(fā)揮巨大作用。

分類(lèi)即將一組組個(gè)體分門(mén)別類(lèi)的歸入預(yù)先設(shè)定好的幾個(gè)類(lèi)中。在WebUsageMining領(lǐng)域,分類(lèi)主要在于發(fā)展屬于特定類(lèi)的用戶(hù)模型。它要求抽取出最能反映一個(gè)給定類(lèi)的特性,通過(guò)誘導(dǎo)學(xué)習(xí)機(jī)制和分類(lèi)的過(guò)程,并通過(guò)用戶(hù)歸入某一特定類(lèi),以對(duì)同一類(lèi)別中的用戶(hù)提供相似的。分類(lèi)的服務(wù)方法有:決策樹(shù)、貝葉斯算法、K近鄰分類(lèi)器等。

遠(yuǎn)程教學(xué)中,可通過(guò)學(xué)生填寫(xiě)的個(gè)人信息及學(xué)生訪(fǎng)問(wèn)行為模式的分析,用分類(lèi)或聚類(lèi)方法劃分相似學(xué)生群體或個(gè)體,以提供相似或個(gè)性化的教學(xué)。遠(yuǎn)程教育中的協(xié)作性學(xué)習(xí)也非常重要。根據(jù)關(guān)聯(lián)、分類(lèi)分析,準(zhǔn)確劃分目標(biāo)群體,為小組分類(lèi)提供可能性和依據(jù)。小組學(xué)習(xí)也是為學(xué)生個(gè)性化服務(wù)的最好模式之一。

序列模式試圖找出頁(yè)面依照時(shí)間順序出現(xiàn)的內(nèi)在模式。如訪(fǎng)問(wèn)Web頁(yè)面/company/products的客戶(hù)中,有30%的人曾在過(guò)去的一星期里用關(guān)鍵字M在Yahoo上做過(guò)查詢(xún)。序列模式可以用來(lái)做用戶(hù)的瀏覽趨勢(shì)分析,即一組數(shù)據(jù)項(xiàng)之后出現(xiàn)另一組數(shù)據(jù)項(xiàng),從而形成一組按時(shí)間排序的會(huì)話(huà),以預(yù)測(cè)未來(lái)的訪(fǎng)問(wèn)模式,這將有助于針對(duì)特別用戶(hù)群安排特定內(nèi)容。通過(guò)序列模式研究,可以解決遠(yuǎn)程教育中針對(duì)各種層次學(xué)生進(jìn)行因材施教的問(wèn)題。

3.3.模式分析

模式分析是WebUsageMining中最后一項(xiàng)重要步驟。其通過(guò)選擇和觀(guān)察把發(fā)現(xiàn)的規(guī)則、模式和統(tǒng)計(jì)值轉(zhuǎn)換為知識(shí),再經(jīng)過(guò)模式分析得到有價(jià)值的模式,即我們感興趣的規(guī)則、模式,采用可視化技術(shù),以圖形界面的方式提供給使用者。

在個(gè)性化的遠(yuǎn)程教育系統(tǒng)中,除了對(duì)日志文件的挖掘,還要對(duì)用戶(hù)與站點(diǎn)的交互數(shù)據(jù)庫(kù)、課件樹(shù)、站點(diǎn)文件等進(jìn)行挖掘,對(duì)學(xué)生作業(yè)與考試的完成過(guò)程與結(jié)果及提問(wèn)、答疑情況進(jìn)行分析,進(jìn)行全方位的個(gè)性化教學(xué)服務(wù)。

4.個(gè)性化服務(wù)

隨著因特網(wǎng)的發(fā)展和普及,越來(lái)越多的用戶(hù)利用搜索引擎來(lái)搜索網(wǎng)上信息。盡管搜索引擎的發(fā)展已較成熟,但人們?cè)谑褂弥袇s發(fā)現(xiàn)要準(zhǔn)確、快速地查找自己所需的信息是越來(lái)越困難。主要原因有兩個(gè):a一次搜索的檢索結(jié)果(一系列URL地址)可能有成千上萬(wàn)條,而在這過(guò)于龐大的信息群中,有用信息只是其中的一小部分,并且常常發(fā)生收到或下載的信息難以消化的情況,即所謂的“認(rèn)知過(guò)載”。b.目前的搜索引擎都是服務(wù)器端軟件,用戶(hù)需要嚴(yán)格按照各種引擎所要求的格式輸入查詢(xún)?cè)~,但種種限制使用戶(hù)不知道如何貼切地表達(dá)自己的信息需求,也不知道如何更準(zhǔn)確地尋找所需信息,即所謂的“迷航”。面對(duì)網(wǎng)絡(luò)信息服務(wù)的現(xiàn)狀,人們?cè)趯で笠环N將信息用戶(hù)感興趣的信息主動(dòng)推薦給用戶(hù)的服務(wù)方式,這便是個(gè)性化信息服務(wù)。個(gè)性化信息服務(wù)是在對(duì)用戶(hù)及其需求了解的情況下,即通過(guò)用戶(hù)研究,從數(shù)量龐大、增長(zhǎng)迅速、類(lèi)型復(fù)雜的網(wǎng)絡(luò)信息中提取出用戶(hù)真正需要的那一小部分提交給用戶(hù),是以“用戶(hù)為中心”的服務(wù)原則在網(wǎng)絡(luò)環(huán)境下的具體體現(xiàn)。

5個(gè)性化的遠(yuǎn)程學(xué)習(xí)框架

5.1個(gè)性化的遠(yuǎn)程學(xué)習(xí)系統(tǒng)

實(shí)現(xiàn)個(gè)性化的遠(yuǎn)程學(xué)習(xí)系統(tǒng)的關(guān)鍵就是在學(xué)習(xí)的各個(gè)階段對(duì)個(gè)體進(jìn)行差異化的分析和處理。首先需要對(duì)參加學(xué)習(xí)的個(gè)體情況進(jìn)行分類(lèi)以安排相應(yīng)的教學(xué)內(nèi)容和進(jìn)程;其次在學(xué)習(xí)的過(guò)程中,知識(shí)表示的內(nèi)容需要根據(jù)對(duì)學(xué)習(xí)者的個(gè)性要求具有不同的形式;最后就是要對(duì)每一個(gè)階段的學(xué)習(xí)進(jìn)行相應(yīng)的評(píng)估和反饋。

個(gè)性化的遠(yuǎn)程學(xué)習(xí)系統(tǒng)設(shè)計(jì)的基本思路是對(duì)每一個(gè)主題知識(shí)的學(xué)習(xí),分別提供初、中、高三個(gè)不同類(lèi)別的學(xué)習(xí)方案。通過(guò)使用SLIQ算法進(jìn)行用戶(hù)分類(lèi),將學(xué)習(xí)者按學(xué)習(xí)能力分成不同的類(lèi)別,類(lèi)別會(huì)隨個(gè)體的學(xué)習(xí)情況進(jìn)行調(diào)整,分類(lèi)的依據(jù)是用戶(hù)的個(gè)人數(shù)據(jù)和學(xué)習(xí)情況歷史。

5.2用戶(hù)分類(lèi)

不同的個(gè)體其背景各不相同,如個(gè)人的學(xué)習(xí)能力、興趣與學(xué)習(xí)習(xí)慣、原來(lái)基礎(chǔ)、努力程度,都存在巨大的差異。因此需要區(qū)分用戶(hù)群體,以便系統(tǒng)作出個(gè)性化的學(xué)習(xí)安排。對(duì)于每一個(gè)用戶(hù)都有很多屬性,有些顯然并不對(duì)個(gè)人的學(xué)習(xí)能力構(gòu)成影響,比如地址、電子郵件等。有些是和學(xué)習(xí)能力密切相關(guān)的,比如學(xué)歷、職業(yè)、年齡和學(xué)習(xí)情況。

當(dāng)用戶(hù)第一次注冊(cè)時(shí),需要填寫(xiě)有關(guān)個(gè)人信息,系統(tǒng)通過(guò)SLIQ算法得到的用戶(hù)類(lèi)別信息將用戶(hù)歸入相應(yīng)類(lèi)別。用戶(hù)所屬類(lèi)別會(huì)根據(jù)用戶(hù)個(gè)人信息的修改和其學(xué)習(xí)情況的改變而更改,比如某用戶(hù)原先的學(xué)習(xí)能力為“低”,經(jīng)過(guò)一段時(shí)間的遠(yuǎn)程課程學(xué)習(xí)以后,其學(xué)習(xí)能力提高為“中”,此用戶(hù)的類(lèi)別將被重新計(jì)算,這樣該用戶(hù)的學(xué)習(xí)等級(jí)就可能會(huì)被提升。

顯然由于用戶(hù)的個(gè)人資料會(huì)隨時(shí)間而發(fā)生更改,而且用戶(hù)的學(xué)習(xí)能力也會(huì)發(fā)生變化,所以挖掘過(guò)程需要定期進(jìn)行以保持結(jié)果的正確性。

5.3個(gè)性化的學(xué)習(xí)知識(shí)庫(kù)

學(xué)習(xí)知識(shí)庫(kù)按相應(yīng)的主題組織學(xué)習(xí)素材,把一個(gè)主題組織成圍繞問(wèn)題和答案的一系列知識(shí)單元來(lái)進(jìn)行,對(duì)應(yīng)每個(gè)主題分解成若干知識(shí)單元。知識(shí)單元之間相互是有聯(lián)系的,聯(lián)系有可能是錯(cuò)綜復(fù)雜的,簡(jiǎn)單的聯(lián)系可以是前序知識(shí)或后繼知識(shí)等;同時(shí)知識(shí)單元的掌握程度是由一組問(wèn)題答案集來(lái)作為評(píng)估學(xué)生學(xué)習(xí)的效果,評(píng)估效果可以由評(píng)估模塊來(lái)測(cè)定,比如對(duì)這一單元知識(shí)是全部掌握、部分掌握、少量掌握還是沒(méi)有掌握;另外特定的知識(shí)單元對(duì)應(yīng)于不同水平的知識(shí)表示,以適合具有不同類(lèi)別的學(xué)生學(xué)習(xí)。

5.4個(gè)性化的知識(shí)表示

知識(shí)表示是系統(tǒng)提供給不同類(lèi)別的學(xué)生學(xué)習(xí)的課程知識(shí)界面,是預(yù)先準(zhǔn)備好的適合不同程度的學(xué)生學(xué)習(xí)的不同詳細(xì)程度的學(xué)習(xí)材料。

知識(shí)表示的示意如圖1:

知識(shí)表示可依據(jù)學(xué)生水平、背景的不同體現(xiàn)不同的層次:如簡(jiǎn)單扼要的表示;帶相應(yīng)解釋、說(shuō)明和示例的表示;配有詳盡解釋和大量參考鏈接的表示。通過(guò)提供不同層次的知識(shí)表示以適合學(xué)生的個(gè)體差異。當(dāng)然,不同的表示對(duì)應(yīng)的是同一個(gè)知識(shí)點(diǎn)的學(xué)習(xí),所以對(duì)應(yīng)的問(wèn)題集和期望的答案應(yīng)是一致的。

當(dāng)學(xué)生進(jìn)入某個(gè)主題知識(shí)的學(xué)習(xí)時(shí),一個(gè)知識(shí)單元呈現(xiàn)內(nèi)嵌的知識(shí)給用戶(hù),記錄他的反應(yīng),更新其掌握水平,產(chǎn)生下一個(gè)知識(shí)表示,當(dāng)要求的掌握水平被達(dá)到了,則可轉(zhuǎn)入流程到另一個(gè)單元;如果沒(méi)有達(dá)到,則根據(jù)具體的掌握程度,或返回其前序知識(shí)的學(xué)習(xí)或提供更詳盡程度知識(shí)表示頁(yè)面的學(xué)習(xí)。因此學(xué)生的學(xué)習(xí)是根據(jù)其自身的基礎(chǔ)和掌握知識(shí)的快邁程度的不同而不同的。

6.個(gè)性化遠(yuǎn)程教育系統(tǒng)實(shí)例

整個(gè)解決方案共分三大部分:第一部分是系統(tǒng)的總體結(jié)構(gòu);第二部分是系統(tǒng)的基本組成及工作流程;第三部分是實(shí)施和個(gè)性化服務(wù)支持。

1.基于Web的數(shù)據(jù)庫(kù)遠(yuǎn)程教育管理系統(tǒng)的總體結(jié)構(gòu)

根據(jù)遠(yuǎn)程教育的實(shí)際需求和發(fā)展趨勢(shì),提出基于Web的數(shù)據(jù)庫(kù)遠(yuǎn)程教育管理系統(tǒng)的總體結(jié)構(gòu)如圖2所示.該數(shù)據(jù)庫(kù)管理系統(tǒng)包括以下部分:

(1)Web瀏覽器,它是客戶(hù)端用于輸入查詢(xún)條件和顯示查詢(xún)結(jié)果的交互界面;

(2)Web服務(wù)器,它提供Internet服務(wù),管理HTML構(gòu)成的信息并提供對(duì)數(shù)據(jù)庫(kù)的存取接口以及用于接收用戶(hù)輸入的信息及形成查詢(xún)結(jié)果;

(3)TCP/IP(TransmissionControlProtocol/InternetProtocol),用于實(shí)現(xiàn)Web瀏覽器

圖2基于Web的數(shù)據(jù)庫(kù)遠(yuǎn)程教育管理系統(tǒng)總體結(jié)構(gòu)框圖

與Web服務(wù)器之間的網(wǎng)絡(luò)信息交換;

(4)CGI(CommonGatewayInterface),它是Web服務(wù)器運(yùn)行外部程序的一種規(guī)范;

(5)數(shù)據(jù)庫(kù)服務(wù)器,用于實(shí)現(xiàn)課件的存儲(chǔ)和數(shù)據(jù)庫(kù)管理功能以及身份驗(yàn)證、計(jì)費(fèi)等,并提供分布式數(shù)據(jù)庫(kù)的搜索路徑和搜索規(guī)則,以有利于網(wǎng)絡(luò)資源共享和利用.

2.數(shù)據(jù)庫(kù)遠(yuǎn)程教育管理系統(tǒng)的基本組成及工作流程

數(shù)據(jù)庫(kù)遠(yuǎn)程教育管理系統(tǒng)的基本組成按功能可以大致分成如下幾部分:

(1)課件基本信息表

(2)課件存儲(chǔ)對(duì)應(yīng)表

(3)課件讀取權(quán)限表

(4)課件計(jì)費(fèi)表

(5)課件自測(cè)結(jié)果表

以課件基本信息表為例,其中包含的條目有:

課件編號(hào)、課件名稱(chēng)、課程介紹、主講教師、開(kāi)課單位、課程分類(lèi)、瀏覽方式、計(jì)費(fèi)方法、可否下載等主要內(nèi)容,其它各表也均包含與自功能有關(guān)的項(xiàng)目,在此不一一列出.

對(duì)于某一訪(fǎng)問(wèn)者,其簡(jiǎn)單工作流程如圖3所示.

圖3訪(fǎng)問(wèn)數(shù)據(jù)庫(kù)管理系統(tǒng)工作流程

3、設(shè)計(jì)說(shuō)明核心功能的特點(diǎn):

●以知識(shí)點(diǎn)為核心組織網(wǎng)絡(luò)教學(xué):以知識(shí)點(diǎn)為核心組織網(wǎng)絡(luò)教學(xué)突破了傳統(tǒng)教學(xué)以章節(jié)為主線(xiàn)的教學(xué)方式,有利于教師準(zhǔn)確評(píng)估自己的教學(xué)效果,有利于學(xué)生對(duì)知識(shí)的準(zhǔn)確把握,有利于網(wǎng)絡(luò)教材的編寫(xiě)制作,同時(shí)為建立智能化的學(xué)習(xí)跟蹤、智能答疑提供了基礎(chǔ)。

●自適應(yīng)的學(xué)習(xí)機(jī)制:根據(jù)學(xué)生瀏覽課件的情況,比如哪種知識(shí)點(diǎn)看到多少,頁(yè)面瀏覽時(shí)間長(zhǎng)短,就可以判斷出學(xué)生背景知識(shí)水平,知識(shí)點(diǎn)的掌握情況,個(gè)人的學(xué)習(xí)能力強(qiáng)弱。根據(jù)這些判斷的結(jié)果動(dòng)態(tài)調(diào)整教學(xué)資源鏈接,提供最適合個(gè)人的學(xué)習(xí)資源,達(dá)到最佳的教學(xué)效果。同時(shí)為學(xué)生提供方便的個(gè)人資源管理工具,使學(xué)生能夠根據(jù)自己的需要組織自己的學(xué)習(xí)資源,與教師提供的資源形成互補(bǔ),激發(fā)學(xué)生自主學(xué)習(xí)的興趣,發(fā)揮網(wǎng)絡(luò)教學(xué)的優(yōu)勢(shì)。

●智能答疑系統(tǒng):系統(tǒng)可以方便快捷地解答學(xué)生的問(wèn)題,同時(shí)結(jié)合知識(shí)點(diǎn)的結(jié)構(gòu)分析學(xué)生問(wèn)題的分布情況,指導(dǎo)教師采取進(jìn)一步的輔導(dǎo)措施。教師可以根據(jù)自身教學(xué)的情況調(diào)整知識(shí)點(diǎn)的結(jié)構(gòu)。

●對(duì)象的行為跟蹤:教師通過(guò)查看學(xué)生的在線(xiàn)學(xué)習(xí)記錄,能夠了解到學(xué)生的學(xué)習(xí)情況,比如學(xué)生的自測(cè)情況,學(xué)生實(shí)驗(yàn)的完成情況,作業(yè)、測(cè)試成績(jī)等,使教師可以方便準(zhǔn)確的評(píng)估自己的教學(xué)效果。教師還可以根據(jù)學(xué)習(xí)跟蹤掌握學(xué)生在線(xiàn)行為,引導(dǎo)學(xué)生正確合理利用網(wǎng)絡(luò)教學(xué)資源。教務(wù)人員也可以通過(guò)該系統(tǒng)了解教師的教學(xué)情況,評(píng)估教學(xué)質(zhì)量。

●學(xué)生自我測(cè)評(píng):學(xué)生可以隨時(shí)向系統(tǒng)發(fā)出申請(qǐng),系統(tǒng)根據(jù)學(xué)生申請(qǐng)的難度要求和學(xué)生學(xué)習(xí)的范圍生成相應(yīng)的試卷。學(xué)生完成試卷后系統(tǒng)自動(dòng)批閱試卷并將批閱結(jié)果返回給學(xué)生,使學(xué)生能夠看到哪些知識(shí)點(diǎn)存在不足,以便在后續(xù)的學(xué)習(xí)過(guò)程中作相應(yīng)的調(diào)整。

●遠(yuǎn)程考試系統(tǒng):教師可以選擇人工或智能組卷方式,生成試卷對(duì)學(xué)生進(jìn)行在線(xiàn)考試或測(cè)驗(yàn)。學(xué)生的考卷經(jīng)系統(tǒng)自動(dòng)評(píng)分后存入成績(jī)庫(kù),教師可按需要獲得各類(lèi)統(tǒng)計(jì)分析信息。

●先進(jìn)的網(wǎng)絡(luò)教學(xué)管理系統(tǒng):以教學(xué)服務(wù)管理為核心功能,同時(shí)提供教學(xué)分析和電子結(jié)算功能。模塊化設(shè)計(jì)便于不同部門(mén)構(gòu)架適于自己的管理系統(tǒng),通用標(biāo)準(zhǔn)數(shù)據(jù)交互為校際管理提供透明交互操作,教學(xué)行為分析與數(shù)據(jù)挖掘?yàn)榫W(wǎng)絡(luò)教學(xué)調(diào)整管理提供反饋數(shù)據(jù)。

7、總結(jié):

從發(fā)展來(lái)看,利用計(jì)算機(jī)互連網(wǎng)開(kāi)展遠(yuǎn)程教育是必然趨勢(shì),本文通過(guò)對(duì)Web日志的分析挖掘和對(duì)不同的用戶(hù)進(jìn)行分類(lèi)并提供相應(yīng)的知識(shí)界面,采用數(shù)據(jù)挖掘技術(shù),在大量的教學(xué)信息的基礎(chǔ)上,利用數(shù)據(jù)分析和挖掘工具,開(kāi)發(fā)教育行為分析工具,指導(dǎo)學(xué)生學(xué)習(xí)和教師教學(xué),提出了一個(gè)遠(yuǎn)程個(gè)性化學(xué)習(xí)的框架模型。個(gè)性化學(xué)習(xí)的服務(wù)體現(xiàn)在學(xué)習(xí)知識(shí)庫(kù)的構(gòu)建、個(gè)性化學(xué)習(xí)資料的呈現(xiàn)和學(xué)習(xí)進(jìn)程的安排上。遠(yuǎn)程教育的真正優(yōu)勢(shì)在于提供符合用戶(hù)個(gè)體的個(gè)性化的學(xué)習(xí)安排,個(gè)性化的教育服務(wù)勢(shì)必會(huì)促進(jìn)遠(yuǎn)程教育的進(jìn)一步發(fā)展,從而提供給用戶(hù)更加滿(mǎn)意的服務(wù),可以相信,其應(yīng)用前景極為廣闊.

【參考文獻(xiàn)】

1教育部文件.現(xiàn)代遠(yuǎn)程教育工程教育資源開(kāi)發(fā)標(biāo)準(zhǔn).1999.10

2韓家煒,孟小峰,王靜,李盛恩.Web挖掘研究.計(jì)算機(jī)研究與發(fā)展.2001.4:405~414

3朱明.數(shù)據(jù)挖掘.合肥:中國(guó)科技大學(xué)出版社,2002.5

4汪啟軍,申瑞民.基于Web的遠(yuǎn)程教育系統(tǒng)模型的研究.計(jì)算機(jī)工程.2000.12:157~159

5施建生.伍衛(wèi)國(guó).Web日志中挖掘用戶(hù)瀏覽模式的研究,西安交通大學(xué)學(xué)報(bào).2001.35(6)621~624

6宋擒豹,沈鈞毅.Web日志的高效多能挖掘算法.計(jì)算機(jī)與發(fā)展.2001.3:328-333

7朱曉云.WEB數(shù)據(jù)與個(gè)性化服務(wù)中應(yīng)用研究.情報(bào)雜志.2004.2

8李澤文基于WEB數(shù)據(jù)挖掘技術(shù).現(xiàn)代計(jì)算機(jī).2004.7

9童恒慶,梅清WEB日志挖掘數(shù)據(jù)預(yù)處理研究.現(xiàn)代計(jì)算機(jī).2004.3

10謝維奇基于“電大在線(xiàn)”遠(yuǎn)程教學(xué)平臺(tái)的WEB數(shù)據(jù)挖掘.教育信息化2004.10

11高巖胡靜濤WEB數(shù)據(jù)挖掘的原理、方法及用途2002.7

12陳恩紅等Web使用挖掘:從Web數(shù)據(jù)中發(fā)現(xiàn)用戶(hù)使用模式計(jì)算機(jī)科學(xué).2001.5

13麗娜等.Web日志挖掘中的數(shù)據(jù)預(yù)處理的研究[J].計(jì)算機(jī)工程第26卷,第四期,2000年4月

14陳新中,李巖,謝永紅.Web挖掘研究.計(jì)算機(jī)工程與應(yīng)用,2002(12)

15鄒濤、黃源、張福炎等基于WWW的文本信息挖掘情報(bào)學(xué)報(bào)1999(4)