信息資源再生的統計分析論文

時間:2022-10-06 04:55:55

導語:信息資源再生的統計分析論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

信息資源再生的統計分析論文

一、統計分析

1.瀏覽次數與回帖數分析

筆者選取瀏覽次數、回帖次數和每百次瀏覽回帖數三個指標來分析論壇信息的再生情況。瀏覽次數代表該信息資源被利用的情況,瀏覽次數越多,表明該資源被利用的情況越好。回帖次數代表資源的再生情況,回帖數越多,表明該資源被反饋而增加信息的機會越多。每百次瀏覽回帖數代表該資源被增加的效率,每百次瀏覽回帖數越大,表明該資源在利用的過程中信息量增加的概率越高。在統計時段內,對抽取的550個樣本進行統計分析發現,單個帖子的最小瀏覽次數為113次,最大瀏覽次數為966209次,平均瀏覽次數為27449.75次,標準差為53675.487;單個帖子的最小回帖數為49個,最大回帖數為313個,平均回帖數為92.62個,標準差為41.152;每百次瀏覽回帖數最小為0.01,最大為50.44,平均為1.9338,標準差為3.77905。統計結果表明,論壇信息資源在利用過程中得到了發展,但是樣本標準差普遍偏大,這表明不同樣本帖子的瀏覽次數、回帖數和每百次瀏覽回帖數之間具有較大的差異。不同網站的帖子瀏覽次數、回帖次數及每百次瀏覽回帖數的統計情況見下表1。對每個帖子的瀏覽次數進行單因素方差分析發現,不同網站的瀏覽次數具有顯著性差異(F=8.014,p<0.01),新浪論壇的帖子瀏覽次數顯著高于貓撲論壇和網易論壇,貓撲論壇和網易論壇的帖子瀏覽次數之間不具有顯著性差異。對每個帖子的回帖次數進行單因素方差分析發現,不同網站的回帖次數具有顯著性差異(F=5.445,p<0.01),網易論壇的帖子回帖次數顯著高于新浪論壇和貓撲論壇,新浪論壇和貓撲論壇的回帖數之間不具有顯著性差異。對每百次瀏覽回帖數進行單因素方差分析發現,不同網站的每百次瀏覽回帖數具有顯著性差異(F=14.684,p<0.01),新浪論壇的每百次瀏覽回帖數顯著低于網易論壇和貓撲論壇,網易論壇和貓撲論壇的每百次瀏覽回帖數之間不具有顯著性差異。瀏覽次數體現了有效的用戶數,每百次瀏覽回帖數說明了用戶在瀏覽帖子的過程中回帖概率的高低。以上數據表明不同網站不僅在有效用戶數上存在差異,而且在用戶參與網絡回帖的積極性上也存在差異。對不同版塊的帖子瀏覽次數進行單因素方差分析發現,不同版塊的帖子瀏覽次數具有顯著性差異(F=4.504,p<0.01),教育版塊的帖子瀏覽次數顯著高于財經版塊和旅游版塊,數碼版塊的帖子瀏覽次數顯著高于財經版塊;其他版塊的帖子瀏覽次數之間沒有顯著性差異。對不同版塊的回帖次數進行單因素方差分析發現,不同版塊的回帖次數具有顯著性差異(F=7.834,p<0.01),教育版塊和旅游版塊的回帖次數顯著高于財經版塊和數碼版塊,其他版塊的回帖次數之間不存在顯著性差異。對不同版塊的每百次瀏覽回帖數進行單因素方差分析發現,不同版塊的每百次瀏覽回帖數具有顯著性差異(F=4.300,p<0.01),數碼版塊的每百次瀏覽回帖數顯著高于財經版塊、教育版塊和旅游版塊,財經版塊、教育版塊和旅游版塊三者之間不存在顯著性差異。以上數據表明,不同版塊之間的有效用戶數和用戶參與回帖的積極性也具有顯著差異。

2.回帖內容分析

由于論壇取樣并非來自專業教育網站,因此論壇帖子的回帖內容的構成比較復雜。為了分析網絡論壇中回帖內容的構成與質量,筆者對所有的回帖內容進行了編碼,分為四類:增加信息內容、支持的內容、反對的內容和無價值內容。其中增加信息內容包括補充新內容、提出建議、提問和提示三類,支持的內容包括支持原帖內容和支持回帖內容兩類,反對的內容包括反對原帖內容和反對回帖內容兩類,無價值內容包括重復他人觀點和無關廣告兩類。網絡論壇中不同回帖內容的數量統計見表3。結果表明,在所有的回帖中,表示支持的內容所占份額最大,達到47.88%;其次是增加信息內容和無價值內容,分別為23.99%和20.84%;表示反對的內容最少,只有7.30%。對四類回帖內容的百分比進行單因素方差分析表明:不同網站在增加信息內容類帖子的百分比上具有顯著性差異(F=14.984,p<0.01),網易論壇增加信息內容類帖子百分比顯著高于新浪論壇和貓撲論壇,新浪論壇和貓撲論壇之間無顯著性差異;不同網站在支持內容類帖子的百分比上具有顯著性差異(F=11.779,p<0.01),新浪論壇表示支持內容類帖子的百分比顯著高于網易論壇和貓撲論壇,網易論壇和貓撲論壇之間無顯著性差異;不同網站在反對內容類帖子的百分比上具有顯著性差異(F=8.523,p<0.01),貓撲論壇表示反對內容類帖子的百分比顯著高于網易論壇,網易論壇表示反對內容類帖子的百分比顯著高于新浪論壇;不同網站在無價值內容類帖子的百分比上無顯著性差異。網絡論壇中不同版塊回帖內容的百分比構成見表5。對四類回帖內容的百分比進行單因素方差分析表明:不同版塊在增加信息內容類帖子的百分比上具有顯著性差異(F=2.951,p<0.05),財經版塊增加信息內容類帖子的百分比顯著高于數碼版塊和旅游版塊,其他版塊之間并無顯著性差異;不同版塊在支持內容類帖子的百分比上具有顯著性差異(F=15.491,p<0.01),財經版塊在支持內容類帖子的百分比上顯著低于其他三個版塊,其他三個版塊之間無顯著性差異;不同版塊在反對內容類帖子的百分比上具有顯著性差異(F=3.434,p<0.05),財經版塊在反對內容類帖子的百分比上顯著低于數碼版塊和教育版塊,其他版塊之間無顯著性差異;不同版塊在無價值內容類帖子的百分比上具有顯著性差異(F=12.109,p<0.01),財經版塊在無價值內容類帖子的百分比上顯著低于其他三個版塊,其他三個版塊之間無顯著性差異。

3.信息資源再生的用戶統計

由于網絡論壇中常常允許用戶匿名參與論壇回帖,所以在進行信息資源再生的統計中并沒有統計匿名用戶的情況。在調查時段內,三大網站的四個版塊共計有注冊用戶22877個。在這些注冊用戶參與論壇回帖的過程中,用戶參與的帖子數最少為1個,最多為47個,平均為1.337個。其中只參與1個帖子的用戶達85.6%,97%的用戶參與帖子的數目不超過3個,99%的用戶回帖數不超過6個。統計結果顯示,在注冊用戶中用戶回帖數最少為1個,最多為633個,平均為2.17個。其中只回帖一次的用戶占77.7%,95%的用戶回帖數不到4個,超過17次回帖的用戶只占總用戶數的1%。從網絡信息資源的再生來看,最有價值的是增加信息內容。考慮到無法對用戶單個回帖的影響進行判斷,而且大部分的用戶只參與了一個帖子的回復,筆者對用戶回帖進行了如下處理:即分別計算用戶回帖中增加信息內容占該用戶發帖總數的比例,將這一比例大于等于80%的用戶定義為高價值組,將這一比例小于等于20%的用戶定義為低價值組。高低價值組參與帖子數的比較情況見表6。筆者通過比較高價值組和低價值組參與帖子數的差異發現,他們之間具有顯著性差異(F=357.971,p<0.001),高價值組參與帖子回復的平均數(1.0420)顯著低于低價值組參與帖子回復的平均數(1.2802)。對兩組用戶參與帖子回復的次數進行進一步的分析發現,99.8%的高價值組用戶參與帖子回復的次數小于等于4個,參與回復的最大帖子數為12個;而在所有參與帖子次數高于4次的用戶中,97.38%的用戶處于低價值組,只有2.62%的用戶處于高價值組。

4.發帖者自頂帖分析

在網絡論壇中,一個完整的帖子包括發帖者發表的原始帖和跟帖者發表的跟帖,其中跟帖者發表的跟帖數量各不相同,跟帖者的組成相對比較復雜,任何人都可以跟帖。在網絡論壇中還存在這樣的現象:發帖者參與到帖子的回復中,成為回帖者,甚至在有些帖子中,發帖者本人成為帖子的最多回帖者。筆者將發帖者同時也是最大回帖者的帖子稱之為自頂帖,自頂帖在網絡論壇中是一種非常常見的現象。通過對自頂帖和非自頂帖的回帖內容構成進行獨立樣本卡方檢驗發現,自頂帖和非自頂帖在內容構成上存在差異,自頂帖和非自頂帖之間在增加信息內容類帖子的百分比(F=64.396,p<0.01)和反對內容類帖子的百分比(F=13.787,p<0.01)上存在顯著性差異,自頂帖增加信息內容類帖子的百分比顯著高于非自頂帖內容,反對內容類帖子的百分比低于非自頂帖;自頂帖和非自頂帖在支持內容類帖子的百分比和無價值內容類帖子的百分比之間均無顯著性差異。在所分析的550個論壇帖子樣本中有201個帖子的最大回帖者是發帖者本人,占總數的36.5%。可見,各個網站和版塊的論壇中都存在自頂帖現象。不同網站和版塊中的自頂帖數量分布情況見表7。筆者通過對其進行差異性檢驗發現,不同網站的自頂帖數量之間存在顯著性差異(F=10.935,p<0.01),貓撲論壇的自頂帖數量明顯低于新浪論壇,新浪論壇的自頂帖數量明顯低于網易論壇。不同版塊的自頂帖數量之間也存在顯著性差異(F=25.252,p<0.01),數碼版塊的自頂帖數量明顯低于教育版塊,教育版塊顯著低于旅游和財經版塊,旅游和財經版塊之間無顯著性差異。

二、研究結果與討論

1.網絡論壇中交互程度低

許多研究者指出,網絡論壇中不同的交互深度會產生不同的學習效果。黎加厚將網絡行為中的交互深度細分為三類:“淺度互動”是指僅用為數不多的字句認同和贊賞博文和作者的表述,以及摘錄文章中的精彩語句并表態;“中度互動”是指簡單地分析,粗略地表達觀點,或簡要描述個人行為的交互程序,包括回復者與作者分享心得體會;“深度互動”是指能深入反思博文主題,提出個人獨立的見解和觀點。(黎加厚,2009)以網絡論壇為樣本,從調查統計的結果來看,網絡論壇中的交互深度遠遠沒有達到我們的預期水平,主要體現在以下三個方面:第一,內容比例失衡。從論壇的回帖內容來看,目前的網絡論壇中有價值的內容偏少,有用信息只占回帖總數的23.99%,大部分回帖內容只是表示支持或反對某些觀點,或者發表一些沒有價值的內容或廣告。論壇回帖主要是淺度交互的內容,中度交互的內容非常少,深度交互的內容更少。同伴之間的相互質疑、相互交流是推進討論進一步發展的動力,是促進資源利用者進行深入思考的保證。但是筆者發現,網絡論壇中大部分的回帖都是表示對原帖或跟帖內容的簡單支持或者反對,這與我們傳統的交流過程存在較大的差異。在傳統的交流過程中,雙方的交流是雙向的,而且雙方在明確知道對方的意思后往往是通過認真的思考來完成信息的交流。如果一方僅僅通過回答同意、反對或提供無關信息等來回應他人,這種交流過程將無法真正完成。但是通過對統計結果的分析,我們可以看出,網絡中的交互過程主要是按照這種單向的交流過程進行的,這說明網絡論壇中的交流方式與傳統的交流方式存在差異,也說明網絡論壇中的交互深度不夠。第二,支持與反對的比例失衡。統計結果表明,在論壇回帖的過程中,表示同意的回帖數有24392條,而表示反對的回帖數只有3718條,支持回帖次數是反對回帖次數的6.56倍。這說明用戶對網絡論壇中的帖子內容,表示支持的概率遠遠大于表示反對的概率。進一步分析發現,在所統計的550個帖子中,共有514個帖子其支持內容的回帖數大于反對內容的回帖數,只有36個帖子其反對內容的回帖數大于支持內容的回帖數,前者是后者的14.3倍。Gunther指出,網民們在網絡上尋找信息的過程中,高卷入度必然引發詳盡分析,并由此而引發更多的拒絕。(Gunther,1992)如此低的拒絕率表明用戶在網絡論壇中的卷入度不夠。另外,論壇中這么多人表達支持的意思,并不能表明大部分的人都支持原帖的觀點,這是因為論壇中的回帖內容可能更多是回帖者不經過仔細思考而匆忙表達出自己的贊成或反對之意,而至于自己在回帖中所解構出的意思是否是自己思維的結果,或者說是否表達了自己的真實意愿,就顯得不是很重要了。第三,用戶對網絡論壇中的內容缺乏深入思考。主要體現在兩個方面:一是對網絡論壇中的內容真偽缺乏判斷,二是對內容評價缺乏多維指標。網絡論壇中,用戶通常根據自己的直覺而不是根據自己已有的經驗來綜合判斷信息的真偽,因而對論壇中的信息要么盲目相信,要么簡單否定,更不會利用網絡對這些信息的真偽進行證實。例如,用戶在接受信息時通常會隨大流,對于非主流觀點通常會進行選擇性忽視,對于與自己的觀點相左的回帖與信息也會進行選擇性忽視,而很少能夠對不同的觀點進行批駁,或者詳細論證自己的觀點。因此,在網絡論壇中常常可以發現,論壇的交流過程常常是簡單的附和與爭吵的過程,而不是討論。

2.網絡論壇的影響因素分析

在以網絡論壇為代表的信息資源再生過程中,不同網站和版塊的回帖內容構成,以及不同用戶在提供信息資源的數量和質量上都存在差異。網站和版塊的差異體現了規則的差異,版塊差異還體現了主題的差異,用戶差異更可以上升為用戶角色的差異。由此,網絡信息資源再生的影響因素可以歸納為平臺機制、網站與版塊規則、用戶差異與主題差異等幾個因素。在信息資源再生平臺的運行過程中,網站和版塊規則是營造網絡文化氛圍的基礎,用戶的行為都必須遵循這些規則。如果用戶違反了這些規則,就會受到懲處,如被刪帖,被禁止發言,甚至被封號等。雖然用戶信息資源再生行為建立在網站和版塊規則的基礎之上,但是隨著用戶網絡行為的不斷進化,也有可能與網站及版塊規則存在沖突。當沖突產生時,網站和版塊管理員既可以對違規行為進行糾正,也可以通過修改規則來響應用戶的需求。在調查過程中,不同網站和版塊在內容構成上所體現出來的差異,首先就受到網站和板塊規則的制約。主題是信息資源再生的核心,用戶的信息資源再生行為必然要圍繞相關主題而進行。主題首先會影響用戶群體的選擇,用戶通常會參加自己感興趣的網絡活動。其次,主題是否專業會直接影響用戶群體規模的大小,主題專業性越強,平臺的專業選擇性就越強,用戶群就越小;相反,平臺越大眾化,平臺的專業選擇性就越弱,用戶群就越大。再次,論壇主題也會影響論壇內容的選擇。在用戶參與信息資源再生的過程中,用戶要想使自己或生成的內容具有較大的社會影響,必然會注意發帖與平臺主題的相關性,并將內容到相關主題的版塊內。如果再生內容與原始資源沒有相關性,那么其影響也會很小,難以真正發揮其作用。在網絡論壇中,回帖通常要圍繞原始資源的小主題和版塊的大主題而進行,所有內容通常要圍繞論壇主題這個核心而展開。不同主題會影響用戶的行為差異,使得不同網站和版塊的信息資源再生體現出差異性。而相同網站的不同版塊的回帖差異,從側面也反映了主題對信息資源再生的影響。信息資源再生過程中網絡用戶之間也存在差異。“尊重動機”是論壇參與的動機之一,即網民希望通過在論壇中的發帖行為,獲得他人的尊重、信任和贊賞,以期確立自己的地位和聲望。(陳然,2012)一些用戶由于前期發帖所形成的號召力,成為網絡中的權威人物。權威人物由于前期網絡行為產生的信譽而形成榜樣作用,成為其他用戶模仿的對象,并影響其他用戶的網絡行為。權威人物在建立威信的同時對版塊規則的制定也會產生一定的反作用,甚至影響版塊規則的制定。網絡行為不是一個人的網絡行為,而是群體網絡行為的合集。個人行為也不是網絡行為的全部,沒有網絡大眾的參與,網絡信息資源的再生就無法實現。如果網絡用戶的行為與網絡社區文化相左,就要不斷調整自己的行為使之適應網絡社區文化的要求,否則就離開這個網站,尋找新的適合自己行為特點的網站。權威用戶的行為只有受到廣大用戶的響應,才能成為榜樣;如果其行為受到用戶的抵制,也要通過不斷修正自己的行為來迎合用戶的期望。另外,群體網絡行為習慣也可以反作用于規則。當規則和群體行為發生沖突時,如果不能通過調整規則等方式來協調群體行為,很有可能會導致用戶群的離去。

三、總結與展望

本研究對網易、新浪和貓撲三個網站的財經、教育、數碼和旅游四個版塊的550個帖子的回帖內容進行統計分析發現,不同論壇網站以及相同論壇網站中的不同版塊在帖子瀏覽次數、發帖次數、每百次瀏覽回帖數、發帖內容構成、發帖者自頂帖次數等方面存在顯著性差異。網絡用戶參與的帖子數與用戶回帖質量相關,參與帖子過多的用戶其回帖質量較差。網絡論壇中用戶回帖質量較差,主要體現在內容比例失衡、支持與反對的比例失衡、對網絡論壇中的內容缺乏深入思考等方面,其根本原因在于網絡論壇中的交互程度過低。不同網站、不同版塊之間的回帖內容存在差異的原因包括:不同網站和版塊的規則制定存在差異,有效用戶群的大小和構成不同,以及論壇主題的差異。在網絡論壇的利用過程中,這些因素造成了用戶回帖內容和網絡行為的差異。本研究也存在一定的局限性。例如,由于統計方法的限制,對高價值和低價值用戶的劃分只能依據樣本中回帖內容的分類,而不能根據用戶回帖對其他用戶的影響來進行劃分。另外,網絡論壇中回帖的質量參差不齊,能否把它們全部稱之為再生資源也值得商磋。這些問題也是后續研究需要解決的問題。

作者:何向陽熊才平單位:湖南第一師范學院信息科學與工程學院華中師范大學教育信息技術學院