雷雨話劇范文
時(shí)間:2023-03-23 12:45:00
導(dǎo)語:如何才能寫好一篇雷雨話劇,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
[關(guān)鍵詞]孫道臨;改編,《雷雨》;電影
的話劇《雷雨》創(chuàng)作于1933年,發(fā)表于1934年的《文學(xué)季刊》第一卷第3期。50年以后的1983年,孫道臨對它進(jìn)行了改編、導(dǎo)演,由上海電影制片廠拍攝成同名電影,孫道臨在電影中扮演了周樸園的角色。這雖說是一次大膽的嘗試,成功的地方有目共睹,但美中不足的是,孫道臨在改編、導(dǎo)演《雷雨》時(shí),有兩個(gè)方面偏離了的本來意思:刪去《雷雨》的序幕和尾聲,使電影的整體結(jié)構(gòu)性與內(nèi)在感染力大大削弱;對人物階級性的重心偏移,使電影的主要人物失卻原有的厚重感和真實(shí)性。
1942年,曾將巴金的小說《家》改編成為同名話劇,因?yàn)樗木幍姆群艽螅援?dāng)他把稿件交給巴金時(shí)感到心中不安,但巴金看過以后卻“欣然肯定”了他的改編,這一點(diǎn)使他“終身不能忘懷”。1983年,孫道臨將話劇《雷雨》改編成同名電影之后,卻沒有發(fā)表任何關(guān)于這次改編的意見,有意思的是,他卻在1985年,和他的女兒萬方一起將其話劇劇本《日出》改編成電影,也由上海電影制片廠隆重推出。這至少說明,是很注意改編作品的,他對孫道臨改編《雷雨》是持保留態(tài)度的。
一
電影是一種現(xiàn)代化的綜合藝術(shù),按照常規(guī)它在時(shí)間的把握上、道具的籌備上、光、電、聲的綜合搭配上,都應(yīng)當(dāng)比話劇更具操作上的靈活性和方便性。但孫道臨卻很輕率地將《雷雨》的序幕和尾聲刪去了。其實(shí),對《雷雨》的序幕和尾聲是相當(dāng)重視的,但是歷來的導(dǎo)演們,從來不注重的感覺,致使《雷雨》的序幕和尾聲幾乎沒有被搬上過舞臺,這使非常失望:“《雷雨》被斫去了‘序曲’和‘尾聲’,無頭無尾,直挺挺一段軀干擺在人們面前。……果若一味憑信自己的主見,不肯多體貼作者執(zhí)筆時(shí)的苦心,便率爾刪除,這確實(shí)是殘忍的。”、萬方1985年將《日出》改編為電影劇本時(shí),首先就“增加了序幕”,也增加了尾聲――“光明的尾巴”。
孫道臨之所以這樣做,可能有多方面的原因,但重要的一點(diǎn)是他沒有很好地理解的《雷雨?序》,寫作《雷雨》的序幕和尾聲的真正用意是“仿佛有希臘悲劇Chorus一部分的功能,導(dǎo)引觀眾的情緒入于更寬闊的深思的海。”“Chorus”的意思就是“合唱隊(duì)”“合唱”,所以,在此我們可以明顯看到希臘悲劇中合唱隊(duì)的影響和啟示。是想用音樂的功能來表達(dá)文學(xué)的意思。
開幕時(shí),外面遠(yuǎn)處有鐘聲。教堂內(nèi)合唱頌主歌同大風(fēng)琴聲,最好是Bach:High Mass in B Minor Benedictus qui venaitDomino Nomini――屋內(nèi)寂靜無人。
……老婦人漸漸倒在地上,舞臺全暗,聽見遠(yuǎn)處合唱彌撒和大風(fēng)琴聲……大彌撒聲。
在第四幕結(jié)束時(shí),作者又呼應(yīng)前面:
舞臺漸暗,奏序幕之音樂(High Mass-Bach)若在遠(yuǎn)處奏起,至完全黑暗時(shí)最響,與序幕末尾音樂聲同。幕落,即開,接尾聲。
在尾聲中:
開幕時(shí)舞臺黑暗。只聽見遠(yuǎn)處教堂合唱彌撒聲同大風(fēng)琴聲,序幕姊弟的聲音。
在此所最想運(yùn)用的是巴赫的《b小調(diào)彌撒曲》,這部彌撒曲包括四部五個(gè)樂章,一共27個(gè)樂段,其音域廣泛、結(jié)構(gòu)復(fù)雜、技巧繁復(fù)、意蘊(yùn)豐富,可以說是整個(gè)宗教音樂中最有代表意義的華章,具有濃重的宗教氣氛,而且它包含了全宇宙中所有的事件經(jīng)歷、全人類所有的情感,當(dāng)然也是想概括或者代表周樸園一生及其一家人的遭遇。《b小調(diào)彌撒曲》出現(xiàn)在“序幕”和“尾聲”中對全劇具有一種預(yù)告、總結(jié)、照應(yīng)和涵蓋作用。它的旋律自然、樸素、優(yōu)美,在教堂演唱時(shí),具有莊嚴(yán)肅穆的色彩;人們聽后可消除塵世俗念,體會上帝的神圣與慈愛。因此,在“序幕”和“尾聲”中,以演奏巴赫的《b小調(diào)彌撒曲》為主,另外還有不可忽視的且與之相協(xié)調(diào)的彌撒合唱聲,由音樂起,以音樂終,使全劇具有濃郁的肅穆的氛圍,觀眾被深深地吸引到劇情中去了。孫道臨改編、導(dǎo)演的《雷雨》開幕時(shí)比較簡單、直接,畫面上首先出現(xiàn)的是江南水鄉(xiāng),一艘輪船穿過江橋,劈波斬浪向前挺進(jìn),這可能是告訴觀眾周樸園從無錫來到北方某城市;音樂也是比較單調(diào)的管弦樂的交替或并行演奏,其旋律和節(jié)奏相對簡潔,如此效果,觀看電影后能不表示遺憾嗎?經(jīng)過10年“”以后,的性格幾乎變得圓滑起來,有時(shí)簡直就是一個(gè)“好好先生”。如果他對電影《雷雨》沒有很大的反感情緒,他一般情況下肯定是要說話的,但他卻什么也未表示。這些不太重視音樂的導(dǎo)演們從一開始就割裂了對《雷雨》的整體思維,割裂了文學(xué)和音樂之間那種微妙而神奇的聯(lián)系,使其感染力大大削弱。
其次,還想讓序幕和尾聲給觀眾以“所謂的‘欣賞的距離’。這樣,看戲的人們可以處在適中的地位來看戲,而不至于使情感或者理解受了驚嚇。”孫道臨導(dǎo)演的電影《雷雨》一開始就直奔主題,沒有給觀眾一個(gè)預(yù)設(shè)的心理;到結(jié)束時(shí),舞臺上風(fēng)聲、雨聲、叫聲、哭聲、槍聲此伏彼起,一瘋、一傻、一逃、三死悲慘欲絕,丟下一個(gè)痛苦的周樸園。觀眾對故事『青節(jié)的變化感到目不暇接,給人的感覺是緊張激烈,扣人心弦,讓觀眾一刻也得不到休息與放松,使觀眾看了以后心里很累。這樣,從根本上違背了的本意。眾所周知,“電影改編貴在創(chuàng)造,但終究不過是一種‘二度刨作’。與一般創(chuàng)作相比,其自由度就少得多,要受到許多限制。”。改編者“要懂得原著的長處在哪里,不足在哪里,不要把原著的缺點(diǎn)擴(kuò)張了,也不要把原著的精華損傷了……方是忠于原著的最好態(tài)度。”上海芭蕾舞團(tuán)將《雷雨》改編為大型芭蕾舞劇,不但對改編以后的幾個(gè)重要人物的性格的表現(xiàn)給予了首肯,同時(shí),“對舞劇《雷雨》的音樂、舞美設(shè)計(jì)也很贊賞”。兩年之后卻沒有給孫道臨改編、導(dǎo)演的同名電影《雷雨》以一個(gè)字的說法,個(gè)中原因不言自明。
二
1956年《劇本》記者采訪了,并撰文《同志漫談(家)的改編》,在文中說:“改編者必須盡力理解原著精神,融會貫通……只有把原著加以消化,成為自己的血肉,改編的劇本才會有生命。……寫劇本不應(yīng)該老是被政治概念拖著走。作者所以被政治概念拖著走,這說明他還是落在政治的后面,作者的生活、思想沒有趕上政治的要求,因此在寫作的時(shí)候常常處于被動的狀態(tài)。”孫道臨所改編、導(dǎo)演的電影《雷雨》在政治性方面有著明顯的缺陷。
在《雷雨》電影中,魯侍萍似乎變成了一個(gè)頂天立地、敢于斗爭的無產(chǎn)階級女性形象:她與周樸園狹路相逢在周公館,但她卻顯得非常主動、鎮(zhèn)靜,兩次主動要借機(jī) 溜走,離開周公館,而周樸園卻是主動、及時(shí)叫她留下。孫道臨所要表現(xiàn)的是魯侍萍要走,周樸園要留;但在話劇劇本中所要表現(xiàn)的正好相反:魯侍萍要留,周樸園要趕:
周樸園:(看她不走)你不知道這間房子底下人不準(zhǔn)隨便進(jìn)來么?
魯侍萍:(看著他)不知道,老爺。
周樸園:你是新來的下人?
魯侍萍:不是的,我找我的女兒來的。
周樸園:你的女兒?
魯侍萍:四鳳是我的女兒。
周樸園:那你走錯(cuò)屋子了。
魯侍萍:哦。――老爺沒事了?
周樸園:(指窗)窗戶誰叫打開的?
魯侍萍:哦。(很自然地走到窗前,慢慢地走向中門)
當(dāng)周樸園提醒她走錯(cuò)了屋子的時(shí)候,她還是留戀不已,沒話找話地問“老爺沒事了?”以延宕時(shí)間,然后利用關(guān)窗戶的時(shí)機(jī),再一次創(chuàng)造機(jī)會,果然周樸園又開始打昕30年來他一直打聽的那件事,沒想侍萍回答得比他問的還清楚:自己的隱私別人居然知道得更詳細(xì)。這使周樸園感到很難堪,第二次發(fā)出了逐客令:
周樸園好,你先下去。讓我想一想。
魯侍萍
老爺,沒有事了?(望著樸園,眼淚要涌出)老爺,您那件雨衣,我怎么說?
這時(shí),魯侍萍卻不愿走,又問了一句“老爺。沒事了?”,然后主動說出只有他倆知道的繡有“梅”字的綢襯衣,同時(shí)發(fā)出了深情的呼喚:“樸園,你找侍萍么?侍萍在這兒。”
孫道臨雖然說曾一度扮演過話劇《雷雨》中的周萍和周沖,但是由于1983年是個(gè)特殊的年代――改革開放剛剛開始,所以他的心中還一直有“階級斗爭”這根弦,而且是緊繃繃的。在電影中,孫道臨儼然是讓魯侍萍審判周樸園,甚至將受苦受難30年的魯侍萍歇斯底里地撕碎周樸園給她的支票的細(xì)節(jié)也改成了魯侍萍很輕蔑、很自信地把支票放在煤油燈上燒掉,把第三幕中魯大海要拿手槍去找周家復(fù)仇而侍萍誓死阻止的情節(jié)也全部省略。
當(dāng)然,與此同時(shí),孫道臨把周樸園的形象也進(jìn)行了一番修改,真正地把周樸園塑造成了一個(gè)所謂“專橫、冷酷、自私、虛偽”的資本家形象。關(guān)于周樸園形象的復(fù)雜性大家都不陌生,藍(lán)棣之曾經(jīng)問過一個(gè)不到10歲的小女孩兒,問她看過話劇《雷雨》以后認(rèn)為劇中最好的是哪個(gè)人,這個(gè)小女孩兒居然說是“周樸園”,這證明原本并沒想把周樸園寫得很壞,因?yàn)榈母赣H萬德尊就是周樸園形象的原型之一,在主觀上也是不會那樣做的。但是,孫道臨在電影中卻把周樸園話語和動作大塊大塊地刪除。
①周樸園在感覺到魯侍萍的關(guān)窗戶動作非常熟悉的時(shí)候,問:“你貴姓?”“你在無錫是什么時(shí)候?”
②周樸園問魯侍萍:“你在無錫是什么時(shí)候?”
③周樸園說:“無錫是個(gè)好地方。”
④周樸園一直在親自打聽或派人打聽魯侍萍的下落。
篇2
【關(guān)鍵詞】虛擬場景;路經(jīng)規(guī)劃;八叉樹;A*算法
中圖分類號:TP39文獻(xiàn)標(biāo)識碼A文章編號1006-0278(2013)06-172-01
一、引言
隨著虛擬現(xiàn)實(shí)技術(shù)的日益成熟,只有景色、建筑物等一般視景信息的虛擬場景已不能滿足人們的視覺需求,迫切需求一個(gè)有生命的對象引入到虛擬場景中,增加瀏覽者的沉浸感。虛擬場景中虛擬人的路徑規(guī)劃是虛擬現(xiàn)實(shí)研究中的一項(xiàng)關(guān)鍵技術(shù)。目前,研究者們已經(jīng)把研究的重心放在如何為虛擬人規(guī)劃出一條行走的最優(yōu)路徑,使虛擬人的路徑導(dǎo)航更具有真實(shí)感和可信度。
由于虛擬環(huán)境中的模型多由三角面網(wǎng)格組成,通過使用基于空間多層次劃分的八叉樹方法,充分發(fā)揮了其空間劃分的優(yōu)勢,加快了場景的渲染速度,減少了確定對象的處理時(shí)間以及存儲空間①。
文章采用八叉樹和A*算法相結(jié)合的方法,對路徑進(jìn)行規(guī)劃,并對A*算法做了改進(jìn),以適應(yīng)八叉樹的存儲結(jié)構(gòu)。
二、密集型區(qū)域八叉樹劃分算法
八叉樹是由四叉樹推廣到三維空間而形成的一種三維柵格數(shù)據(jù)結(jié)構(gòu),它作為一種場景組織方法,廣泛應(yīng)用于虛擬現(xiàn)實(shí)系統(tǒng),可顯著減少對場景中多邊形進(jìn)行排序的時(shí)間。
由于傳統(tǒng)八叉樹對空間的劃分是均勻的,導(dǎo)致了最終生成一個(gè)結(jié)構(gòu)不平衡的八叉樹,從而增加整個(gè)八叉樹的存儲空間以及各結(jié)點(diǎn)的遍歷時(shí)間。文章采用了對傳統(tǒng)八叉樹算法進(jìn)行改進(jìn),采用基于密集型區(qū)域八叉樹劃分方法。密集型區(qū)域八叉樹的網(wǎng)格劃分算法是對每一子空間重新建立最小包圍盒,這樣避免了在建立頂點(diǎn)樹時(shí),由于該部分頂點(diǎn)在空間上分布不均勻而導(dǎo)致樹的深度的增加,進(jìn)而減少了存儲空間,加快了網(wǎng)格模型數(shù)據(jù)的讀取速度。另外,由于建立了頂點(diǎn)的最小包圍盒,在誤差較小時(shí),只有空間距離比較近的頂點(diǎn)才會聚合在一起;而相距較遠(yuǎn)的頂點(diǎn)只有在深層次簡化時(shí)才會聚合,這些特點(diǎn)在一定程度上保證了簡化時(shí)網(wǎng)格模型的逼真度。
密集型區(qū)域八叉樹劃分方法的算法描述如下:
步驟1使用OBB包圍盒方法建立模型的最小包圍盒。
步驟2以包圍盒的X軸、Y軸、Z軸方向的中分面作為分割基準(zhǔn),將包圍盒平均劃分為八個(gè)子包圍盒。
步驟3如果每個(gè)子空間內(nèi)存在物體的屬性不相同或未達(dá)到規(guī)定的限差,則重新從步驟1開始進(jìn)行劃分。否則,劃分結(jié)束,并對劃分后的每一個(gè)結(jié)點(diǎn)記錄下結(jié)點(diǎn)編號、劃分標(biāo)志、結(jié)點(diǎn)在頂點(diǎn)樹中的深度以及它所含的景物面片表的入口指針。
三、A*算法
A*算法是建立在典型的Dijkstra算法上的,是由Hart,Nilsson,Raphael等人首先提出的。該算法的創(chuàng)新之處在于選擇下一個(gè)被檢查的節(jié)點(diǎn)時(shí)引入了已知的全局信息,對當(dāng)前節(jié)點(diǎn)距終點(diǎn)的距離做出估計(jì),作為評價(jià)該節(jié)點(diǎn)處于最優(yōu)路線上的可能性的量度,這樣就可以首先搜索可能性較大的節(jié)點(diǎn),從而提高了搜索過程的效率。
下面是對A*算法的介紹,我們首先來介紹一下啟發(fā)式搜索中的估計(jì)函數(shù)。因?yàn)樵趩l(fā)式搜索中,對位置的估價(jià)是十分重要的。估價(jià)函數(shù)的表示如下:
其中是節(jié)點(diǎn)的估價(jià)函數(shù),是已知的,指在狀態(tài)空間中從初始節(jié)點(diǎn)到節(jié)點(diǎn)的實(shí)際代價(jià);是從結(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)最佳路徑的估計(jì)代價(jià),它體現(xiàn)了搜索的啟發(fā)信息,啟發(fā)信息決定著算法的啟發(fā)能力。啟發(fā)信息越多,估價(jià)函數(shù)就越好,即約束條件越多,則排除的節(jié)點(diǎn)就越多,說明這個(gè)算法越好。這種做法存在一個(gè)平衡的問題,也會使算法的準(zhǔn)確性下降。具體的說,代表了搜索的廣度優(yōu)先趨勢,當(dāng)時(shí),可以省略,這樣就提高了搜索效率。
A*算法是一個(gè)可采納的最好優(yōu)先算法。A*算法的估價(jià)函數(shù)可表示為:
這里,是估價(jià)函數(shù),是起點(diǎn)到終點(diǎn)的最短路徑值,是到目標(biāo)的最短路經(jīng)啟發(fā)值。由于這個(gè)其實(shí)是無法預(yù)先知道的,所以我們用前面的估價(jià)函數(shù)做近似。代替,但需要滿足(在大多數(shù)情況下都滿足時(shí),可以不用考慮)。代替,并滿足。可以證明應(yīng)用這樣的估價(jià)函數(shù)是可以找到最短路徑的。
四、基于密集型區(qū)域八叉樹的A*算法改進(jìn)
由于使用八叉樹存儲結(jié)構(gòu)存儲的環(huán)境地圖擴(kuò)展步長不一致,采用傳統(tǒng)的A*算法效率較低,因此對A*算法做了改進(jìn),以適應(yīng)八叉樹結(jié)構(gòu)的搜索。改進(jìn)的辦法是從葉節(jié)點(diǎn)開始搜索并為Open表設(shè)置兩個(gè)優(yōu)先隊(duì)列,命名為隊(duì)列1和隊(duì)列2(隊(duì)列1中存放的節(jié)點(diǎn)總是高于隊(duì)列2),在兩個(gè)隊(duì)列中分別存放相鄰層次的全部節(jié)點(diǎn),層次越高的優(yōu)先級越高。通過這種分層次的搜索,也大大縮小了搜索的空間并縮短了搜索時(shí)間,這樣一來大大提高了搜索效率。
五、結(jié)束語
針對于復(fù)雜的3D環(huán)境,文章根據(jù)八叉樹適合虛擬場景劃分的特點(diǎn),采用了一種適合密集型區(qū)域的八叉樹劃分方法,進(jìn)行場景劃分。為適合八叉樹的存儲結(jié)構(gòu),對A*算法做了改進(jìn),引入優(yōu)先級隊(duì)列并采用了分層結(jié)構(gòu),采用了從葉節(jié)點(diǎn)到根節(jié)點(diǎn)的搜索方法,規(guī)劃出了虛擬人行走的最優(yōu)路徑。
篇3
關(guān)鍵詞:聚類算法;并行;K-means;PAM
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2009)24-7010-03
Research on Parallelizing Based on Clustering Algorithm
PENG Hou-wen, YANG Shuang, HE Feng-cheng
(Dalian University of TechnologyNational Exemplary Software School, Dalian 116620, China)
Abstract: Cluster analysis is an important component of data mining, aiming at improving the executive efficiency of clustering. In this paper, a method of parallel operating is applied to k-means algorithm and PAM algorithm, in order to improve these two algorithms. Experiments show that: parallel k-means algorithm has better performance than serial k-means algorithm; and k-means algorithm has better parallelism and extendibility than PAM algorithm. Finally, this paper puts forward the idea of introducing the method of parallel operating into spectral clustering algorithm technology.
Key words: clustering algorithm; parallelizing; k-means PAM
所謂數(shù)據(jù)挖掘,簡言之是指在大量的數(shù)據(jù)中發(fā)現(xiàn)、提取潛在的有用信息和知識的過程。聚類分析是數(shù)據(jù)挖掘法技術(shù)中重要組成部分,聚類分析是指根據(jù)數(shù)據(jù)中對象及其之間的關(guān)系,將數(shù)據(jù)對象分組。其目標(biāo)是,使組內(nèi)的對象相互之間是相似的(相關(guān)的),而不同組中的對象是不同的(不相關(guān)的)。組內(nèi)的相似性(同質(zhì)性)越大,組間差別越大,聚類效果就越好[1]。
由于數(shù)據(jù)挖掘是從海量數(shù)據(jù)中提取有用信息,處理效率問題成了對海量數(shù)據(jù)處理的瓶頸之一,傳統(tǒng)的單機(jī)串行算法效率較低;由于部分聚類算法中蘊(yùn)涵并行性,所以為了解決處理效率問題,將并行化的程序設(shè)計(jì)思想(并行處理)引入聚類算法,同時(shí)降低算法的復(fù)雜度,使用機(jī)群系統(tǒng)進(jìn)行并行計(jì)算,從而有效的縮短聚類的時(shí)間。
1 K-means算法
1.1 傳統(tǒng)K-means聚類算法
K-means算法以k為輸入?yún)?shù),把包含n個(gè)對象的集合分為k個(gè)簇,使得結(jié)果簇內(nèi)的相似度高,而簇間的相似度低。簇的相似度是關(guān)于簇中對象的均值度量,可以看做簇的質(zhì)心或重心[2]。
傳統(tǒng)K-means算法的處理流程如下:
輸入: k:簇的數(shù)目
D:包含n個(gè)對象的數(shù)據(jù)集
輸出:k個(gè)簇的集合
方法:
1) 從D中任意選擇k個(gè)對象作為初始簇重心
2) Do
3) 根據(jù)簇中對象的均值,將每個(gè)對象(再)指派到最相似的簇
4) 更新簇均值,即計(jì)算每個(gè)簇中對象的均值
5) while 數(shù)據(jù)集中所有對象的平方誤差和E不再發(fā)生變化
通常,采用平方誤差準(zhǔn)則,其定義如下:
其中,E是數(shù)據(jù)集中所有對象的平方誤差和,p是空間中的點(diǎn),即給定對象,mi是簇Ci的均值(p和mi都是多維的)。換言之,對于每個(gè)簇中的每個(gè)對象,求對象到簇中心距離的平方再求和。這個(gè)準(zhǔn)則試圖使得生成的k個(gè)結(jié)果簇盡可能的緊湊和獨(dú)立。
1.2 并行化K-means改進(jìn)算法
隨著并行處理技術(shù)的快速發(fā)展,越來越多的研究人員嘗試將并行處理方法應(yīng)用于提高聚類算法的效率,通過研究發(fā)現(xiàn)K-means算法具有很大的并行性。首先,可將待挖掘的數(shù)據(jù)集N劃分為t個(gè)數(shù)據(jù)子集,t為并行處理環(huán)境中處理機(jī)的數(shù)目;然后將劃分后t個(gè)數(shù)據(jù)子集分別發(fā)送到t臺處理機(jī)進(jìn)行數(shù)據(jù)聚類處理;最后主機(jī)將收到的節(jié)點(diǎn)機(jī)的聚類結(jié)果計(jì)算平方誤差準(zhǔn)則函數(shù)E的值,并將前后兩次結(jié)果做差,如果差的絕對值小于閾值10-6,則處理結(jié)束,否則繼續(xù)循環(huán)處理。并行K-means算法的流程如圖1所示。
1.3 實(shí)驗(yàn)結(jié)果與分析
我們搭建工作站機(jī)群系統(tǒng),通過以太網(wǎng)卡等連接5臺PC機(jī)(Intel P4.17GHz、256MB RAM,安裝LINUX redhat OS),采用Master/Slave模式的數(shù)據(jù)并行策略,建立基于消息傳遞的工作站機(jī)群系統(tǒng),用MPI進(jìn)行算法編程驗(yàn)證實(shí)驗(yàn)。
本實(shí)驗(yàn)的主要目的是驗(yàn)證并行化后的K-means算法的執(zhí)行時(shí)間和效率,所以為了簡單起見,本實(shí)驗(yàn)中的數(shù)據(jù)是通過計(jì)算機(jī)隨機(jī)產(chǎn)生的整型數(shù)據(jù)。同時(shí),我們將并行與串行算法的實(shí)驗(yàn)結(jié)果相比較,當(dāng)進(jìn)行算法比較時(shí),把程序運(yùn)行10次并取平均值進(jìn)行作圖比較(如圖2)。
從圖2中我們可以看出并行K-means在數(shù)據(jù)集較大時(shí)表現(xiàn)出比串行K-means更好的執(zhí)行效率,而當(dāng)數(shù)據(jù)集較小時(shí),主要由于并行計(jì)算中PC間通信時(shí)耗較大,所以單機(jī)串行算法表現(xiàn)出相對更高的執(zhí)行效率。實(shí)驗(yàn)可以證明K-means算法在并行機(jī)群上具有了良好的并行性和可擴(kuò)展性。
2 PAM算法
2.1 PAM聚類算法
PAM是k中心點(diǎn)(k-medoid)算法之一,它試圖確定n個(gè)對象的k個(gè)劃分。在隨機(jī)選擇k個(gè)初始代表對象之后,該算法反復(fù)試圖選擇簇的更好的代表對象。分析所有可能的對象對,每對中的一個(gè)對象看作是代表對象,另一個(gè)看做非代表對象。對于每個(gè)這樣的組合,計(jì)算結(jié)果聚類的質(zhì)量。對象oj被那個(gè)可以使誤差值減少最多的對象所取代。再一次迭代中產(chǎn)生的每個(gè)簇中最好的對象集合成為下次迭代的代表對象。最終集合中的代表對象便是簇的代表中心。PAM算法的處理流程如下[2]:
輸入:k: 結(jié)果簇的個(gè)數(shù)
D: 包含n個(gè)對象的數(shù)據(jù)集合
輸出:k個(gè)簇的集合
方法:
1) 從D中任意選取k個(gè)對象作為初始的對象或種子
2) repeat
3) 將每個(gè)剩余對象指派到最近的代表對象所代表的簇
4) 隨機(jī)地選取一個(gè)非代表對象Orandom
5) 計(jì)算用Orandom交換代表對象Oj的總代價(jià)S
6) if S
7) until不在發(fā)生變化
2.2 并行化PAM改進(jìn)算法
為了使問題簡單化,首先我們選擇任意的當(dāng)前k個(gè)對象作為節(jié)點(diǎn){Ol,…,Ok}。對于PAM算法,當(dāng)每一步結(jié)束時(shí),一種情況是找到一個(gè)代價(jià)最小的相鄰節(jié)點(diǎn),另一種情況是算法結(jié)束(當(dāng)前節(jié)點(diǎn)代價(jià)最小)[3]。如果我們需要從當(dāng)前節(jié)點(diǎn)移動到一個(gè)新的節(jié)點(diǎn),我們必須交換一個(gè)已選對象和一個(gè)未選對象。為了保證已選對象在前k位,我們交換他們的下標(biāo)。這樣{Ol,…,Ok}會一直作為當(dāng)前節(jié)點(diǎn),而且不會受到當(dāng)前節(jié)點(diǎn)移動的影響。
PAM的主要任務(wù)是檢查當(dāng)前節(jié)點(diǎn)的所有相鄰節(jié)點(diǎn),而且必須在劃分的同時(shí)檢查[3]。假設(shè)在p個(gè)進(jìn)程(記為p1,p2,…,pp)上運(yùn)行PAM算法。算法描述為:
1)將所有相鄰節(jié)點(diǎn)寫在列表中并按下標(biāo)(升序)排序;
2)前[k(n-k)/p]個(gè)相鄰節(jié)點(diǎn)指派給p1,接著的[k(n-k)/p]個(gè)相鄰節(jié)點(diǎn)指派給 p2,…,最后的[k(n-k)/p]個(gè)相鄰節(jié)點(diǎn)指派給process p;
3)p個(gè)進(jìn)程并行,并且報(bào)告各自相鄰節(jié)點(diǎn)n1,…,np;
4)如果沒有相鄰節(jié)點(diǎn)被報(bào)告,算法結(jié)束(當(dāng)前節(jié)點(diǎn)的代價(jià)最小);
5)從n1,…,np中選擇代價(jià)最小的節(jié)點(diǎn),將此節(jié)點(diǎn)改為當(dāng)前節(jié)點(diǎn),重復(fù)第一步。
下面舉一個(gè)例子簡單說明該算法,給定一個(gè)對象集{1,2,3,4,5,6,7},假設(shè)k=4,“1234”相鄰節(jié)點(diǎn)為(用上述方法得到):1235,1236,1237(i=4);1245,1246,1247(i=3);1345,1346,1347(i=2);2345,2346,2347(i=1)。
每個(gè)進(jìn)程被指派任務(wù)后,各自查找代價(jià)最小的節(jié)點(diǎn),最后所有的進(jìn)程(除了p1)將得到的節(jié)點(diǎn)報(bào)告給p1,由p1作比較工作。
2.3 實(shí)驗(yàn)結(jié)果與分析
利用2.3中搭建的工作站機(jī)群系統(tǒng),此時(shí)用3臺PC機(jī),進(jìn)行PAM算法的執(zhí)行效率驗(yàn)證,并對比串行和并行PAM的執(zhí)行時(shí)間(如圖3),由于PAM算法不適用于大量數(shù)據(jù)集的處理,所以實(shí)驗(yàn)n取1000以內(nèi)的數(shù)值。
從圖3中我們可以看出并行PAM的執(zhí)行時(shí)間比串行PAM的執(zhí)行時(shí)間長,并沒有提高算法的執(zhí)行效率,由此我們可知K-means算法有比PAM更好的并行性和可擴(kuò)展性。
3 具有并行性的其他聚類算法
聚類算法中除了上述K-means、PAM算法具有潛在的并行性和可擴(kuò)展性外,還有一些算法可以進(jìn)行并行化處理例如:并行硬聚類算法中的K-mediods,面向大規(guī)模數(shù)據(jù)庫系統(tǒng)的BIRCH算法,處理非數(shù)值屬性聚類的CACTUS算法,子空間聚類算法ENCLUS等[4],以及模糊聚類算法中的FCM等算法,理論上也具有在并行機(jī)群上的加速性。
4 進(jìn)一步研究方向與展望
近年來誕生了聚類算法中的一個(gè)嶄新分支和研究熱點(diǎn)―譜聚類算法,譜聚類算法建立在譜圖理論之上,其實(shí)質(zhì)是將聚類問題轉(zhuǎn)化為圖的最優(yōu)劃分問題,相對于傳統(tǒng)的聚類算法有許多優(yōu)勢,并在實(shí)踐中取得了很好的效果。由于譜聚類算法一般可以歸納總結(jié)為三個(gè)步驟[5]:
步驟一:構(gòu)造數(shù)據(jù)集表示矩陣Z;
步驟二:計(jì)算Z的前k個(gè)特征值和特征向量,構(gòu)造特征值的向量空間;
步驟三:利用K-means或其它傳統(tǒng)聚類算法對特征向量進(jìn)行聚類。
由于譜聚類算法研究中可以運(yùn)用K-means算法等具有并行性的聚類算法進(jìn)行特征向量的聚類,所以本文對K-means算法并行化的研究也可以運(yùn)用于譜聚類的并行化,提高譜聚類算法的執(zhí)行效率,是很有前景的研究問題。
參考文獻(xiàn):
[1] Tan P N, Steinbach M, Kumar V. Introduction to Data Mining[M].Beijing:POSTS& TELECOM PRESS,2006.
[2] Jia W H, Micheline Kamber. Data Mining Concepts and Techniques[M]. Beijing: China Machine Press,2006.
篇4
關(guān)鍵詞關(guān)鍵詞:流形學(xué)習(xí);子空間聚類;低秩表示法(LRR);稀疏子空間聚類(SSC);變化率
DOIDOI:10.11907/rjdk.162181
中圖分類號:TP312文獻(xiàn)標(biāo)識碼:A文章編號文章編號:16727800(2017)001002903
引言
隨著科學(xué)技術(shù)的發(fā)展,各類數(shù)據(jù)量迅猛增長。然而,并不是所有數(shù)據(jù)都是精煉且真實(shí)有效的,海量數(shù)據(jù)中存在著冗余與錯(cuò)誤。如何對這些數(shù)據(jù)進(jìn)行快速、有效的處理,從而找到數(shù)據(jù)之間的內(nèi)在聯(lián)系成為解決很多問題的關(guān)鍵。因此對高維數(shù)據(jù)進(jìn)行相關(guān)性分析、聚類分析、結(jié)構(gòu)分析,挖掘數(shù)據(jù)背后的價(jià)值與意義尤為重要。
對高維數(shù)據(jù)進(jìn)行分析處理,當(dāng)前應(yīng)用比較廣泛的維數(shù)約減技術(shù)有流形學(xué)習(xí)[1]和子空間聚類[2]。流形學(xué)習(xí)的前提是假設(shè)在一個(gè)高維歐式空間均勻地對數(shù)據(jù)進(jìn)行采樣,然后將高維數(shù)據(jù)映射到低維,使得數(shù)據(jù)的低維表示能體現(xiàn)高維數(shù)據(jù)的本質(zhì)信息[3];子空間聚類是假設(shè)一組數(shù)據(jù)屬于多個(gè)線性子空間的并集,將這組數(shù)據(jù)進(jìn)行分類,使得不同的類對應(yīng)不同的子空間。
高維數(shù)據(jù)的結(jié)構(gòu)一般為低維的,可以用位于相同子空間的低維數(shù)據(jù)對高維數(shù)據(jù)進(jìn)行稀疏表示,因此設(shè)計(jì)一種能分析低維多流形非相似結(jié)構(gòu)數(shù)據(jù)的算法更具有一般性和適用性。本文針對低維多流形非相似結(jié)構(gòu)數(shù)據(jù),提出一種基于變化率聚類的算法,從而更有效進(jìn)行聚類分析。
1基于變化率的子空間聚類算法
1.1算法描述
為更好地對低維多流行非相似結(jié)構(gòu)的數(shù)據(jù)進(jìn)行聚類分析,本文提出一種基于變化率的子空間聚類算法。該算法的基本思想是:首先觀察數(shù)據(jù),若數(shù)據(jù)來源于多個(gè)維數(shù)不等的數(shù)據(jù)結(jié)構(gòu),則先根據(jù)按屬性重要性篩選出的維對不同結(jié)構(gòu)的數(shù)據(jù)進(jìn)行分類;然后在同構(gòu)數(shù)據(jù)點(diǎn)之間按其變化率進(jìn)行劃分,若變化率超過一定的閾值β,則分到不同的類中,若小于等于β則分到同一類;最終得到各個(gè)不同結(jié)構(gòu)的分類。任意兩點(diǎn)之間的變化率為:RC(X,Y) = Yi + 1 -Xi + 1 Yi -Xi (1)算法描述如下:
輸入:數(shù)據(jù)集D,簇?cái)?shù)k。
輸出:k個(gè)簇。
Step1:按一定的準(zhǔn)則選擇重要屬性。
Step2:根據(jù)重要屬性將不同結(jié)構(gòu)的數(shù)據(jù)劃分開,形成m個(gè)中間簇。
Step3:對中間簇中的數(shù)據(jù)按變化率RC進(jìn)行分類,如果兩點(diǎn)之間的變化率大于β,則劃分為不同的類;否則劃為一類。
Step4:重復(fù)Step3直到中間簇都被劃分完。
Step5:輸出k個(gè)簇。
1.2對比算法選取
在子空間聚類算法中,應(yīng)用比較多的是基于譜聚類的方法,首先根據(jù)樣本點(diǎn)之間的關(guān)系構(gòu)造圖譜,然后利用NCut[4]等譜聚類方法得到分割結(jié)果。基于譜聚類的子空間分割方法中比較有代表性的是低秩表示法(LRR)[5]和稀疏子空間聚類(SSC)[6]算法。
低秩表示法(LRR)算法是為了從包含錯(cuò)誤的數(shù)據(jù)中恢復(fù)子空間結(jié)構(gòu)而提出的。在給定的一組數(shù)據(jù)樣本中,每一個(gè)都可以被表示為在一個(gè)字典中的一個(gè)基數(shù)線性組合,LRR旨在找到所有共同數(shù)據(jù)的低秩表示。通過選擇一個(gè)特定的字典,LRR可以很好解決子空間聚類問題。對于被任意錯(cuò)誤污染的數(shù)據(jù),LRR還可以近似的恢復(fù)行空間,LRR是一個(gè)有效的且具有魯棒性的子空間聚類算法。
稀疏子空間聚類(SSC)可以用來聚類位于低維子空間的并集的數(shù)據(jù)點(diǎn)。關(guān)鍵思想是,從其它點(diǎn)獲得無窮多的可以表示的數(shù)據(jù)點(diǎn),并用一個(gè)稀疏表示來對應(yīng)從相同的子空間選擇的點(diǎn)。這促進(jìn)了譜聚類算法框架下用來推斷數(shù)據(jù)的聚類子空間的稀疏優(yōu)化程序。該算法處理接近于子空間交集的數(shù)據(jù)點(diǎn)是有效的,另一個(gè)關(guān)鍵優(yōu)勢在于它可以通過合并數(shù)據(jù)的模型到稀疏優(yōu)化程序來直接處理數(shù)據(jù)干擾,如噪音、稀疏的無關(guān)記錄和缺失記錄。在運(yùn)動分割和聚類方面,該算法都具有較高的實(shí)用性。
2實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證基于變化率的子空間聚類算法的有效性與實(shí)用性,本文選取三幅變化率較為明顯的低維多流行結(jié)構(gòu)圖進(jìn)行聚類分析實(shí)驗(yàn)。
2.1實(shí)驗(yàn)一結(jié)果與分析
從圖2可以看出,對分布在獨(dú)立子空間中的兩條直線上的數(shù)據(jù)進(jìn)行聚類,若每條直線上的數(shù)據(jù)為一類,則本文提出方法的聚類結(jié)果明顯要比LRR和SSC好。LRR和SSC算法聚類效果欠佳的原因在于對數(shù)據(jù)分解處理后用K-means算法[8]進(jìn)行聚類,K-means算法以距離度量為基礎(chǔ),適合于發(fā)現(xiàn)球狀簇,對于線性數(shù)據(jù)的聚類效果并不理想。本文算法和LRR算法的主要誤差都在于圖像交叉相似的部分,但LRR算法的聚類誤差部分明顯大于本文算法的聚類誤差部分,而SSC算法基本無法聚類該圖數(shù)據(jù)。
3結(jié)語
本文提出一種基于變化率聚類的算法,首先觀察數(shù)據(jù),按屬性重要性篩選出的維對不同結(jié)構(gòu)數(shù)據(jù)進(jìn)行分類,然后在同構(gòu)數(shù)據(jù)點(diǎn)之間按其變化率進(jìn)行分類,若變化率超過一定的閾值β,則分到不同的類中;若小于或等于β,則分到同一類,最終得到各個(gè)不同結(jié)構(gòu)的分類。此算法能夠有效對低維多流形非相似結(jié)構(gòu)的數(shù)據(jù)進(jìn)行聚類分析,聚類效果明顯優(yōu)于LRR、SSC等傳統(tǒng)算法,且時(shí)間復(fù)雜度較低,可以進(jìn)一步應(yīng)用到圖像分類、運(yùn)動識別等領(lǐng)域。
參考文獻(xiàn):
[1]JB TENENBAUM,VD SILVA,JC LANGFORD.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):23192323.
圖4實(shí)驗(yàn)三結(jié)果
[2]E ELHAMIFAR,R VIDAL.Sparse subspace clustering[C].IEEE Conference on Computer Vision and Pattern Recognition,2009:27902797.
[3]鄭媛媛.基于非負(fù)矩陣分解的數(shù)據(jù)表示算法研究及其應(yīng)用[D].南京:南京理工大學(xué),2013.
[4]J SHI,J MALIK.Normalized cuts and image segmentation[J].IEEE Transactions Pattern Analysis Machine Intelligence,2000,22(8):888905.
[5]G LIU,Z LIN,S YAN,et al.Robust recovery of subspace structures by lowrank representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):171184.
[6]E ELHAMIFAR,R VIDAL.Sparse subspace clustering:algorithm,theory,and applications[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(11):27652781.
篇5
關(guān)鍵詞:數(shù)據(jù)結(jié)構(gòu);可視化;設(shè)計(jì)
在我國的科學(xué)技術(shù)得到迅速發(fā)展的過程中,科學(xué)計(jì)算的工作量也開始變得愈來愈大,可視化的方法能夠有效的幫助工作人員進(jìn)行獲取更多的信息,從而更為直觀的來對計(jì)算的結(jié)果進(jìn)行分析。由于受到計(jì)算機(jī)性能以及軟件平臺限制,在最初的可視化軟件系統(tǒng)方面都是在高性能圖形工作站進(jìn)行發(fā)展的,對數(shù)據(jù)結(jié)構(gòu)可視化類庫的設(shè)計(jì)能夠有效的將效率得到提高。
一、數(shù)據(jù)結(jié)構(gòu)可視化類庫設(shè)計(jì)的重要性及目的
(一)數(shù)據(jù)結(jié)構(gòu)可視化類庫設(shè)計(jì)的重要性
在使用以及學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)和程序設(shè)計(jì)過程中,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的可視化能夠有效的提高對數(shù)據(jù)結(jié)構(gòu)的直觀分析,從而加深理解。在對程序進(jìn)行調(diào)試的過程中,通過數(shù)據(jù)結(jié)構(gòu)可視化類庫能夠有效的將編程的效率得以提高。從目前的發(fā)展情況來看,已經(jīng)有了諸多的應(yīng)用廣泛的可視化集成開發(fā)環(huán)境,其中最為常見的就是Visual C++等,這些可視化的集成開發(fā)環(huán)境簡化了程序界面的設(shè)計(jì),對編寫界面的程序降低了難度,從而有效的提高了軟件的開發(fā)效率。
(二)數(shù)據(jù)結(jié)構(gòu)可視化類庫設(shè)計(jì)的目的
在數(shù)據(jù)結(jié)構(gòu)可視化類庫設(shè)計(jì)的目的上就是使得JVDSCL能夠比較容易的在不同用途中進(jìn)行應(yīng)用,這就是要加強(qiáng)其靈活性,JVDSCL能夠直接的應(yīng)用到軟件應(yīng)用程序的開發(fā)方面,在開發(fā)人員方面也能夠通過JVDSCL來進(jìn)行對新的數(shù)據(jù)結(jié)構(gòu)進(jìn)行構(gòu)造,另外就是加強(qiáng)其可靠性的目的,在這一方面是JVDSCL的最為主要的目的,還有就是面向?qū)ο蟮哪康模瑪?shù)據(jù)結(jié)構(gòu)是JVDSCL的主要對象,同時(shí)算法也是對象,它們保存運(yùn)行的結(jié)果以及提供訪問結(jié)果的接口。
二、數(shù)據(jù)結(jié)構(gòu)可視化類庫的設(shè)計(jì)和實(shí)現(xiàn)探究
(一)數(shù)據(jù)結(jié)構(gòu)可視化類庫的設(shè)計(jì)探究。在對數(shù)據(jù)結(jié)構(gòu)可視化類庫進(jìn)行設(shè)計(jì)的過程中,要對問題進(jìn)行綜合性的考慮,其中在JVDSCL方面它主要是在Java集合庫基礎(chǔ)上來進(jìn)行對原有的數(shù)據(jù)結(jié)構(gòu)類中進(jìn)行的擴(kuò)展,與此同時(shí)也在這一過程中添加了相應(yīng)的較為復(fù)雜化的數(shù)據(jù)結(jié)構(gòu),最為常見的就是樹圖。在JVDSCL過程中對可視化數(shù)據(jù)結(jié)構(gòu)進(jìn)行構(gòu)造來實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的可視化,而這一可視化的數(shù)據(jù)結(jié)構(gòu)也是在Java集合庫當(dāng)中的原有數(shù)據(jù)結(jié)構(gòu)類的操作基礎(chǔ)上進(jìn)行的,另外就是增添了一些可視屬性以及對可視化的接口進(jìn)行了提供。在每種數(shù)據(jù)結(jié)構(gòu)都會有著多種顯示的模式,這就需要開發(fā)人員進(jìn)行有機(jī)的選擇,而在JVDSCL當(dāng)中,對于每種數(shù)據(jù)結(jié)構(gòu)會有這多種布局的方法來對其加以布局。
在對數(shù)據(jù)結(jié)構(gòu)可視化類庫進(jìn)行設(shè)計(jì)的內(nèi)容上主要就是基本的可視化接口的設(shè)計(jì)以及顯示模式和布局方法。其中在可視化接口的設(shè)計(jì)方面,最為主要的接口就是V Collection接口,它不僅是能夠提供Collection接口的基本方法,同時(shí)也提供可視化接口,在這一內(nèi)容上主要有 void draw,操作上就是重畫指定的數(shù)據(jù)結(jié)構(gòu),通過display Mode參數(shù)值來決定選用的顯示模式,在這一接口中的參數(shù)c是表示數(shù)據(jù)結(jié)構(gòu)所顯示的顏色。在顯示模式的設(shè)計(jì)當(dāng)中,JVDSCL的每種數(shù)據(jù)結(jié)構(gòu)都會有不相同的顯示模式,如下圖所表示的兩種模式。
另外,在布局的設(shè)計(jì)上,關(guān)于數(shù)據(jù)結(jié)構(gòu)可視化的關(guān)鍵問題就是圖形的布局問題,這對于相關(guān)的研究人員對數(shù)據(jù)結(jié)構(gòu)和算法的效果理解有著非常密切的關(guān)系。而在JVDSCL當(dāng)中的最為主要的就是線性布局的方法以及圖布局的方法,針對于每種不同的布局在算法的實(shí)現(xiàn)上也是不同的。其中在線性的布局方面,主要是能夠適用于隊(duì)列和線性表的數(shù)據(jù)結(jié)構(gòu),在對線性的布局方法上其基本的算法框架就是獲取數(shù)據(jù)的元素個(gè)數(shù)以及依靠著所顯示大小和數(shù)據(jù)元素個(gè)數(shù)進(jìn)行對布局的大小值進(jìn)行計(jì)算。如下圖所示。
在圖布局的設(shè)計(jì)方面在算法上是屬于二維彈性模型的算法,最為基本的思想就是在二維平面上進(jìn)行計(jì)算。這一方法比較的適合圖等數(shù)據(jù)結(jié)構(gòu),在JVDSCL當(dāng)中能夠提供的多種算法實(shí)現(xiàn)圖的可視化,其中有基于遺傳模擬退火算法圖的三維可視化以及以上所說的二維彈性模擬算法等。可視化技術(shù)的主要目的就是來輔助人們增強(qiáng)認(rèn)知上的能力,而在計(jì)算機(jī)的可視化技術(shù)方面能夠?qū)⑵渥鳛槭切畔⒌奶幚砉ぞ撸源藖砜紤]多樣化的樣本以及變量和聯(lián)系。
(二)數(shù)據(jù)結(jié)構(gòu)可視化類庫的實(shí)現(xiàn)分析。在數(shù)據(jù)結(jié)構(gòu)的可視化類庫的實(shí)現(xiàn)方面由于本論文的篇幅有限簡要進(jìn)行講述,數(shù)據(jù)結(jié)構(gòu)動態(tài)演示系統(tǒng)演示了各種不同算法的數(shù)據(jù)結(jié)構(gòu)變化的過程,這還需要相關(guān)的設(shè)計(jì)人員在大量的畫圖操作上得以實(shí)現(xiàn),比如對鏈表的結(jié)點(diǎn)的繪制,對于JVDSCL的應(yīng)用就不需要自己來編碼就能夠?qū)崿F(xiàn)畫圖的操作,在動態(tài)演示系統(tǒng)方面有了很大程度上的層次性提高,在這一過程中設(shè)計(jì)人員不需對數(shù)據(jù)結(jié)構(gòu)的布局進(jìn)行考慮,在JVDSCL自身已經(jīng)有了布局的功能,只需要根據(jù)自身的的需要來進(jìn)行重寫即可實(shí)現(xiàn)。另外,在對數(shù)據(jù)結(jié)構(gòu)中的draw()進(jìn)行調(diào)用也能夠有效的實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的可視化。
三、結(jié)語
總而言之,對于數(shù)據(jù)結(jié)構(gòu)的可視化類庫的設(shè)計(jì)以及實(shí)現(xiàn)能夠有效的將軟件的重用性和擴(kuò)展性得到提高,在JVDSCL的基礎(chǔ)上進(jìn)行對其加以設(shè)計(jì),對軟件的開發(fā)設(shè)計(jì)的效率有了明顯的提高,在未來我國的軟件技術(shù)設(shè)計(jì)水平不斷提升的過程中,也定能夠在這一領(lǐng)域取得更加優(yōu)異的設(shè)計(jì)成果。
參考文獻(xiàn):
[1]楊曉波,陳邦澤.數(shù)據(jù)結(jié)構(gòu)課程實(shí)踐教學(xué)體系研究[J].實(shí)驗(yàn)技術(shù)與管理,2013,(08).
[2]馮月華.《數(shù)據(jù)結(jié)構(gòu)》課程改革下的一堂教學(xué)實(shí)例――最小生成樹[J].隴東學(xué)院學(xué)報(bào),2014,(03).
篇6
一、器具的用途
例1現(xiàn)有器具如圖1所示。
(1)吸取和滴加少量液體時(shí)用_____;洗滌試管應(yīng)使用_____。(填器具名稱)
(2)若利用圖1中的器具進(jìn)行實(shí)驗(yàn):溶解氯化鈉時(shí)還需要添加的器具是_________;加熱高錳酸鉀制取氧氣,還需要的鐵制器具是_________。
分析:試管、試管夾、玻璃棒、酒精燈、滴管、鐵架臺、燒杯、量筒、集氣瓶是化學(xué)實(shí)驗(yàn)中的常用器具,同學(xué)們應(yīng)熟練掌握這些器具的用途及使用時(shí)的注意事項(xiàng)。量取一定體積的液體用量筒,而吸取或滴加少量液體則用膠頭滴管。燒杯可用作較大量試劑反應(yīng)或配制溶液的容器。試管刷用來刷洗玻璃器具,如試管。酒精燈是常用的加熱器具。鐵架臺用于固定和支持各種器具,常用在加熱、過濾等實(shí)驗(yàn)中。玻璃棒用于攪拌、過濾或轉(zhuǎn)移液體。
[答案:(1)膠頭滴管;試管刷(2)玻璃棒;鐵架臺(帶鐵夾)]
二、藥品的取用
例2學(xué)習(xí)化學(xué),要經(jīng)常做實(shí)驗(yàn)。下列實(shí)驗(yàn)操作中正確的是( )。
A.將鼻子湊近容器口聞藥品的氣味
B.將試管中用剩的藥品倒回試劑瓶中
C.用手抓取固體藥品
D.用藥匙取用固體粉末藥品
分析:取用藥品時(shí)要遵循“三不”原則,即不能用手接觸藥品;不要把鼻孔湊到容器口去聞藥品(特別是氣體)的氣味;不得嘗藥品的味道。取用固體藥品一般用藥匙,塊狀藥品可用鑷子夾取。實(shí)驗(yàn)剩余的藥品要放入指定容器內(nèi),不能倒回原瓶,也不能隨意丟棄,更不能帶出實(shí)驗(yàn)室。
(答案:D)
例3剛接觸化學(xué)實(shí)驗(yàn),張琳同學(xué)對基本操作還不很熟悉。圖2分別表示她完成的實(shí)驗(yàn)操作,正確的一項(xiàng)是( )。
分析:取用細(xì)口瓶中的藥液時(shí),瓶塞要倒放在桌上,標(biāo)簽朝手心,瓶口緊挨著試管口。量筒用來度量液體藥品的體積,量液時(shí),量筒必須平放,視線與量筒中液體的凹液面的最低處保持水平。吸取和滴加少量液體試劑用滴管,且滴管應(yīng)懸空放在試管上方,不要接觸試管壁,也不要伸入試管中。托盤天平用于稱量固體藥品的質(zhì)量,使用時(shí),稱量物放在左盤,砝碼放在右盤,即“左物右碼”。
(答案:B)
三、給物質(zhì)加熱
例4具備基本的實(shí)驗(yàn)技能是進(jìn)行科學(xué)探究活動的基礎(chǔ)和保證。圖3中實(shí)驗(yàn)操作不正確的是( )。
分析:使用酒精燈時(shí),要注意三個(gè)“禁止”:禁止向燃著的酒精燈里添加酒精;禁止用一只酒精燈引燃另一只酒精燈;禁止用嘴吹滅酒精燈。給液體加熱可以用試管、燒杯、燒瓶、蒸發(fā)皿等,但用燒杯或燒瓶給液體加熱時(shí),應(yīng)將燒杯或燒瓶放置在石棉網(wǎng)上。給試管中的液體加熱時(shí),液體體積不能超過試管容積的1/3要傾斜一定角度,試管口不可朝著自己或有人的方向。除掌握以上幾點(diǎn)外,加熱時(shí)還要注意玻璃器具外壁不能有水,玻璃容器的底部不能跟燈芯接觸,先預(yù)熱再集中加熱等問題。
(答案:B)
四、器具的連接
例5王鵬同學(xué)是某校科技興趣小組的積極分子,喜歡動手做各種化學(xué)實(shí)驗(yàn)。但在他的下列操作中有一項(xiàng)是不正確的,該項(xiàng)是( )。
A.把試管放在實(shí)驗(yàn)臺上再使勁塞進(jìn)橡皮塞
B.先用水把玻璃管口潤濕,再稍稍用力將其插入膠皮管
C.按由下向上、從左往右的順序連接各種器具
D.實(shí)驗(yàn)結(jié)束后拆下裝置,將要洗滌的器具洗滌干凈
分析:連接器具應(yīng)遵循由下向上、從左往右的順序.往試管口塞橡皮塞時(shí),左手拿試管,右手拿橡皮塞慢慢轉(zhuǎn)動,塞進(jìn)試管口,切不可把試管放在實(shí)驗(yàn)臺上再使勁塞進(jìn)橡皮塞,因?yàn)檫@樣做容易壓破試管。將玻璃管插入橡皮塞的孔或膠皮管中時(shí),都要先把玻璃管口用水潤濕,且要用手抓住插入端的玻璃管,以免玻璃管折斷。
(答案:A)
五、器具的洗滌
例6請指出李雯同學(xué)在一次實(shí)驗(yàn)考核中出現(xiàn)的錯(cuò)誤操作( )。
A.用試管刷刷洗試管內(nèi)壁不易洗掉的物質(zhì)
B.將洗凈的試管倒放在試管架上
C.滴瓶上的滴管用過后立即用清水沖洗干凈
D.玻璃器具洗凈后,內(nèi)壁附著的水既不聚成水滴,也不成股流下
分析:每次實(shí)驗(yàn)完成后,將玻璃器具洗滌干凈是良好的實(shí)驗(yàn)習(xí)慣,但,一要注意用正確的方法洗滌;二要注意該洗則洗,該洗時(shí)才能洗。如,燒得很熱的玻璃容器就不能立即用冷水沖洗;用過的滴管要立即用清水沖洗干凈,以備再用;嚴(yán)禁用未經(jīng)清洗的滴管再吸取別的試劑。但滴瓶上的滴管與滴瓶配套使用,屬于“專管專用”,使用后就沒有必要再用水沖洗。
(答案:C)
六、操作的順序
例7初中化學(xué)實(shí)驗(yàn)中,有許多涉及操作上“先”與“后”的問題,如果把“先”與“后”順序顛倒,就會影響實(shí)驗(yàn)效果或?qū)е率鹿实陌l(fā)生。試寫出下列幾種情況的“先”與“后”。
(1)用托盤天平稱量固體藥品,___________________。
(2)實(shí)驗(yàn)室制取氣體,________________________________。
分析:按照規(guī)定的步驟和方法進(jìn)行操作是實(shí)驗(yàn)取得成功的重要保證。如,給物質(zhì)加熱時(shí),要先預(yù)熱再集中加熱;過濾時(shí),要先靜置后過濾;加熱高錳酸鉀制取氧氣的實(shí)驗(yàn)結(jié)束時(shí),應(yīng)先從水槽中移出導(dǎo)管,然后再熄滅酒精燈。托盤天平用于稱量固體藥品的質(zhì)量,在稱量前先把游碼放在標(biāo)尺的零刻度處,檢查天平是否平衡。如果天平未達(dá)到平衡,則應(yīng)調(diào)節(jié)橫梁右端的平衡螺母,使天平平衡。天平平衡后,在左盤中放稱量物,右盤中放砝碼,然后移動游碼使天平平衡,記錄數(shù)值。凡是制取氣體的實(shí)驗(yàn),都必須先檢查裝置的氣密性,只有在確認(rèn)裝置不漏氣的前提下,才能裝入藥品進(jìn)行實(shí)驗(yàn)。
[答案:(1)先調(diào)平,再稱量 (2)先檢查氣密性,再裝藥品]
[練習(xí)]
1.過濾是化學(xué)實(shí)驗(yàn)中的一項(xiàng)重要基本操作,其中不需要使用的器具是( )。
A.量筒 B.漏斗
C.燒杯 D.玻璃棒
2.下列操作中,正確的是( )。
A.用鑷子夾取塊狀的藥品
B.用托盤天平稱量藥品時(shí),先加小砝碼,再加大砝碼
C.將盛有液體藥品的試管固定在酒精燈外焰處加熱
D.沒有說明藥品用量時(shí),液體取1~2 mL,固體取1~2g
3.下列實(shí)驗(yàn)基本操作或事故處理,正確的是( )。
A.為安全起見,將用剩的藥品丟棄到水池中
B.酒精燈打翻著火,用濕抹布撲蓋
C.喝少量的某無色液體,看是酸味還是無味
篇7
關(guān)鍵詞:數(shù)據(jù)挖掘;簇;聚類算法
中圖分類號:TP301.6文獻(xiàn)標(biāo)識碼:A文章編號:1672-7800(2012)010-0033-03
基金項(xiàng)目:湖南省大學(xué)生研究性學(xué)習(xí)和創(chuàng)新性實(shí)驗(yàn)計(jì)劃項(xiàng)目(JSU-CX-2011-28)
作者簡介:張露(1991-),女,吉首大學(xué)軟件服務(wù)外包學(xué)院學(xué)生,研究方向?yàn)橛?jì)算機(jī)科學(xué);張彬連(1978-),女,吉首大學(xué)軟件服務(wù)外包學(xué)院講師,研究方向?yàn)橛?jì)算機(jī)科學(xué)。
0引言
隨著信息和科學(xué)技術(shù)的高速發(fā)展,各行業(yè)積累的數(shù)據(jù)量迅速增長,而更重要的是如何從大量的、不完全的數(shù)據(jù)中提取出有用的信息。而在數(shù)據(jù)挖掘中充當(dāng)重要角色的就是聚類,它在識別數(shù)據(jù)的內(nèi)在結(jié)構(gòu)方面具有獨(dú)到的作用。而數(shù)據(jù)挖掘工具以及工具提供的可選擇的算法是實(shí)現(xiàn)數(shù)據(jù)挖掘目的的墊腳石。數(shù)據(jù)的類型、聚類的目的應(yīng)用決定了選擇哪一類聚類算法,其中聚類是把物理或者抽象對象分組成為由類似對象構(gòu)成的多個(gè)簇的過程,即把數(shù)據(jù)對象分成多個(gè)類或簇,在同一個(gè)簇中的對象具有較高的相似度,而不同簇中的對象差異較大。它對未知數(shù)據(jù)的分析和劃分能起到非常有效的作用。此外,通過聚類,能夠識別密集和稀疏的區(qū)域,發(fā)現(xiàn)全局的分布模式,以及數(shù)據(jù)屬性之間的相互關(guān)系等。為了找到效率高、通用性強(qiáng)的聚類方法,人們從不同角度提出了許多種聚類算法,大致可分為層次方法、劃分方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法這五大類。
1典型聚類算法分類及其優(yōu)缺點(diǎn)分析
1.1基于劃分的聚類算法
首先,給定一個(gè)樣本為n的數(shù)據(jù)集,然后根據(jù)給定要?jiǎng)?chuàng)建劃分的數(shù)目k,將數(shù)據(jù)劃分為k個(gè)組(kn),每個(gè)組相應(yīng)地表示一個(gè)簇,同時(shí)滿足以下的條件:①每個(gè)組至少包含一個(gè)樣本;②每個(gè)樣本屬于且僅屬于一個(gè)簇。算法要事先給出要?jiǎng)?chuàng)建的劃分的數(shù)目k,創(chuàng)建一個(gè)初始劃分,然后采用循環(huán)定位技術(shù),通過根據(jù)簇類之間的差異把對象從一個(gè)劃分移動到另一個(gè)劃分的方法來改善劃分質(zhì)量。評價(jià)劃分的好壞的標(biāo)準(zhǔn)一般是在同一個(gè)類中的對象盡可能“接近”,而不同類中的對象盡可能“遠(yuǎn)離”。為達(dá)到全局最優(yōu)的目的,基于劃分的聚類會要求窮舉所有可能的劃分。其中包括以下典型的劃分方法:k-平均、k-中心點(diǎn)、CLARA、CLARANS等。
1.1.1基于簇的重心技術(shù):k-平均算法
(2)k-平均算法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):當(dāng)滿足結(jié)果簇是緊湊的,并且簇與簇之間明顯分離式的前提條件,k-平均算法能發(fā)揮較好的效果,而且在處理大數(shù)據(jù)集時(shí),是有相對可伸縮的和有效率的;②缺點(diǎn):該算法有其限制條件,只有在簇的平均值被定義的基礎(chǔ)上才能使用,這就使得可能不適應(yīng)某些應(yīng)用的數(shù)據(jù),要求用戶必須事先給出k的取值。在大部分實(shí)際應(yīng)用中,最終的聚類數(shù)量并不能得到一個(gè)確切的數(shù)目,且該算法遇到非凸面形狀的簇,或者遇到在大小上存在很大差別的簇時(shí),聚類效果不明顯。而且,它對于帶有“噪聲”的空間數(shù)據(jù)和離群數(shù)據(jù)是敏感的。該算法經(jīng)常止于局部最優(yōu)。
1.1.2基于有代表性的對象的技術(shù):k-中心點(diǎn)方法
1.1.3基于選擇的k-中心點(diǎn)CLARANS方法
(1)CLARANS方法的處理流程:首先,不考慮整個(gè)數(shù)據(jù)集合,用實(shí)際數(shù)據(jù)的抽樣來作為數(shù)據(jù)的樣本;然后,用PAM方法從樣本中選擇中心點(diǎn);返回最好的聚類結(jié)果作為輸出。
(2)CLARANS方法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):該算法的效率較高,能夠發(fā)現(xiàn)最“自然的”結(jié)果簇?cái)?shù)目,且能夠檢測離群點(diǎn),且相應(yīng)地拓展了數(shù)據(jù)處理量的伸縮范圍;②缺點(diǎn):該方法的聚類質(zhì)量對采取的抽樣方法依賴性強(qiáng),且最中心點(diǎn)的要求較高。而且對于大數(shù)據(jù)量、時(shí)間復(fù)雜度和空間復(fù)雜度都很大。
1.2基于層次的聚類算法
根據(jù)樹的形成過程,層次分解的方向的不同可以分為以下兩種類型:
(1)自底向上(凝聚)聚類方法。該方法一開始將每個(gè)對象作為單獨(dú)的一個(gè)組,然后繼續(xù)與相近的對象或組合并,直到所有單獨(dú)的組都被合并,成為一個(gè)整體,或者達(dá)到一個(gè)終止條件。
(2)自頂向下(分裂)聚類方法。與凝聚法相反,該策略先將所有對象置于一個(gè)簇中,在迭代的每一步中,在一個(gè)簇的基礎(chǔ)上分裂為更小的簇,直到最終每個(gè)單獨(dú)的簇中包含一個(gè)對象,或者達(dá)到一個(gè)終止條件。下面介紹其代表算法。
1.2.1BIRCH算法
(1)BIRCH算法包括階段:階段一是BIRCH掃描數(shù)據(jù)庫,建立初始化的CF樹,嘗試把數(shù)據(jù)內(nèi)在的聚類結(jié)構(gòu)保留下來;階段二是BIRCH算法采用某個(gè)聚類算法對CF樹的葉節(jié)點(diǎn)進(jìn)行聚類。
(2)BIRCH算法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):引入的聚類特征樹概括了聚類的有用信息,且占用空間較元數(shù)據(jù)集合小,只需要一次性訪問數(shù)據(jù)庫,速度快,伸縮性好,對增量或動態(tài)聚類也非常有效,不需要大量遞歸運(yùn)算。②缺點(diǎn):由于CF樹每個(gè)節(jié)點(diǎn)的大小受限制,并不總是對應(yīng)于用戶所認(rèn)為的一個(gè)自然聚類,而且算法的工作效率依賴于簇的球形要求。
1.2.2CURE算法
(1)CURE算法工作原理:選擇了屬于聚合方法和分解的中間做法。選擇數(shù)據(jù)空間中具有代表性的點(diǎn)。且在選擇簇中分散的對象中產(chǎn)生一個(gè)簇的代表點(diǎn),然后根據(jù)一個(gè)特定的分?jǐn)?shù)或者收縮因子向簇心“收縮”或移動它們。
(2)CURE算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):能識別非球狀以及大小不一的聚類,能更好地處理孤立點(diǎn)。對于大型的數(shù)據(jù)庫,它也具有良好的伸縮性,且不影響聚類的質(zhì)量;②缺點(diǎn):聚類結(jié)果容易受到參數(shù)設(shè)置的影響,且CURE算法對分類屬性不進(jìn)行處理工作。
1.3基于密度的聚類算法
基于密度的聚類算法并不是基于各種各樣的距離而是基于密度的。這樣就能克服基于距離的算法只能發(fā)現(xiàn)“圓形”類的缺點(diǎn),它可以發(fā)現(xiàn)任意形狀類的聚類結(jié)果。該方法的思想就是,只要一個(gè)區(qū)域中的點(diǎn)的密度大于某個(gè)閾值,就把它加到與之相近的聚類中。以下介紹其代表算法DBSCAN算法和OPTICS算法。
1.3.1DBSCAN算法
(1)DBSCAN算法思想:首先通過檢查數(shù)據(jù)庫中每個(gè)點(diǎn)的ε-鄰域內(nèi)的鄰居點(diǎn)數(shù)衡量改點(diǎn)所在空間的密度。來尋找聚類。如果一個(gè)點(diǎn)p的ε-鄰域名超過某個(gè)指定閾值MinPts個(gè)點(diǎn),則建一個(gè)新簇以p作為核心對象,然后再反復(fù)地尋找從這些核心對象直接密度可達(dá)的對象,當(dāng)沒有新的點(diǎn)可以被添加時(shí),該過程即結(jié)束。
(2)DBSCAN算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):能夠把具有足夠高密度的區(qū)域劃分為簇,對帶有“噪聲”的空間數(shù)據(jù)比較敏感,可以發(fā)現(xiàn)任意形狀的聚類;②缺點(diǎn):參數(shù)的設(shè)置難以確定,對參數(shù)值是非常敏感的,容易導(dǎo)致誤差很大的聚類結(jié)果,且全局密度參數(shù)不能刻畫其內(nèi)在的聚類結(jié)構(gòu)。
1.3.2OPTICS算法
(1)OPTICS算法思想:采用影響函數(shù),即用一個(gè)數(shù)字函數(shù)來形式化地模擬每個(gè)數(shù)據(jù)點(diǎn)的影響;所有數(shù)據(jù)點(diǎn)的影響函數(shù)的總和可以由數(shù)據(jù)空間的整體密度模型化得到;可以通過確定密度吸引點(diǎn)來得到聚類,且此時(shí)全局密度函數(shù)在密度吸引點(diǎn)達(dá)到局部最大。
(2)OPTICS算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):該算法的數(shù)據(jù)基礎(chǔ)非常堅(jiān)實(shí),并且概括了其他的聚類算法;其良好的聚類特性在處理有大量“噪聲”的數(shù)據(jù)集合時(shí)充分體現(xiàn)出來了;提供了簡單而有效的數(shù)學(xué)技術(shù)給高維數(shù)據(jù)集合的任意形狀的聚類;速度較快;②缺點(diǎn):聚類結(jié)果會容易受到密度參數(shù)和噪聲閾值等參數(shù)的影響。
1.4基于網(wǎng)格的聚類算法
基于網(wǎng)格的聚類方法采用的數(shù)據(jù)結(jié)構(gòu)是一個(gè)多分辨率的網(wǎng)格。它將數(shù)據(jù)空間分為有限數(shù)目的單元,形成網(wǎng)結(jié)構(gòu),所有的處理對象是單個(gè)的數(shù)據(jù)單元,這種處理方法與目標(biāo)數(shù)據(jù)庫中記錄的個(gè)數(shù)并不存在很大的關(guān)系。以下介紹其中的STING算法。
(1)STING算法工作原理:STING是一種基于網(wǎng)格的多分辨率聚類技術(shù),它將空間區(qū)域劃分為矩形單元,通常存在多個(gè)級別的矩形單元,這些單元形成了一個(gè)層次結(jié)構(gòu):高層的每個(gè)單元由多個(gè)低一層的單元組成,且事先計(jì)算和存儲關(guān)于每個(gè)網(wǎng)格單元屬性的統(tǒng)計(jì)信息,在查詢處理時(shí)就能使用這些統(tǒng)計(jì)參數(shù),達(dá)到不一樣的效果。
(2)STING算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):基于網(wǎng)格的計(jì)算與查詢是相對獨(dú)立的;在處理數(shù)據(jù)和增量更新方面能夠更加方便;效率較高;②缺點(diǎn):最底層的粒度影響算法的質(zhì)量,且該算法在構(gòu)建一個(gè)父單元時(shí),忽略了子單元與相鄰單元間的關(guān)系,導(dǎo)致結(jié)果簇的形狀的邊界不穩(wěn)定。
1.5基于模型的聚類算法
基于模型的聚類算法嘗試優(yōu)化給定的數(shù)據(jù)和某些數(shù)學(xué)模型之間的適應(yīng)性,是基于“數(shù)據(jù)是根據(jù)潛在的概率分布生成的”這一假設(shè)而提出的。該方法主要包括統(tǒng)計(jì)學(xué)方法和神經(jīng)網(wǎng)絡(luò)方法這兩大類。以下介紹其中的COBWEB算法。
(1)COBWEB算法工作原理:COBWEB算法采用分類屬性-值對來描述其輸入對象,以一個(gè)分類樹的形式來構(gòu)造層次聚類,并且在啟發(fā)式估算度量方法以及分類效用的指導(dǎo)下開展樹的構(gòu)建工作。
(2)COBWEB算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):對劃分過程中類的數(shù)目能自動修正,不需要用戶提供這樣的輸入?yún)?shù),可以找到分類對象的最好結(jié)點(diǎn);②缺點(diǎn):該算法基于的“每個(gè)屬性上的概率分布式彼此獨(dú)立的”假設(shè)不總是成立的;更新和存儲聚類代價(jià)相當(dāng)高,可能導(dǎo)致時(shí)間和空間復(fù)雜性發(fā)生劇烈的變化。
2結(jié)語
分層聚類的突出亮點(diǎn)是它能夠生成比較規(guī)整的類集合,聚類結(jié)果不依賴元素的初始排列或輸入次序,與聚類過程的先后次序并沒有直接的關(guān)系,聚類結(jié)果相對穩(wěn)定,不易導(dǎo)致類的重構(gòu)。但它也存在著部門缺點(diǎn),如計(jì)算開銷較大,對異常數(shù)據(jù)比較脆弱。劃分聚類的優(yōu)點(diǎn)是運(yùn)算量小,能運(yùn)用于處理龐大的樣本數(shù)據(jù),也為實(shí)時(shí)處理提供了一定的可能性。但要求用戶必須預(yù)先給出聚類的參數(shù),還要靠度量函數(shù)來判定所給出解的優(yōu)劣程度。網(wǎng)格聚類處理速度快,處理時(shí)間與數(shù)據(jù)對象的數(shù)目無關(guān),聚類時(shí)間獨(dú)立于數(shù)據(jù)規(guī)模和數(shù)據(jù)次序,伸縮性極好。缺點(diǎn)是只能發(fā)現(xiàn)邊界是水平或垂直的聚類,不能檢測到斜邊界,也不適用于高維情況,并存在量化尺度的問題。密度聚類多用于時(shí)空信息處理、消除奇異值,并且可以在帶有“噪聲”的空間數(shù)據(jù)庫中發(fā)現(xiàn)形狀任意、個(gè)數(shù)不定的聚類,適合大型、高維數(shù)據(jù)集等方面具有較好的特性。對于所提到的上述聚類算法,可以從可伸縮性、處理不同類型屬性的能力、發(fā)現(xiàn)任意形狀的簇、處理噪聲數(shù)據(jù)的能力、對輸入順序的敏感性、處理高維數(shù)據(jù)的能力、需要決定的輸入?yún)?shù)最少以及對輸入記錄順序不敏感這些方面來進(jìn)行比較分析,以更好地了解這些聚類算法。
參考文獻(xiàn):
[1]HUANGZX,MICHAELK.Anoteonk-modesclustering[J].JournalogClassification,2003(2).
[2]PELLEGD,MOOREA.X-meansextendingk-meanswithefficientestimationofthenumberoftheclusters[C].Proceedingsofthe17thIC-ML,2000.
[3]ERTOZL,STEINBACHM,KUMARV.Findingclustersofdifferentsizes,shapesanddensitiesinnoisy,highdinensionaldata[R].MinneapolisUniversityofMinnesota,2002.
[4]MARQUESJP,WRITTEN,WUYF,etal.PatternRecognitionConcepts,MethodsandApplications(2nded)[M].Beijing:TsinghuaUniversityPress,2002.
[5]DHILONI.Co-clusteringDocumentsandwordsusingbipartitespec-tralgraphpartitioning[C].SanDiegaProceedingsofthe7thACMSIGKDD,2001.
[6]SAMBASIVAMS,THEODOSOPOULOSN.AdvanceddataclusteringminingWebdocuments[J].IssuesinInformingScienceandInformationTechnology,2006(3).
[7]NANNIM,PEDRESCHID.Time-Focusedclusteringoftrajectoriesofmovingobjects[J].JournalofIntelligentInformationSystems,2006(3).
[8]BIRANTD,KUTA.ST-DBSCAN:ANalgorithmforclusteringspatial-temporaldata[J].Data&KnowledgeEngineering,2007(1).
[9]CRISTOFORD,SINOVICIDA.Aninformation-theoreticalapproachtoclusteringcategoricaldatabasesusinggeneticalgorithms[C].ArlingtonThe2ndSIAMICDM,WorkshoponClusteringHighDinen-sionalData,2001.
篇8
>> 河北省農(nóng)業(yè)自然災(zāi)害財(cái)政救助的問題與對策分析 城鄉(xiāng)統(tǒng)籌的河北省重大自然災(zāi)害防御與補(bǔ)償機(jī)制設(shè)想 基于聚類分析法的遼寧省主體功能區(qū)劃分 基于因子―聚類分析的河北省經(jīng)濟(jì)發(fā)展水平差異研究 氣溫升高與地膜覆蓋對河北省棉花熟區(qū)劃分的影響 基于聚類分析的礦業(yè)經(jīng)濟(jì)區(qū)劃分研究 基于聚類分析對河北省各市三次產(chǎn)業(yè)就業(yè)人員差異化的研究 自然災(zāi)害的能量 農(nóng)業(yè)自然災(zāi)害對通貨膨脹的影響基于動態(tài)面板的實(shí)證分析 基于聚類分析方法的人口區(qū)劃研究 江西省樟樹市主要?dú)庀鬄?zāi)害風(fēng)險(xiǎn)區(qū)劃分析 園藝樹種的自然災(zāi)害及其預(yù)防分析 自然災(zāi)害救援物流系統(tǒng)的流動要素分析 匈奴政權(quán)興衰中的自然災(zāi)害因素分析 分析大型自然災(zāi)害的救災(zāi)物資管理 自然災(zāi)害的社會學(xué)分析綜述 基于主成分聚類分析的云南省干旱自然分區(qū) 不做自然災(zāi)害的“幫兇” 煤礦生產(chǎn)的自然災(zāi)害 果園自然災(zāi)害的防御 常見問題解答 當(dāng)前所在位置:,2010-12-08.
[5] 延平軍.災(zāi)害地理學(xué)[M].西安:陜西師范大學(xué)出版社,1989.
[6] 西北師范大學(xué)地理系.中國自然地理圖集[M].中國地圖出版社,2007.
[7] 徐建華.計(jì)量地理學(xué)[M].北京:高等教育出版社,2008.
[8] 張 超,楊秉賡.計(jì)量地理學(xué)基礎(chǔ)[M].北京:高等教育出版社.2008.
[9] 高 ,蒙小亮,勞小青.基于聚類分析的海南島雷電災(zāi)害易損度風(fēng)險(xiǎn)區(qū)劃[J].自然災(zāi)害學(xué)報(bào),2013,22(1):175-182.
[10] 王 芳,陳 浩,王 瑛,等.面向地震災(zāi)害的河北省救災(zāi)物資儲備庫選址研究[J].自然災(zāi)害學(xué)報(bào),2013,22(2):29-35.
[11] 王汝正, 王正新.模糊聚類分析在區(qū)域自然災(zāi)害區(qū)劃的應(yīng)用――以四川省為例[J].災(zāi)害學(xué),1993,8(1):6-12.
篇9
1 問題的提出
旅游是人們外出旅行與游覽的綜合,是游客在地域空間的流動。無論是往返于常住地和目的地之間,還是在目的地內(nèi)各景區(qū)之間的旅游活動,都必須借助良好的交通設(shè)施和工具,因此,便捷的交通成為溝通旅游者和目的地的橋梁和紐帶。改革開放30余年來(特別是近20年),我國交通運(yùn)輸網(wǎng)絡(luò)發(fā)生了巨大的變化。2008年年底,全國交通運(yùn)輸線路總里程達(dá)到639.45萬千米,是1985年的4.62倍,其中,民航通航里程248.16萬千米,是1985年的8.88倍。民用機(jī)場數(shù)翻了一番,民航旅客構(gòu)成多元化,私人出行增長迅猛,旅客吞吐量比1985年增加了18504萬人次,年均增長高達(dá)14.50%,北京、上海和廣州3大樞紐機(jī)場均進(jìn)入全球機(jī)場前50強(qiáng)行列。鐵路通車?yán)锍?.97萬千米,是1985年的1.44倍,高速鐵路從無到有,既有線路改造成效顯著,電氣化里程是1985年的6倍多,新增91座現(xiàn)代化鐵路客站,旅客運(yùn)輸能力大為提升,鐵路客運(yùn)總量是1985年的1.3倍,高速鐵路日發(fā)送旅客達(dá)到92.5萬人。公路通車?yán)锍?73.02萬千米,是1985年的4倍,僅次于美國,居全球第2。其中,高速公路通車?yán)锍踢_(dá)6.5萬千米,居全球第2,與歐盟27國相當(dāng)。公路客運(yùn)量是1985年的5.63倍,年均增長7.47%。交通運(yùn)輸?shù)目焖侔l(fā)展,極大地促進(jìn)了我國入境旅游和國內(nèi)旅游的快速發(fā)展。1985~2008年,入境客流量增加了1.14億人次,年均增長8.63%;國內(nèi)客流量增加了14.98億人,年均增長8.53%。
有關(guān)旅游與交通運(yùn)輸?shù)年P(guān)系,國外相關(guān)研究開展較早。倫德格倫(lundgren)、皮爾斯等(pearce,etal)對交通在旅游中的作用進(jìn)行了探討。倫德格倫、斯圖爾特等(stewart,et al)對旅游者空間行為和遷移規(guī)律進(jìn)行了分析。德斯蒙德(desmond)、托馬斯(thomas)、丹尼爾(daniel)、蒂亞戈(tiago)分析了包機(jī)旅游及航空運(yùn)輸?shù)淖饔谩鴥?nèi)該方面的研究起步較晚,汪正元分析了交通對旅游的影響和制約作用。保繼剛認(rèn)為,現(xiàn)代旅游業(yè)的發(fā)展與交通運(yùn)輸緊密相連,交通運(yùn)輸?shù)谋憷潭仁呛饬柯糜螛I(yè)發(fā)展的重要標(biāo)志。劉南分析了杭甬高速公路開通對杭州、寧波和紹興旅游發(fā)展的影響。張濤認(rèn)為,旅游交通是發(fā)展旅游業(yè)的命脈,是旅游生產(chǎn)力的重要組成部分。金鳳君等認(rèn)為,鐵路客運(yùn)提速對城市間旅游業(yè)的分工與合作十分有利。繆婧晶、王勁松分析了旅游交通成本對旅游業(yè)的影響及對策。何調(diào)霞等、馬麗君等研究了中國旅游業(yè)與航空運(yùn)輸業(yè)的關(guān)系。張文嘗等對北京、成都和大連城市居民出行交通方式和結(jié)構(gòu)進(jìn)行了分析。王兆峰分析了旅游交通對張家界旅游的影響。陳曉、李悅錚探究了城市交通系統(tǒng)和旅游系統(tǒng)之間的協(xié)調(diào)模式。周蓓研究了四川省航空旅游網(wǎng)絡(luò)空間特征及其結(jié)構(gòu)。朱茲、張明等分析了鐵路建設(shè)對旅游業(yè)的影響。
國內(nèi)外學(xué)者關(guān)于旅游與交通運(yùn)輸?shù)年P(guān)系研究,主要集中在某種交通方式對旅游需求的影響及對旅游目的地發(fā)展的影響。國外學(xué)者較關(guān)注航空和公路(私家車)交通對旅游的影響,研究具有較為明顯的深度和廣度。國內(nèi)學(xué)者注重理論的探討,對于重大的鐵路和公路工程建設(shè)的旅游效應(yīng)較為關(guān)注。但在研究方法方面,定性分析多于定量分析;研究層次上著眼個(gè)別區(qū)域或個(gè)別線路的個(gè)案分析,而忽視整體的宏觀研究,且研究的交通方式也較單一。由于不同的交通方式具有不同特點(diǎn),在游客運(yùn)輸中擔(dān)負(fù)著不同的角色,以及國內(nèi)旅游與入境旅游對交通方式的不同選擇,因此,上述研究既不能提供航空、鐵路、公路等運(yùn)輸?shù)陌l(fā)展對入境旅游和國內(nèi)旅游產(chǎn)生何種影響及具有什么邊際彈性,也不能從地區(qū)差異上提供各省區(qū)交通運(yùn)輸對旅游業(yè)發(fā)展的適宜性特征。本文嘗試運(yùn)用宏觀的時(shí)空結(jié)合方法:首先,利用1985~2008年時(shí)間序列數(shù)據(jù),分析旅游客流量與交通客運(yùn)量的協(xié)整關(guān)系;然后,依據(jù)2006~2007年30個(gè)省區(qū)截面數(shù)據(jù),分析旅游客流量與交通客運(yùn)量的統(tǒng)計(jì)規(guī)律,并劃分其依賴一偏好類型,從時(shí)空變化上定量分析交通運(yùn)輸業(yè)對旅游業(yè)的拉動作用,對于認(rèn)識交通運(yùn)輸與旅游發(fā)展的關(guān)系有很重要的現(xiàn)實(shí)意義。
2 概念模型、數(shù)據(jù)說明與研究方法
2.1概念模型與基本假設(shè)
張文嘗等認(rèn)為,交通運(yùn)輸是中國國民經(jīng)濟(jì)發(fā)展的基礎(chǔ)產(chǎn)業(yè)。對于旅游業(yè)的發(fā)展來說,交通運(yùn)輸更是必不可少的先決條件。從旅游客源地來說,旅游交通連接著旅游目的地和景區(qū),幫助游客實(shí)現(xiàn)外出旅游;從旅游目的地來說,旅游交通聯(lián)系客源地、組合旅游產(chǎn)品,使旅游接待和景點(diǎn)旅游得以實(shí)現(xiàn)。根據(jù)抽樣調(diào)查和問卷調(diào)查資料,依據(jù)空間尺度將旅游交通劃分為兩個(gè)層次,如圖1所示。第一層是大中尺度的長途交通,主要是航空和鐵路,一般運(yùn)送空間尺度大于100千米,主要承擔(dān)從客源地到目的地的大中尺度空間移動,包括入境旅游和跨省區(qū)旅游。航空旅游具有快捷、直達(dá)、舒適等特點(diǎn),但價(jià)格比較昂貴;鐵路旅游具有運(yùn)量大、價(jià)格低廉等特點(diǎn),但速度較慢。這兩種交通運(yùn)輸方式對于旅游業(yè)的發(fā)展來說,主要解決游客“進(jìn)得來”和“出得去”的問題。第二層是中小尺度的短途交通,主要為公路旅客運(yùn)輸,一般運(yùn)送空間尺度小于100千米,是游客在目的地(中心城市)到風(fēng)景區(qū)之間交通,省內(nèi)旅游和市內(nèi)交通以公路為主。因公路運(yùn)輸快捷靈活,主要解決游客在目的地“散得開”的問題。
基于上述認(rèn)識,本出如下兩點(diǎn)假設(shè):(1)入境旅游及客流量在30個(gè)省區(qū)的分布主要受航空運(yùn)輸和鐵路運(yùn)輸?shù)挠绊憽R驗(yàn)椋刖陈糜慰土髁吭诟魇^(qū)的分布主要是大中尺度的旅游流,入境游客可支配收入高、旅游時(shí)間寶貴、活動范圍大,航空和鐵路是長距離旅行的主要交通方式;至于人境旅游者在各城市內(nèi)的交通運(yùn)輸,多由旅行社專配旅游車輛來完成,一般不計(jì)入公共交通系統(tǒng)。(2)國內(nèi)旅游客流量在30個(gè)省區(qū)的分布,主要受公路交通和鐵路運(yùn)輸?shù)挠绊憽R驗(yàn)閲鴥?nèi)旅游一部分是本省游客在本省區(qū)內(nèi)的旅游(大約占20%~40%)①;另外,跨省區(qū)的國內(nèi)旅游,因國內(nèi)居民收入較低,航空運(yùn)輸票價(jià)較為昂貴,2000年之前乘坐飛機(jī)手續(xù)復(fù)雜,鐵路成為國內(nèi)大中尺度旅游的主要交通工具。
2.2數(shù)據(jù)說明
本研究所選用的基礎(chǔ)數(shù)據(jù)包括兩個(gè)序列:(1)1985~2008年中國旅游客流量和交通運(yùn)輸客運(yùn)量數(shù)據(jù),共包括3個(gè)子序列:①入境客流量,反映入境旅游業(yè)發(fā)展?fàn)顩r,記為tf;②國內(nèi)旅游客流量,反映國內(nèi)旅游發(fā)展?fàn)顩r,記為td;③航空、鐵路、公路客運(yùn)量,反映陸路交通運(yùn)輸系統(tǒng)的運(yùn)輸能力,分別記為al、rw、hw。這些數(shù)據(jù)均來自1986—2009年《中國旅游年鑒》、《中國統(tǒng)計(jì)年鑒》、《中國交通年鑒》等官方統(tǒng)計(jì)資料。(2)30個(gè)省區(qū)的截面數(shù)據(jù)。為了分析各省區(qū)入境旅游、國內(nèi)旅游與航空運(yùn)輸、公路運(yùn)輸?shù)年P(guān)系,本文還選取2006年全國30個(gè)省區(qū)的截面數(shù)據(jù)(西藏除外),分別以上述時(shí)間序列分析中的關(guān)鍵因素,采用截面數(shù)據(jù)分析入境客流量與航空客運(yùn)量、國內(nèi)旅游客流量與公路客運(yùn)量的關(guān)系。
旅游業(yè)是環(huán)境敏感的脆弱產(chǎn)業(yè),極易受到各種危機(jī)事件的影響。1989年的政治風(fēng)波、1998年的亞洲金融危機(jī)、2003年的sars危機(jī)、2008年的汶川地震等,均對中國入境旅游和國內(nèi)旅游產(chǎn)生較大影響,為了在較平穩(wěn)的序列中分析旅游客流量與交通客運(yùn)量的關(guān)系,本文依據(jù)本底趨勢線理論,對1989年、1998年、2003年和2008年的入境旅游和國內(nèi)旅游數(shù)據(jù)進(jìn)行了內(nèi)插訂正。
2.3研究方法
本研究采用時(shí)間序列和截面數(shù)據(jù)結(jié)合的方法,分析交通運(yùn)輸對旅游業(yè)的影響。首先,利用時(shí)間序列的單位根檢驗(yàn)方法,對交通運(yùn)輸巨變與旅游業(yè)發(fā)展的長期穩(wěn)定關(guān)系進(jìn)行檢驗(yàn),在存在長期均衡關(guān)系的基礎(chǔ)上,建立誤差修正模型進(jìn)行短期均衡關(guān)系調(diào)整的檢驗(yàn);然后,利用格蘭杰因果關(guān)系檢驗(yàn)法,對交通運(yùn)輸與旅游業(yè)因果關(guān)系進(jìn)行檢驗(yàn),從時(shí)間序列數(shù)據(jù)分析中認(rèn)識交通運(yùn)輸與旅游業(yè)發(fā)展的因果關(guān)系;最后,利用2006年30個(gè)省區(qū)的截面數(shù)據(jù),分析入境旅游客流量與航空客運(yùn)量、國內(nèi)旅游客流量與公路客運(yùn)量的統(tǒng)計(jì)相關(guān)性,依據(jù)相對偏差劃分依賴一偏好類型,尋找旅游客流量與主要交通運(yùn)輸方式之間的空間差異。
3 時(shí)間序列分析與格蘭杰因果關(guān)系檢驗(yàn)
3.1時(shí)間序列的穩(wěn)定性檢驗(yàn)
要分析變量之間的協(xié)整關(guān)系并建立var模型,首先需對變量進(jìn)行是否具有單位根平穩(wěn)性檢驗(yàn)。只有變量在同階平穩(wěn)的條件下,才能對其進(jìn)行協(xié)整分析。常用adf方法來驗(yàn)證,該方法可以通過對如下3個(gè)模型進(jìn)行檢驗(yàn):模型1-不含有常數(shù)項(xiàng)和時(shí)間趨勢項(xiàng),模型2-含有常數(shù)項(xiàng)而沒有趨勢項(xiàng),模型3一含有常數(shù)項(xiàng)和趨勢項(xiàng)。如果其中任何一個(gè)adf值大于麥金農(nóng)臨界值,則可以認(rèn)為該序列沒有單位根,是平穩(wěn)的時(shí)間序列。因此,本文對取自然對數(shù)后的變量以及它們的差分序列作平穩(wěn)性檢驗(yàn)。結(jié)果見,表1。
從表1可以看出,在1%顯著性水平下,所有變量水平值都是非平穩(wěn)的。經(jīng)過一階差分后,在5%顯著性水平下,國內(nèi)客流量(ltd)、入境客流量(ltf)、公路客運(yùn)量(lhw)、鐵路客運(yùn)量(lrw)和航空客運(yùn)量(lal)為平穩(wěn)性變量,即為一階單整序列。
3.2協(xié)整檢驗(yàn)
協(xié)整理論是20世紀(jì)80年代由恩格爾(engle)和格蘭杰(granger)提出的。其基本思想是,盡管兩個(gè)(或兩個(gè)以上)變量中每個(gè)都是非平穩(wěn)的,但其線性組合有可能相互抵消趨勢項(xiàng)的影響,成為一個(gè)平穩(wěn)的變量。協(xié)整檢驗(yàn)的常用方法是e—g兩步法,對于多個(gè)變量之間的協(xié)整關(guān)系,可以使用基于向量自回歸模型的約翰森(johansen)檢驗(yàn)法。為分析變量ltd、ltf與lrw、lhw、lal之間的長期穩(wěn)定關(guān)系,本文采用約翰森模型對其進(jìn)行協(xié)整檢驗(yàn)。選擇方程中含有截距項(xiàng),根據(jù)aic和sc準(zhǔn)則,將滯后階數(shù)確定為2,檢驗(yàn)結(jié)果如表2和表3所示。
從表2可以看出,在5%顯著性水平上,人境客流量與公路、鐵路、航空客運(yùn)量之間存在長期穩(wěn)定的均衡關(guān)系。采用ols方法,其協(xié)整方程如下:
ltf=-0.350486lrw +(1. 51442)
1.121560lhw 0.348604lal+(-2.43182) (1.92863)-22.04167 (1)
從方程的系數(shù)可以看出,各時(shí)間序列變量都顯著地進(jìn)入了協(xié)整方程,反映了變量之間存在長期穩(wěn)定的趨勢。從長期來看,鐵路客運(yùn)對入境客流量的彈性為-0.350486,公路客運(yùn)對入境客流量的彈性為1,121560,民航客運(yùn)對入境客流量的彈性為0.348604。王海江和苗長虹認(rèn)為,我國客運(yùn)交通聯(lián)系具有明顯的距離衰減規(guī)律,公路、鐵路和航空客運(yùn)最佳營運(yùn)距離為150千米、700千米和1300千米。入境游客由國外進(jìn)入中國及在中國大區(qū)之間移動的空間距離較大,依賴長途交通,主要以航空客運(yùn)為主;而在各省區(qū)內(nèi)部,大部分省區(qū)內(nèi)航班班次少,加之高速公路網(wǎng)發(fā)達(dá)、快捷等優(yōu)勢,游客在省區(qū)內(nèi)部移動主要由公路運(yùn)輸承擔(dān),一個(gè)人境游客在省內(nèi)的移動,可產(chǎn)生10~20個(gè)公路客運(yùn)人次,導(dǎo)致公路客運(yùn)彈性系數(shù)很高。對入境客流量而言,鐵路客運(yùn)產(chǎn)生的負(fù)效應(yīng)是由于航空客運(yùn)、公路客運(yùn)部分替代效應(yīng)和鐵路客運(yùn)距離衰減雙重作用所致。
從表3可以看出,在5%顯著性水平上,國內(nèi)客流量與公路、鐵路、航空客運(yùn)量之間存在長期穩(wěn)定的均衡關(guān)系。采用ols方法,其協(xié)整方程如下:
ltd=1.049012lrw+0.881197lhw-00.172383lal-24.06571
轉(zhuǎn)貼于
(-2.0803) (-1.96406) (-2.13556) (2)
從方程的系數(shù)可以看出,各時(shí)間序列變量都顯著地進(jìn)入了協(xié)整方程,反映了變量之間存在長期穩(wěn)定的趨勢。從長期來看,鐵路客運(yùn)對國內(nèi)客流量的彈性為1.049012,公路客運(yùn)對國內(nèi)客流量的彈性為0.881197,民航客運(yùn)對國內(nèi)客流量的彈性為0.17383。中國地域遼闊,國內(nèi)游客在超過150千米的省區(qū)之間主要由鐵路客運(yùn)承擔(dān),或鐵路客運(yùn)和公路客運(yùn)交替承擔(dān)。各省區(qū)十分重視公路網(wǎng)絡(luò)的建設(shè),尤其是高速公路的快速發(fā)展。公路較鐵路網(wǎng)絡(luò)密集和完善,筆者依據(jù)國內(nèi)游客抽樣調(diào)查數(shù)據(jù)估算,約有20%~40%的游客在本省區(qū)內(nèi)發(fā)生。因此,在省區(qū)內(nèi)旅游移動主要由公路客運(yùn)完成。航空客運(yùn)對國內(nèi)客流量增長貢獻(xiàn)相對較小,是因?yàn)樵谑^(qū)之間或省區(qū)內(nèi)空間位移,航空客運(yùn)較鐵路客運(yùn)和公路客運(yùn)費(fèi)用高,加之我國經(jīng)濟(jì)發(fā)展水平不高,居民可自由支配收入水平較低,航空客運(yùn)不是國內(nèi)大多數(shù)游客出行首選交通方式,以及早期航空客運(yùn)比重較小等因素所致。
3.3誤差修正模型
上述協(xié)整分析分別給出了ltf、ltd與lrw、lhw、lal之間的長期穩(wěn)定均衡關(guān)系,而這種長期穩(wěn)定關(guān)系是在短期動態(tài)過程的不斷調(diào)整下得以維持的。根據(jù)granger定理,一組具有協(xié)整關(guān)系的變量具有誤差修正模型的表達(dá)形式。因此,在協(xié)整檢驗(yàn)的基礎(chǔ)上,筆者進(jìn)一步建立包括誤差修正項(xiàng)在內(nèi)的誤差修正模型,以此來研究模型的短期動態(tài)和長期調(diào)整特征。將長期關(guān)系模型中的各變量以一階差分形式重新加以構(gòu)造,并將長期關(guān)系模型所產(chǎn)生的殘差序列作為解釋變量引入。作為解釋變量引入的長期關(guān)系模型的殘差,代表著在取得長期均衡過程中各時(shí)點(diǎn)上出現(xiàn)“偏誤”的程度。分別建立ltf與lrw、lhw、lal以及l(fā)td與lrw、lhw、lal如下形式的修正模型:
3.3.1 入境客流量(ltf)短期波動向長期均衡調(diào)整的誤差修正模型
dltf=-0.716022ecm-0.280582dltf(-1)+0.548099dltf(-2)-0.017133dlrw(-1)+0.015559dlrw(-2)-1,171688dlhw(-1)+0.893335dlhw(-2)+1,022703dlal(-1)+0.029439dlal(-2)+0.0329289
r2=0.618536 (3)
誤差修正方程(3)中各參數(shù)的系數(shù),可分別看作是各滯后量對dltf的彈性系數(shù),可對其進(jìn)行彈性分析。其中,dltf(-1)和dltf(-2)為入境客流量的1期和2期滯后,系數(shù)分別為-0.28058和0.548099,說明前1年或前2年客流量每增長1%,將促使下年客流量下降0.28058%或第2年增長0.548099%;dlrw(-1)和dlrw(-2)為鐵路客運(yùn)量的1期和2期滯后,系數(shù)分別為-0.017133和0.0155589,說明前1年或前2年鐵路客運(yùn)量每增長1%,將促使下年客流量下降0.017133%或第2年增長0.0155589%;dlhw(-1)和dlhw(-2)為公路客運(yùn)量1期和2期滯后,系數(shù)分別為-1.171689和0.893335,說明前1年或前2年公路客運(yùn)量每增長1%,將促使下年客流量下降1.171689%或第2年增長0.893335%;dlal(-1)和dlal(一2)為航空客運(yùn)量1期和2期滯后,系數(shù)分別為1.022703和0.029438,說明前1年或前2年航空客運(yùn)量每增長1%,將促使下年客流量增長1.022703%或第2年增長0.029438%。從彈性分析可看出,入境客流量增長對自身發(fā)展的推動作用不顯著,而交通客運(yùn)量增長對下年入境客流量增長起到重要的作用,尤其航空客運(yùn)量增長貢獻(xiàn)最大。ecm項(xiàng)系數(shù)反映了對偏離長期均衡的調(diào)整力度。當(dāng)修正系數(shù)為l時(shí),入境客流量和鐵路、公路、航空客運(yùn)量均衡的誤差,將在下年就可以調(diào)整到均衡狀態(tài)。方程(1)中ecm系數(shù)為-0.716022,說明入境客流量與鐵路、公路、民航客運(yùn)量之間的均衡關(guān)系,對當(dāng)期非均衡誤差的修正能力較強(qiáng),符合反向修正機(jī)制原理。
3.3.2國內(nèi)客流量(ltd)短期波動向長期均衡調(diào)整的誤差修正模型
dltd=-0.243782ecm+0.576056dltd(-1)+0.269367dltd(-2)-0.348364dlrw(-1)+0.083713dlrw(-2)+0.510915dlhw(-1)+0.654979dlhw(-2)+0.260907dlal(-1)+0.093286dlal(-2)+0.113737
r2=0.517116 (4)
方程(4)中,dltd(-1)和dltd(-2)為國內(nèi)旅游1期和2期滯后,系數(shù)分別為0.5760和0.2694,說明上年或前2年國內(nèi)客流量每增長1%,將使今年或明年國內(nèi)客流量增長0.5760%和0.2694%;dlrw(-1)和dlrw(-2)為鐵路客運(yùn)量1期和2期滯后,系數(shù)分別為-0.3484和0.0837,說明上年或前2年鐵路客運(yùn)量每增長1%,將使今年國內(nèi)客流量下降0.3483%和第2年增長0.0837%;dlhw(-1)和dlhw(-2)為公路客運(yùn)1期和2期滯后,系數(shù)分別為0.5109和0.6550,說明上年或前2年公路客運(yùn)每增長1%,將使今年和第2年國內(nèi)客流量增長0.510915%和0.654979%;dlal(-1)和dlal(-2)為航空客運(yùn)l期和2期滯后,系數(shù)分別為0.2609和0.0933,說明上年或前2年航空客運(yùn)量增長1%,將使今年和第2年國內(nèi)客流量增長0.2609%和0.093286%。彈性分析結(jié)果顯示,國內(nèi)客流量1期和2期滯后都對自身發(fā)展有推動作用,這是國內(nèi)發(fā)展的慣性或稱為系統(tǒng)的記憶性。而公路、鐵路、航空的l期滯后對國內(nèi)客流量有明顯的推動效應(yīng),2期滯后的推動作用相對較小,相比較而言,公路客運(yùn)對國內(nèi)客流量增長貢獻(xiàn)最大。而偏差調(diào)整項(xiàng)ecm系數(shù)為-0.243782,說明國內(nèi)客流量與公路、鐵路、民航客運(yùn)量的均衡關(guān)系對當(dāng)期非均衡誤差調(diào)整能力不強(qiáng),當(dāng)國內(nèi)旅游短期波動偏離長期均衡時(shí),會以(-0.244)的調(diào)整能力將其拉回均衡狀態(tài)。
3.4格蘭杰因果檢驗(yàn)
通過協(xié)整檢驗(yàn),表明變量ltf,ltd分別與lrw、lhw和lal之間存在協(xié)整關(guān)系。但是,這種長期的均衡關(guān)系究竟是旅游客流量引起交通客運(yùn)量變動的結(jié)果,還是交通客運(yùn)量引起旅游客流量的結(jié)果?旅游客流量和交通客運(yùn)量在波動中孰為因孰為果還是互為因果?這需要對旅游客流量和交通客運(yùn)量進(jìn)行格蘭杰因果關(guān)系檢驗(yàn)。張曉峒認(rèn)為,滯后期數(shù)的選取是任意的,以xt和yt為例,如果xt-1對yt存在顯著性影響,則不必再做滯后期更長的檢驗(yàn),否則應(yīng)該再做滯后期更長的檢驗(yàn)。因此,本文按照這一原則選擇格蘭杰檢驗(yàn)的滯后期為2,結(jié)果如表4。
表4表明,在10%顯著水平下,入境客流量方面,公路客運(yùn)量與入境客流量之間存在單向格蘭杰因果關(guān)系,格蘭杰因概率為0.06571,因此,拒絕原假設(shè),表明公路客運(yùn)能夠促進(jìn)入境客流量的增長;入境客流量與航空客運(yùn)量存在單向格蘭杰因果關(guān)系,格蘭杰因概率為0.08605,因此,拒絕原假設(shè),即入境客流量增長對航空客運(yùn)量具有拉動效應(yīng)。我國地域遼闊,省區(qū)之間的距離相當(dāng)于歐洲國與國之間的距離,入境旅游者從境外入境中國大陸及在大陸較遠(yuǎn)各省區(qū)間進(jìn)行旅游,基本上都屬于大尺度上的空間位移,對長距離的交通工具飛機(jī)和火車依賴較大,因此,入境旅游對航空客運(yùn)拉動作用明顯。鐵路客運(yùn)量與入境客流量之間存在單向格蘭杰因果關(guān)系,格蘭杰因概率為0.01962,因此,拒絕原假設(shè),表明我國鐵路提速和高鐵的建設(shè)對入境旅游者的增長和其在境內(nèi)中尺度上空間位移產(chǎn)生了積極作用。國內(nèi)客流量方面,公路客運(yùn)量與國內(nèi)客流量為單向格蘭杰因果關(guān)系,格蘭杰因概率為0.10026,因此,拒絕原假設(shè),即公路客運(yùn)對國內(nèi)客流量增長具有促進(jìn)效應(yīng)。短距離的省區(qū)間及省區(qū)內(nèi),因汽車具有靈活、方便和快捷等優(yōu)勢,加之通向旅游景區(qū)高等級公路的修建,旅游者出行主要以汽車為主。航空客運(yùn)量與國內(nèi)客流量存在單向格蘭杰因果關(guān)系,格蘭杰因概率為0.05458,因此,拒絕原假設(shè),即航空客運(yùn)發(fā)展對國內(nèi)客流量增長能起到一定的推動效應(yīng),航空運(yùn)輸?shù)奶攸c(diǎn)能較好地滿足經(jīng)濟(jì)實(shí)力強(qiáng)和對時(shí)間要求高的部分旅游者的需求。
檢驗(yàn)結(jié)果還顯示,在10%顯著水平下,入境客流量不是公路客運(yùn)量和鐵路客運(yùn)量的格蘭杰因概率分別為0.52387和0.20404,接受原假設(shè),即入境旅游對公路客運(yùn)和鐵路客運(yùn)推動作用不大。國內(nèi)客流量與鐵路客流量之間不存在格蘭杰因果關(guān)系,格蘭杰因概率為0.47319和o,28107,接受原假設(shè),即國內(nèi)客流量與鐵路客運(yùn)量無顯著互相推動效應(yīng)。國內(nèi)客流量與航空客運(yùn)量和公路客運(yùn)量的格蘭杰因概率分別為0.20358和0.39884,接受原假設(shè),即國內(nèi)客流量對航空客運(yùn)和公路推動效應(yīng)不明顯。這些檢驗(yàn)結(jié)果都與事實(shí)有出入,但這并不代表旅游客流量對交通運(yùn)輸客運(yùn)量沒有促進(jìn)作用。格蘭杰因果關(guān)系檢驗(yàn)只是基于時(shí)間序列數(shù)據(jù)的分析,是在特定顯著性水平的定量判斷,并不能完全排除理論上的質(zhì)性分析。質(zhì)性分析可以發(fā)現(xiàn),交通運(yùn)輸是旅游必不可少的先決條件,是連接客源地與目的地的必不可少的工具,因此,無論是入境客流量,還是國內(nèi)客流量都是交通運(yùn)輸客流量的重要組成部分,對交通客運(yùn)量增長的作用是顯而易見的,旅游客流量在交通客運(yùn)量中的比重逐年上升就表明了這一點(diǎn)。隨著《關(guān)于加快旅游業(yè)發(fā)展的意見》綱領(lǐng)性文件的出臺,這一比重還將進(jìn)一步上升。這也說明格蘭杰因果關(guān)系分析存在某些方面的局限。格蘭杰因果性檢驗(yàn)是時(shí)間上的“先后次序”(或前因后果)關(guān)系,而不是一般意義上的因果關(guān)系。它要求變量必須是平穩(wěn)的(無趨勢項(xiàng))。若原始變量的時(shí)間序列不平穩(wěn),就要對變量作對數(shù)變換或多級差分處理,這種處理有可能會扭曲原始變量間的因果關(guān)系,所以才得出“不是因果關(guān)系”的結(jié)論。
4 交通客運(yùn)量與旅游客流量關(guān)系的統(tǒng)計(jì)分析及地域類型劃分
時(shí)空互照,旅游客流量與交通客運(yùn)量非線性時(shí)間序列的規(guī)律,在某種情況下也可以通過空間差異反映出來。我國東部北京、上海、廣東是3個(gè)最大的入境口岸,國際航空客運(yùn)和國內(nèi)航空客運(yùn)都十分發(fā)達(dá),成為人境旅游的三大高地;而浙江、江蘇、河南、四川、廣東、山東等省區(qū),人口眾多、公路運(yùn)輸發(fā)達(dá),國內(nèi)旅游居于全國領(lǐng)先地位。下面著重以入境旅游與航空客運(yùn)、國內(nèi)旅游與公路客運(yùn)為對象,采用30個(gè)省區(qū)截面數(shù)據(jù),分析交通客運(yùn)量與旅游客流量的關(guān)系并劃分其地域類型。
4.1入境客流量與航空客流量關(guān)系的統(tǒng)計(jì)分析
入境旅游是大尺度、高消費(fèi)、高選擇的高層次旅游。因受旅行時(shí)間等因素的限制,國外旅游者往往選擇經(jīng)濟(jì)發(fā)達(dá)、基礎(chǔ)設(shè)施較好的熱點(diǎn)城市和級別較高的景點(diǎn)旅游。我國幅員遼闊,地域差異大,各省區(qū)在交通區(qū)位和旅游資源豐度上存在較大差異,使得各省區(qū)接待的入境游客有較大差別。依據(jù)國家旅游局抽樣調(diào)查資料,外國旅游者入境中國及在各省區(qū)之間的流動,50%依靠民航運(yùn)輸,20%依靠鐵路客運(yùn),而公路主要承擔(dān)城市內(nèi)部和旅游景點(diǎn)之間的短途運(yùn)輸①。本節(jié)以航空客運(yùn)為關(guān)鍵變量,分析各省區(qū)入境客流量與航空客運(yùn)量的關(guān)系。以2006年30個(gè)省區(qū)截面數(shù)據(jù)為依據(jù),以入境客流量為因變量,航空客運(yùn)量為自變量,制作x—y關(guān)系散點(diǎn)圖,結(jié)果表明,入境客流量與民航客運(yùn)量呈明顯的線性相關(guān)。其中,廣東、上海、北京航空客運(yùn)量位居前三名,入境客流量排全國前3名,并且遠(yuǎn)遠(yuǎn)超過其他省區(qū);中西部的陜西、云南、四川、重慶航空客運(yùn)量較高,入境客流量也領(lǐng)先其他省區(qū)。本文采用ols法進(jìn)行回歸分析,其回歸方程如下:
tf=0.1079al+61.765 (5)
可決系數(shù)r2=0.758,擬合效果較好,符合預(yù)測要求。由方程(5)可知,航空客運(yùn)量的邊際彈性系數(shù)為0.1079,即航空客運(yùn)量每增加1萬人次,入境客流量將增加0.1079萬人次。
仔細(xì)觀察圖中散點(diǎn)分布,可以發(fā)現(xiàn)各省區(qū)在入境旅游與航空客運(yùn)上存在較大差異。為了分析這種散點(diǎn)分布對回歸方程的偏差,本文借用孫根年早期提出的依賴一偏好指數(shù)模型,分省區(qū)比較入境客流量與航空客運(yùn)量的地區(qū)差異。依賴一偏好指數(shù)計(jì)算公式為:
轉(zhuǎn)貼于
εi=[sti/tti]
其中:sti為入境客流量統(tǒng)計(jì)值,tti為回歸方程的預(yù)測值。依據(jù)對依賴一偏好指數(shù)的計(jì)算和偏離程度,得到全國30個(gè)省區(qū)入境客流量對航空客運(yùn)量的偏離指數(shù)類型。結(jié)果見表5。
表5表明,在所統(tǒng)計(jì)的30個(gè)省區(qū)中,強(qiáng)依賴或偏好省區(qū)有4個(gè),占13.33%;較強(qiáng)依賴或偏好省區(qū)有8個(gè),占26.67%;中等依賴或中等偏好省區(qū)有9個(gè),占30%;較弱依賴或偏好省區(qū)有7個(gè),占23.3%;弱依賴或偏好省區(qū)有2個(gè),占6.6%。內(nèi)蒙古、上海、山東、廣西依賴指數(shù)高于1.45,內(nèi)蒙古和廣西地處邊陲,上海是出入境口岸,江蘇和浙江經(jīng)濟(jì)發(fā)達(dá),對航空需求大;天津、江蘇、河北、遼寧、黑龍江、安徽、福建、云南依賴指數(shù)處于1~1,45,多處于邊陲或內(nèi)陸,對航空依賴明顯;北京、浙江、河南、湖北、湖南、廣東、重慶、四川、陜西依賴指數(shù)處于0.7~1,北京和廣東是出入境口岸,陜西、四川和重慶則地處內(nèi)陸,對航空有依賴;山西受北京影響,吉林受遼寧影響,江西受上海、江浙等影響,航空依賴指數(shù)較小;青海和寧夏地處邊緣地區(qū),旅游資源豐度不高,入境旅游客流量較小,對航空需求低。
4.2國內(nèi)客流量與公路客運(yùn)量關(guān)系的統(tǒng)計(jì)分析
經(jīng)過近20年的發(fā)展,我國國內(nèi)旅游已進(jìn)入大眾化階段,旅游人數(shù)屢創(chuàng)新高。盡管受到金融危機(jī)的影響,2009年國內(nèi)旅游仍達(dá)到19.3億人次,出游率達(dá)到1.5次/人,較2008年增長16.3%。但由于經(jīng)濟(jì)發(fā)展水平所限,國內(nèi)旅游仍具有低消費(fèi)、中近距離等特點(diǎn),30%以上游客為本省區(qū)內(nèi)旅游。因公路運(yùn)輸靈活、方便,鐵路運(yùn)輸票價(jià)低廉,此兩種方式是國內(nèi)旅游主要的交通運(yùn)輸方式。本節(jié)以公路客運(yùn)量為關(guān)鍵變量,分析各省區(qū)國內(nèi)旅游與公路客流量的關(guān)系。以2006年30個(gè)省區(qū)截面數(shù)據(jù)為依據(jù),以國內(nèi)旅游客流量為因變量,公路客運(yùn)量為自變量,制作x—y散點(diǎn)圖,結(jié)果發(fā)現(xiàn),回歸方程可決系數(shù)很低,方程擬合效果不理想。分析發(fā)現(xiàn)北京、上海和天津國內(nèi)客流量大,但公路客運(yùn)量小,與其是中國最大的直轄市有關(guān),影響了方程的回歸,隨后剔除三者,做新的散點(diǎn)圖,結(jié)果表明,國內(nèi)客流量與公路客運(yùn)量呈明顯的二次函數(shù)關(guān)系。其中,東部沿海的浙江、山東和江蘇國內(nèi)客流量很大,中部安徽國內(nèi)客流量排在第l位,西部地區(qū)四川國內(nèi)客流量位居首位。本文采用ols法進(jìn)行回歸分析,其擬合的二次曲線回歸方程如f:
td=-0.0055hw2+0.193hw-0.121 (6)
可決系數(shù)r。=o,7673,擬合效果較好,符合預(yù)測要求。根據(jù)依賴一偏好指數(shù)公式,得到各省區(qū)國內(nèi)旅游客流量對公路客運(yùn)量的依賴一偏好指數(shù)類型。結(jié)果見表6。
表6表明,在所統(tǒng)計(jì)的27個(gè)省區(qū)中,強(qiáng)依賴或偏好省區(qū)有2個(gè),占所統(tǒng)計(jì)省區(qū)的7,41%;較強(qiáng)依賴或偏好省區(qū)12個(gè),占44,44%;中等依賴或中等偏好省區(qū)9個(gè),占33,33%;弱依賴或偏好省區(qū)4個(gè),占14,81%。青海和寧夏多山,地形復(fù)雜,航空與鐵路網(wǎng)絡(luò)少,國內(nèi)旅游主要依賴公路運(yùn)輸;浙江、山東和四川等省境內(nèi)公路網(wǎng)絡(luò)密度大,尤其浙江和山東不僅高等級公路比例高,而且四通發(fā)達(dá),出行十分方便。遼寧、河南和陜西不僅公路網(wǎng)絡(luò)發(fā)達(dá),更重要的都是我國鐵路交通樞紐,高速列車和動車組較多,航空線眾多,在一定程度上降低了對公路運(yùn)輸?shù)男枨蟆V卸纫蕾囈黄眯偷氖^(qū)9個(gè),占33.33%,這些省區(qū)中,廣東和湖北省鐵路與航空網(wǎng)絡(luò)發(fā)達(dá),基本已形成了民航、鐵路和公路運(yùn)輸三位一體的交通網(wǎng)絡(luò)。因此,國內(nèi)旅游對公路運(yùn)輸依賴適中。而甘肅、湖南、廣西、重慶等省區(qū)大部分鐵路網(wǎng)絡(luò)不發(fā)達(dá),高等級鐵路少,經(jīng)濟(jì)發(fā)展水平較低,而且境內(nèi)多山,因此,國內(nèi)出游主要以公路為主。弱依賴一偏好型的省區(qū)4個(gè),占14.81%,依賴一偏好指數(shù)在0.6以下,這些省區(qū)都地處我國邊疆地區(qū),地形復(fù)雜、多山,且距離遠(yuǎn),與外界聯(lián)系以鐵路和航空運(yùn)輸為主,對公路運(yùn)輸需求很小。
5 結(jié)論
盡管旅游業(yè)的發(fā)展,促進(jìn)了交通運(yùn)輸?shù)陌l(fā)展,但是交通運(yùn)輸功能巨大,并非完全是為旅游業(yè)服務(wù)的,因?yàn)樨浳镞\(yùn)輸、國內(nèi)外非旅游者的運(yùn)輸,也是交通運(yùn)輸?shù)闹匾蝿?wù)。在旅游業(yè)發(fā)展之前,交通運(yùn)輸已經(jīng)存在,并在客貨運(yùn)輸中擔(dān)負(fù)著重要的功能。20年來,隨著交通運(yùn)輸?shù)目焖侔l(fā)展,尤其是航空客運(yùn)逐漸普及,鐵路提速、高速鐵路的修建,公路和高速公路的發(fā)展,對我國旅游業(yè)的發(fā)展起到了巨大的推動作用。本文利用1985~2008年的時(shí)間序列數(shù)據(jù)和2006年全國30個(gè)省區(qū)的截面數(shù)據(jù),分析了旅游客流量與交通客運(yùn)量的關(guān)系。結(jié)果發(fā)現(xiàn):
(1)基于時(shí)間序列的協(xié)整分析發(fā)現(xiàn),長期內(nèi),旅游客流量與交通客運(yùn)量之間存在著長期穩(wěn)定的均衡關(guān)系。彈性系數(shù)表明,交通運(yùn)輸業(yè)對旅游業(yè)的發(fā)展具有顯著的推動作用。格蘭杰因果關(guān)系檢驗(yàn)表明,航空客運(yùn)量和公路客運(yùn)量與入境客流量之間存在單向格蘭杰因果關(guān)系,航空客運(yùn)與公路客運(yùn)對入境旅游的推動作用很大。入境客流量與航空客運(yùn)量之間存在單向格蘭杰因果關(guān)系,即入境旅游能推動航空客運(yùn)的增長。航空客運(yùn)量和公路客運(yùn)量與國內(nèi)客流量之間存在單向格蘭杰因果關(guān)系,即公路客運(yùn)和航空客運(yùn)的增長促進(jìn)了國內(nèi)旅游的發(fā)展。
(2)誤差修正模型分析發(fā)現(xiàn),對于入境旅游,短期動態(tài)內(nèi),航空客運(yùn)量、鐵路客運(yùn)量和公路客運(yùn)量的1期和2期滯后效應(yīng)中,航空客運(yùn)量對入境客流量增長具有積極的推動作用,鐵路客運(yùn)量和公路客運(yùn)量1期效應(yīng)不顯著。當(dāng)短期波動偏離長期均衡時(shí),系統(tǒng)將以-0.716022的調(diào)整力度將非均衡狀態(tài)拉回到均衡狀態(tài)。對于國內(nèi)旅游,短期動態(tài)內(nèi),航空客運(yùn)量、鐵路客運(yùn)量和公路客運(yùn)量的1期和2期滯后效應(yīng)中,公路客運(yùn)量和航空客運(yùn)量對國內(nèi)客流量增長具有較大推動效應(yīng),鐵路客運(yùn)量1期滯后效應(yīng)微弱。當(dāng)短期波動偏離長期均衡時(shí),系統(tǒng)將以-0.243782的調(diào)整力度將非均衡狀態(tài)拉回到均衡狀態(tài)。
(3)基于對全國30個(gè)省區(qū)截面數(shù)據(jù)的分析,發(fā)現(xiàn)入境客運(yùn)量與航空客運(yùn)量呈明顯的線性相關(guān),航空客運(yùn)量的邊際彈性為0.1079,即民航客運(yùn)量每增加1萬人次,入境客流量將增加0.1079萬人;國內(nèi)旅游與公路客運(yùn)量呈明顯的二次函數(shù)關(guān)系。這種基于主導(dǎo)因素的分析,忽略了鐵路客運(yùn)的空間再分配作用。
(4)依據(jù)各省區(qū)入境客流量對航空客運(yùn)量的依賴一偏好差異,本文將全國30個(gè)省區(qū)劃分為5種類型。其中,內(nèi)蒙古、上海、江蘇、浙江、山東、廣西依賴指數(shù)高于1.45,天津、河北、遼寧、黑龍江、安徽、福建、云南依賴指數(shù)處于1~1.45,北京、河南、湖北、湖南、廣東、重慶、四川、陜西依賴指數(shù)為0.7~1,而青海和寧夏對航空需求低。
篇10
關(guān)鍵詞:顏正華;痞滿;關(guān)聯(lián)規(guī)則;聚類算法
DOI:10.3969/j.issn.1005-5304.2013.03.013
中圖分類號:R2-05;R256.32 文獻(xiàn)標(biāo)識碼:A 文章編號:1005-5304(2013)03-0031-03
顏正華教授是國醫(yī)大師,首都國醫(yī)名師,治驗(yàn)甚眾,尤擅長胃脘痛、痞滿、便秘、腹痛等消化系統(tǒng)病證的診療。本研究首先收集、整理顏正華教授治療痞滿處方,進(jìn)而基于“中醫(yī)傳承輔助系統(tǒng)(V1.1)”軟件,采用關(guān)聯(lián)規(guī)則apriori算法、復(fù)雜系統(tǒng)熵聚類等無監(jiān)督數(shù)據(jù)挖掘方法,分析處方中藥物的使用頻次及藥物之間的關(guān)聯(lián)規(guī)則、處方規(guī)律,探討顏正華教授治療痞滿的用藥經(jīng)驗(yàn),希冀為闡明顏正華教授痞滿用藥思想提供參考。
1 資料與方法
1.1 處方來源與篩選
本研究以2005-2010年顏正華教授在北京中醫(yī)藥大學(xué)國醫(yī)堂出診處方為來源進(jìn)行篩選,以鄧鐵濤、董建華主編《實(shí)用中醫(yī)內(nèi)科學(xué)》[1]中痞滿主要癥狀為評判標(biāo)準(zhǔn),共篩選痞滿處方143首。
1.2 分析軟件
“中醫(yī)傳承輔助系統(tǒng)(V1.1)”軟件,中國中醫(yī)科學(xué)院中藥研究所提供。軟件集關(guān)聯(lián)規(guī)則、聚類算法、頻次統(tǒng)計(jì)等算法、功能于一體,可用于名老中醫(yī)處方的儲存、分析、挖掘[2]。
1.3 處方錄入與核對
將上述篩選后的處方錄入“中醫(yī)傳承輔助系統(tǒng)(V1.1)”。錄入完成后,由2人負(fù)責(zé)數(shù)據(jù)的審核,以確保數(shù)據(jù)的準(zhǔn)確性。通過“中醫(yī)傳承輔助系統(tǒng)(V1.1)”軟件中“數(shù)據(jù)分析”模塊中的“處方分析”功能,進(jìn)行用藥規(guī)律挖掘。
1.4 數(shù)據(jù)分析
1.4.1 提取數(shù)據(jù)源 在“中醫(yī)疾病”項(xiàng)中輸入“痞滿”,提取出治療痞滿的全部處方。
1.4.2 頻次統(tǒng)計(jì)分析 將痞滿處方中每味藥的出現(xiàn)頻次從大到小排序,并將“頻次統(tǒng)計(jì)”結(jié)果導(dǎo)出。
1.4.3 組方規(guī)律分析 “支持度個(gè)數(shù)”(表示在所有藥物中同時(shí)出現(xiàn)的次數(shù))分別設(shè)為30,“置信度”設(shè)為0.9,按藥物組合出現(xiàn)頻次從大到小的順序進(jìn)行排序;“規(guī)則分析”分析所得的規(guī)則。
1.4.4 新方分析 首先進(jìn)行聚類分析(核心算法包括改進(jìn)的互信息法、復(fù)雜系統(tǒng)熵聚類),在聚類分析前,先選擇合適的相關(guān)度和懲罰度,然后點(diǎn)擊“提取組合”按鈕,發(fā)現(xiàn)新組方(基本算法是無監(jiān)督的熵層次的聚類),并可以實(shí)現(xiàn)網(wǎng)絡(luò)可視化展示。
2 結(jié)果
2.1 用藥頻次
對顏正華教授143首痞滿處方中的藥物頻次進(jìn)行統(tǒng)計(jì),使用頻次>30的有20味藥(見表1)。使用頻次前3位分別是陳皮、香附、赤芍。
2.2 基于關(guān)聯(lián)規(guī)則分析的組方規(guī)律分析
按照藥物組合出現(xiàn)頻次由高到低排序,前3位分別是“陳皮、香附”,“佛手、陳皮”,“赤芍、陳皮”。見表2。分析所得藥對的用藥規(guī)則見表3。支持度為30、置信度為0.9條件下的藥物關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)展示見圖1。
2.3 基于熵聚類的處方組方規(guī)律分析
2.3.1 基于改進(jìn)的互信息法的藥物間關(guān)聯(lián)度分析 依據(jù)處方數(shù)量,結(jié)合經(jīng)驗(yàn)判斷和不同參數(shù)提取數(shù)據(jù)的預(yù)讀,設(shè)置相關(guān)度為8,懲罰度為4,進(jìn)行聚類分析,得到處方中兩兩藥物間的關(guān)聯(lián)度。關(guān)聯(lián)系數(shù)0.03以上的藥對見表4。
2.3.2 基于復(fù)雜系統(tǒng)熵聚類的藥物核心組合分析 以藥物間關(guān)聯(lián)度分析結(jié)果為基礎(chǔ),按照相關(guān)度與懲罰度約束,基于復(fù)雜系統(tǒng)熵聚類,演化出3~4味藥核心組合,結(jié)果見表5。在以上核心組合提取的基礎(chǔ)上,運(yùn)用無監(jiān)督熵層次聚類算法得到治療痞滿新處方,見表6。
3 討論
本研究應(yīng)用“中醫(yī)傳承輔助系統(tǒng)(V1.1)”軟件,運(yùn)用關(guān)聯(lián)規(guī)則和聚類算法分析顏正華教授治療痞滿的用藥經(jīng)驗(yàn)。經(jīng)關(guān)聯(lián)算法分析,顏教授治療痞滿常用的藥物包括:陳皮、香附、赤芍、砂仁、佛手、白芍、枳殼、茯苓、紫蘇梗、煅瓦楞子、夜交藤、丹參、青皮、炒酸棗仁、旋覆花、炒枳殼、當(dāng)歸、炒神曲、烏藥、柴胡等。出現(xiàn)頻次較高的藥對有:陳皮、香附,佛手、陳皮,赤芍、陳皮等。基于改進(jìn)的互信息法的關(guān)聯(lián)度較大的藥物組合有:麥冬-生谷芽,煅瓦楞子-焦三仙,赤芍-炙甘草,煅瓦楞子-懷牛膝,赤芍-香附,麥冬-焦三仙等。基于復(fù)雜系統(tǒng)熵聚類的治療痞滿的核心組合主要有:茯苓-柏子仁-葛根,白芍-炒白芍-赤芍,白芍-烏藥-赤芍,白芍-赤芍-清半夏,青皮-旋覆花-烏藥等。基于熵層次聚類的治療痞滿新處方有:白芍,炒白芍,赤芍,清半夏;黨參,大棗,炒白術(shù),旋覆花,煅瓦楞子,紫蘇梗;枳殼,炒薏苡仁,柴胡,炒谷芽;枳殼,柴胡,郁金,炒枳殼等。
以上研究結(jié)果較好地驗(yàn)證了顏正華教授診療胃脘痛的治療經(jīng)驗(yàn)。顏教授認(rèn)為,痞滿病位在胃脘,與肝脾關(guān)系密切。病機(jī)有虛實(shí)之異,且多虛實(shí)并見。基本病機(jī)為脾胃功能失調(diào),升降失司,胃氣壅塞。辨證以辨寒熱虛實(shí)為要點(diǎn),并應(yīng)與胃痛的辨證要點(diǎn)互參。治療原則是調(diào)理脾胃、理氣消痞。
陳皮是出現(xiàn)頻率最高的藥物,其味辛、苦,性溫,歸脾、肺經(jīng),功能理氣健脾、燥濕化痰,善治中焦寒濕脾胃氣滯,脘腹痞滿,還可用于食積氣滯、脘腹脹痛等。香附是出現(xiàn)頻率第二的藥物,其味辛、微苦、微甘,性平,歸肝、脾、三焦經(jīng),功能疏肝解郁、理氣調(diào)中。善散肝氣之郁結(jié),可治肝氣郁結(jié)之胸膈痞滿。赤芍與白芍均為處方常用藥,且常配伍同用。赤芍味苦,性微寒,歸肝經(jīng),功能清熱涼血;散瘀止痛;白芍味苦、酸,微寒,歸肝、脾經(jīng),功能養(yǎng)血斂陰、柔肝止痛。二者配伍同用,共奏活血散瘀止痛之功。砂仁為芳香化濕藥,氣味辛,性溫,歸脾、胃、腎經(jīng),化濕醒脾、行氣溫中之效均佳,故凡濕阻或氣滯所致之脘腹脹滿等脾胃不和諸癥常用。佛手味辛、苦,性溫,歸肝、脾、胃、肺經(jīng),功能疏肝解郁、理氣和中、燥濕化痰,可用于脾胃氣滯兼痰濕之痞滿。枳殼味苦、辛、酸,性溫,歸脾、胃、大腸經(jīng),功似枳實(shí)但作用緩和,長于行氣開胸、寬中除脹,有祛邪而不傷正之特點(diǎn)。顏老用藥平和輕靈,故方中多用枳殼,而少用枳實(shí)。茯苓味甘、淡,性平,歸心、脾、腎經(jīng),功能利水滲濕、健脾寧心。取其消補(bǔ)兼具之特點(diǎn),痞滿有脾虛之象者常用之。紫蘇梗味辛、甘,性微溫,歸肺、脾、胃經(jīng),功能寬胸利膈,用于胸腹氣滯之痞滿。煅瓦楞子為顏老治療肝胃不和、痞滿反酸之常用藥。其味咸,性平,歸肺、胃、肝經(jīng),功能消痰軟堅(jiān)、化瘀散結(jié)、制酸止痛,煅后制酸止痛效佳,常用于肝胃不和之痞滿[3-4]。
本研究基于中醫(yī)傳承輔助系統(tǒng)平臺開展顏正華教授用藥規(guī)律數(shù)據(jù)挖掘研究,獲得了既往傳統(tǒng)醫(yī)案整理和統(tǒng)計(jì)學(xué)研究未獲得的新知識、新信息,為顏正華教授痞滿治驗(yàn)的深入挖掘和傳承提供了參考。
參考文獻(xiàn):
[1] 鄧鐵濤,董建華.實(shí)用中醫(yī)內(nèi)科學(xué)[M].上海:上海科學(xué)技術(shù)出版社,1984.
[2] 盧笑暉,單琦瑋.基于中醫(yī)傳承輔助系統(tǒng)分析的盧尚嶺教授治療頭風(fēng)病用藥經(jīng)驗(yàn)[J].中國實(shí)驗(yàn)方劑學(xué)雜志,2012,18(9):5-8.
[3] 吳嘉瑞,張冰.國醫(yī)大師顏正華臨床經(jīng)驗(yàn)實(shí)錄[M].北京:中國醫(yī)藥科技出版社,2011.149.
熱門標(biāo)簽
雷雨 雷雨安全教育 初中生物實(shí)驗(yàn) 音樂理論論文 醫(yī)務(wù)申報(bào)材料 安全環(huán)保論文