支持向量機在新經濟中的可靠性

時間:2022-08-23 09:38:05

導語:支持向量機在新經濟中的可靠性一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

支持向量機在新經濟中的可靠性

一、引言

2008年,中國政府為應對由美國次貸危機引起的全球性金融危機,通過投資四萬億元拉動經濟增長,使得中國的經濟增長模式由出口型向內需型轉變,雖然在一定程度上有效地緩解了金融危機帶來的影響,但其不可持續性已成定論。“十二五”期間尋找新的經濟發展契機、培育新經濟增長點已成為各級政府統籌經濟工作的重點。如何能夠找到新的增長點,將選擇過程變得有根有據,為政策制定提供依據,是本文研究的出發點。經濟增長點理論來源于經濟不平衡增長理論,法國經濟學家弗朗索瓦•佩魯(F.Perroux)在《經濟空間:理論的應用》和《略論發展極的概念》等著述中最早提出了“發展極”(PolesofDevelopment)理論,他認為某些主導產業或有創新能力的企業在一些區域的聚集和優先發展形成經濟活動中心,這些中心具有輻射作用,可以帶動一個地區的經濟發展[1]。在西方,新經濟增長點主要指的是地理上的經濟活動中心,在我國,新經濟增長點主要指產業上的帶動作用[2]。由此可見,新經濟增長點是一個經濟屬性與空間屬性并重的概念,是經濟點與空間點的結合[3]。本文認為,新經濟增長點是一切能引起經濟增長的潛在因素,不僅具有經濟屬性和空間屬性,同時也具有時間上的潛在性,即不是已有的、成熟的增長點,而是在現階段尚不明顯或已初現,但在不久將來,因其巨大的成長性和帶動作用將成為一個時期發展的主流。新經濟增長點的選擇模型主要有三種:選擇圖譜法[4],線性模型法[3],因子分析法[5]。現有方法存在兩點不足,第一,沒有突出新經濟增長點的潛在性,區分出“已有的”增長點與“新的”增長點;第二,沒有指明新經濟增長點具體的增長環節。支持向量機(SupportVectorMachine,SVM)方法是建立在統計學習理論和Vapnik-Cher-vonenkis(VC)維概念的基礎之上[6]225-260。雖然統計學習理論論證堅實,理論完善,但是它對所研究對象的樣本數目要求較高,往往要有趨于無窮大的漸近行為,而實際問題中,研究對象的樣本數目有限,通常很難滿足以上假設前提。支持向量機的出現,為解決有限樣本學習問題提供了有力支持。鄭治偉、孟衛東使用支持向量機對重慶市主導產業進行了預測[7],研究結果同“十一五”期間重慶市產業現狀和未來產業規劃基本吻合,證實了支持向量機的科學性、合理性和前瞻性。前人的研究成果啟發了筆者的研究思路。VM是一種典型的兩類問題分類器,可以根據已學會的知識和處理問題的經驗對復雜問題做出合理的判斷決策,給出較滿意的解答[8]。對于新經濟增長點的選擇問題,可以使用過去的“新經濟增長點”對模型進行訓練,識別出未來的“新經濟增長點”的時間屬性。同時,針對新經濟增長點選擇更為具體、微觀的特點,在選擇出新經濟增長點后,將行業與本地區的自然資源和行業發展動態相結合,尋找具體的增長環節,完成新經濟增長點的微觀化,加深對增長環節具體化的理解和研究。

二、計量模型及測量指標

(一)支持向量機簡介支持向量機是由V.Vapnik和A.Lerner提出的一種新型的基于統計學習理論的機器學習算法。自從20世紀90年代提出相關概念后,SVM已在手寫體識別、圖像分類、時間序列預測等領域取得了廣泛的應用和豐碩的成果。隨著對支持向量機的不斷深入研究,它已經成為機器學習和數據挖掘最重要的工具之一。SVM模型主要應用于樣本點的分類問題。在線性可分的情況下,如圖1所示,對于分別屬于H1和H2的兩類樣本點,可以輕易地找出一條直線H,將兩類樣本很好地區分開來。在無法用直線來分類樣本點的情況下,SVM通過尋找唯一的分類間隔最大超平面來解決分類問題。在圖1中,超平面H1由兩個空心圓張成,超平面H2由兩個實心圓張成。這四個樣本稱為支持向量。所謂分類間隔最大超平面就是指平行H1和H2的超平面H,它不僅能將H1和H2正確分類,而且使得兩者之間的距離最大。無論是直線還是超平面,在線性可分的情形下,總可以在原空間上利用SVM解決分類問題。但是對于線性不可分的情況,在原空間上已不能直接應用上述分類手段,必須利用非線性特征函數Φ∶Rd→W,將原空間上線性不可分的情形轉換為特征空間上線性可分的情形,才能夠繼續利用SVM進行分類。由于無法直接在高維的特征空間上利用特征函數計算分類超平面,為此,引入核函數K(x,y)的概念。核函數,就是原空間上的非線性映射,它的函數表現為特征函數的點積形式,即K(x,y)=Φ(x)•Φ(y)。因此,特征空間上的分類問題可以轉化為支持向量在核函數上的權重和問題。實際應用中,由于徑向基函數實現非線性映射時使用參數較少,往往成為選擇核函數時的首選。本文即選用徑向基函數作為核函數進行SVM分類。從以上介紹可知,相對其他統計方法,SVM具有以下優勢:1.在有限樣本的前提下,可以求出問題的最優解,降低了收集樣本信息的成本;2.SVM模型得到的結論是全局最優的,克服了其他方法中無法避免的局部極值問題;3.通過引入核函數,使得可以僅僅通過兩個原始低維空間中的向量,獲得高維特征空間中的向量內積,解決了在高維空間中難以求解最優超平面的難題。

(二)建立分類模型已知新經濟增長點訓練樣本(x1,y1),(x2,y2),…,(xl,yl),x∈R,y=-1,非新經濟增長點1,{新經濟增長點,l為樣本容量,則建立SVM判別新經濟增長點的模型步驟為:1.訓練樣本數據預處理(1)對訓練樣本歸一化,消除量綱的影響;(2)yqi采用如下策略進行調整:若行業屬于新經濟增長點,則yqi=1;反之,yqi=-1。2.建立SVM模型分類器取徑向基函數為核函數,利用訓練樣本(xi,yi)求解如式(5)的二次優化問題,從而獲得(αi,b)及其對應的支持向量:maxQ(α)=∑li=1ai-12∑lj=1αiαjyqiyqjK(xi•xj)+bs.t.∑li=1yqiαi=0,αi≥0,q=1,2,…,烅烄烆m(5)利用獲得的αi,b和支持向量,得到行業的分類模型:f(x)=∑pi=1αiyqiK(xi,x)+b,q=1,2,…,m(6)重復上述分類過程l次,得到l個行業分類模型。3.判別行業是否屬于新經濟增長點利用獲得的判別模型,即可根據行業輸入模式,判別行業是否屬于新經濟增長點。若第q個行業的輸出等于1,則該行業屬于新經濟增長點;若輸出為-1,則該行業不屬于新經濟增長點。

(三)指標體系的設立新經濟增長點是指那些處于潛在狀態,尚不明顯或者已初現,具有良好的發展勢頭和前景,能在不久的將來發揮作用的經濟增長點,結合經濟增長點的特征,經濟增長點的選擇應依據以下三點原則:1.增長潛力與成長性。新經濟增長點要有發展潛力和成長性,對經濟增長貢獻要大,能夠成為拉動經濟增長的主導力量。同時,具有技術進步帶動作用,技術進步才能使得增長點由外延式增長轉變為集約式、內涵式增長。2.經濟效益。所選行業應具有一定的經濟規模和經濟效益。3.帶動性。新經濟增長點的推動作用和帶動作用要大,能夠促進相關產業發展。結合以上原則,根據理論指導及實際數據來源,本文選擇如下指標:1.反映增長潛力與成長性的指標經濟增長理論認為,決定經濟增長的主要因素有技術進步、人力資源和資本積累。根據前言分析,中國現階段通過投資實現增長已經不可持續,但可以通過鼓勵技術進步得到,因此在增長潛力原則下選擇技術進步貢獻率指標。技術進步貢獻率x1=1-(α×K)/Y-(β×L)/Y其中K為資本的年均增長速度,L為勞動的平均增長速度,α為資本產出彈性,β為勞動產出彈性,通常假定生產在一定時期內α、β為一常數,并且α+β=1。新經濟增長點應該適應市場需求,具有巨大的市場潛力,因此選擇需求收入彈性系數x2作為反映市場需求標準的指標。該系數是指在價格不變的前提下,某行業的需求增加率同人均國民收入增加率之比,用以反映某行業的社會需求量的變化對國民收入變化的敏感程度。需求收入彈性系數x2=ΔQiQi/ΔNiNi(7)其中x2表示某行業i的需求收入彈性系數;ΔQi/Qi為該產業的需求增加率;ΔNi/Ni為同期人均國民收入增加率,i=1,2,…,n。2.反映經濟效益的指標增加值貢獻率x3=Nit-Ni0GDPt-GDP0×100%,其中Nit代表i行業期末增加值,Ni0代表i行業期初增加值,GDP0代表區域期初GDP,GDPt代表區域期末GDP。產值利稅率x4=SiYi×100%,其中Si代表利稅額,Yi代表工業總產值。成本費用利潤率x5=riwi×100%,其中ri代表利潤總額,wi代表成本費用總額。資產增加值率x6=NiCi×100%,其中Ni代表i行業增加值,Ci代表平均資產總額。全員勞動生產率x7=NiLi×100%,其中Ni代表i行業增加值,Li代表i行業員工人數。3.反映帶動性的指標新經濟增長點對一個時期一個地區經濟增長的帶動性可以通過影響力系數和感應度系數得以評價。影響力系數反映了某產品部門最終需求增加一個單位時對國民經濟其他部門的影響程度。影響力系數x8=∑ni=1b珔ij1n∑nj=1∑ni=1b珔ij,其中b珔ij代表完全需求系數。感應度系數反映了國民經濟的其他部門的最終需求均增加一個單位,各部門應該增加的總產出的數量。感應度系數x9=∑nj=1b珔ij1n∑ni=1∑nj=1b珔ij,其中b珔ij代表完全需求系數。

三、實證分析

(一)訓練集與實驗集樣本數據來源訓練集中的訓練樣本分為兩類,一類為“新經濟增長點”,另一類為“非新經濟增長點”。“新經濟增長點”一類選擇的是我國信息產業(2010)、汽車產業(2003),這兩個行業在相關文獻中有所提及并在經濟發展中得到檢驗[9-10],因此選擇信息產業2005—2009年的數據及汽車產業1999—2003年數據;“非新經濟增長點”一類選擇的是我國水的生產和供應業(2010),為與“新經濟增長點”一類保持同比性,數據同樣為5年期限,從2006—2010年。指標數據來源于《中國信息產業年鑒》(2006—2010),《中國汽車工業年鑒》(2000—2004),《中國統計年鑒》(2004—2011),《中國投入產出表》(2002,2007),部分指標數據經計算得到。實驗集中的實驗樣本選擇《陜西統計年鑒》(2011)工業分類下的38個部門,數據來源于《陜西統計年鑒》(2005—2011),《中國投入產出表》(2007),《陜西省投入產出表》(2007)。

(二)計算步驟與結果1.數據無量綱化處理為了剔除量綱對計算結果的影響,首先對數據進行初始化處理。本文選擇的無量綱化方法為標準化處理法,xi*j=xij-x珚jsj,式中x珚j、sj(j=1,2,…,m)分別為第j項指標觀測值的平均值和標準差,xij*為處理后的標準化指標。2.指標計算需求收入彈性系數的計算。在利用式(7)對需求收入彈性系數進行實際計算時,對此公式做適當的轉化,用某行業的產品收入彈性系數代表該行業的收入彈性系數;公式所指的需求量是指未來的需求量,但因無法提前預知,故用當期的需求量替代;基于對統計數據可得性的考慮,用當期的銷售量表示需求量。技術進步貢獻率的計算。技術進步貢獻率的計算根據C-D生產函數,ΔA/A=ΔY/Y-αΔK/K-βΔL/L。式中,ΔA/A為全要素生產率;ΔY/Y為生產增長率,ΔL/L為勞動增長率;ΔK/K為資金增長率;α表示勞動對國民收入所做貢獻的百分比,β表示資金對國民收入所作貢獻的百分比。本文對陜西省第二產業各行業分別取2005—2011年產值、從業人員數、固定資產數,根據C—D生產函數,其中使用永續存盤法測算固定資本存量,使用SPSS11.0利用多元非線性回歸功能計算第二產業各行業的技術進步貢獻率。3.模型擬合首先,按如下規則設置訓練集樣本:(1)設“新經濟增長點”信息產業和汽車產業均為“1”;(2)設“非新經濟增長點”水的生產和供應業為“-1”。模型采用基于徑向基函數的SVM分類器,令σ=0.5。利用式(5),求出相應的(αi,b)及其對應的支持向量,并結合式(6)給出的行業分類模型,計算實驗樣本中各行業的分類結果。表1給出了以上計算過程的擬合結果。從表1中可以看出,模型將行業分為兩類:新經濟增長點(13個行業)和非新經濟增長點(24個行業)。通過計算各行業實驗數據到最優平面的距離(d),可以給出各行業在各自分類中的排名次序規則:d越小,越與訓練集中的分類標準相近,該行業越有可能成為(非)新經濟增長點。

(三)結果分析經計算可知,被劃分為新經濟增長點一類的行業為通信設備、計算機及其他電子設備制造業,非金屬礦物制品業,石油和天然氣開采業,文教體育用品制造業,醫藥制造業,印刷業和記錄媒介的復制,有色金屬礦采選業,通用設備制造業,電氣機械及器材制造業,專用設備制造業,紡織業,化學纖維制造業,非金屬礦采選業。根據行業到最優平面的距離(d)將排在前十位的行業作為重點發展行業。根據行業增長特點,具體的增長環節分析如下:通信設備、計算機及其他電子設備制造業可發展一些污染小、附加值高、對整個西部輻射作用較大的產業,如高端軟件和集成電路產業、物聯網產業;通用設備制造業著重發展高新技術產業;有色金屬礦采選業注重其中新能源產業的發展;基于陜西省大力發展文化產業的實際情況,印刷業和記錄媒介的復制業的發展可側重于與文化產業相關部分進行結合;醫藥制造業著重培育在生物產業的生物醫藥領域中的應用;借陜西省建立國家民用航天產業基地的契機,專用設備制造業也可與之相結合發展;電氣機械及器材制造業可著重發展集成電路、激光、半導體照明等產業。《陜西省國民經濟和社會發展“十二五”規劃綱要》中指出,“十二五”期間陜西省要重點發展裝備制造業、文化產業、戰略性新興產業,其中戰略性新興產業包括高新技術產業、能源產業,與本文的分析結果相比,通過支持向量機的方法選擇的新經濟增長點與陜西省“十二五”規劃確定的重點發展產業基本吻合。

四、結論

本文使用SVM選擇新經濟增長點,其優勢在于:通過經時間證實的增長點挖掘潛在經濟增長點,使得模型同時具備經濟屬性、空間屬性和時間上的潛在性。SVM在解決小樣本、非線性及高維模式識別方面具有優勢,本文使用某個地區在某個時期成為新經濟增長點的行業作為新經濟增長點判斷的“標準行業”,利用SVM在識別時需要訓練的特點,使用這些標準行業進行訓練,通過訓練使模型對新經濟增長點的特征有了“記憶”,這時,再使用需要被評價的某地區當下時間段的多個行業輸入模型進行運算,當某個行業的特征同經過時間驗證的過去的新經濟增長點的特征一致或接近時,模型就會識別出來新經濟增長點。同時,在選擇出新經濟增長點后,將行業與本地區的自然資源和行業發展動態相結合,尋找具體的增長環節,完成新經濟增長點的微觀化,加深對增長環節具體化的理解和研究。