卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)化范文
時(shí)間:2024-04-08 18:05:46
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)化,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:深度學(xué)習(xí);機(jī)器學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò)
1概述
深度學(xué)習(xí)(Deep Learning)是人工智能、圖像建模、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、最優(yōu)化理論和信號(hào)處理等領(lǐng)域的交叉學(xué)科,主要構(gòu)建和模擬人腦進(jìn)行分析學(xué)習(xí),它屬于機(jī)器學(xué)習(xí)的新興領(lǐng)域。
2大數(shù)據(jù)與深度學(xué)習(xí)
目前,光學(xué)檢測(cè)、互聯(lián)網(wǎng)、用戶(hù)數(shù)據(jù)、互聯(lián)網(wǎng)、金融公司等許多領(lǐng)域都出現(xiàn)了海量數(shù)據(jù),采用BP算法對(duì)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)出現(xiàn)了梯度越來(lái)越稀疏、收斂到局部最小值只能用有標(biāo)簽的數(shù)據(jù)來(lái)訓(xùn)練等缺點(diǎn)。Hinton于2006年提出了深度學(xué)習(xí)的概念,Lecun等人提出了卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)利用空間關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。
CPU和GPU計(jì)算能力大幅提升,為深度學(xué)習(xí)提供了硬件平臺(tái)和技術(shù)手段,在海量大數(shù)據(jù)處理技術(shù)上解決了早期神經(jīng)網(wǎng)絡(luò)訓(xùn)練不足出現(xiàn)的過(guò)擬合、泛化能力差等問(wèn)題。
大數(shù)據(jù)和深度學(xué)習(xí)必將互相支撐,推動(dòng)科技發(fā)展。
3深度學(xué)習(xí)模型
深度學(xué)習(xí)模型實(shí)際上是一個(gè)包含多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),目前主要有卷積神經(jīng)網(wǎng)絡(luò),深深度置信神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)。
1)卷積神經(jīng)網(wǎng)絡(luò)
在機(jī)器學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)屬于前饋神經(jīng)網(wǎng)絡(luò)的一種,神經(jīng)元不再是全連接的模式,而是應(yīng)用了局部感受區(qū)域的策略。然而傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)使用神經(jīng)元間全連接的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)處理圖像任務(wù),因此,出現(xiàn)了很多缺陷,導(dǎo)致模型⑹急劇增加,及其容易過(guò)擬合。
在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中的神經(jīng)元只與前一層的部分神經(jīng)元連接,利用圖像數(shù)據(jù)的空間結(jié)構(gòu),鄰近像素間具有更強(qiáng)的相關(guān)性,單個(gè)神經(jīng)元僅對(duì)局部信息進(jìn)行響應(yīng),相鄰神經(jīng)元感受區(qū)域存在重疊,因此,綜合所有神經(jīng)元可以得到全局信息的感知。
另外,一個(gè)卷積層中的所有神經(jīng)元均由同一個(gè)卷積核對(duì)不同區(qū)域數(shù)據(jù)響應(yīng)而得到,即共享同一個(gè)卷積核,使得卷積層訓(xùn)練參數(shù)的數(shù)量急劇減少,提高了網(wǎng)絡(luò)的泛化能力。
一般在卷積層后面會(huì)進(jìn)行降采樣操作,對(duì)卷積層提取的特征進(jìn)行聚合統(tǒng)計(jì)。降采樣區(qū)域一般不存在重疊現(xiàn)象。降采樣簡(jiǎn)化了卷積層的輸出信息,進(jìn)一步減少了訓(xùn)練參數(shù)的數(shù)量,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。
卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了局部特征的自動(dòng)提取,使得特征提取與模式分類(lèi)同步進(jìn)行,適用于處理高分辨率的圖像數(shù)據(jù)。目前,卷積神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)、自然語(yǔ)言處理等領(lǐng)域得到廣泛應(yīng)用。
2)深度置信網(wǎng)絡(luò)
深度置信網(wǎng)絡(luò)是一種生成模型,網(wǎng)絡(luò)中有若干隱藏層,同一隱藏層內(nèi)的神經(jīng)元沒(méi)有連接,隱藏層間的神經(jīng)元全連接。神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)“反向運(yùn)行”得到輸入數(shù)據(jù)。
深度置信網(wǎng)絡(luò)可以用做生成模型,通過(guò)前期的逐層無(wú)監(jiān)督學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以較好的對(duì)輸入數(shù)據(jù)進(jìn)行描述,然后把訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)看作深度神經(jīng)網(wǎng)絡(luò),最后得到分類(lèi)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)。
深度置信網(wǎng)絡(luò)可以用于圖像識(shí)別、圖像生成等領(lǐng)域,深度置信網(wǎng)絡(luò)可以進(jìn)行無(wú)監(jiān)督或半監(jiān)督的學(xué)習(xí),利用無(wú)標(biāo)記數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,提高神經(jīng)網(wǎng)絡(luò)性能。但近幾年由于卷積神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展,深度置信網(wǎng)絡(luò)已經(jīng)很少被提及。
3)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種專(zhuān)門(mén)用于處理時(shí)序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它與典型的前饋型神經(jīng)網(wǎng)絡(luò)最大區(qū)別在于網(wǎng)絡(luò)中存在環(huán)形結(jié)構(gòu),隱藏層內(nèi)部的神經(jīng)元是互相連接的,可以存儲(chǔ)網(wǎng)絡(luò)的內(nèi)部狀態(tài),其中包含序列輸入的歷史信息,實(shí)現(xiàn)了對(duì)時(shí)序動(dòng)態(tài)行為的描述。這里的時(shí)序并非僅僅指代時(shí)間概念上的順序,也可以理解為序列化數(shù)據(jù)間的相對(duì)位置。如語(yǔ)音中的發(fā)音順序,某個(gè)英語(yǔ)單詞的拼寫(xiě)順序等。序列化輸入的任務(wù)都可以用循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)處理。如語(yǔ)音、視頻、文本等。對(duì)于序列化數(shù)據(jù),每次處理時(shí)輸入為序列中的一個(gè)元素,比如單個(gè)字符、單詞、音節(jié),期望輸出為該輸入在序列數(shù)據(jù)中的后續(xù)元素。循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理任意長(zhǎng)度的序列化數(shù)據(jù)。
循環(huán)神經(jīng)網(wǎng)絡(luò)可以用于機(jī)器翻譯、連寫(xiě)字識(shí)別、語(yǔ)音識(shí)別等。循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)結(jié)合,將卷積神經(jīng)網(wǎng)絡(luò)用于檢測(cè)并識(shí)別圖像中的物體,循環(huán)神經(jīng)網(wǎng)絡(luò)用于識(shí)別出物體的名稱(chēng)為輸入,生成合理的語(yǔ)句,從而實(shí)現(xiàn)對(duì)圖像內(nèi)容的描述。
4深度學(xué)習(xí)應(yīng)用
1)語(yǔ)音識(shí)別
語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。其應(yīng)用領(lǐng)域主要有語(yǔ)音輸入系統(tǒng)、語(yǔ)音控制系統(tǒng)和智能對(duì)話查詢(xún)系統(tǒng),語(yǔ)音識(shí)別極大地推動(dòng)了人工智能的快速發(fā)展。1952年Davis等人研究了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng)。大規(guī)模的語(yǔ)音識(shí)別研究是在20世紀(jì)70年代以后,在小詞匯量、孤立詞的識(shí)別方面取得了實(shí)質(zhì)性的進(jìn)展。2012年,微軟研究院使用深度神經(jīng)網(wǎng)絡(luò)應(yīng)用在語(yǔ)音識(shí)別上將識(shí)別錯(cuò)誤率降低了20%,取得了突破性的進(jìn)展。2015年11月17日,浪潮集團(tuán)聯(lián)合全球可編程芯片巨頭Altera,以及中國(guó)最大的智能語(yǔ)音技術(shù)提供商科大訊飛,共同了一套DNN語(yǔ)音識(shí)別方案。
2)圖像分析
圖像是深度學(xué)習(xí)最早嘗試的應(yīng)用領(lǐng)域。1989年,LeCun和他的同事們就發(fā)表了卷積神經(jīng)網(wǎng)絡(luò)的工作。2012年10月,Hinton和他的兩個(gè)學(xué)生用更深的CNN在ImageNet挑戰(zhàn)上獲得了第一名,使圖像識(shí)別向前躍進(jìn)了一大步。
自2012年以來(lái),深度學(xué)習(xí)應(yīng)用于圖像識(shí)別使得準(zhǔn)確率大大上升,避免了消耗人工特征抽取的時(shí)間,極大地提升了效率,目前逐漸成為主流的圖像識(shí)別與檢測(cè)方法。
篇2
關(guān)鍵詞:智能消防;火焰識(shí)別;卷積神經(jīng)網(wǎng)絡(luò)
一、智能裝備簡(jiǎn)介
若想提高消防救援隊(duì)伍的滅火救援效能,提高裝備的智能化水平是必不可少的一步。消防裝備的配備情況影響著戰(zhàn)術(shù)和戰(zhàn)術(shù)效果,甚至是直接影響救援成功率的重要因素。因此,提升裝備的智能化水平、改善裝備結(jié)構(gòu)從而提升消防救援隊(duì)伍的作戰(zhàn)能力是關(guān)系廣大人民群眾生命以及財(cái)產(chǎn)安全的重要手段。消防裝備智能化的研究工作任重而道遠(yuǎn)。本文著眼于圖像法火焰識(shí)別技術(shù),通過(guò)研究新技術(shù),探討將其應(yīng)用于智能消防裝備之中的可行性。
二、卷積神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)介
(一)網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)功能繁多,其中多層檢測(cè)學(xué)習(xí)神經(jīng)網(wǎng)是一種多層次的神經(jīng)監(jiān)測(cè)網(wǎng)絡(luò)。其中心模塊為卷積層,主要由隱藏層與最大池采樣層組成,主要功能是特征提取。其中,連接層與傳統(tǒng)多層感應(yīng)器的隱藏層、邏輯歸類(lèi)器相對(duì)應(yīng)。卷積神經(jīng)網(wǎng)絡(luò)的輸入特征來(lái)源使卷積濾波器,而該神經(jīng)網(wǎng)絡(luò)的每一層都有多個(gè)理論上的神經(jīng)元以及特征圖。在給一個(gè)來(lái)自卷積和子采樣層的輸入統(tǒng)計(jì)濾波后,系統(tǒng)就提取了圖像局部的特征,就可以確定它與其他特征之間的相對(duì)方位,上一層的輸出值直接輸入至下一層。通常情況下,我們可以通過(guò)特征層來(lái)得到卷積層(特征層是指:輸入到隱藏層之間的映射)。(二)局部感受野與權(quán)值共享。局部感受野:由于圖像空間的連接是局部性的,因此每個(gè)神經(jīng)元都不需要感測(cè)全部圖像,而只需感覺(jué)到局部的特征。然后,通過(guò)對(duì)較高級(jí)別感測(cè)量的局部神經(jīng)元進(jìn)行集成,可以得到整體的信息,并且減少了連接數(shù)量。權(quán)重分享:不同神經(jīng)元之間的參數(shù)分享可通過(guò)降低求解參數(shù),并通過(guò)放大器對(duì)圖像的放大積獲得多種特征圖。實(shí)際上,權(quán)重共享圖像上的第一隱藏層的所有神經(jīng)元由于是在同一卷積上確認(rèn)的,所以均能在圖像的任意一個(gè)位置檢測(cè)到毫無(wú)差別的特性。他的最主要的功能是能夠通過(guò)適應(yīng)小范圍的圖像和平移從而達(dá)到檢測(cè)不同位置的目的,也就是良好的不變性平移。(三)卷積層、下采樣層。卷積層:通過(guò)去卷積來(lái)提取圖像特征,用來(lái)強(qiáng)化初始信號(hào)原屬性,從而減少噪音。下采樣層:由于研究人員發(fā)現(xiàn)圖像下采樣過(guò)程中,它能在保留信息的同時(shí)降低數(shù)據(jù)處理量,因此在發(fā)現(xiàn)某一特定的特征后,由于這個(gè)位置并不重要,所以樣本會(huì)擾亂特定的位置。我們只需要知道這個(gè)特征與其他特點(diǎn)之間的空間相對(duì)方位,就可以處理類(lèi)似的物體由變形和變型而產(chǎn)生的變化。(四)卷積神經(jīng)網(wǎng)絡(luò)的不足。如果網(wǎng)絡(luò)層需要加深,每一個(gè)網(wǎng)絡(luò)層增加的神經(jīng)元數(shù)量會(huì)大幅增加,從而使模型復(fù)雜化,增大了調(diào)整參數(shù)的難度,也增大了過(guò)度擬合的風(fēng)險(xiǎn)。此外,在反向傳播過(guò)程中,連續(xù)迭代會(huì)使梯度不斷減小,而梯度一旦歸零,權(quán)值便無(wú)法更新,導(dǎo)致神經(jīng)元失效。(五)展望與總結(jié)隨著研究人員對(duì)卷積神經(jīng)網(wǎng)絡(luò)相關(guān)的研究不斷推進(jìn),其性能日益強(qiáng)大,復(fù)雜度也日益提升。目前,卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)研究已經(jīng)取得了顯著成效。然而,一些人工擾動(dòng)(如向原圖片中鍵入噪點(diǎn))仍然會(huì)導(dǎo)致圖像的錯(cuò)誤分類(lèi)。如何解決這一問(wèn)題,是今后研究的重點(diǎn)。此外,卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)升級(jí)仍有很大空間,通過(guò)提升網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的合理性,可以完善量化分析能力。
三、圖像分割
圖像中包含很多數(shù)據(jù),需要分割圖像。然而,精確區(qū)分干擾是對(duì)整個(gè)系統(tǒng)亮度的精確分類(lèi)和準(zhǔn)確劃類(lèi)的前提。圖像的分析技術(shù)是計(jì)算機(jī)視覺(jué)技術(shù)的基礎(chǔ)。通過(guò)圖像分割、提取特征參量等方法可以將原本的圖像抽象化,從而便于分析和處理。多年以來(lái),圖像的分割技術(shù)研究一直是重中之重,研究人員給出了多種分割方法。一般而言,圖像分割是將圖像劃分為不同的區(qū)域,給不同的區(qū)域賦予不同的權(quán)重,從而獲取重要對(duì)象的一種技術(shù)。特征可能是灰度、顏色、紋理等,目標(biāo)可能對(duì)應(yīng)一個(gè)區(qū)或多個(gè)地方,這與特殊目的應(yīng)用程序和特殊目的服務(wù)請(qǐng)求程序有關(guān)。一般而言,圖像取值分割分析算法大致來(lái)說(shuō)可以再細(xì)分為圖形圖像取值分割、邊緣圖像分割、區(qū)域分割和重復(fù)圖像分析四大個(gè)門(mén)類(lèi)。
四、火焰色彩虛擬模型的特征
(一)火焰色彩顏色類(lèi)型特征。火焰色彩模型一般來(lái)說(shuō)是基于某種火焰色彩類(lèi)型模式,通過(guò)在圖像閾值控制范圍內(nèi)通過(guò)設(shè)置某種色彩模型圖像閾值來(lái)降噪提取火焰顏色特征圖像。可以用任何提取靜態(tài)火焰的特殊像素或者圖案方式來(lái)精確描述一個(gè)靜態(tài)火焰特征。然而,單純地依靠顏色模型來(lái)進(jìn)行火焰識(shí)別會(huì)導(dǎo)致嚴(yán)重的誤判。火焰的顏色范圍是非常大的,所以它很可能與其他物體顏色相近,導(dǎo)致模型將其混為一談。(二)降噪在。火焰發(fā)展的初期過(guò)程中,是不斷處于移動(dòng)變化的。又一方面,火焰的全部運(yùn)動(dòng)都不會(huì)跳躍,也就是火焰滿足相對(duì)穩(wěn)定性。所謂燃燒火災(zāi)的相對(duì)穩(wěn)定性,是指在火災(zāi)發(fā)生后,燃燒范圍的空間會(huì)成一個(gè)相對(duì)穩(wěn)定的擴(kuò)增趨勢(shì)擴(kuò)增。通過(guò)分析火災(zāi)的相對(duì)穩(wěn)定性,可以消滅許多虛假信號(hào)。(三)靜態(tài)模型。在基于單幀圖像識(shí)別的算法中,由于只使用了幾個(gè)以火焰為基準(zhǔn)的單一形狀特征,因此算法復(fù)雜、誤判率很高。因此,一個(gè)能夠自主優(yōu)化識(shí)別的模型就顯得十分重要,圖像靜態(tài)特征提取的方法如下:由于曲率在人的視覺(jué)系統(tǒng)中往往是觀測(cè)場(chǎng)景的重要參數(shù),因此提取幾何圖像曲率等參數(shù),并以此描繪火焰圖像;根據(jù)測(cè)得的數(shù)據(jù),描繪連續(xù)零曲率以及局部最大曲率、最高曲率正負(fù)值等集合特點(diǎn)。(四)動(dòng)態(tài)模型在動(dòng)態(tài)燃燒過(guò)程中,產(chǎn)生的火焰具有持續(xù)性。此外,根據(jù)火焰自身的特性和各種原因,火焰還會(huì)不斷發(fā)生變化。然而,這種變化并不在單個(gè)幀圖像中反映出來(lái),而是在連續(xù)的多幀圖像中只反映。因此,提取火焰的動(dòng)態(tài)特征就是分析處理連續(xù)多幀圖像。近年來(lái),隨著火災(zāi)科學(xué)的發(fā)展,從火焰的隨機(jī)狀態(tài)中發(fā)現(xiàn)了其規(guī)則性:1.火焰的面積增長(zhǎng)性;2.火焰的形狀相似性;3.火焰的整體移動(dòng)。基于圖像的火焰識(shí)別算法可劃分為動(dòng)態(tài)識(shí)別和靜態(tài)識(shí)別。若將這兩種算法同步進(jìn)行應(yīng)用,則定能增加工作效率。火焰形成的重要特點(diǎn)之一便是火焰形狀。對(duì)于采集到的ccd火焰圖像,首先進(jìn)行兩個(gè)連續(xù)的圖像差分操作,然后通過(guò)分割方法獲得連續(xù)幀的變化區(qū)域,使用掃描窗口得到的像素點(diǎn)數(shù)來(lái)記述連續(xù)幀變化區(qū)域。變化區(qū)域是指:圖像處理中,在獲得閾值之后,通過(guò)對(duì)高光度進(jìn)行科學(xué)計(jì)算、實(shí)驗(yàn)分析,最終得到的區(qū)域。當(dāng)其他高溫物體移動(dòng)到相機(jī)或離開(kāi)視野時(shí),所檢測(cè)到的目標(biāo)區(qū)域會(huì)逐漸擴(kuò)大,并容易引起干擾,從而造成系統(tǒng)錯(cuò)誤的報(bào)告。因此,需要將數(shù)據(jù)和其他圖像的關(guān)鍵性特征進(jìn)行一個(gè)高強(qiáng)度的結(jié)合,再深度進(jìn)行挖掘。火焰的形狀相似性:圖像之間的類(lèi)似性通常依賴(lài)于已知描述特點(diǎn)之間的差異度。該方法能夠在任意復(fù)雜程度上建立相應(yīng)的類(lèi)似性量。我們可以對(duì)兩個(gè)相似的元素進(jìn)行比較,也可以對(duì)兩個(gè)相似的場(chǎng)面進(jìn)行比較,圖像之間的相似性通常意義上是指場(chǎng)景以及結(jié)構(gòu)上的相似性。在一般情況下,圖像的結(jié)構(gòu)相似度往往并不高,因此,我們傾向于選擇更加典型的結(jié)構(gòu)特點(diǎn)進(jìn)行描述,如區(qū)域面積、區(qū)域亮度、線段長(zhǎng)度等參數(shù)。雖然火焰的圖像序列中火焰的邊緣往往是很不穩(wěn)定的,但圖像的總體變化會(huì)被限制在一定范圍內(nèi),而且一般的干擾信號(hào)模式包含了固定點(diǎn)或者光照變化,因此,在火焰識(shí)別的過(guò)程中,可以用初始火焰形狀的變化規(guī)則與其進(jìn)行對(duì)照。盡管火焰的變化通常呈現(xiàn)出不規(guī)則的特性,然而這種不規(guī)則在形態(tài)、空間分布等方面往往具有某種相似之處,因此,我們可以用連續(xù)圖像的結(jié)構(gòu)相似性來(lái)進(jìn)行解析。
五、結(jié)語(yǔ)
各種高新技術(shù)不斷飛躍式發(fā)展,這為我國(guó)消防智能化技術(shù)的開(kāi)發(fā)以及與外國(guó)新型消防設(shè)備之間的碰撞提供了一個(gè)良好的契機(jī),而消防裝備的智能化已成為一個(gè)必然的趨勢(shì)。自改革開(kāi)放至今,我國(guó)所研究的有關(guān)裝備智能化領(lǐng)域內(nèi)取得的成果,已經(jīng)為我們打下了堅(jiān)實(shí)的發(fā)展基礎(chǔ),因此我們更應(yīng)該加快消防智能化的進(jìn)程,綜合現(xiàn)有所具備的技術(shù),取其精華去其糟粕,適而用之。由于研究條件和專(zhuān)業(yè)方向的局限,本文對(duì)智能消防裝備中的火焰識(shí)別技術(shù)仍然存在不足。此次智能消防裝備的研究方向主要是火焰識(shí)別領(lǐng)域,以建立模型的方法進(jìn)行測(cè)算與研究,而對(duì)于理論性知識(shí)方面的探討仍存在很大的不足。之后的研究可以從其他方面進(jìn)行深入的探討,探究其對(duì)系統(tǒng)化建模會(huì)產(chǎn)生哪些方面的影響。
參考文獻(xiàn):
[1]喻麗春,劉金清.基于改進(jìn)MaskR-CNN的火焰圖像識(shí)別算法[J].計(jì)算機(jī)工程與應(yīng)用,2020,964(21):200-204.
[2]肖堃.多層卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法可移植性分析[J].哈爾濱工程大學(xué)學(xué)報(bào),2020,41(03):420-424.
[3]郭昆.基于卷積神經(jīng)網(wǎng)絡(luò)的建筑風(fēng)格圖像分類(lèi)的研究[D].武漢理工大學(xué),2017.
[4]徐曉煜.極化合成孔徑雷達(dá)艦船檢測(cè)方法研究[D].西安電子科技大學(xué),2017.
[5]黃憶旻.基于圖像檢索的導(dǎo)游系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].蘇州大學(xué),2016.
[6]宋戈.火災(zāi)自動(dòng)檢測(cè)技術(shù)在無(wú)人值守變電站中的應(yīng)用[D].沈陽(yáng)理工大學(xué),2010.
[7]葛勇.基于視頻的火災(zāi)檢測(cè)方法研究及實(shí)現(xiàn)[D].湖南大學(xué),2009.
篇3
關(guān)鍵詞:ROS;表面缺陷;圖像采集;神經(jīng)網(wǎng)絡(luò);模型訓(xùn)練
飛機(jī)蒙皮是包圍在飛機(jī)骨架結(jié)構(gòu)外且用粘接劑或鉚釘固定于骨架上,形成飛機(jī)氣動(dòng)力外形的維形構(gòu)件,在飛機(jī)正常工作狀態(tài)下扮演著重要的角色,一旦飛機(jī)蒙皮出現(xiàn)缺陷等問(wèn)題,需要及時(shí)的反饋出來(lái)并且維修。傳統(tǒng)的飛機(jī)表面缺陷檢測(cè)方式大多數(shù)是由人工來(lái)完成,會(huì)存在效率低、成本高等缺點(diǎn),甚至?xí)霈F(xiàn)檢測(cè)失誤的情況。本文就針對(duì)鋁合金表面缺陷檢測(cè)方面,提出一種基于ROS的飛機(jī)表面缺陷檢測(cè)系統(tǒng),采用移動(dòng)機(jī)器人底盤(pán)定位和導(dǎo)航技術(shù),結(jié)合深度學(xué)習(xí)、圖像處理等技術(shù)檢測(cè)出存在缺陷的位置并標(biāo)記出來(lái),通過(guò)機(jī)器代替?zhèn)鹘y(tǒng)人工的方式,旨在提高檢測(cè)效率和檢測(cè)精度,為飛機(jī)表面缺陷檢測(cè)提供一種方式。
1系統(tǒng)的總體設(shè)計(jì)
飛機(jī)表面缺陷檢測(cè)系統(tǒng)主要由檢測(cè)模塊、ROS機(jī)器人模塊、圖像處理模塊三大部分組成,系統(tǒng)的總體結(jié)構(gòu)框圖如圖1所示。系統(tǒng)的具體工作原理為:在某一區(qū)域范圍內(nèi),檢測(cè)模塊以樹(shù)莓派為核心控制器,通過(guò)檢測(cè)模塊中的圖像采集系統(tǒng)對(duì)鋁合金材料表面進(jìn)行圖像采集,將采集到的圖像通過(guò)TCP通信傳輸?shù)綀D像處理模塊上[4]。圖像處理模塊利用深度學(xué)習(xí)中設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)訓(xùn)練,得到檢測(cè)模型,將檢測(cè)模型應(yīng)用到圖像預(yù)處理上。此時(shí),OpenCV對(duì)檢測(cè)模塊得到的圖像進(jìn)行圖像處理[5],最終得到缺陷出現(xiàn)的位置。當(dāng)前區(qū)域檢測(cè)完畢后,通過(guò)ROS機(jī)器人模塊的定位和導(dǎo)航功能,驅(qū)動(dòng)運(yùn)動(dòng)執(zhí)行機(jī)構(gòu)工作,并移動(dòng)到相鄰下一塊檢測(cè)區(qū)域,直到所有位置都檢測(cè)完畢。上述工作原理可實(shí)現(xiàn)飛機(jī)表面缺陷檢測(cè)系統(tǒng),下文將對(duì)其包括的三大模塊進(jìn)行說(shuō)明介紹。
2檢測(cè)模塊設(shè)計(jì)
如圖2所示,系統(tǒng)的檢測(cè)模塊主要是包括樹(shù)莓派和攝像頭,其中樹(shù)莓派作為檢測(cè)模塊的處理器,搭建的有Ubuntu系統(tǒng),是系統(tǒng)實(shí)現(xiàn)的重要組成部分。樹(shù)莓派可以提供普通計(jì)算機(jī)的功能,并且功耗低。可直接在樹(shù)莓派上安裝Keil進(jìn)行開(kāi)發(fā),具有很好的開(kāi)發(fā)效果,運(yùn)行穩(wěn)定。本次飛機(jī)表面缺陷檢測(cè)系統(tǒng)實(shí)現(xiàn)了樹(shù)莓派將攝像頭拍攝的圖片發(fā)送到圖像處理模塊上,同時(shí)也搭載ROS系統(tǒng)實(shí)現(xiàn)了移動(dòng)底盤(pán)的定位和導(dǎo)航功能。
3ROS機(jī)器人模塊設(shè)計(jì)
ROS隨著機(jī)器人技術(shù)發(fā)展愈發(fā)受到關(guān)注,采用分布式框架結(jié)構(gòu)來(lái)處理文件,這種方式允許開(kāi)發(fā)者單獨(dú)設(shè)計(jì)和開(kāi)發(fā)可執(zhí)行文件。ROS還以功能包的形式封裝功能模塊,方便移植和用戶(hù)之間的共享。下面將介紹其建圖和導(dǎo)航功能的實(shí)現(xiàn)。
3.1建圖設(shè)計(jì)
本文在ROS系統(tǒng)中使用Gmapping算法軟件包實(shí)現(xiàn)建圖[7],在ROS系統(tǒng)中設(shè)計(jì)了建圖過(guò)程中各節(jié)點(diǎn)及節(jié)點(diǎn)間的話題訂閱/的關(guān)系如圖3所示。在圖3建圖節(jié)點(diǎn)話題關(guān)系圖上,其中橢圓形里代表節(jié)點(diǎn),矩形基于ROS的飛機(jī)表面缺陷檢測(cè)系統(tǒng)胡浩鵬(紐約大學(xué)NewYorkUniversity紐約10003)框里代表的是主題,節(jié)點(diǎn)指向主題代表著該節(jié)點(diǎn)了主題消息,主題指向節(jié)點(diǎn)代表著該節(jié)點(diǎn)訂閱了主題消息。在建圖過(guò)程中,主要涉及激光雷達(dá)節(jié)點(diǎn)、鍵盤(pán)控制節(jié)點(diǎn)、底盤(pán)節(jié)點(diǎn)、Gmapping節(jié)點(diǎn)和地圖服務(wù)節(jié)點(diǎn)。
3.2導(dǎo)航設(shè)計(jì)
ROS提供的Navigation導(dǎo)航框架結(jié)構(gòu)如圖4所示,顯然MOVE_BASE導(dǎo)航功能包中包括全局路徑規(guī)劃和局部路徑規(guī)劃兩部分,即在已構(gòu)建好的地圖的基礎(chǔ)上,通過(guò)配置全局和局部代價(jià)地圖,從而支持和引導(dǎo)路徑規(guī)劃的實(shí)施。為了保證導(dǎo)航效果的準(zhǔn)確,通過(guò)AMCL定位功能包進(jìn)行護(hù)理床的位置定位[8]。獲取目標(biāo)點(diǎn)的位置后,MOVE_BASE功能包結(jié)合傳感器信息,在路徑規(guī)劃的作用下,控制指令,控制護(hù)理床完成相應(yīng)的運(yùn)動(dòng)。
4圖像處理模塊設(shè)計(jì)
圖像處理模塊設(shè)計(jì)主要分為圖像預(yù)處理、模型訓(xùn)練和卷積神經(jīng)網(wǎng)絡(luò)三大部分,通過(guò)TCP通信協(xié)議進(jìn)行通信,TCP通信是一種面向連接的通信,可完成客戶(hù)端(樹(shù)莓派)和服務(wù)端(PC)的信息傳遞[9]。下面主要對(duì)卷積神經(jīng)網(wǎng)絡(luò)部分進(jìn)行介紹。
4.1卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程
通過(guò)相機(jī)采集到的缺陷和問(wèn)題圖像作為訓(xùn)練樣本,這部分是檢測(cè)飛機(jī)表面缺陷的關(guān)鍵一步,然后對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,具體步驟如下所示。(1)訓(xùn)練標(biāo)記數(shù)據(jù):首先使用圖像預(yù)處理中標(biāo)記好的道路故障提取出來(lái),通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)記框內(nèi)的目標(biāo)數(shù)據(jù)進(jìn)行訓(xùn)練;(2)提取特征數(shù)據(jù):將道路故障的類(lèi)型統(tǒng)計(jì)并歸納;(3)誤差反饋學(xué)習(xí):對(duì)測(cè)試樣本進(jìn)行誤差反饋學(xué)習(xí),并進(jìn)行測(cè)試;(4)優(yōu)化訓(xùn)練數(shù)據(jù):將得到的測(cè)試結(jié)果與設(shè)定的故障分類(lèi)結(jié)果進(jìn)行誤差對(duì)比,不斷優(yōu)化訓(xùn)練集,最終得到理想的訓(xùn)練數(shù)據(jù)。
4.2缺陷檢測(cè)流程
缺陷檢測(cè)流程如圖5所示,首先輸入缺陷原始圖像,通過(guò)特征提取網(wǎng)絡(luò),將處理后的圖像使用檢測(cè)器進(jìn)行檢測(cè),其中檢測(cè)器里為卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練后得到的模型,最終缺陷檢測(cè)后得到的識(shí)別后的圖像,并反饋出來(lái)。
4.3實(shí)驗(yàn)測(cè)試
鋁合金表面缺陷主要有碰傷、刮花、凸粉、臟點(diǎn)等常見(jiàn)的缺陷,下面將以這四種為主要對(duì)象進(jìn)行檢測(cè)訓(xùn)練,各自訓(xùn)練集數(shù)量為1000張。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)缺陷的特征進(jìn)行提取和分類(lèi),最終實(shí)現(xiàn)了缺陷的檢測(cè)。本次實(shí)驗(yàn)測(cè)試的樣本為200張,每種缺陷50張,均采集自鋁合金材料表面且與訓(xùn)練樣本一致,實(shí)驗(yàn)結(jié)果如表1所示。由表1可知,檢測(cè)臟點(diǎn)的準(zhǔn)確率高達(dá)98%,刮花和凸粉的準(zhǔn)確率也達(dá)到94%,但碰傷的準(zhǔn)確率相對(duì)較低,只有88%。可能造成的原因是:①硬件原因?qū)е虏杉膱D像清晰度比較低;②碰傷缺陷不明顯,無(wú)人機(jī)難以識(shí)別;③訓(xùn)練的數(shù)據(jù)集較少,特征學(xué)習(xí)誤差大;但最后結(jié)果是滿足了設(shè)計(jì)需求,還需進(jìn)一步改進(jìn)。
5總結(jié)與展望
篇4
關(guān)鍵詞:人機(jī)大戰(zhàn);人工智能;發(fā)展前景
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
0.引言
2016年3月15日,備受矚目的“人機(jī)大戰(zhàn)”終于落下帷幕,最終Google公司開(kāi)發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國(guó)九段棋手李世h。毫無(wú)疑問(wèn),這是人工智能歷史上一個(gè)具有里程碑式的大事件。大家一致認(rèn)為,人工智能已經(jīng)上升到了一個(gè)新的高度。
這次勝利與1997年IBM公司的“深藍(lán)”戰(zhàn)勝?lài)?guó)際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個(gè)方面:
(1)AlphaGo的勝利并非僅僅依賴(lài)強(qiáng)悍的計(jì)算能力和龐大的棋譜數(shù)據(jù)庫(kù)取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對(duì)弈過(guò)的棋盤(pán),并在練習(xí)和實(shí)戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗(yàn)。
(2)圍棋比國(guó)際象棋更加復(fù)雜,圍棋棋盤(pán)有361個(gè)點(diǎn),其分支因子無(wú)窮無(wú)盡,19×19格圍棋的合法棋局?jǐn)?shù)的所有可能性是冪為171的指數(shù),這樣的計(jì)算量相當(dāng)巨大。英國(guó)圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡(jiǎn)單的規(guī)則加深了棋局的復(fù)雜性”。因此,進(jìn)入圍棋領(lǐng)域一直被認(rèn)為是目前人工智能的最大挑戰(zhàn)。
簡(jiǎn)而言之,AlphaGo取得勝利的一個(gè)很重要的方面就是它擁有強(qiáng)大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來(lái)發(fā)展前景。
1.人工智能的發(fā)展歷程
AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個(gè)不斷進(jìn)步,并且至今仍在取得不斷突破的學(xué)科。回顧人工智能的發(fā)展歷程,可大致分為孕育、形成、暗淡、知識(shí)應(yīng)用和集成發(fā)展五大時(shí)期。
孕育期:1956年以前,數(shù)學(xué)、邏輯、計(jì)算機(jī)等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國(guó)數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號(hào)化,奠定了數(shù)理邏輯的基礎(chǔ)。英國(guó)數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動(dòng)機(jī)理論(亦稱(chēng)圖靈機(jī)),1950年在其著作《計(jì)算機(jī)與智能》中首次提出“機(jī)器也能思維”,被譽(yù)為“人工智能之父”。總之,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻(xiàn)。
形成期:1956年夏季,在美國(guó)達(dá)特茅斯大學(xué)舉辦了長(zhǎng)達(dá)2個(gè)多月的研討會(huì),熱烈地討論用機(jī)器模擬人類(lèi)智能的問(wèn)題。該次會(huì)議首次使用了“人工智能”這一術(shù)語(yǔ)。這是人類(lèi)歷史上第一次人工智能研討會(huì),標(biāo)志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時(shí)期。在接下來(lái)的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當(dāng)時(shí)形成了廣泛的樂(lè)觀思潮。
暗淡期:20世紀(jì)70年代初,即使最杰出的AI程序也只能解決問(wèn)題中最簡(jiǎn)單的部分,發(fā)展遇到瓶頸也就是說(shuō)所有的AI程序都只是“玩具”,無(wú)法解決更為復(fù)雜的問(wèn)題。隨著AI遭遇批評(píng),對(duì)AI提供資助的機(jī)構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。
知識(shí)應(yīng)用期:在80年代,“專(zhuān)家系統(tǒng)”(Expect System)成為了人工智能中一個(gè)非常主流的分支。“專(zhuān)家系統(tǒng)”是一種程序,為計(jì)算機(jī)提供特定領(lǐng)域的專(zhuān)門(mén)知識(shí)和經(jīng)驗(yàn),計(jì)算機(jī)就能夠依據(jù)一組從專(zhuān)門(mén)知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問(wèn)題。不同領(lǐng)域的專(zhuān)家系統(tǒng)基本都是由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、推理機(jī)、解釋機(jī)制、知識(shí)獲取等部分組成。
集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計(jì)算機(jī)性能的突飛猛進(jìn)、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長(zhǎng)足的進(jìn)步,取得了令人矚目的成就。
人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個(gè)里程碑。當(dāng)前人工智能的研究熱點(diǎn)主要集中在自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
2.人工智能l展現(xiàn)狀與前景
人工智能當(dāng)前有很多重要的研究領(lǐng)域和分支。目前,越來(lái)越多的AI項(xiàng)目依賴(lài)于分布式系統(tǒng),而當(dāng)前研究的普遍熱點(diǎn)則集中于自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
自然語(yǔ)言處理:自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP),是語(yǔ)言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實(shí)現(xiàn)讓機(jī)器明白人類(lèi)的語(yǔ)言,這需要將人類(lèi)的自然語(yǔ)言轉(zhuǎn)化為計(jì)算機(jī)能夠處理的機(jī)器語(yǔ)言。
自然語(yǔ)言處理主要包括詞法分析、句法分析和語(yǔ)義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對(duì)自然語(yǔ)言中句子的結(jié)構(gòu)、語(yǔ)法進(jìn)行分析如辨別疑問(wèn)句和感嘆句等。而語(yǔ)義分析則注重情感分析和整個(gè)段落的上下文分析,辨別一些字詞在不同的上下文定的語(yǔ)義和情感態(tài)度。
當(dāng)前自然語(yǔ)言的處理主要有兩大方向。一種是基于句法-語(yǔ)義規(guī)則的理性主義理論,該理論認(rèn)為需要為計(jì)算機(jī)制定一系列的規(guī)則,計(jì)算機(jī)在規(guī)則下進(jìn)行推理與判斷。因此其技術(shù)路線是一系列的人為的語(yǔ)料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計(jì)學(xué)習(xí)的經(jīng)驗(yàn)主義理論,這種理論在最近受到普遍推崇。該理論讓計(jì)算機(jī)自己通過(guò)學(xué)習(xí)并進(jìn)行統(tǒng)計(jì)推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語(yǔ)言,試圖刻畫(huà)真實(shí)世界的語(yǔ)言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計(jì)語(yǔ)言的規(guī)律。
機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)(Machine Learning)是近20年來(lái)興起的人工智能一大重要領(lǐng)域。其主要是指通過(guò)讓計(jì)算機(jī)在數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行判斷和預(yù)測(cè)的方法。
機(jī)器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無(wú)監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個(gè)函數(shù)和目標(biāo),當(dāng)有新的數(shù)據(jù)到來(lái)時(shí),可以由訓(xùn)練得到函數(shù)預(yù)測(cè)目標(biāo)。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時(shí)有輸入和輸出,也就是所謂的特征和目標(biāo)。而依據(jù)預(yù)測(cè)的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問(wèn)題,即統(tǒng)計(jì)分類(lèi)問(wèn)題和回歸分析問(wèn)題。統(tǒng)計(jì)分類(lèi)的預(yù)測(cè)結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問(wèn)題目標(biāo)是連續(xù)的,如天氣、股價(jià)等的預(yù)測(cè)。
無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒(méi)有人為標(biāo)注的結(jié)果,這就需要計(jì)算機(jī)去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來(lái)分類(lèi)等。一種常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)是聚類(lèi)分析(Cluster Analysis),它是將相似的對(duì)象通過(guò)靜態(tài)分類(lèi)的方法分成不同的組別或者是特定的子集,讓同一個(gè)子集中的數(shù)據(jù)對(duì)象都有一些相似的屬性,比較常用的聚類(lèi)方法是簡(jiǎn)潔并快速的“K-均值”聚類(lèi)算法。它基于K個(gè)中心并對(duì)距離這些中心最近的數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)。
機(jī)器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等類(lèi)別。總而言之,機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類(lèi)學(xué)習(xí)活動(dòng)的一門(mén)學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來(lái)越廣泛,如模式識(shí)別、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、推薦算法等領(lǐng)域越來(lái)越廣泛地應(yīng)用到了機(jī)器學(xué)習(xí)中。
人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認(rèn)為人類(lèi)的意識(shí)及智能行為,都是通過(guò)巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個(gè)神經(jīng)細(xì)胞通過(guò)突出與其他神經(jīng)細(xì)胞連接,當(dāng)通過(guò)突觸的信號(hào)強(qiáng)度超過(guò)某個(gè)閾值時(shí),神經(jīng)細(xì)胞便會(huì)進(jìn)入激活狀態(tài),向所連接的神經(jīng)細(xì)胞一層層傳遞信號(hào)。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個(gè)多輸入單輸出的信息處理單元,并通過(guò)傳遞函數(shù)f對(duì)輸入x1,x2…,xn進(jìn)行處理并模擬神經(jīng)細(xì)胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。
在此基礎(chǔ)上,對(duì)神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進(jìn)展。日本的福島教授于1983年基于視覺(jué)認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型。通過(guò)學(xué)習(xí)訓(xùn)練獲取到卷積運(yùn)算中所使用的卷積系數(shù),并通過(guò)不同層次與自由度的變化,可以得到較為優(yōu)化的計(jì)算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺(jué)分類(lèi)能力,也就是所謂的“棋感”,增強(qiáng)了其對(duì)全盤(pán)決策和把握的能力。
3.人工智能的發(fā)展前景
總體來(lái)看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個(gè)里程碑。在以上4個(gè)領(lǐng)域中,既是縱向發(fā)展的過(guò)程,也是橫向不斷改進(jìn)的過(guò)程。
人工智能在博弈階段,主要是實(shí)現(xiàn)邏輯推理等功能,隨著計(jì)算機(jī)處理能力的進(jìn)步以及深度學(xué)習(xí)等算法的改進(jìn),機(jī)器擁有了越來(lái)越強(qiáng)的邏輯與對(duì)弈能力。在感知領(lǐng)域,隨著自然語(yǔ)言處理的進(jìn)步,機(jī)器已經(jīng)基本能對(duì)人類(lèi)的語(yǔ)音與語(yǔ)言進(jìn)行感知,并且能夠已經(jīng)對(duì)現(xiàn)實(shí)世界進(jìn)行視覺(jué)上的感知。基于大數(shù)據(jù)的處理和機(jī)器學(xué)習(xí)的發(fā)展,機(jī)器已經(jīng)能夠?qū)χ車(chē)沫h(huán)境進(jìn)行認(rèn)知,例如微軟的Kinect就能夠準(zhǔn)確的對(duì)人的肢體動(dòng)作進(jìn)行判斷。該領(lǐng)域的主要實(shí)現(xiàn)還包括蘋(píng)果的Siri,谷歌大腦以及無(wú)人駕駛汽車(chē)中的各種傳感器等。在以上兩個(gè)階段的基礎(chǔ)上,機(jī)器擁有了一定的決策和反饋的能力。無(wú)人駕駛汽車(chē)的蓬勃發(fā)展就是這兩個(gè)里程碑很好的例證。Google的無(wú)人駕駛汽車(chē)通過(guò)各種傳感器對(duì)周?chē)沫h(huán)境進(jìn)行感知并處理人類(lèi)的語(yǔ)言等指令,利用所收集的信息進(jìn)行最后的決策,比如操作方向盤(pán)、剎車(chē)等。
人工智能已經(jīng)滲透到生活中的各個(gè)領(lǐng)域。機(jī)器已經(jīng)能識(shí)別語(yǔ)音、人臉以及視頻內(nèi)容等,從而實(shí)現(xiàn)各種人際交互的場(chǎng)景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實(shí)現(xiàn)自動(dòng)讀片和輔助診斷以及個(gè)性化t療和基因排序等功能。在教育領(lǐng)域,機(jī)器也承擔(dān)了越來(lái)越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無(wú)人車(chē)的發(fā)展表明無(wú)人駕駛是一個(gè)可以期待的未來(lái),另一方面人工智能能夠帶來(lái)更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景。總之,人工智能在一些具有重復(fù)性的和具備簡(jiǎn)單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來(lái)幫助人們解決問(wèn)題,創(chuàng)造價(jià)值。
參考文獻(xiàn)
[1]阮曉東.從AlphaGo的勝利看人工智能的未來(lái)[J].新經(jīng)濟(jì)導(dǎo)刊,2016 (6):69-74.
篇5
計(jì)算機(jī)視覺(jué)的第一步是特征提取,即檢測(cè)圖像中的關(guān)鍵點(diǎn)并獲取有關(guān)這些關(guān)鍵點(diǎn)的有意義信息。特征提取過(guò)程本身包含4個(gè)基本階段:圖像準(zhǔn)備、關(guān)鍵點(diǎn)檢測(cè)、描述符生成和分類(lèi)。實(shí)際上,這個(gè)過(guò)程會(huì)檢查每個(gè)像素,以查看是否有特征存在干該像素中。
特征提取算法將圖像描述為指向圖像中的關(guān)鍵元素的一組特征向量。本文將回顧一系列的特征檢測(cè)算法,在這個(gè)過(guò)程中,看看一般目標(biāo)識(shí)別和具體特征識(shí)別在這些年經(jīng)歷了怎樣的發(fā)展。
早期特征檢測(cè)器
Scale Invariant Feature Transform(SIFT)及Good Features To Track(GFTT)是特征提取技術(shù)的早期實(shí)現(xiàn)。但這些屬于計(jì)算密集型算法,涉及到大量的浮點(diǎn)運(yùn)算,所以它們不適合實(shí)時(shí)嵌入式平臺(tái)。
以SIFT為例,這種高精度的算法,在許多情況下都能產(chǎn)生不錯(cuò)的結(jié)果。它會(huì)查找具有子像素精度的特征,但只保留類(lèi)似于角落的特征。而且,盡管SIFT非常準(zhǔn)確,但要實(shí)時(shí)實(shí)現(xiàn)也很復(fù)雜,并且通常使用較低的輸入圖像分辨率。
因此,SIFT在目前并不常用,它主要是用作一個(gè)參考基準(zhǔn)來(lái)衡量新算法的質(zhì)量。因?yàn)樾枰档陀?jì)算復(fù)雜度,所以最終導(dǎo)致要開(kāi)發(fā)一套更容易實(shí)現(xiàn)的新型特征提取算法。
二代算法
Speeded Up Robust Features(SURF)是最早考慮實(shí)現(xiàn)效率的特征檢測(cè)器之一。它使用不同矩形尺寸中的一系列加法和減法取代了SIFT中浩繁的運(yùn)算。而且,這些運(yùn)算容易矢量化,需要的內(nèi)存較少。
接下來(lái),HOG(Histograms ofOriented Gradients)這種在汽車(chē)行業(yè)中常用的熱門(mén)行人檢測(cè)算法可以變動(dòng),采用不同的尺度來(lái)檢測(cè)不同大小的對(duì)象,并使用塊之間的重疊量來(lái)提高檢測(cè)質(zhì)量,而不增加計(jì)算量。它可以利用并行存儲(chǔ)器訪問(wèn),而不像傳統(tǒng)存儲(chǔ)系統(tǒng)那樣每次只處理一個(gè)查找表,因此根據(jù)內(nèi)存的并行程度加快了查找速度。
然后,ORB(Oriented FASTand Rotated BRIEF)這種用來(lái)替代SIFT的高效算法將使用二進(jìn)制描述符來(lái)提取特征。ORB將方向的增加與FAST角點(diǎn)檢測(cè)器相結(jié)合,并旋轉(zhuǎn)BRIEF描述符,使其與角方向?qū)R。二進(jìn)制描述符與FAST和HarrisCorner等輕量級(jí)函數(shù)相結(jié)合產(chǎn)生了一個(gè)計(jì)算效率非常高而且相當(dāng)準(zhǔn)確的描述圖。
CNN:嵌入式平臺(tái)目標(biāo)識(shí)別的下一個(gè)前沿領(lǐng)域
配有攝像頭的智能手機(jī)、平板電腦、可穿戴設(shè)備、監(jiān)控系統(tǒng)和汽車(chē)系統(tǒng)采用智能視覺(jué)功能將這個(gè)行業(yè)帶到了一個(gè)十字路口,需要更先進(jìn)的算法來(lái)實(shí)現(xiàn)計(jì)算密集型應(yīng)用,從而提供更能根據(jù)周邊環(huán)境智能調(diào)整的用戶(hù)體驗(yàn)。因此,需要再一次降低計(jì)算復(fù)雜度來(lái)適應(yīng)這些移動(dòng)和嵌入式設(shè)備中使用的強(qiáng)大算法的嚴(yán)苛要求。
不可避免地,對(duì)更高精度和更靈活算法的需求會(huì)催生出矢量加速深度學(xué)習(xí)算法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于分類(lèi)、定位和檢測(cè)圖像中的目標(biāo)。例如,在使用交通標(biāo)志識(shí)別的情況下,基于CNN的算法在識(shí)別準(zhǔn)確度上勝過(guò)目前所有的目標(biāo)檢測(cè)算法。除了質(zhì)量高之外,CNN與傳統(tǒng)目標(biāo)檢測(cè)算法相比的主要優(yōu)點(diǎn)是,CNN的自適應(yīng)能力非常強(qiáng)。它可以在不改變算法代碼的情況下快速地被重新“訓(xùn)練(tuning)”以適應(yīng)新的目標(biāo)。因此,CNN和其他深度學(xué)習(xí)算法在不久的將來(lái)就會(huì)成為主流目標(biāo)檢測(cè)方法。
CNN對(duì)移動(dòng)和嵌入式設(shè)備有非常苛刻的計(jì)算要求。卷積是CNN計(jì)算的主要部分。CNN的二維卷積層允許用戶(hù)利用重疊卷積,通過(guò)對(duì)同一輸入同時(shí)執(zhí)行一個(gè)或多個(gè)過(guò)濾器來(lái)提高處理效率。所以,對(duì)于嵌入式平臺(tái),設(shè)計(jì)師應(yīng)該能夠非常高效地執(zhí)行卷積,以充分利用CNN流。
事實(shí)上,CNN嚴(yán)格來(lái)說(shuō)并不是一種算法,而是一種實(shí)現(xiàn)框架。它允許用戶(hù)優(yōu)化基本構(gòu)件塊,并建立一個(gè)高效的神經(jīng)網(wǎng)絡(luò)檢測(cè)應(yīng)用,因?yàn)镃NN框架是對(duì)每個(gè)像素逐一計(jì)算,而且逐像素計(jì)算是一種要求非常苛刻的運(yùn)算,所以它需要更多的計(jì)算量。
不懈改進(jìn)視覺(jué)處理器
篇6
【關(guān)鍵詞】神經(jīng)網(wǎng)絡(luò);故障測(cè)距;小波包;相對(duì)誤差
0 引言
我國(guó)礦井配電網(wǎng)多為6kV單側(cè)電源供電系統(tǒng),采取中性點(diǎn)非有效接地方式,屬于小電流接地系統(tǒng)(NUGS)。饋電回路選用多段短電纜徑向延伸為各種井下高低壓電機(jī)、電氣設(shè)備、照明及各種通信、自動(dòng)化裝置和儀表、儀器提供電能。由于井下工作環(huán)境惡劣,供電電纜經(jīng)常發(fā)生接地、斷線、短路等故障,據(jù)電力部門(mén)統(tǒng)計(jì),其中單相接地故障的發(fā)生率最高。盡管發(fā)生單相接地故障時(shí),線電壓仍然對(duì)稱(chēng),暫時(shí)不影響對(duì)負(fù)荷的連續(xù)供電,但就礦井這類(lèi)危險(xiǎn)易爆場(chǎng)所而言,當(dāng)發(fā)生單相接地故障時(shí),應(yīng)盡快跳閘斷電以確保安全。為此,必須及時(shí)對(duì)故障點(diǎn)進(jìn)行定位、排除故障、加快恢復(fù)線路供電。
NUGS饋線的故障定位問(wèn)題一直以來(lái)未得到滿意的解決,這與其自身的特點(diǎn)有關(guān)。由于電網(wǎng)變壓器中性點(diǎn)不直接接地,造成單相接地電流無(wú)法形成小阻抗回路,故障電流主要由線路對(duì)地電容電流提供,其數(shù)值較小,且基波分量幅值故障前后變化不大,使得定位保護(hù)裝置很難準(zhǔn)確進(jìn)行故障選線和定位。考慮到井下環(huán)境條件和負(fù)荷的特殊性,礦井配電網(wǎng)與傳統(tǒng)意義上的NUGS存在一定的差異:?jiǎn)蜗嘟拥禺a(chǎn)生的暫態(tài)分量較穩(wěn)態(tài)分量大得多,暫態(tài)波形畸變嚴(yán)重,應(yīng)研究利用暫態(tài)電氣量進(jìn)行故障測(cè)距的可行性;饋電線路分支少、長(zhǎng)度短,對(duì)測(cè)距精度要求高[1]。
鑒于上述原因,本文就井下配電網(wǎng)故障測(cè)距問(wèn)題進(jìn)行研究,以期提高故障測(cè)距的精度和可靠性。
1 BP網(wǎng)絡(luò)的結(jié)構(gòu)和算法
BP網(wǎng)絡(luò)結(jié)構(gòu)上類(lèi)似于多層感知器,是一種多層前饋神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)權(quán)值的訓(xùn)練算法為誤差反向傳播(BP)學(xué)習(xí)算法。如圖1所示為一典型3層BP網(wǎng)絡(luò)模型。
圖1 3層BP網(wǎng)絡(luò)模型
以圖示BP網(wǎng)絡(luò)模型為例說(shuō)明網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程:
(1)初始化。為每個(gè)連接權(quán)值wij、wjt、閥值θj、θt賦予(-1,1)區(qū)間的隨機(jī)值。
(2)給定輸入輸出目標(biāo)樣本。給定輸入向量Xp=(x1,x2,...,xn)和期望目標(biāo)向量Tp=(t1,t2,...,tm),p∈1,2,...,P。
(3)計(jì)算網(wǎng)絡(luò)各層的輸出。由輸入樣本、連接權(quán)值、閥值及各層神經(jīng)元傳遞函數(shù)計(jì)算隱含層和輸出層的輸出。
(4)計(jì)算網(wǎng)絡(luò)實(shí)際輸出與期望輸出的一般化誤差。系統(tǒng)的目標(biāo)函數(shù)為:
E=■■■(t■-y■)2=■E■(1)
網(wǎng)絡(luò)通過(guò)調(diào)整權(quán)值和閥值使?jié)M足預(yù)先設(shè)定的一個(gè)極小值。
(5) 利用目標(biāo)函數(shù)調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值。BP算法按照目標(biāo)函數(shù)梯度的反方向?qū)W(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,使目標(biāo)函數(shù)收斂,即實(shí)際輸出接近目標(biāo)輸出。對(duì)于第p個(gè)輸入樣本的權(quán)值、閥值,按下式修正,式中?濁為學(xué)習(xí)速率。
?駐w=-?濁■, ?駐θ=-?濁■(2)
對(duì)應(yīng)的權(quán)值、閥值按下式調(diào)整,式中為迭代步數(shù)。
w(k+1)=w(k)+?駐wθ(k+1)=θ(k)+?駐θ(3)
(6)隨機(jī)選擇下一組學(xué)習(xí)樣本向量進(jìn)行訓(xùn)練,直到P個(gè)樣本對(duì)訓(xùn)練完畢。
(7)重新從P個(gè)學(xué)習(xí)樣本中隨機(jī)選取一組輸入、目標(biāo)樣本對(duì),返回步驟(3),直到目標(biāo)函數(shù)E收斂于給定值,若訓(xùn)練次數(shù)大于設(shè)定的最大訓(xùn)練次數(shù),則網(wǎng)絡(luò)不收斂。
由于BP算法學(xué)習(xí)速率為固定值,收斂速度較慢,且可能會(huì)產(chǎn)生多個(gè)局部極小值,另外網(wǎng)絡(luò)的隱含層層數(shù)和神經(jīng)元數(shù)目的選擇尚無(wú)理論指導(dǎo),因此網(wǎng)絡(luò)具有較大的冗余性。為了克服以上不足,提出了許多改進(jìn)算法,從改進(jìn)途徑上分為兩類(lèi):
一類(lèi)為啟發(fā)式學(xué)習(xí)算法,如動(dòng)量BP算法、彈性算法、學(xué)習(xí)率可變的BP算法等;另一類(lèi)為快速優(yōu)化算法,如擬牛頓算法、LM算法等。
2 基于BP小波神經(jīng)網(wǎng)絡(luò)的故障測(cè)距
小波包具有正交特性、信號(hào)分解后的信息量是完整的,因此利用小波包算法分析信號(hào)頻率的分布情況,能夠有效提取信號(hào)的暫態(tài)特征。對(duì)于電纜線路而言,其暫態(tài)零序電流的自由振蕩頻率一般在1500~3000Hz之間[2-3]。本文利用小波包提取該頻段的暫態(tài)零序電流信號(hào)模極大值作為神經(jīng)網(wǎng)絡(luò)模型的輸入,以期實(shí)現(xiàn)高精度的故障測(cè)距。
2.1 小波基的選擇
在利用小波包提取模極大值時(shí),小波基的選擇十分重要,選擇不同的小波基對(duì)信號(hào)進(jìn)行分解,可以突出不同特點(diǎn)的信號(hào)特征。Daubechies小波系是信號(hào)分析處理中常用的一類(lèi)小波,具有緊支性、正交性,滿足精確重構(gòu)條件,但由于其不具有對(duì)稱(chēng)性,因而其邊界效應(yīng)會(huì)隨尺度的增加而擴(kuò)大,引起分解誤差;Morlet小波常用于信號(hào)表示、圖像特征的提取和識(shí)別;Mexican hat小波則用于系統(tǒng)辨識(shí)。
3次B樣條小波是一種具有線性相位的緊支對(duì)稱(chēng)小波,分頻能力強(qiáng),頻帶相干小,由于具有對(duì)稱(chēng)性,只要采取合理的延拓方式,其邊界效應(yīng)引起的誤差可忽略不計(jì)。
B樣條基函數(shù)的遞推公式如下:
N■(x)=1,x■≤x≤x■0,x?埸x■,x■N■(x)=■N■(x)+■N■(x)(4)
3次B樣條基函數(shù)N■(x)在xi,xi+4上具有局部支集性,表達(dá)式如(5)所示。
(5)若取參數(shù)x■=i(i=0,1,...,n)為節(jié)點(diǎn)即為均勻B樣條基,再對(duì)均勻B樣條基作參數(shù)變換,在每個(gè)子區(qū)間內(nèi)以參數(shù)代換,在每個(gè)子區(qū)間的值均為u0,1。3次B樣條基函數(shù)的表達(dá)式如式6所示。
由于二進(jìn)小波包變換具有平移不變性,不會(huì)引起正交小波包變換在所分析信號(hào)不連續(xù)處產(chǎn)生的偽吉布斯現(xiàn)象[4]。故本文利用3次B樣條小波包對(duì)短路故障電流進(jìn)行卷積型二進(jìn)小波包分解,以期獲得更顯著的故障特征信息。
N■(x)=■,x■≤x≤x■■+■,x■≤x≤x■■+■,x■≤x≤x■■,x■≤x≤x■0,x?埸x,x■
(5)
N■(u)=■u3■(-3u3+3u2+3u+1)■(3u3-6u2+4)■(-u3+3u2-3u+1) 0≤u≤1(6)
2.2 分解尺度的選擇
如何選擇分解尺度對(duì)于零序電流暫態(tài)分量的模極大值提取至關(guān)重要,尺度取得越大,信號(hào)與噪聲的表現(xiàn)差異越明顯,越有利于兩者的分離。但分解尺度取得越大,則對(duì)應(yīng)的頻帶寬度越窄,采樣點(diǎn)數(shù)過(guò)小,不利于下一步的信號(hào)分析[5-7]。
由于本文仿真的采樣頻率取1MHz,則Nyquist頻率為5kHz,為提取暫態(tài)零序電流1500~3000Hz頻率段分量,小波包分解層數(shù)為3,考慮小波包頻帶劃分規(guī)則,取(3,3)、(3,7)頻帶的零序電流暫態(tài)分量即可滿足要求。
2.3 BP網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的選擇
欲利用BP小波神經(jīng)網(wǎng)絡(luò)計(jì)算井下配電網(wǎng)故障測(cè)距,必須首先確定BP網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),如各層的初始權(quán)值、閥值,學(xué)習(xí)速率,各層節(jié)點(diǎn)數(shù)、傳遞函數(shù)等,只有確定了網(wǎng)絡(luò)的最佳配置,才能有效解決所提出的問(wèn)題[8]。
(1)網(wǎng)絡(luò)層數(shù)的確定。Hecht-Nielsen已經(jīng)證明,在不限制隱層節(jié)點(diǎn)數(shù)的情況下,含有一個(gè)隱層的BP網(wǎng)絡(luò)能夠?qū)崿F(xiàn)任意非線性映射。Cybenko指出,當(dāng)隱層傳遞函數(shù)選用S型傳遞函數(shù)時(shí),單隱層足以滿足解決任意判決分類(lèi)問(wèn)題的需要,兩個(gè)隱層則能夠?qū)崿F(xiàn)輸入圖形的映射。增加隱層數(shù)可以進(jìn)一步提高精度,但同時(shí)會(huì)增加網(wǎng)絡(luò)權(quán)值的訓(xùn)練時(shí)間。另外,增加隱層神經(jīng)元個(gè)數(shù)也能降低誤差,訓(xùn)練效果也更易觀察,因此,應(yīng)優(yōu)先考慮增加隱含層神經(jīng)元的個(gè)數(shù)。對(duì)于本文研究的故障測(cè)距問(wèn)題,網(wǎng)絡(luò)需要較快的收斂速度,因此采用單隱層網(wǎng)絡(luò)。
(2)各層節(jié)點(diǎn)數(shù)目的確定。網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)等于輸入向量的維數(shù)。由于井下電網(wǎng)大多數(shù)實(shí)時(shí)運(yùn)行參數(shù)如負(fù)荷、系統(tǒng)等效阻抗可由監(jiān)控終端獲得,其它隨機(jī)性因素如發(fā)生故障線路、故障時(shí)刻可由故障后可測(cè)信息準(zhǔn)確識(shí)別,不可知變化因素僅包括接地過(guò)渡電阻及故障點(diǎn)位置,并且神經(jīng)網(wǎng)絡(luò)的內(nèi)插性能優(yōu)于外推性能,故輸入向量維數(shù)等于3,分別為(3,3)、(3,7)頻帶零序電流暫態(tài)分量的模極大值和故障點(diǎn)過(guò)渡電阻值。輸出層節(jié)點(diǎn)數(shù)為1,表示故障點(diǎn)位置。隱含層節(jié)點(diǎn)數(shù)的選擇比較復(fù)雜,需要依據(jù)經(jīng)驗(yàn)和經(jīng)過(guò)多次實(shí)驗(yàn)確定,選取過(guò)多將導(dǎo)致學(xué)習(xí)時(shí)間過(guò)長(zhǎng),過(guò)少將引起容錯(cuò)性差,對(duì)未經(jīng)學(xué)習(xí)的樣本識(shí)別能力低。根據(jù)Hebe準(zhǔn)則可以確定最佳隱含層節(jié)點(diǎn)數(shù)的參考值。另外,也可先令隱含層節(jié)點(diǎn)數(shù)可變,開(kāi)始時(shí)給以較小數(shù)值,學(xué)習(xí)到給定訓(xùn)練次數(shù)最大值,若未達(dá)到收斂精度則再增加節(jié)點(diǎn)數(shù),直至達(dá)到合理數(shù)值為止。經(jīng)過(guò)多次仿真訓(xùn)練,隱層節(jié)點(diǎn)數(shù)為11時(shí),網(wǎng)絡(luò)的訓(xùn)練誤差最小。
(3)初始權(quán)值的選取。初始權(quán)值的選擇對(duì)于網(wǎng)絡(luò)能否收斂和訓(xùn)練的速度關(guān)系密切。若權(quán)值選擇過(guò)大,會(huì)使加權(quán)輸入處于激勵(lì)函數(shù)的飽和區(qū),導(dǎo)致無(wú)法進(jìn)行權(quán)值的調(diào)整。威得羅等人提出一種權(quán)值初定策略,選擇權(quán)值的量級(jí)為S1的r次方,其中S1為第一層神經(jīng)元數(shù)目,利用此方法可以在較少的訓(xùn)練次數(shù)下獲得滿意的訓(xùn)練結(jié)果。本文選擇的輸入層及隱含層至輸出層的初始權(quán)值均為0.25。
(4)訓(xùn)練算法的選擇。給定一個(gè)具體問(wèn)題,采用何種訓(xùn)練算法對(duì)于是否能夠達(dá)到目標(biāo)誤差及網(wǎng)絡(luò)收斂速度的影響很大。就中等規(guī)模的前饋神經(jīng)網(wǎng)絡(luò)而言,LM算法的訓(xùn)練函數(shù)trainlm可以獲得比其它任何一種算法更小的均方誤差,且收斂速度最快,在精度要求較高時(shí),該算法的優(yōu)點(diǎn)尤其突出。本文選擇LM算法對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(5)學(xué)習(xí)速率的選擇。一般情況下傾向于選擇較小的學(xué)習(xí)速率以保證訓(xùn)練過(guò)程的穩(wěn)定性,但是過(guò)小的學(xué)習(xí)速率會(huì)導(dǎo)致訓(xùn)練時(shí)間過(guò)長(zhǎng),收斂速度很慢,無(wú)法保證網(wǎng)絡(luò)的誤差值跳出誤差曲面的低谷而最終趨于最小誤差,一般選擇范圍在0.01~0.9之間。
3 系統(tǒng)仿真及測(cè)距結(jié)果
深井供電系統(tǒng)仿真模型如圖2所示。各模塊參數(shù)如下:進(jìn)線電纜(In line)采用YJV42,線路正序參數(shù)為:R1=0.078/km,L1=0.27mH/km,C1=0.695F/km,零序參數(shù)為:R0=0.106/km,L0=1.223mH/km,C0=0.358F/km;配電電纜(Line)采用YJV32;采區(qū)電纜(Mine line)、負(fù)荷電纜(Load line)采用UPQ,正序參數(shù)為:R1=0.024/km,L1=0.516mH/km,C1=0.308F/km,零序參數(shù)為:R0=0.196/km,L0=3.98mH/km,C0=0.203F/km;采區(qū)變壓器(MineT1)型號(hào)為KBSG-200/6/0.69kV,Ud%=4%,I0%=2.5%;隔爆移動(dòng)變電站(MineT2)選用KBSGZY-315/6/1.2kV,P0=1400W,Pd=2200W。負(fù)荷變壓器采用SL7-100/6/0.4kV。線路長(zhǎng)度分別為:進(jìn)線電纜取1km;
配電電纜1、3、4取0.5km;配電電纜2取0.4km;采區(qū)電纜長(zhǎng)度均取0.3km;負(fù)荷電纜取0.2km。電源線電壓有效值6.3kV,X/R ratio=7。
考慮配電線路1在不同故障點(diǎn)位置和過(guò)渡電阻下發(fā)生單相接地故障(數(shù)據(jù)窗取故障前1ms至故障后4ms共5ms)得到的暫態(tài)零序電流經(jīng)小波包分析后(3,3)、(3,7)頻帶的模極大值(為防止邊界效應(yīng)引起的信號(hào)值突變,取前2000個(gè)采樣值進(jìn)行模極大值分析)經(jīng)歸一化處理后所形成的訓(xùn)練和測(cè)試樣本集,對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并測(cè)試網(wǎng)絡(luò)的測(cè)距性能。
選取的訓(xùn)練樣本集如下:
(1)過(guò)渡電阻值分別為0.01、5、50、100、150、200、250、300、350、400、450、500;
(2)在靠近線路兩端發(fā)生故障時(shí),應(yīng)適當(dāng)減小故障距離以提高測(cè)距精度。故障點(diǎn)位置分別為:0.01km、0.02km、0.025km、0.075km、0.125km、0.175km、0.225km、0.25km、0.3km、0.325km、0.375km、0.425km、0.475km、0.48km、0.49km。
組合兩因素可形成12×15=180個(gè)訓(xùn)練樣本集。
訓(xùn)練誤差曲線如圖3所示,經(jīng)2794次迭代后誤差收斂于0.00099829,基本達(dá)到了設(shè)定的目標(biāo)誤差0.001。
為檢驗(yàn)訓(xùn)練后BP網(wǎng)絡(luò)的推廣能力即測(cè)距效果,采用非訓(xùn)練樣本集進(jìn)行測(cè)試,選取的測(cè)試樣本集如下圖3:
圖3 BP網(wǎng)絡(luò)訓(xùn)練誤差性能曲線
(1)過(guò)渡電阻值分別為25、75、125、175、225、275、325、375、425、475;
(2)故障點(diǎn)位置分別為0.015km、0.05km、0.1km、0.15km、0.2km、0.275km、0.35km、0.4km、0.45km、0.485km。
組合兩因素形成10×10=100個(gè)測(cè)試樣本集。
對(duì)于給定的測(cè)試樣本集,經(jīng)BP網(wǎng)絡(luò)前饋運(yùn)算得到的實(shí)際測(cè)距結(jié)果及相對(duì)誤差分別如表1、表2所示。
其中,L表示實(shí)際故障距離,l表示測(cè)量距離。
相對(duì)誤差e=(實(shí)際故障距離-測(cè)量距離)線路總長(zhǎng)×100%。
由表2可知,對(duì)于測(cè)試樣本集,訓(xùn)練后的BP網(wǎng)絡(luò)測(cè)距相對(duì)誤差隨過(guò)渡電阻值的增加有增大的趨勢(shì),最大誤差達(dá)到了-16.56%,且出現(xiàn)在過(guò)渡電阻為475時(shí),同時(shí)注意到在故障點(diǎn)接近線路兩端時(shí),由于適當(dāng)增加了訓(xùn)練樣本,測(cè)距相對(duì)誤差明顯減小,因此,通過(guò)增加訓(xùn)練樣本數(shù)量有望進(jìn)一步提高測(cè)距精度。
4 結(jié)論
通過(guò)研究得出以下結(jié)論:
1)采用小波包提取故障暫態(tài)零序電流的模極大值能有效表征故障時(shí)所蘊(yùn)含的物理現(xiàn)象,為準(zhǔn)確進(jìn)行故障測(cè)距提供了有效的數(shù)據(jù)。
2)BP神經(jīng)網(wǎng)絡(luò)具有良好的分類(lèi)及擬合功能,能在獲得大量樣本數(shù)據(jù)的基礎(chǔ)上,訓(xùn)練出符合要求的前饋型網(wǎng)絡(luò),為煤礦井下電網(wǎng)故障測(cè)距提供強(qiáng)有力的手段。從測(cè)距相對(duì)誤差結(jié)果來(lái)看,基于小波分析與BP神經(jīng)網(wǎng)絡(luò)的故障測(cè)距方法能基本滿足測(cè)距要求。另外,本文下一步的工作將在樣本集數(shù)量、網(wǎng)絡(luò)結(jié)構(gòu)等方面進(jìn)行更為深入的研究。
【參考文獻(xiàn)】
[1]丁恩杰,王超楠,崔連成.礦井配電網(wǎng)輸電線路故障測(cè)距方法的研究[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2006,35(3):311-316.
[2]竇新宇,李春明.小電流接地系統(tǒng)行波測(cè)距方法研究[J].電力科學(xué)與工程,2010,26(2):51-53.
[3]季濤.基于暫態(tài)行波的配電線路故障測(cè)距研究[D].濟(jì)南:山東大學(xué),2006.
[4]姚李孝,趙化時(shí),柯麗芳,等.基于小波相關(guān)性的配電網(wǎng)單相接地故障測(cè)距[J].電力自動(dòng)化設(shè)備,2010,30(1):71-74.
篇7
關(guān)鍵詞:人工智能 心血管 超聲
大數(shù)據(jù)是現(xiàn)代醫(yī)學(xué)模式的重要特征。在這種醫(yī)療模式下,要求醫(yī)療人員在確保患者安全和健康的同時(shí)追求效率的最大化[1]。對(duì)于高分辨率的醫(yī)學(xué)影像成像,集中體現(xiàn)在醫(yī)務(wù)人員快速、準(zhǔn)確、有效地解釋影像數(shù)據(jù)(包括肉眼可見(jiàn)和不可見(jiàn)),挖掘利于診斷和治療的有用信息。在此背景下,人工智能(artificial intelligence,AI)應(yīng)運(yùn)而生,它為促進(jìn)圖像采集、測(cè)量、報(bào)告和隨后的臨床路徑以及影像和臨床數(shù)據(jù)的整合提供了有效手段[2]。心血管影像的精確性成為AI臨床應(yīng)用中的主要領(lǐng)域之一,本文對(duì)此作一綜述。
1 人工智能及其在醫(yī)學(xué)上的應(yīng)用
AI是一個(gè)廣義的術(shù)語(yǔ),指的是機(jī)器或計(jì)算程序執(zhí)行具有人類(lèi)智能特征的任務(wù)的能力,如模式識(shí)別和解決問(wèn)題的能力等。AI可以通過(guò)彌補(bǔ)人類(lèi)智能,使現(xiàn)有醫(yī)療診斷和預(yù)后價(jià)值最大化,同時(shí)使醫(yī)師負(fù)擔(dān)最小化,從而顯著改善健康診療過(guò)程和結(jié)果。AI在臨床實(shí)踐中的應(yīng)用預(yù)示著醫(yī)學(xué)領(lǐng)域一個(gè)更為劇烈變化時(shí)代的到來(lái),在影像學(xué)方面尤其如此。一項(xiàng)通過(guò)分析科學(xué)網(wǎng)數(shù)據(jù)庫(kù)的研究[3]發(fā)現(xiàn),目前AI在醫(yī)學(xué)的研究領(lǐng)域主要集中在大數(shù)據(jù)分析、腦卒中康復(fù)、心臟手術(shù)和醫(yī)療診斷和預(yù)后預(yù)測(cè)等方面。其中,用于醫(yī)學(xué)診斷、預(yù)后預(yù)測(cè)和分類(lèi)的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)是主要熱點(diǎn),占所有文獻(xiàn)的26%;而未來(lái)最引人關(guān)注的研究主題是基于AI的微創(chuàng)手術(shù)。然而,關(guān)于AI數(shù)據(jù)管理、模型可靠性、模型臨床效用驗(yàn)證等問(wèn)題尚未進(jìn)行廣泛研究。
2 人工智能的機(jī)器學(xué)習(xí)法
大數(shù)據(jù)是一個(gè)經(jīng)常用來(lái)描述大量收集數(shù)據(jù)的術(shù)語(yǔ),如來(lái)自大型生物信息庫(kù)的基因組數(shù)據(jù)、電子健康記錄檔案和大型研究隊(duì)列數(shù)據(jù)以及影像學(xué)掃描數(shù)據(jù)等。AI系統(tǒng)通過(guò)識(shí)別和提取一組觀測(cè)數(shù)據(jù)(數(shù)據(jù)集)的模式來(lái)自主獲取知識(shí)的過(guò)程稱(chēng)為機(jī)器學(xué)習(xí)(machine learning,ML)。ML是人工智能的一個(gè)組成部分,描述為計(jì)算機(jī)從經(jīng)驗(yàn)中學(xué)習(xí)的過(guò)程,并在沒(méi)有事先知識(shí)的情況下執(zhí)行預(yù)定的任務(wù)[4]。機(jī)器學(xué)習(xí)可以進(jìn)一步分為監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),這取決于用于學(xué)習(xí)的樣本是否完全標(biāo)記、部分標(biāo)記或未標(biāo)記。ML的典型例子是人工神經(jīng)網(wǎng)絡(luò),后者基于人類(lèi)大腦的神經(jīng)元及其連接,神經(jīng)元之間的相互依賴(lài)關(guān)系反映出不同的權(quán)重,每個(gè)神經(jīng)元接受多個(gè)輸入,所有的輸入一起決定了神經(jīng)元的激活。通過(guò)樣本訓(xùn)練找到這些合適權(quán)重的過(guò)程就是學(xué)習(xí)。學(xué)習(xí)過(guò)程的復(fù)雜性和所需的樣本量隨著神經(jīng)元數(shù)量的增加而增加。由于計(jì)算能力和樣本大小的限制,機(jī)器學(xué)習(xí)應(yīng)用程序的成功依賴(lài)于從原始樣本中手工提取特征來(lái)減少神經(jīng)元的數(shù)量。為了解決這一問(wèn)題,人們提出了深度學(xué)習(xí)的方法,即自動(dòng)學(xué)習(xí)代表性的樣本。深度學(xué)習(xí)是指一種特別強(qiáng)大的ML方法,它利用卷積神經(jīng)網(wǎng)絡(luò)模擬人類(lèi)的認(rèn)知,常用于影像模式識(shí)別和分類(lèi)。
模型訓(xùn)練是所有ML類(lèi)型的共同過(guò)程,它是利用模型分析所提供的數(shù)據(jù)中的各種特性來(lái)學(xué)習(xí)如何生成輸出標(biāo)簽的過(guò)程[5]。如在超聲心動(dòng)圖中,一個(gè)模型可以分析各種特征,如左心室壁厚度和左心室射血分?jǐn)?shù),以確定患者是否具有特定的條件。然而,在分析中包含不相關(guān)的特征可能會(huì)導(dǎo)致模型過(guò)度擬合,從而在呈現(xiàn)新數(shù)據(jù)集時(shí)降低其準(zhǔn)確性。這強(qiáng)調(diào)了擁有一個(gè)能夠代表總體的訓(xùn)練數(shù)據(jù)集的重要性。數(shù)據(jù)集的質(zhì)量對(duì)于最終ML模型的質(zhì)量至關(guān)重要。盡管ML算法可以使用小數(shù)據(jù)集或大數(shù)據(jù)集進(jìn)行訓(xùn)練,但大數(shù)據(jù)集可以最大限度地提高訓(xùn)練算法的內(nèi)部和外部有效性,降低過(guò)度擬合的風(fēng)險(xiǎn)。正確模型的選擇通常取決于操作員的專(zhuān)業(yè)知識(shí)、數(shù)據(jù)集的性質(zhì)和最終人工智能系統(tǒng)的目的。
3 人工智能在心血管超聲的應(yīng)用
心血管成像領(lǐng)域,包括超聲心動(dòng)圖、心臟計(jì)算機(jī)斷層掃描、心臟磁共振成像和核成像,具有復(fù)雜的成像技術(shù)和高容量的成像數(shù)據(jù),處于精準(zhǔn)心臟病學(xué)革命的前沿。然而,在基于AI的臨床轉(zhuǎn)化方法中,心血管成像一直落后于腫瘤學(xué)等其他領(lǐng)域。人工智能在超聲心動(dòng)圖中的應(yīng)用包括自動(dòng)心室定量和射血分?jǐn)?shù)計(jì)算、應(yīng)變測(cè)量和瓣膜形態(tài)及功能評(píng)估以及ML在心臟疾病自動(dòng)診斷中的應(yīng)用。
3.1 心室定量和EF自動(dòng)化。
自動(dòng)心室量化和EF計(jì)算的算法旨在提供準(zhǔn)確、快速和可重復(fù)的心尖視圖分類(lèi)、解剖標(biāo)志檢測(cè)、心室壁分割和心內(nèi)膜跟蹤。有研究[6]比較了AI軟件自動(dòng)測(cè)量(AutoEF)和手工追蹤雙平面Simpson法測(cè)量左室EF的準(zhǔn)確性,并與心臟MRI進(jìn)行了比較。結(jié)果表明AutoEF與手動(dòng)雙平面Simpson法測(cè)得的EF相關(guān)性較好,且與MRI相關(guān)性良好,但AutoEF低估了左室舒張末期容積(EDV)和收縮期末期容積(ESV)。此外,在不同切面,測(cè)量的準(zhǔn)確性存在差異,以胸骨旁長(zhǎng)軸切面的準(zhǔn)確性最高,達(dá)96%,而在心尖切面時(shí)整體精度降低(84%)。腔室定量和左室EF測(cè)量的中位數(shù)絕對(duì)偏差在15%~17%,其中ESV的絕對(duì)偏差最小;左房容積和左室EDV被高估。
3.2 心肌運(yùn)動(dòng)和應(yīng)變測(cè)量。
Kusunose等[7]研究發(fā)現(xiàn)與傳統(tǒng)二維超聲心動(dòng)圖相比,利用深度卷積神經(jīng)網(wǎng)絡(luò)可更好的檢測(cè)區(qū)域壁運(yùn)動(dòng)異常并區(qū)分冠狀動(dòng)脈梗死區(qū)域。Cikes等[8]利用復(fù)雜超聲心動(dòng)圖數(shù)據(jù)(整個(gè)心動(dòng)周期的左室容積和變形數(shù)據(jù),而不是單個(gè)數(shù)據(jù)點(diǎn))和臨床參數(shù)的ML算法識(shí)別心衰并對(duì)心臟再同步化治療的反應(yīng)進(jìn)行評(píng)估,證實(shí)通過(guò)整合臨床參數(shù)和全心周期成像數(shù)據(jù),無(wú)監(jiān)督的ML可以為表型異質(zhì)性心力衰竭隊(duì)列提供一個(gè)有臨床意義的分類(lèi),并可能有助于優(yōu)化特定治療的反應(yīng)率。另有研究證實(shí)[9-10],ML算法有助于區(qū)分縮窄性心包炎、限制性心肌病以及肥厚性心肌的重塑。Zhang等[11]采用AI軟件和手工勾畫(huà)對(duì)左室心肌的縱向應(yīng)變進(jìn)行了比較研究。發(fā)現(xiàn)AI自動(dòng)測(cè)量的心肌全局縱向應(yīng)變與手動(dòng)應(yīng)變變化最小(絕對(duì)值為1.4%~1.6%)。
3.3 心臟瓣膜評(píng)估。
有學(xué)者[12]采用AI軟件對(duì)二尖瓣幾何形狀進(jìn)行測(cè)量,測(cè)量參數(shù)包括二尖瓣環(huán)面積、瓣環(huán)高度和寬度、瓣葉連合間距、前后葉長(zhǎng)度等。發(fā)現(xiàn)相對(duì)于常規(guī)超聲心動(dòng)圖,所有評(píng)估的成像參數(shù)均獲得了更好的觀察者間一致性,而且所花費(fèi)的時(shí)間明顯較少。Prihadi等[13]研究證實(shí),經(jīng)食管超聲心動(dòng)圖AI軟件能夠精確地對(duì)主動(dòng)脈瓣結(jié)構(gòu)以及冠狀動(dòng)脈開(kāi)口進(jìn)行測(cè)量和定位,且與多層螺旋CT的測(cè)量結(jié)果具有良好的相關(guān)性。
4 展望
在海量醫(yī)學(xué)信息和影像數(shù)字化日益積累的現(xiàn)代醫(yī)學(xué)時(shí)代,AI和ML為疾病診斷和風(fēng)險(xiǎn)預(yù)測(cè)等問(wèn)題提供了新的解決方案。通過(guò)AI對(duì)超聲心動(dòng)圖數(shù)據(jù)進(jìn)行預(yù)測(cè)、建模和精確分析,可以幫助超聲醫(yī)師快速、準(zhǔn)確地處理大量心臟超聲影像學(xué)數(shù)據(jù),既有利于應(yīng)對(duì)當(dāng)前醫(yī)療信息數(shù)量的急劇增長(zhǎng),又有利于提高處理數(shù)據(jù)信息的能力。未來(lái),針對(duì)AI的研究應(yīng)關(guān)注超聲圖像數(shù)據(jù)特征定義及其提取方法的標(biāo)準(zhǔn)化,以確保可推廣性和可再現(xiàn)性,促進(jìn)AI向更加個(gè)性化的醫(yī)療模式轉(zhuǎn)變。此外,AI系統(tǒng)與遠(yuǎn)程醫(yī)療等軟件的集成,將使智能心臟超聲診斷系統(tǒng)滲透到資源消耗負(fù)擔(dān)最繁重的地區(qū),提高經(jīng)濟(jì)效益。
參考文獻(xiàn)
[1]Oikonomou EK,Siddique M,Antoniades C.Artificial intelligence in medical imaging:A radiomic guide to precision phenotyping of cardiovascular disease[J].Cardiovasc Res,2020,Feb 24;cvaa021.
[2]Dey D,Slomka PJ,Leeson P,et al.Artificial Intelligence in Cardiovascular Imaging:JACC State-of-the-Art Review[J].J Am Coll Cardiol,2019,73(11):1317-1335.
[3]Tran BX,Latkin CA,Vu GT,et al.The Current Research Landscape of the Application of Artificial Intelligence in Managing Cerebrovascular and Heart Diseases:A Bibliometric and Content Analysis[J].Int J Environ Res Public Health,2019,16(15):2699.
[4]Gandhi S,Mosleh W,Shen J,et al.Automation,machine learning,and artificial intelligence in echocardiography:A brave new world[J].Echocardiography,2018,35(9):1402-1418.
[5]Alsharqi M,Woodward WJ,Mumith JA,et al.Artificial intelligence and echocardiography[J].Echo Res Pract,2018,5(4):R115-R125.
[6]Xu B,KocyigitD,Grimm R,et al.Applications of artificial intelligence in multimodality cardiovascular imaging:A state-of-theart review[J].Prog Cardiovasc Dis,2020,19;S0033-0620(20)30060-8.
[7]Kusunose K,Abe T,Haga A,et al.A Deep Learning Approach for Assessment of Regional Wall Motion Abnormality From Echocardiographic Images[J].JACC Cardiovasc Imaging,2020,13(2 Pt 1):374-381.
[8]Cikes M,Sanchez-Martinez S,Claggett B,et al.Machine learningbased phenogrouping in heart failure to identify responders to cardiac resynchronization therapy[J].Eur J Heart Fail,2019,21(1):74-85.
[9]Narula S,Shameer K,Salem Omar AM,et al.Machine-Learning Algorithms to Automate Morphological and Functional Assessments in 2D Echocardiography[J].J Am Coll Cardiol,2016,68(21):2287-2295.
[10]Sengupta PP,Huang YM,Bansal M,et al.Cognitive machine-learning algorithm for cardiac imaging:a pilot study for differentiating constrictive pericarditis from restrictive cardiomyopathy[J].Circ Cardiovasc Imaging 2016,9(6):e004330.
[11]Zhang J,Gajjala S,Agrawal P,et al.Fully automated echocardiogram interpretation in clinical practice[J].Circulation,2018,138(16):1623-1635.
篇8
該如何審視越來(lái)越快速迭代的一個(gè)個(gè)熱點(diǎn)?
星瀚資本創(chuàng)始合伙人楊歌被業(yè)內(nèi)贊譽(yù)為最懂技術(shù)的投資人之一。從清華大學(xué)物理系畢業(yè)的楊歌經(jīng)歷了7次創(chuàng)業(yè),在創(chuàng)業(yè)中磨練了多方能力,會(huì)寫(xiě)代碼的同時(shí)又懂金融,善于從基礎(chǔ)理論上推演商業(yè)發(fā)展規(guī)律。
轉(zhuǎn)型投資人后,星瀚資本的成績(jī)單上有了鯤云科技這樣明星級(jí)的人工智能芯片企業(yè)、國(guó)內(nèi)領(lǐng)先的農(nóng)業(yè)規(guī)劃種植平臺(tái)企業(yè)甲加由,以及不久前與豆瓣音樂(lè)完成合并的流媒體原創(chuàng)音樂(lè)平臺(tái)V.Fine等明星項(xiàng)目。
面對(duì)市場(chǎng)熱點(diǎn)不斷地快速切換,楊歌認(rèn)為要從底層邏輯來(lái)冷靜審視,方能不錯(cuò)失真正的價(jià)值,不盲目追逐資本泡沫。
一、AI大浪潮是一條上揚(yáng)價(jià)值線
“AI是個(gè)大浪潮,跟互聯(lián)網(wǎng)是一個(gè)級(jí)別的大趨勢(shì)。虛擬現(xiàn)實(shí)、智能硬件、機(jī)器人屬于其二級(jí)子行業(yè)。這個(gè)大賽道的發(fā)展一定會(huì)是長(zhǎng)期可持續(xù)發(fā)展的。”
楊歌認(rèn)為,不能把AI簡(jiǎn)單的等同于區(qū)塊鏈、小程序或是共享單車(chē)這樣的行業(yè)熱點(diǎn)來(lái)放在一起看待。相對(duì)于其他熱點(diǎn),AI是真正意義上繼互聯(lián)網(wǎng)之后的一個(gè)大趨勢(shì),其影響的領(lǐng)域?qū)訉訚B透,就如互聯(lián)網(wǎng)對(duì)信息、游戲、購(gòu)物、出行等領(lǐng)域的改造一樣,這是一個(gè)長(zhǎng)期昂揚(yáng)向上的價(jià)值增長(zhǎng)趨勢(shì)。
而去年的圖像識(shí)別、語(yǔ)音識(shí)別,包括自動(dòng)駕駛等等都是圍繞AI價(jià)值增長(zhǎng)曲線波動(dòng)的一個(gè)個(gè)熱點(diǎn)。自動(dòng)駕駛雖然很火,但還需要在數(shù)據(jù)、場(chǎng)景上完成優(yōu)化并找到更優(yōu)解決方案,才能在市場(chǎng)中應(yīng)用,圖像識(shí)別、語(yǔ)音識(shí)別則在商業(yè)化應(yīng)用的初級(jí)階段,還并未找到真正突破的應(yīng)用爆發(fā)場(chǎng)景。
今年,AI似乎被區(qū)塊鏈、小程序等熱點(diǎn)搶了風(fēng)頭,主要源自于大眾對(duì)AI的認(rèn)知還需進(jìn)一步深化,在AI方向有所布局的企業(yè)預(yù)期AI的話題性和功能性能為其產(chǎn)生價(jià)值。結(jié)果實(shí)際應(yīng)用落地并沒(méi)有市場(chǎng)期待的那么快。
“AI是你拿任何一個(gè)既成的模塊都沒(méi)法直接用的,需要根據(jù)場(chǎng)景一個(gè)個(gè)算法去運(yùn)算,CNN、遺傳算法、LSTM、優(yōu)化算法等你可能都要試一遍,再進(jìn)行算法簡(jiǎn)化、調(diào)優(yōu),才能有一點(diǎn)點(diǎn)效果。這個(gè)周期非常長(zhǎng),不像互聯(lián)網(wǎng)網(wǎng)站的建設(shè),無(wú)論是旅游的還是賣(mài)東西的,都是前端、后端的框架搭建起來(lái)就能看到效果。”
二、不要盲目低估AI的復(fù)雜性
楊歌認(rèn)為,目前市場(chǎng)對(duì)AI的認(rèn)知相對(duì)簡(jiǎn)單化了,好像自動(dòng)駕駛的實(shí)現(xiàn)指日可待,期待指數(shù)過(guò)高。而實(shí)際上AI的算法變化、搭建框架、落地方向等都是非常難的。
“我認(rèn)為人工智能目前所需要解決的難點(diǎn)有以下幾點(diǎn):第一點(diǎn)是算法的變化特別快,組合越來(lái)越復(fù)雜。神經(jīng)網(wǎng)絡(luò)之后有對(duì)抗神經(jīng)網(wǎng)絡(luò),基于神經(jīng)元的卷積神經(jīng)網(wǎng)絡(luò)之后又提出了最新的膠囊神經(jīng)網(wǎng)絡(luò)(CapsNets),不斷有新的算法產(chǎn)生,有些算法甚至連TensorFlow(谷歌第二代AI學(xué)習(xí)系統(tǒng))都不支持。
第二個(gè)問(wèn)題是人工智能與商業(yè)需要強(qiáng)耦合性。即必須要非常深度地了解關(guān)于算法的特性,同時(shí)還要了解商業(yè)場(chǎng)景,只有把對(duì)商業(yè)場(chǎng)景的理解轉(zhuǎn)成算法語(yǔ)言,才能實(shí)現(xiàn)。而這并不是找到一個(gè)算法工程師就可以實(shí)現(xiàn)的簡(jiǎn)單過(guò)程。
例如,用CNN來(lái)做人臉識(shí)別、圖像識(shí)別有效,但對(duì)自然語(yǔ)義理解就未必,實(shí)際自然語(yǔ)言理解中有很多上下文遠(yuǎn)距離相關(guān)的信息,需要LSTM來(lái)訓(xùn)練就更有效。”
三、AI距離C端應(yīng)用還很遠(yuǎn),TO B的商業(yè)化才剛剛開(kāi)始
鑒于AI本身的復(fù)雜性,楊歌認(rèn)為AI正在處在摸索成長(zhǎng)期,底層技術(shù)基本上已經(jīng)成熟,但是商業(yè)化過(guò)程還不是非常明確。
“五年之內(nèi),我認(rèn)為AI的爆發(fā)點(diǎn)是在To B的應(yīng)用上,就是基礎(chǔ)層結(jié)構(gòu)化數(shù)據(jù)的優(yōu)化處理。”
楊歌將AI分層三層結(jié)構(gòu):底層是算法、芯片等;中間層是圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)義的識(shí)別、運(yùn)動(dòng)機(jī)能識(shí)別等;最上面的應(yīng)用層則涵蓋了自動(dòng)駕駛、機(jī)器人、智能音箱、量化金融、AI教育等等。
目前,應(yīng)用最廣泛的圖像識(shí)別、語(yǔ)音識(shí)別公司如科大訊飛、商湯科技、曠視科技、思必馳等業(yè)內(nèi)領(lǐng)先企業(yè),楊歌認(rèn)為這些公司研發(fā)的中間層模塊,很難獨(dú)立形成商業(yè)場(chǎng)景,必須和應(yīng)用層結(jié)合才可以。
據(jù)了解,目前這些公司在車(chē)載、音箱、安防、翻譯機(jī)等方面進(jìn)行了初步的商業(yè)化落地嘗試。例如,智能音箱大多只能實(shí)現(xiàn)簡(jiǎn)單的對(duì)話和語(yǔ)音識(shí)別調(diào)用,遠(yuǎn)未達(dá)到無(wú)障礙的人機(jī)交互程度。
“這些場(chǎng)景的入口模塊都需要完整的、完全標(biāo)準(zhǔn)的算法模塊層,中間模塊層,就是說(shuō)語(yǔ)音識(shí)別、語(yǔ)義識(shí)別都需要非常精準(zhǔn),無(wú)論是器械,還是一個(gè)機(jī)器人,都需要中間算法模塊層要非常成熟,同時(shí)需要底層芯片層也需要很成熟。
我預(yù)計(jì)大概五年之內(nèi),中間的模塊層就能基本上成熟,在這個(gè)層面上一旦技術(shù)成熟,就會(huì)促成應(yīng)用層的大爆發(fā)。應(yīng)用層首先爆發(fā)的就是機(jī)器人,工業(yè)機(jī)器人會(huì)形成大范圍的改造,家用機(jī)器人會(huì)高度的智能機(jī)械化。”
楊歌認(rèn)為,AI的使用最重要的在于兩點(diǎn),一方面是要有成熟的海量數(shù)據(jù),另一方面是要對(duì)場(chǎng)景問(wèn)題進(jìn)行精準(zhǔn)的模型化設(shè)計(jì)。
智能駕駛雖然具備明確的使用場(chǎng)景,但場(chǎng)景模型化的算法方案卻很復(fù)雜,另外也不具備已成型的可供訓(xùn)練數(shù)據(jù)集,需要模擬真實(shí)場(chǎng)景長(zhǎng)期積累數(shù)據(jù),目前在上述的兩個(gè)必要方面都不具備優(yōu)勢(shì)。
“在未來(lái)的幾年中,AI勢(shì)必會(huì)爆發(fā)在量化金融、物流倉(cāng)儲(chǔ)大數(shù)據(jù)、有數(shù)據(jù)積累和標(biāo)準(zhǔn)的傳統(tǒng)產(chǎn)業(yè)升級(jí)、以及機(jī)器人運(yùn)動(dòng)行為學(xué)習(xí)等方向中。”楊歌稱(chēng),對(duì)于數(shù)據(jù)積累成熟,模型化場(chǎng)景清晰明確的行業(yè),人工智能將會(huì)帶來(lái)更多創(chuàng)新性的顛覆,這也是星瀚資本投資的主要方向之一。
“量化金融方向已經(jīng)在爆發(fā)前夕,就差臨門(mén)一腳。但這個(gè)行業(yè)大型公司主要在國(guó)外,中國(guó)在做量化金融的公司還有待壯大。”
四、如何正確看待小程序熱點(diǎn)?
隨著騰訊對(duì)小程序的開(kāi)放進(jìn)程加快,小程序近期形成了一個(gè)市場(chǎng)熱點(diǎn),多家依托小程序生態(tài)的創(chuàng)業(yè)公司都先后拿到了融資。
但楊歌認(rèn)為,小程序只是微信生態(tài)的一個(gè)小模塊,很難像互聯(lián)網(wǎng)一樣孕育百億級(jí)別的商業(yè)模式,也很難形成一個(gè)大風(fēng)口。
“小程序是微信縮短流量分發(fā)步驟的嘗試。從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的經(jīng)驗(yàn)都是,只要縮短了流量分發(fā)的中間步驟,就會(huì)帶來(lái)流量的紅利爆發(fā)。典型是微信支付對(duì)支付寶的超越,微信支付之所以后進(jìn)入,但快速爆發(fā)超越支付寶,就在于微信支付無(wú)需跳出微信就可以直接使用,縮短了用戶(hù)使用的路徑,省去了切換的步驟。
但實(shí)際上,用戶(hù)對(duì)這種通過(guò)縮短使用路徑獲取流量的邏輯已經(jīng)有些疲勞了。今天很難說(shuō)在微信中下拉菜單找到一個(gè)小程序定外賣(mài)與直接打開(kāi)外賣(mài)軟件,哪個(gè)讓用戶(hù)覺(jué)得更方便。”
楊歌認(rèn)為,舊日那套通過(guò)縮減用戶(hù)使用步驟就能獲取流量紅利贏得商業(yè)變現(xiàn)的邏輯已經(jīng)達(dá)到頂峰,互聯(lián)網(wǎng)已在一個(gè)潮流褪去的通道里,區(qū)塊鏈可能是互聯(lián)網(wǎng)后半程最后的一次小浪潮。但目前市場(chǎng)上運(yùn)用區(qū)塊鏈的投機(jī)行為過(guò)多,真正的商業(yè)價(jià)值還未展現(xiàn)。區(qū)塊鏈也將成為AI爆發(fā)前的基礎(chǔ),承前啟后。
五、無(wú)人店的商業(yè)形態(tài)需要打造合理的成本模型
無(wú)人貨架、無(wú)人便利店風(fēng)風(fēng)火火熱鬧了一年,但隨著行業(yè)內(nèi)得到資本助力的幾家企業(yè)相繼爆出裁員、業(yè)務(wù)縮水等負(fù)面消息,市場(chǎng)似乎對(duì)無(wú)人零售這種商業(yè)形態(tài)陷入了一種迷茫,很難看清其真實(shí)價(jià)值。
楊歌觀察了一年則明確表示無(wú)人店的商業(yè)形態(tài)需要打造更為合理的成本模型,其邏輯有兩點(diǎn):
第一, 楊歌認(rèn)為末端最后一公里的配送和分揀成本太高,太復(fù)雜,還是完全依賴(lài)人力。目前市場(chǎng)上幾乎很難看到在這一塊做到成本可以覆蓋的團(tuán)隊(duì)。
篇9
Master的“過(guò)人之處”
2016年年末,圍棋界對(duì)阿爾法狗留下的心理陰影正在消散,這不單是因?yàn)樵诰€圍棋網(wǎng)站上冒出了更多AI棋手―如日本的DEEPZEN、中國(guó)的“絕藝”――更重要的是,人類(lèi)棋手在與之較量時(shí)互有勝負(fù)。特別是當(dāng)中國(guó)第一高手柯潔曾完勝“絕藝”的升級(jí)版“刑天”(被認(rèn)為棋力相當(dāng)于阿爾法狗)一局并宣稱(chēng)可以找到AI漏洞后,人類(lèi)棋手歡欣鼓舞。
可是,Master就是在這樣的背景下登場(chǎng)并毫無(wú)懸念地收割勝利的。賽后,棋圣聶衛(wèi)平感喟“我們無(wú)法像電腦那樣從不犯錯(cuò)”,而柯潔則連連慨嘆,“人類(lèi)數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化,計(jì)算機(jī)卻告訴我們?nèi)际清e(cuò)的……”那么,Master究竟強(qiáng)在哪里呢?阿爾法狗研發(fā)團(tuán)隊(duì)的黃士杰博士表示,其“過(guò)人之處”即在于背靠多組超級(jí)計(jì)算機(jī)組成的卷積神經(jīng)網(wǎng)絡(luò),這使得Master不僅具備類(lèi)似人腦的“策略網(wǎng)絡(luò)”(選擇某一手棋的最優(yōu)下法),更擁有人類(lèi)難以企及的“價(jià)值網(wǎng)絡(luò)”(判斷每一步靜態(tài)棋局的精準(zhǔn)勝率)。與此同時(shí),Master還可以通過(guò)每天自我對(duì)弈數(shù)十萬(wàn)局來(lái)增長(zhǎng)棋力――人類(lèi)棋手一年最多下1000局。由此,Master得以拋開(kāi)事倍功半的窮舉分析,并以閃電般的高效應(yīng)對(duì)使人類(lèi)棋手難以招架。
電腦將“學(xué)會(huì)”文化創(chuàng)意
對(duì)計(jì)算機(jī)而言,一切任務(wù)都是邏輯運(yùn)算,而算法和算力是提升效率的主要指標(biāo)。優(yōu)化算法可以更輕易地解決問(wèn)題,提升算力則能在單位時(shí)間內(nèi)獲得更多成果。當(dāng)一項(xiàng)活動(dòng)具備邏輯運(yùn)行特征時(shí),即可交由計(jì)算機(jī)執(zhí)行;其中的變化規(guī)則越多地被掌握,計(jì)算機(jī)越是容易立于不敗之地。國(guó)際象棋就是一個(gè)例子,由于棋路變化相對(duì)簡(jiǎn)單,今天安裝在手機(jī)上的對(duì)弈程序都已經(jīng)有了國(guó)際特級(jí)大師的棋力。專(zhuān)業(yè)級(jí)弈棋程序(如Rybka)幾乎已經(jīng)算盡棋路,在與人類(lèi)棋手對(duì)決時(shí)穩(wěn)居上風(fēng)。
常人的直覺(jué)是,計(jì)算方面輸給電腦是正常的,文化創(chuàng)意方面人類(lèi)則是永遠(yuǎn)的贏家。而事實(shí)上,文藝創(chuàng)作活動(dòng)也可以通過(guò)算法轉(zhuǎn)化為邏輯運(yùn)算。著名科幻作家劉慈欣就曾開(kāi)發(fā)過(guò)一款寫(xiě)詩(shī)軟件,設(shè)定創(chuàng)作一首三行詩(shī),韻腳為a,按下“生成”就跳出結(jié)果:“伏特加,請(qǐng)霧化吧!懸崖,請(qǐng)磁化吧!我們都是嘩嘩啦啦的籌碼,我們要掙扎!”而如果在這一領(lǐng)域樹(shù)立一尊“圣杯”,那無(wú)疑是嘗試創(chuàng)造博爾赫斯筆下的“通天塔圖書(shū)館”。這座由小說(shuō)家臆想出來(lái)的圖書(shū)館中,收藏著以不同字符、數(shù)字、標(biāo)點(diǎn)符號(hào)組合而成的所有文本――既包括我們讀過(guò)的書(shū),也包括消逝在歷史塵埃中的書(shū),更包括尚未被寫(xiě)出的書(shū)……計(jì)算機(jī)通過(guò)羅列全部組合的方式來(lái)締造這個(gè)圖書(shū)館,不斷優(yōu)化的算法會(huì)通過(guò)剔除大量無(wú)意義結(jié)果來(lái)為算力減壓。
當(dāng)代的計(jì)算機(jī)尚無(wú)法構(gòu)建這個(gè)圖書(shū)館,正如它們還無(wú)法窮盡圍棋套路的變化那樣。但處理器性能是以指數(shù)級(jí)速度發(fā)展的,1946年人類(lèi)第一臺(tái)電子計(jì)算機(jī)“埃尼阿克”的算力在今天連手持計(jì)算器都不如,我們又怎能設(shè)想一個(gè)世紀(jì)后的電腦將強(qiáng)大到何種程度呢?可以確定的是,一旦計(jì)算機(jī)可以“創(chuàng)作”,那么它也必然會(huì)攻克音樂(lè)、繪畫(huà)等人文藝術(shù)領(lǐng)域,人類(lèi)靈感創(chuàng)意的專(zhuān)屬領(lǐng)地將遭遇機(jī)器邏輯的入侵。
與AI共生的未來(lái)
AI(人工智能)有強(qiáng)、弱之分。弱人工智能只擅長(zhǎng)某個(gè)特定領(lǐng)域,比如駕駛、裝配或掃地吸塵。阿爾法狗亦屬于此,但它的本質(zhì)是一種深度學(xué)習(xí)引擎,而不是只會(huì)下圍棋。按照谷歌公司的藍(lán)圖,它將被運(yùn)用在協(xié)助判斷早期病癥等領(lǐng)域。強(qiáng)人工智能將擁有類(lèi)似人類(lèi)的語(yǔ)言、情感以及思維能力,它們?cè)诤芏喾矫鏁?huì)超越人類(lèi)本身,因此研發(fā)的意義不是為解決某種具體問(wèn)題,而是用它們來(lái)開(kāi)創(chuàng)出更多視界。
篇10
關(guān)鍵詞: 邊緣檢測(cè); 脈沖噪聲; 均值梯度; 非極大值抑制
中圖分類(lèi)號(hào): TN91919?34; TP391.41 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)06?0119?03
Mean gradient based edge detection algorithm for image with impulse noise
SHEN De?hai, HOU Jian, E Xu, ZHANG Long?chang
(College of Information Science and Technology, Bohai University, Jinzhou 121013, China)
Abstract: In order to detect the edge of image polluted by impulse noise, an image edge detection algorithm based on mean gradient is proposed. The algorithm divided the detection window into up, down, left and right areas according to the horizontal and vertical directions, which calculates the average gray value of non noise pixels in every area first, and then calculates the image gradient according to the mean difference of these values to get the gradient image. Finally, the improve non?maximum suppression method is adopted to refine the gradient image and extract the image edge. The experiment results show that the algorithm can detect the edge of image polluted by higher density impulse noise, and the edge is thinning, and the effect of the algorithm is better than the traditional Sobel algorithm.
Keywords: edge detection; impulse noise; mean gradient; non?maximum suppression
0 引 言
邊緣是圖像中目標(biāo)與背景的分界線,灰度值變化最為顯著。圖像邊緣是圖像的最基本特征之一,包含了許多重要的信息,是圖像識(shí)別、圖像分割和圖像理解的重要依據(jù)[1]。邊緣檢測(cè)就是將圖像不同區(qū)域的邊界進(jìn)行確定并提取出來(lái),其效果直接影響后續(xù)圖像處理的精度和性能。由于數(shù)字圖像在獲取和傳輸過(guò)程中可能受到各種因素的影響而產(chǎn)生噪聲,進(jìn)而影響到圖像邊緣檢測(cè)的效果,直接影響到圖像的后續(xù)處理工作。因此,在檢測(cè)圖像邊緣的同時(shí)如何有效地抑制噪聲一直是圖像處理領(lǐng)域研究的熱點(diǎn)之一。傳統(tǒng)的邊緣檢測(cè)算法如Roberts算子[2]、Sobel算子[3]、Prewitt算子[4]、LoG算子[5]、Canny算子[6]及Kirsch算子等,它們主要是基于圖像強(qiáng)度的一階或二階導(dǎo)數(shù)的計(jì)算,算法簡(jiǎn)單,但對(duì)噪聲比較敏感。近年來(lái),一些基于新理論的算法被提了出來(lái),如數(shù)學(xué)形態(tài)學(xué)算法[7]、小波算法[8]、神經(jīng)網(wǎng)絡(luò)算法[9]及遺傳算法[10]等,這些邊緣檢測(cè)算法在噪聲抑制性能上有了一定的提高,但也各自的存在著算法復(fù)雜、普適性差及實(shí)時(shí)性差等問(wèn)題。本文借鑒傳統(tǒng)邊緣檢測(cè)算法的梯度計(jì)算原理,提出了一種基于均值梯度的邊緣檢測(cè)算法,并采用改進(jìn)的非極大值抑制方法對(duì)梯度圖像進(jìn)行細(xì)化,算法對(duì)不同程度污染的脈沖噪聲干擾圖像具有良好的抑噪性能,并能較好地檢測(cè)出圖像的邊緣。
1 基于梯度的邊緣檢測(cè)原理
傳統(tǒng)邊緣檢測(cè)算法都是基于梯度算子的,梯度算子就是一階導(dǎo)數(shù)算子。圖像的邊緣具有方向和幅度兩個(gè)基本屬性,沿著邊緣方向,像素灰度值變化平緩,而沿著垂直邊緣的方向,像素灰度值變化劇烈,在此方向上,像素點(diǎn)的一階導(dǎo)數(shù)具有最大值。當(dāng)圖像噪聲污染較小時(shí),梯度算子檢測(cè)的圖像邊緣效果良好。設(shè)f(x,y) 為連續(xù)數(shù)字圖像函數(shù),則其梯度可以表示為如下的一個(gè)矢量。
[?fx,y=Gx GyT=?f?x ?f?yT] (1)
式中:Gx和Gy分別為x和y的一階導(dǎo)數(shù),表示點(diǎn)(x,y)水平和垂直方向的梯度,其梯度幅值和方向分別可以通過(guò)式(2)和式(3)來(lái)計(jì)算。
[?fx,y=Gx2+Gy212=?f2?x+?f2?y12] (2)
[?x,y=arctanGxGy=arctan?f?x?f?y] (3)
為了使計(jì)算簡(jiǎn)潔,常采用近似梯度幅值的計(jì)算方法,如式(4)所示。[?fx,y=maxfx′,fy′或?fx,y=fx′+fy′] (4)
式中[fx′=fx+1,y-fx,y,f′y=fx,y+1-fx,y]。
一階導(dǎo)數(shù)Gx和Gy需要針對(duì)圖像中每個(gè)像素的位置計(jì)算,實(shí)際中經(jīng)常采用小窗口具有權(quán)值的模板與圖像進(jìn)行卷積近似求得。Gx和Gy分別使用一個(gè)模板,它們的組合便是一個(gè)梯度算子。傳統(tǒng)的梯度算子有Roberts算子、Sobel算子和Prewitt算子等,它們的大小和權(quán)值都不盡相同,如圖1所示。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\07T1.tif>
圖1 幾種梯度算子模板
傳統(tǒng)的基于梯度算子邊緣檢測(cè)算法利用算子模板與圖像做卷積運(yùn)算,將最大值輸出得到梯度圖像,然后再設(shè)定門(mén)限值TH,將大于等于TH的點(diǎn)視為圖像邊緣。梯度算子由于采用相鄰像素灰度差計(jì)算梯度,對(duì)噪聲較為敏感,當(dāng)圖像受噪聲影響較為嚴(yán)重時(shí),檢測(cè)出的邊緣圖像包括許多的噪聲邊緣,使得后續(xù)處理無(wú)法進(jìn)行。
2 本文算法
針對(duì)傳統(tǒng)算法在邊緣檢測(cè)時(shí)對(duì)噪聲敏感問(wèn)題,提出了一種基于均值梯度的邊緣檢測(cè)算法,算法采用5×5檢測(cè)窗口,將窗口按照水平方向和垂直方向分為4個(gè)區(qū)域,按照區(qū)域非噪聲點(diǎn)的均值差計(jì)算窗口中心點(diǎn)的梯度,求得梯度圖像,然后采用改進(jìn)的非極大值抑制方法對(duì)梯度圖像進(jìn)行細(xì)化,實(shí)驗(yàn)證明,算法對(duì)脈沖噪聲抑制能力較強(qiáng),邊緣細(xì)化效果較好,算法原理如下。
2.1 抑噪原理
圖像受脈沖噪聲干擾,主要表現(xiàn)為受污染點(diǎn)像素值發(fā)生突變,遠(yuǎn)大于或遠(yuǎn)小于周?chē)O袼攸c(diǎn),使得其與邊緣點(diǎn)一樣具有較大的梯度值,因此采用梯度算子進(jìn)行邊緣檢測(cè),將會(huì)使噪聲邊緣同真實(shí)邊緣一樣被檢測(cè)出來(lái)。本文算法在進(jìn)行邊緣檢測(cè)時(shí),針對(duì)脈沖噪聲的特點(diǎn),采用閾值法先將檢測(cè)窗口中噪聲點(diǎn)檢測(cè)出來(lái),判斷噪聲點(diǎn)按照式(5)方法進(jìn)行。然后通過(guò)非噪聲點(diǎn)計(jì)算圖像梯度,不僅消除了噪聲點(diǎn)的邊緣,也消除了噪聲對(duì)圖像梯度計(jì)算的影響。
[fx,y=0, 0+δ≤fx,y≤255-δfx,y,others ] (5)
式(5)是對(duì)檢測(cè)窗口對(duì)噪聲點(diǎn)進(jìn)行判斷,由于脈沖噪聲點(diǎn)像素值接近0或255,因此引用了調(diào)解因子δ,δ的范圍可根據(jù)具體圖像來(lái)調(diào)解。式(5)表明,如果檢測(cè)窗口內(nèi)像素點(diǎn)為脈沖噪聲點(diǎn),則將噪聲點(diǎn)置為零,否則保持原值不變。
2.2 分區(qū)均值計(jì)算梯度
算法采用分區(qū)均值計(jì)算圖像梯度,將5×5檢測(cè)窗口按照水平方向和垂直方向分為4個(gè)區(qū)域,如圖2所示。每個(gè)區(qū)域大小一樣,均為長(zhǎng)方形,分布在中心點(diǎn)邊緣方向的上下或左右。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\07T2.tif>
圖2 檢測(cè)窗口四個(gè)分區(qū)
圖2中的(a)是檢測(cè)窗口沿中心點(diǎn)水平方向的上下兩個(gè)區(qū)域,用來(lái)計(jì)算中心點(diǎn)對(duì)應(yīng)像素的垂直方向梯度;(b)是檢測(cè)窗口沿中心點(diǎn)垂直方向的左右兩個(gè)區(qū)域,用來(lái)計(jì)算中心點(diǎn)對(duì)應(yīng)像素的垂直方向梯度,(x,y)為窗口中心點(diǎn)坐標(biāo),各區(qū)域內(nèi)的灰色圓圈表示落在窗口區(qū)域內(nèi)圖像的像素點(diǎn)。算法水平方向梯度和垂直方向梯度的計(jì)算如式(6)和式(7)所示。
[?fxx,y=1βavgAux,y-avgAdx,y] (6)
[?fyx,y=1βavgAlx,y-avgArx,y] (7)
式(6)表示采用中心點(diǎn)的上下兩個(gè)區(qū)域內(nèi)的非噪聲像素平均值之差計(jì)算水平方向梯度,式(7)表示采用中心點(diǎn)的左右兩個(gè)區(qū)域內(nèi)的非噪聲像素平均值之差計(jì)算垂直方向梯度,根據(jù)前面所述,區(qū)域內(nèi)的噪聲點(diǎn)像素值均被賦0值,在計(jì)算區(qū)域均值時(shí),不參與計(jì)算。式中的β為衰減因子,主要是防止梯度值的溢出,算法中取值為10。由于區(qū)域均值的計(jì)算去除了脈沖噪聲的干擾,采用區(qū)域均值充分利用了鄰域相關(guān)性原理,如果方向區(qū)域?yàn)檫吘壏较颍瑒t該區(qū)域內(nèi)的像素灰度值變化平緩,雖然缺少了一些像素點(diǎn)對(duì)區(qū)域均值的影響較小,利用均值差分可以較準(zhǔn)確的表示邊緣梯度。最后將兩個(gè)方向梯度值的最大值作為輸出,即得到梯度圖像G,如式(8)所示。
[Gx,y=maxΔfxx,y,Δfyx,y] (8)
2.3 梯度邊緣細(xì)化及提取
圖像邊緣的細(xì)化是指在保持原圖像邊緣輪廓不變的情況下,盡可能地提取出單像素寬的骨架的過(guò)程。細(xì)化過(guò)程是數(shù)字圖像處理中的一個(gè)重要處理步驟,其效果直接影響圖像后續(xù)的相關(guān)處理。由于梯度圖像是通過(guò)一階微分或近似方法計(jì)算得出的,其邊緣較粗,為了只保留邊緣處梯度幅值局部變化最大的點(diǎn),常采用非極大值抑制方法來(lái)細(xì)化邊緣。所謂非極大值抑制過(guò)程,就是沿著圖像邊緣的梯度方向進(jìn)行檢測(cè),將檢測(cè)方向上不具備局部極大值的像素值置為0,否則保持原像素值。
經(jīng)過(guò)非極大值抑制方法處理后的梯度圖像,邊緣得到了細(xì)化,但也會(huì)產(chǎn)生新的非邊緣點(diǎn)或丟失一些邊緣點(diǎn),不適合后續(xù)處理的要求。本文采用改進(jìn)的非極大值抑制算法,如式(9)所示。算法采用3×3窗口,從水平和垂直兩個(gè)方向?qū)μ荻葓D像G進(jìn)行非極大值處理,G′為處理后的梯度圖像。
[G'(x,y)=G(x,y), if(G(x,y)≥γ.max(G(x-1,y),G(x+1,y))) 或if(G(x,y)≥γ.max(G(x,y-1),G(x,y+1)))0, others] (9)
式中:γ為細(xì)化度調(diào)解因子,根據(jù)γ可以根據(jù)需要調(diào)解細(xì)化強(qiáng)度。γ值減小,將減少邊緣點(diǎn)的丟失,γ值增大,額外的邊緣點(diǎn)會(huì)減少,當(dāng)然邊緣點(diǎn)的丟失和額外邊緣點(diǎn)的增加是一對(duì)矛盾,可根據(jù)需要適當(dāng)調(diào)解。經(jīng)過(guò)多次實(shí)驗(yàn)驗(yàn)證,γ值在0.98~1.02之間調(diào)整,可保證邊緣寬度較細(xì),且連續(xù)性較好。最后,選取合適閾值TH,將細(xì)化后的梯度圖像G′進(jìn)行二值化處理,得到邊緣圖像。
3 驗(yàn)證實(shí)驗(yàn)
將標(biāo)準(zhǔn)灰度圖像cell作為實(shí)驗(yàn)對(duì)象,在Matlab 實(shí)驗(yàn)平臺(tái)下進(jìn)行編程實(shí)驗(yàn)。第一次實(shí)驗(yàn)中,將cell圖像就加入密度為5%的脈沖噪聲,第二次將cell圖像加入密度為50%的脈沖噪聲,分別采用傳統(tǒng)Sobel 算法和本文算法對(duì)噪聲圖像進(jìn)行邊緣檢測(cè)試驗(yàn)。實(shí)驗(yàn)結(jié)果如圖3和圖4所示。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\07T3.tif>
圖3 較低密度噪聲圖像檢測(cè)結(jié)果
從圖3可以看出,在噪聲密度較低時(shí),傳統(tǒng)Sobel算法雖然能夠?qū)⒄嬲膱D像邊緣檢測(cè)出來(lái),但圖中同時(shí)含有許多噪聲邊緣,對(duì)于后續(xù)的工作將產(chǎn)生重大的誤差。本文算法 提取的邊緣圖像中不存在噪聲邊緣,圖像輪廓清晰,連續(xù)性較好,而且邊緣較細(xì)。從圖4可以看出,在噪聲密度達(dá)到50時(shí),傳統(tǒng)Sobel算法檢測(cè)出的邊緣圖像受噪聲影響嚴(yán)重,已經(jīng)模糊不清,幾乎用肉眼都無(wú)法識(shí)別出圖像輪廓;而本文算法依然能夠檢測(cè)出清晰的圖像邊緣,存在非常少的噪聲邊緣,同時(shí)邊緣較細(xì),連續(xù)性較好。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\07T4.tif>
圖4 較高密度噪聲圖像檢測(cè)結(jié)果
4 結(jié) 論
針對(duì)含噪圖像提出一種基于均值梯度的邊緣檢測(cè)算法,算法采用分區(qū)域均值的方法計(jì)算圖像梯度,在較好地檢測(cè)出圖像邊緣的同時(shí),對(duì)脈沖噪聲起到了良好的抑制作用。采用改進(jìn)的非極大值抑制方法使得檢測(cè)出的圖像邊緣較細(xì),而且連續(xù)性較好,具有良好的適應(yīng)性和較高的應(yīng)用價(jià)值。
參考文獻(xiàn)
[1] 鄧彩霞,王貴彬,楊鑫蕊.改進(jìn)的抗噪形態(tài)學(xué)邊緣檢測(cè)[J].數(shù)據(jù)采集與處理,2013,28(6):740?744.
[2] 趙月云,王波.基于Roberts 邊緣檢測(cè)的面向?qū)ο蠼ㄖ镄畔⑻崛J].城市勘測(cè),2012(2):120?122.
[3] 鄭英娟,張有會(huì),王志巍,等.基于八方向Sobel算子的邊緣檢測(cè)算法[J].計(jì)算機(jī)科學(xué),2013,40(11):354?356.
[4] 鄒柏賢,張然,苗軍.Prewitt圖像邊緣檢測(cè)方法的改進(jìn)[J].微電子學(xué)與計(jì)算機(jī),2013,30(5):23?26.
[5] 馬婭麗,熊淑華,黑建業(yè).一種改進(jìn)的LOG 邊緣算法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(9):6?9.
[6] 許宏科,秦嚴(yán)嚴(yán),陳會(huì)茹.一種基于改進(jìn)Canny 的邊緣檢測(cè)算法[J].紅外技術(shù),2014,36(3):210?214.
[7] 師文,朱學(xué)芳,朱光.基于形態(tài)學(xué)的MRI圖像自適應(yīng)邊緣檢測(cè)算法術(shù)[J].儀器儀表學(xué)報(bào),2013,34(2):408?413.
[8] 韓慧妍,韓燮.基于方向小波變換的邊緣檢測(cè)算法[J].微電子學(xué)與計(jì)算機(jī),2007,29(7):55?57.