人像識別在安全生產中的應用

時間:2022-12-25 03:01:00

導語:人像識別在安全生產中的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

人像識別在安全生產中的應用

1系統體系結構

整個安全管控系統分為五個部分:視頻數據采集、圖像分離、人像特征挖掘、人像庫建立和危險行為識別,如圖1所示。圖1安全管控系統系統體系其中視頻數據采集和圖像分離兩個階段實現了基礎數據的粗加工,視頻數據采集模塊為系統提供實時的視頻信息數據流,圖像分離實現了圖像中前景和背景的分離,為進一步進行人像的提取奠定了基礎。人像特征挖掘階段尤為重要,此時系統要將識別出來的物體運行分類定性,可以運用多種數據挖掘方法(監督的和非監督的)進行分類,也可以融入的機器自學習理論運行分類的優化。人像特征挖掘不但要進行人像識別,更重要的是要形成便于存儲、傳輸和共享的人像特征庫,便于在多通道視頻輸入環境下進行各分布式分類器同時進行處理。上述過程的完成僅僅是實現了從復雜背景圖像中提取人像的任務,接下來的任務是對生產環節中人員的著裝、佩戴的安全裝備和行為動作等關鍵的安全要素進行識別和處理。

2圖像分離

圖像分離技術包括靜態圖像分離和動態圖像分離兩個方面。靜態圖像分離可以采取的手段并不多,主要集中在圖像分割技術的討論,包括閾值分割、區域分割、邊緣分割和直方圖法。近年針對人體特征的分割技術有了一些進展,出現了MagicWand[1]、IntelligentScissors[2]、ActiveContourModel[3]、GraphCut和LevelSet[4]等一系列有代表性的算法。但是無論上述哪種算法都是基于單張圖像有限的圖元信息進行分析,局限性比較大,比如:GraphCut算法是基于圖像的顏色進行分析,如果前景和背景顏色比較接近時,就無法得到完整的人像輪庫;LevelSet算法無法處理模糊的和有噪聲干擾的圖像。本文的數據來源是連續視頻信息,可以利用多幀圖像信息的關聯性將人像從背景中準確的提取出來。提取出來的圖像沒有背景的干擾,求取出來的特征值將更具有代表性。現有的運動圖像前景提取算法包括:背景差分法、幀間差分法、光流法[5]、能量分析法和碼本法[6]等。2.1光流法真實的物體運動是在三維空間中進行的,可以用運動場來表示,而視頻錄像卻是二維平面圖像,物體的運動是通過計算各個像素點色彩(為了減少計算量,往往采用灰度進行計算)的變化趨勢,從而得到運動矢量來體現的。從三維空間到二維平面的映射,即是運動場到光流場(OpticalFlowField)的轉換。光流法即是利用多幀連續圖像序列來計算各個像素點的運動矢量,從而為真實的運動進行近似估計的方法。光流法分離前景的最大特點是:該算法能夠獨立檢測運動目標,甚至可以精確地計算出目標的運動速度而不需要任何先驗的背景信息。光流法缺點也比較多。首先是計算繁雜,不適用于對效率要求較高的環境;其次外部光線變化對算法的影響比較大,即使物體沒有運動,也能檢測到光流;最后如果圖像的灰度等級變化不明顯,很難檢測出運動和識別物體。2.1碼本法碼本(CodeBook)模型處理對象是仍然是連續圖像。首先利用顏色失真程度和亮度失真范圍相結合的方式將圖像各像素量化后用碼本表示,將不同時刻圖像中對應像素的碼本做比較判斷,利用減除背景的思想提取出前景運動目標。顏色失真因子:δ=colordist(x)t,vi=xt2-xt,xi2xi2(1)亮度失真因子:brightness(I),Ǐ,Î=ìíîtrueifIlow≤xt≤Ihifalseotherwise(2)具體算法是為每個像素建立一個編碼本,這個編碼本里包括一個或者多個碼字。進行運動檢測時,在編碼本里已有的碼字中查找當前幀像素點,如果前者中有可以匹配的碼字,則該像素點即為背景點;如果匹配失敗,那么該像素點即為前景點,即運動目標的一部分。碼本檢測算法利用量化和聚類技術來構建背景模型具有魯棒性強,計算效率高的特點,可以通過迭代更新碼本模型來適應背景變化。

3人體特征挖掘與識別

通過圖像分離,所有的活動目標都被區分識別出來了,其中包括人和其他物件。本節將要討論如何選擇合適的特征表述方法對目標進行標識,從而將人體和其他物件區分開來。物體具有的特征的非常多,比如說顏色、輪廓、形狀、尺寸和紋理等,本文將選取HOG[7](HistogramofOrientedGradient)特征作為標志和區分的依據。方向梯度直方圖(HOG)特征是由經過計算和統計的圖像局部區域梯度方向直方圖構成,在計算機視覺(ComputerVision)和圖像處理中常用來進行物體檢測的特征描述。3.1HOG特征提取算法1.圖像預處理—灰度化;2.圖像顏色空間的標準化和歸一化;3.計算每個像素的梯度值:大小和方向;4.將圖像劃分成細胞單元(Cell);5.統計每個Cell的梯度形成直方圖(Histogram),即CellDescriptor;6.將每幾個Cell組成一個區塊(Block),每個區塊內所有CellDescriptor再次歸一化便得到該區塊的BlockDescriptor。7.圖像內的所有區塊的BlockDescriptor串聯起來就可以得到該圖像以特征向量表示的ImageDescriptor了。第2步的歸一化處理,能對光照變化和陰影獲得更好的效果。第3步通過卷積運算,確定每個像素在水平方向和垂直方向上的梯度分量,計算公式如下:Gx(x),y=H(x)+1,y-H(x)-1,y(3)Gy(x),y=H(x),y+1-H(x),y-1(4)其中Gx(x),y,Gy(x),y,H(x),y分別表示坐標(x),y處像素點的水平方向梯度分量、垂直方向梯度分量和灰度值。然后再計算該像素點的梯度幅值和梯度方向。G(x),y=Gx(x),y2+Gy(x),y2(5)θ(x),y=tan-1æèççöø÷÷Gy(x),yGx(x),y(6)其中G(x),y代表梯度幅度值,θ(x),y代表梯度方向。第4步可以采用矩形(Rectangular)或星形(Radial)結構來劃分細胞單元(Cell)。第5步統計每個Cell的梯度形成直方圖,即是求取該Cell的特征向量。根據不同的精度要求,將梯度方向360度(2π)根據需要分割成若干個區間(Section),比方分割成12個Section,每個Section即為30度,然后根據Cell中每個像素點的梯度方向,將其幅值累加到這12個區間中,最終形成能刻畫該Cell灰度特征的特征向量。第6步的Cell組合,可以采取Overlap和Non-Overlap兩種策略。Overlap指的是組合出的Block互相交疊,有重合的區域;Non-Overlap指的是Block不交疊,沒有重合的區域。因為目前說做所有的分割和組合都帶有隨機性,以人臉為例,如果采用Non-Overlap方式進行組合,很有可能將人臉上的器官1分為N,直接影響后續的分類效果,但是它的好處是計算量小、速度快;而Overlap則不同,冗余的數據將提高器官完整的可能性,但是缺點是計算量大,因為重疊區域需要重復計算。總而言之,與其他的特征描述方法(SIFT和PCA-SIFT)相比,HOG算法著眼于圖像局部單元(Cell和Block)的計算,受圖像幾何(Geometric)和光學(Photometric)形變影響比較小。3.2SVM分類器經過HOG運算完成之后得到的特征向量就可以納入到分類器當中進行分類了,本文選擇SVM(SupportVectorMachine)分類器進行人體識別。SVM分類器是基于統計學習的分類算法,在圖像識別中得到廣泛的應用,其主要思想是:將分類問題轉化為尋找訓練樣本點的一個分割超平面的問題,目的是保證最小的分類錯誤率。如果樣本線性可分,能夠將樣本完全分開的超平面不止一個,SVM算法的終極目標是找到其中的最優超平面(能使得每類數據中與超平面距離最近的向量之間距離最大的平面);如果樣本線性不可分,則是因為其特征向量維度太低引起的,可以通過所謂的核函數(非線性映射算法)將低維向量樣本映射到高維特征空間,使其線性可分。本文使用到的SVM最優分類函數是:f(x)=æèçöø÷∑i=1nαiyixiTx+b=∑i=1nαiyixi,x+b(7)其中αi是支持向量的最優系數,b是分類閥值。使用核函數提高特征向量維度后進行分類的確可以提高分類的準確性,但是卻因為其計算量大,對識別速度會有影響,常見的核函數如下:線性核函數:K(x),y=x∙y(8)多項式核函數:K(x),y=(x)∙y+1d,d=1,2,⋯,n(9)高斯核函數:K(x),y=e-2|x|-yσ2(10)實際應用中需要根據具體需求,平衡識別的準確率和效率,選擇合適的核函數。3.3人體識別人體的識別過程分為兩個部分:訓練和識別,如圖2所示。圖2人體識別流程訓練過程,首先通過碼本分離算法從運動圖像中提取出的前景,此時的前景包括了人體和其他物體;然后是通過人工分檢,選出各種光照效果下具有典型勞動特征的人體形成訓練樣本庫;接下來計算每一個樣本的HOG特征值,并利用這個樣本值集合進行SVM訓練,使其針對HOG特征具有分類能力;最終構建出人體特征分類器。識別過程,首先將碼本算法得到的前景提取HOG特征值,然后送入到訓練過程產生的分類器當中進行分類;最終識別出人體。

4危險行為識別

隨著行業的不同,生產環節中對安全的要求也有所不同,比如:不同工種的著裝、佩戴的安全裝備和行為動作等都屬于安全生產管轄的范疇。本文就以建筑行業的施工環節中安全帽的佩戴作為檢測目標,并作為出算法的驗證試驗。4.1人頭模型識別安全帽首先要提取人體的頭部信息,可以采取復雜模型:首先進行人臉識別定位人頭的位置;然后建立人體軀體模型,找到軀干和四肢;最終完成人體重建。雖然看似第一步就可以通過臉部準確的定位人頭,但是此方法在現實中卻不可行,因為在工地上具體的施工環節中,不可能讓每一個工人都正面面對攝像頭進行人臉檢測,攝像頭中往往得到的是一個背影或側影。簡化模型:首先根據SVM人體分類器中不同工作姿勢人體類別,統計各類別中人頭的位置和大小比例;然后從待處理人體圖像中分離處彩色的人頭圖像;最后使用顏色直方圖進行安全帽的識別。4.1模型對比復雜模型適應于沒有進行過前景背景分離的圖像,識別的前提是圖像中的人體有人臉的正面照,因此識別率較低;簡化模型中識別對象是經過了前景背景分離和SVM分類并已經真正分割出來的獨立的人體,雖然人體模型簡單,但是人頭的識別率非常高。

5實驗及結果分析

為了驗證本文闡述的安全管控系統的有效性,特地選取某建筑企業在建工地的鋼筋加工車間實時視頻監控圖像進行分析,原始視頻中包含了各種姿態(站姿和蹲姿)的人體,如圖3所示。1)碼本算法提取前景。由于碼本算法是基于像素點的色彩變化進行統計分析來確定運動目標,受光線等干擾的影響,碼本算法采集到的前景區域往往不連通,如圖4所示。2)膨脹處理。對圖像進行膨脹處理的目的是為了擴大連通區域,便于圖像分割。膨脹之后的圖像如圖5所示。3)圖像分割。采用第2章中所述的靜態圖像分離算法切割膨脹處理之后的局部連通圖,分割出來的去除了背景的單體圖像比分割前“意義”更明確,求出的HOG特征向量特征更明顯,單體圖像如圖6所示。4)遮罩提取。上述步驟操作的都是對象區域,為了得到原始的分割圖像,只需要進行遮罩運算即可,結果如圖7所示。5)安全帽識別。使用4.1節所述的人體模型提取人頭圖像,如圖8所示。因為安全帽的種類和顏色非常規范,提供統計建立顏色(紅、黃、藍)分布直方圖,即可識別個人是否佩戴安全帽。上述過程前4步可以實現前景提取,并進行基于SVM的人體特征挖掘與識別。本例構建的訓練樣本分別為100、300、500張,使用HOG算法進行特征向量提取,并將此特征向量集用于SVM訓練,最終得出人體分類器、人頭位置和尺寸參數。通過訓練好的分類器對測試樣本進行檢測,實驗結果如表1所示。從表中數據可以看出:隨著訓練樣本數的增加,人體檢出準確率明顯提高,而安全帽檢出的準確率受樣本規模影響比較小。

6結論

本文首次將圖像處理技術和數據挖掘技術應用到安全生產管理中。研討了將碼本運算、HOG運算、SVM運算融為一體進行人體圖像挖掘的具體實現細節,提出基于實時視頻流模式的多姿態安全帽檢測技術,并且通過試驗證明該算法的實用性和有效性,取得了令人滿意的結果。未來的工作是對人像進行跟蹤,分析其動作,并抽象提煉出行為,通過對每一種行為的危險系數進行評估,最終實現危險行為識別即做出有害和無害的結論。

作者:汪建 方洪鷹 單位:重慶郵電大學