圖像處理技術論文范文
時間:2023-04-08 05:05:58
導語:如何才能寫好一篇圖像處理技術論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
基于圖像采集卡的視頻圖像處理系統(tǒng)
計算機圖像處理系統(tǒng)從系統(tǒng)層次上可分為高、中、低檔三個層次,目前一般比較普及的是低檔次的系統(tǒng),該系統(tǒng)由CCD(攝像頭)、圖像采集卡、計算機三個部分組成,其結構簡單,應用方便,效果也比較不錯,得到的圖像較清晰。目前網上基于VC開發(fā)經驗的文章不少,可是關于如何在VC開發(fā)平臺上使用圖像采集卡的文章確沒發(fā)現(xiàn),筆者針對在科研開發(fā)中積累的使用圖像采集卡經驗,介紹如何自己是如何將采集卡集成到圖像開發(fā)系統(tǒng)中,希望能夠給目前正需要利用圖像采集卡開發(fā)自己的圖像處理系統(tǒng)的朋友有所幫助。
使用的攝像機采用臺灣BENTECHINDUSTRIAL有限公司生產的CV-155L黑白攝像機。該攝像機分辨率為752x582。圖象采集卡我們采用北京中科院科技嘉公司開發(fā)的基于PCI總線的CA-MPE1000黑白圖象采集卡。使用圖像采集卡分三步,首先安裝采集卡的驅動程序,并將虛擬驅動文件VxD.vxd拷貝到Windows的SYSTEM目錄下;這時候就可以進入開發(fā)狀態(tài)了,進入VC開發(fā)平臺,生成新的項目,由于生產廠家為圖像采集卡提供了以mpew32.dll、mpew32.lib命名的庫文件,庫中提供了初始硬件、采集圖像等函數(shù),為使用這些函數(shù),在新項目上連接該動態(tài)庫;最后一步就是采集圖像并顯示處理了,這一步要設置系統(tǒng)調色板,因為采集卡提供的是裸圖形式,既純圖像數(shù)據,沒有圖像的規(guī)格和調色板信息,這些需要開發(fā)者自己規(guī)定實現(xiàn),下面是實現(xiàn)的部分代碼:
CTestView::CTestView()
{
W32_Init_MPE1000();//初始化采集卡
W32_Modify_Contrast(50);//下面的函數(shù)是為了對采集卡進行預設置
W32_Modify_Brightness(45);//設置亮度
W32_Set_HP_Value(945);//設置水平采集點數(shù)
wCurrent_Frame=1;//當前幀為1,獲取的圖像就是從這幀取得的
//設置采集信號源,僅對MPE1000有效
W32_Set_Input_Source(1);
W32_CACardParam(AD_SETHPFREQ,hpGrabFreq);
W32_Set_PAL_Range(1250,1024);//設置水平采集范圍
W32_Set_VGA_Mode(1);
wGrabWinX1=0;//采集窗口的左上角的坐標
wGrabWinY1=0;
firstTime=TRUE;
bGrabMode=FRAME;
bZipMode=ZIPPLE;
/
lpDib=NULL;//存放獲取的圖像數(shù)據
}
CTestView::~CTestView()
{
W32_Close_MPE1000();//關閉采集卡
}
////顯示采集的圖象,雙擊鼠標采集停止
voidCTestView::OnGraboneframe()
{
//TODO:Addyourcommandhandlercodehere
wCurrent_Frame=1;
//設置采集目標為內存
W32_CACardParam(AD_SETGRABDEST,CA_GRABMEM);
//啟動采集
if(lpDib!=NULL)
{
GlobalUnlock(hglbDIB);
GlobalFree(hglbDIB);
}
//分配內存
hglbDIB=GlobalAlloc(GHND,(DWORD)wImgWidth*(DWORD)wImgHeight);
lpDib=(BYTE*)GlobalLock(hglbDIB);
hdc=GetDC()->GetSafeHdc();
if(lpDib!=NULL)
{
cxDib=wImgWidth;
cyDib=wImgHeight;
SetLogicPal(hdc,cxDib,cyDib,8);
SetStretchBltMode(hdc,COLORONCOLOR);
bGrabMark=TRUE;
while(bGrabMark==TRUE)
{
if(msg.message==WM_LBUTTONDBLCLK)
bGrabMark=FALSE;
W32_ReadXMS2Buf(wCurrent_Frame,lpDib);
SetDIBitsToDevice(hdc,0,0,cxDib,cyDib,0,0,
0,cyDib,(LPSTR)lpDib,
bmi,
DIB_RGB_COLORS);
}
//停止采集
W32_CAStopCapture();
::ReleaseDC(GetSafeHwnd(),hdc);
return;
}
////將下面這個函數(shù)添加在視圖類的CTestView::OnSize()函數(shù)中,就可以對系統(tǒng)的調色板進行設置。
voidWINAPIInitLogicPal(HDChdc,shortwidth,shortheight,WORDbitCount)
{
intj,i;
shortcxDib,cyDib;
LOGPALETTE*pLogPal;
j=256;
if((pLogPal=(LOGPALETTE*)malloc(sizeof(LOGPALETTE)+(j*sizeof(PALETTEENTRY))))==NULL)
return;
pLogPal->palVersion=0x300;
pLogPal->palNumEntries=j;
for(i=0;ipLogPal->palPalEntry[i].peRed=i;
pLogPal->palPalEntry[i].peGreen=i;
pLogPal->palPalEntry[i].peBlue=i;
pLogPal->palPalEntry[i].peFlags=0;
}
hPal=::CreatePalette(pLogPal);
deletepLogPal;
::SelectPalette(hdc,hPal,0);
::RealizePalette(hdc);
cxDib=width;cyDib=height;
if((bmi=(BITMAPINFO*)malloc(sizeof(BITMAPINFOHEADER)+j*sizeof(RGBQUAD)))==NULL)
return;
//bmi為全局變量,用于顯示圖像時用
bmi->bmiHeader.biSize=40;
bmi->bmiHeader.biWidth=cxDib;
bmi->bmiHeader.biHeight=cyDib;
bmi->bmiHeader.biPlanes=1;
bmi->bmiHeader.biBitCount=bitCount;
bmi->bmiHeader.biCompression=0;
bmi->bmiHeader.biSizeImage=0;
bmi->bmiHeader.biXPelsPerMeter=0;
bmi->bmiHeader.biYPelsPerMeter=0;
bmi->bmiHeader.biClrUsed=0;
bmi->bmiHeader.biClrImportant=0;
for(i=0;ibmi->bmiColors[i].rgbBlue=i;
bmi->bmiColors[i].rgbGreen=i;
bmi->bmiColors[i].rgbRed=i;
bmi->bmiColors[i].rgbReserved=0;
}
}
視頻"畫中畫"技術
"畫中畫"這個概念類似與彩色電視機"畫中畫",就是在一幅大的圖像內顯示另外一幅內容不同的小的圖像,小圖像的尺寸大小一般地說為大圖像尺寸的1/4或1/9,顯示位置在大圖像的右上角。這種技術不僅在電視技術中,在可視電話系統(tǒng)也可以發(fā)現(xiàn)這種技術的身影,它們都是依靠硬件來實現(xiàn)的,但是如何在VC開發(fā)平臺上用編程語言來將該功能添加到自己開發(fā)的視頻監(jiān)控軟件,為使用者提供更大的信息量呢?也許讀者最容易想到的是首先顯示大圖像,然后再在一個固定位置畫第二幅小圖像,這種技術技術如果對于靜止圖像當然沒有問題,但是對于視頻流,由于每一秒鐘需要畫25幀,即25幅圖像,這樣一來計算機需要不停的畫不停的擦除,會給用戶以閃爍的感覺,如何解決這個問題呢?有的參考書上將大小圖像分快顯示,這種方法要將待顯示的圖像數(shù)據與顯示位置的關系對應起來,容易出錯不說,而且麻煩,且速度慢,為此,我對該方法進行了改進,得到了滿意的效果。實現(xiàn)的代碼如下:
voidpictureinpicture()
{
………………………..
CBitmapbitmap,*oldmap;
pData1=(BYTE*)newchar[biWidth*biHeight*3];//biWidth和biHeight為視頻采集卡獲取//的圖像尺寸。
Read(pData1,bih.biWidth*bih.biHeight*3);//該函數(shù)從采集卡中獲取數(shù)據
CClientDCdc(this);
m_pBMI1=newBITMAPINFO;//自定義的BMP文件信息結構,用于后面的圖像顯示
m_pBMI1->bmiHeader.biBitCount=24;
m_pBMI1->bmiHeader.biClrImportant=0;
m_pBMI1->bmiHeader.biClrUsed=0;
m_pBMI1->bmiHeader.biCompression=0;
m_pBMI1->bmiHeader.biHeight=biHeight;
m_pBMI1->bmiHeader.biPlanes=1;
m_pBMI1->bmiHeader.biSize=40;
m_pBMI1->bmiHeader.biSizeImage=WIDTHBYTES(biWidth*8)*biHeight*3;
m_pBMI1->bmiHeader.biWidth=biWidth;
m_pBMI1->bmiHeader.biXPelsPerMeter=0;
m_pBMI1->bmiHeader.biYPelsPerMeter=0;
////////////////////////////////////////////////////////////////////////
pData2=(BYTE*)newchar[biWidth1*biHeight1*3];//申請存放小圖像的緩沖區(qū)
Read(pData2,biWidth1*biHeight1*3);////向該緩沖區(qū)讀數(shù)據
m_pBMI2=newBITMAPINFO;
m_pBMI2->bmiHeader.biBitCount=24;
m_pBMI2->bmiHeader.biClrImportant=0;
m_pBMI2->bmiHeader.biClrUsed=0;
m_pBMI2->bmiHeader.biCompression=0;
m_pBMI2->bmiHeader.biHeight=biHeight1;
m_pBMI2->bmiHeader.biPlanes=1;
m_pBMI2->bmiHeader.biSize=40;
m_pBMI2->bmiHeader.biSizeImage=WIDTHBYTES(biWidth1*8)*biHeight1*3;
m_pBMI2->bmiHeader.biWidth=biWidth1;
m_pBMI2->bmiHeader.biXPelsPerMeter=0;
m_pBMI2->bmiHeader.biYPelsPerMeter=0;
//下面實現(xiàn)畫中畫的顯示
CDCMemDc;
MemDc.CreateCompatibleDC(&dc);
bitmap.CreateCompatibleBitmap(&dc,biWidth,biHeight);
oldmap=MemDc.SelectObject(&bitmap);
::StretchDIBits(MemDc.m_hDC,0,0,biWidth,biHeight,0,0,—biWidth,biHeight,pData1,m_pBMI1,DIB_RGB_COLORS,SRCCOPY);//首先將大圖像畫在內寸上下文中
::StretchDIBits(MemDc.m_hDC,20,20,biWidth1,biHeight1,_
0,0,biWidth1,biHeight1,pData2,m_pBMI2,DIB_RGB_COLORS,SRCCOPY);//再將小圖像畫在內寸上下文中
::StretchBlt(dc.m_hDC,0,0,bih.biWidth,bih.biHeight,_
MemDc.m_hDC,0,0,bih.biWidth,bih.biHeight,SRCCOPY);//將結果顯示在屏幕上。
MemDc.SelectObject(oldmap);
deletepData1;
deletem_pBMI1;
deletepData2;
篇2
1.1加強對Photoshop圖像處理應用
案例分析總結就是一種間接的自我學習,通過案例分析總結可以讓自己展開豐富的想象力,加強對Photoshop圖像處理應用。這是一組人居環(huán)境適宜的景觀設計效果處理前后變化展示,前一張圖片是用3Dmax配合V-ray插件進行渲染的最終效果,為了進一步美化效果圖,這是就需要Photoshop圖像處理,結合中間這一張照片,采用圖層處理、素材插入、調整圖層、圖層蒙版、創(chuàng)建亮度\對比度調整層等方式最終合成想要的效果。在案例分析過的成中,應注意多觀察多總結多思考,設計最終效果的高低,一方面是和自己所擁有的知識水平有關,另一方面還和自己的審美能力高低有關,這就需要告誡我們平時多注意學習,學習不僅僅局限在書本上,還應該多參觀欣賞較好的作品,從中得到審美能力的提高。
1.2模仿和創(chuàng)造相結合,提高Photoshop圖像處理動手能力
模仿是人的本能天性,是人類進行各種學習活動的最基本方法。在平時的Photoshop圖像處理模仿使用中,通常就是通過網上視頻,如金鷹視頻來自己分析Photoshop軟件的各個功能。在視頻觀看的過程,可以根據視頻中的實例操作,最終達到理解,這個過程就是模仿。例如:模仿給圖片添加陰影效果,通常情況下,可以選擇Photoshop菜單欄圖層—圖層樣式—陰影就可以完成。而通過視頻模仿,就可以快速的通過浮動圖層菜單,選定此圖片圖層,并把鼠標快速放到縮略藍色區(qū)域雙擊就可以打開圖層樣式浮動菜單完成陰影效果。在提高Photoshop圖像處理動手能力上,還要發(fā)揮自己的創(chuàng)造能力。例如給此圖片添加完陰影后,圖層樣式還有內外陰影、內外發(fā)光、光澤、斜面和浮雕、顏色疊加等方式,我們嘗試可以根據圖片實際情況試著添加,達到最佳效果。這里就需要發(fā)揮創(chuàng)造性對圖片處理創(chuàng)新性在里面。
1.3結合科研項目,帶動Photoshop圖像處理實踐能力
如在科研項目:西部山地型小城市人居環(huán)境問題及保護策略研究——以商洛市商州區(qū)為例上,需要收集大量的本地環(huán)境有關的圖片素材并進行美化處理,這就可以親自參與商州區(qū)大氣質量惡化、丹江主要河流體固體廢物污染、交通混亂等圖片的處理,
1.4參與企業(yè)設計,增強Photoshop圖像處理靈活性
參與企業(yè)設計,就是參與設計公司的工作。例如:在商洛市西街片區(qū)的舊城改造過程中,學生負責收集照片,并對舊城的原始照片進行處理規(guī)范化。
2小結
篇3
【關鍵詞】圖像處理 偏微分方程 模型構建 處理步驟
一、圖像處理的基本方式
(一)信號分析處理
信號處理的方式是利用空間變化的思路,空間變換的方法就是從早期的頻域變換發(fā)展而來形成了小波變換。小波變換在時域同時有良好的的局部分析特征,可以實現(xiàn)在多個尺寸上的多分辨特性。小波變換在圖像壓縮中獲得了較好的效果。
(二)隨機建模的處理
數(shù)字圖像在形成的過程中有隨機性,所以二維的圖形實際是一個隨機的場。所及建模的方式是按照隨機場對圖像域建模,以此描述圖像域鄰域像素的分布情況,從而完成對圖形的描述。通常采用的隨機建模方式有高斯混合模型等。隨機場模型可以對圖形的紋理進行細致描述。
(三)偏微分處理
偏微分方程是一種數(shù)學方式,對數(shù)字影像進行處理,利用空間域內的像素灰度值進行微分處理,利用二階方程表征圖形中區(qū)域邊界的特征。微分方程具有各項異性的擴展特征,在不同的圖像特征上顯示的擴展性能也就不同,所以利用方程迭代處理圖形可最大限度的保持邊緣特征,同時獲得重建的平滑區(qū)域。
二、偏微分方程和圖像處理的應用
當前利用物理學和力學的變分和偏分方程方法的圖像處理技術在計算機圖形處理領域已經開辟了新的領域,基于偏分方程的圖形處理方式已經獲得了重視和良好的效果。其基本的思路就是在一個偏微分方程模型中發(fā)展一個圖形,一條曲線、一個曲面等,利用求解這個偏微分方程來獲得圖形處理的期望值。變分和偏微分方程使得數(shù)字圖像處理進入了一個新的領域。
(一)偏微分方程處理的主要領域
對圖形進行去噪處理:圖形去噪的典型分析與計算方法是高斯低通濾波器,也即是熱擴散方程,因為高斯濾波器在去找的過程中不能保持良好的邊緣特征,所以多數(shù)研究都是對該特征進行改進,其中較為有效的方式就是由Perona 和 Malik 提出的 P-M 方程,公式如下:
公式中,迭代步長dt,It是迭代項,ΔI則是拉普拉斯算子,c則代表傳導系數(shù)。其中div是散度算子,代表梯度算子, Δ是拉普拉斯斯算子。在實際的應用中為了保證模型的收斂性,通常利用經驗值,取迭代步長dt值為0.25。在此基礎上,PDE去噪的基本思路如下:1)在圖像相同質量特征的區(qū)域內進行減弱噪聲擴散的處理;2)控制區(qū)域邊界未知不擴散,并保持邊緣的基本特征。因為P-M是一個病態(tài)問題,所以有研究提出對梯度值正則化處理,然后獲得相對穩(wěn)定的P-M方程。有人提出直接使用擴散張量作為擴散項,從而實現(xiàn)張量偏微分的方程模型。這個模型可以在一個方向上獲得快速擴散,而在正交的另一個方向緩慢擴散,由此獲得邊緣去噪的效果。
圖形的放大處理:對圖像進行插值放大,獲得超分辨率的分析。偏微分方程可以按照圖像邊緣、水平曲線等幾何特征實現(xiàn)插值放大。所以偏微分方程可以最大限度的保持邊緣的細節(jié)特征,同時可以減弱噪聲的影響。在研究中提出基于偏微分方程擬合水平集曲線的圖形像素重構。也就研究提出了一種復擴散偏微分方程被放大模式,在減弱鋸齒效應的同時,可以銳化邊緣的特征。
圖形的分割處理:圖形的分割也是圖像處理的重要內容,計算機和圖像處理按照使用的圖像特征進行分類處理,可以分為基于邊界的分割、基于區(qū)域的方法,以及混合分割的方法。如按照使用數(shù)學工具和模型,其主要的方法有:基于聚類的方法;基于統(tǒng)計學的方法;基于數(shù)學形態(tài)的方法;基于偏微分方程的方法,主要有蛇形模型等;基于Graph cut的方法。
(二)圖像處理的偏微分模型
在圖形處理中,偏微分方程模式有很多種,其中一種是在變分原理的基礎上對函數(shù)進行優(yōu)化,這個方式首先對一個特定的圖形處理模式,通過變分原理實現(xiàn)對能量函數(shù)模型的優(yōu)化,這樣就可得到偏微分方程,通過對偏微分方程數(shù)值求解由此完成圖形的處理任務。如:整體變分能量泛函
利用此模式就可完成對函數(shù)的優(yōu)化。
三、基于偏微分方程的圖形處理的步驟
作為圖像處理的一個重要工具,在變分和偏微分方程的圖像處理的基本框架和基本步驟如下:1)明確實際問題的出現(xiàn)和處理思路建立,因為不同的應用問題有不同的處理思路和特征,因此采用的處理方式也就不同,所以在處理圖像問題時應先掌握問題的關鍵。2)構建相關數(shù)學模型,這一步驟是處理圖像的重要步驟,其影響的是處理的過程和結果,數(shù)學模型構建將直接影響處理的效果,對微分方程、變分方法、微分幾何等進行合理選擇與組合,以此獲得較好的處理結果,提高處理的有效性。3)模型分析:主要是對模型的適應性進行分析,了解模型解是否存在、解是否唯一、方法是否穩(wěn)定等,4)分析計算:利用數(shù)學模式進行求解,進行微分方程的數(shù)值分析,利用有限差分、有限元、迭代法等進行計算,這一步驟會影響相關數(shù)學求解的收斂性、穩(wěn)定性、計算量等。5)程序實現(xiàn):這個步驟是解決問題的最終步驟,這一步驟的一些問題可以導致前面工作的重新修改,必須慎重操作。
四、結束語
偏微分方程是一種高效的數(shù)學處理工具,在圖像處理中也獲得了較好的效果。連續(xù)區(qū)域上建立模型,方便對實際問題的處理和數(shù)值計算。數(shù)學上豐富的偏微分方程處理理論和計算方式,對圖形處理的理論分析和算法都給予了較大的幫助,同時不斷完善的計算和處理方式將幫助偏微分方程提高圖像處理的效果。
參考文獻:
[1]李艷霞.基于變分偏微分方程的圖像分解研究與應用[D].中國海洋大學學位論文,2009.
篇4
關鍵詞:PBL模式 數(shù)字圖像處理 實踐教學
中圖分類號:TP399 文獻標識碼:A 文章編號:1007-9416(2013)03-0242-01
在高校教學體系中,數(shù)字圖像處理成為了包括理工科、農醫(yī)科在內專業(yè)必選課程或者重點選修課程。作為一門理論知識豐富、實踐性非常強的高校課程,當前PBL模式已經成為了包括美國在內的多個國家的主要教學模式。
1 PBL模式與數(shù)字圖像處理結合探索背景
PBL模式作為一種較為先進的教學模式,英文名稱Problem-Based Learning,其含義為問題式教學模式或者基于問題的學習模式,PBL模式的主要思路是以問題為前提進行教學的展開活動,這一教學方法的特點在于在教師的直接參與和指導之下,將學生放在主體地位,通過小組討論的方式,通過以某一具體問題為中心的研究討論和加強學習的過程,將教學的焦點放在某學科的重要原理以及關鍵概念之上,通過幫助學生自己構建知識體系的過程,養(yǎng)成學習獨立學習、獨立思考的基本能力,數(shù)字圖像處理具有其本身獨特的特色。
其一,該門課程的理論知識豐富,知識點較為深奧難懂[1];其二,日常生活中,應用到的數(shù)字圖像處理相關課程知識點較多,對學生綜合能力要求較高,尤其在工科專業(yè)的基礎知識學習中要求較高,需要對計算機、數(shù)學等學科知識進行綜合運用,例如,湖南省某學院部分專業(yè)在開設這門課程時,每一學期的課時量為30至40課時,該學院部分立刻專業(yè)設置了選修課程的的課時量。依靠傳統(tǒng)的教學模式進行數(shù)字圖像處理已經不適宜當前的教學實際,須對高校包括機械制造專業(yè)、自動化等專業(yè)的數(shù)字圖像處理能力進行要求,才能全面提升學生的綜合能力。
2 基于PBL模式的實踐教學改革方案探索
2.1 對數(shù)字圖像處理實踐教學方式方法的研究
以上述湖南某城市學院為例,為推進數(shù)字圖像處理的PBL模式改革,該校自行編撰了驗證性課程指導實踐用書,該書的主要內容包括了30多個實踐項目,涵蓋了圖像分析、圖像濾波、數(shù)字處理軟件的使用以及圖像分割等多個板塊知識點,該學院學生中計算機普及程度廣,所以在進行圖像處理實踐時可自行下載相關的支持軟件。改變以往該課程集中實踐方式,升級成分散與集中結合的模式,即第一步學生利用業(yè)余時間或者在專門實驗室內完成數(shù)字圖像處理分散實驗,第二步教師對學生教學實踐中產生的問題進行一對一面談解決或者利用網絡通訊工具解決問題,第三步,通過多次的分散式課程實踐活動,利用4個至6個課時進行集中式教學。
2.2 突破數(shù)字圖像處理理論教學模式
其一,確保在對數(shù)字圖像處理完整性以及整體性進行維護前提下,在實踐教學課堂中盡量避免對數(shù)字處理相關公式的重復推導[2],主要對相關算法以及關鍵原理進行說明,如在對均衡處理數(shù)字圖像知識點進行講解過程中,直接引用推導公式,利用均衡化圖像的原理以及關鍵算法進行處理技術的編程;其二,在對相關的信息進行篩選之后重點對處理圖像的算法進行編程和實踐應用,在對圖像處理邊緣檢測知識進行運用過程中,可以將Hough的變換、路經檢測加強聯(lián)系,更好進行編程;其三,在解決實踐問題的過程中,多進行實例的例舉,可利用2至3個課時對實踐教學的背景、已有的實踐教學成果的、重要技術流程、重要算法進行演示等。
3 基于PBL模式的數(shù)字圖像處理教學方案設計
仍以湖南某城市學院信息學院為例,從PBL模式出發(fā),針對于數(shù)字圖像處理建立了處理庫,這一項目中涵蓋處理圖像、分析圖像、識別圖像等多類別項目,例如“門禁系統(tǒng)視覺識別系統(tǒng)”、“指紋識別”、“二維碼檢測”等,學院每學期建立了不低于36個的項目,學生可在這些項目中進行選修,另外,以40個課時為標準,數(shù)字圖形處理理論課程教學學時為30個,實踐性教學課時為10個,每周保證3個學時,總共教學時長為13個教學周。
第一,在進行教學的前兩個周內,將數(shù)字圖像處理課程PBL模式實踐考察和教學方式進行明確和推介,并將以往的學生實踐教學成果進行分享,為學生在選修過程中提供參考,學生進行是否選修的決策;第二,在3至4周,擬定學生課程選修名單,進行實踐性教學任務的布置,確定36個以上的實踐項目給學生,學生自動組成項目合作,保持每組在3個人左右,學生自行數(shù)字圖像處理選擇題目,對實踐項目進行圖像加文字型的介紹,盡快確定目標,盡快對實踐應用難度進行確定以及評分;第三,在5至6周的時候確定數(shù)字圖像處理實踐目標書,確定相關參考資料;第四,在7周至12周時間內實施實踐項目,學生利用課余時間完成分散型實驗,這段時間內適當安排集中型實驗,對實踐項目進行驗證,在這一過程中,特別注意積極提出實踐項目存在的問題,及時檢查問題解決的進度,教師有針對地進行問題解答,幫助實踐小組完成任務目標;第五,在第13周時,組成專業(yè)或者班級為小組的實踐項目答辯,實踐項目的成果進行答辯與說明;最后,數(shù)字圖像處理課程教師完成總結,學生對實踐項目進行報告,教師根據實際情況對學生進行打分。
4 結語
基于PBL模式的數(shù)字圖像處理的教學形式,能幫助高校學生快速了解和吸收處理數(shù)字化圖像過程中必要的技術、方法與原理等知識點[3],還能幫助學生掌握數(shù)字圖像處理實踐項目的實踐研究方法和思路,提升學生利用圖像處理的基礎知識靈活解決生活實際問題能力,提升學生的學習積極性以及創(chuàng)新、實踐能力,對于全面提升數(shù)字圖像處理相關課程的教學質量具有重要作用。
參考文獻
[1]何林錦,翟云波,李彩亭.項目式實驗教學模式及其可行性評價方法[J].實驗室研究與探索,2010,29(2):94-96.
篇5
論文摘要:針對碩士研究生在學習“數(shù)字圖像處理與模式識別”課程中面臨的理論與實際脫節(jié)、書本知識陳舊和教學手段單一等問題,本文從教材選擇、講授內容和手段、講授形式和考核方法等方面進行了教學改革的探討,通過在教學活動中不斷實踐探索,使學生在學習中不僅學到了豐富的理論知識,而且通過開放的實驗環(huán)節(jié)找到理論應用到實際之中的關鍵所在,同時帶領學生放眼于本領域的熱點技術,激發(fā)了大家的研究興趣。本課題已獲得“211工程”三期的資助。
1 緒論
學生剛從本科階段走入研究生階段,都懷著極大的熱情要投身于科學研究中,他們需要通過更多更專業(yè)的課程來夯實自身的理論基礎,以便使他們能夠在科學研究工作中充分發(fā)揮自身才華,所以研究生階段的文化課程具有更強的針對性和實用性。可反觀研究生課程現(xiàn)狀,選用的教材往往是五年甚至十年之前出版的,其內容已非常陳舊,與信息時代的要求相差甚遠;學生反映學到的知識不知如何在實際科研中應用,不了解本領域最新發(fā)展方向,學習過程單調枯燥,沒有達到研究生課程應有的效果。針對這些問題,作者在多年的教學過程中不斷總結原因,不斷進行教學改革探索,并在國家“211工程”資助下,開展了研究生“數(shù)字圖像處理與模式識別”課程的教學改革課題研究。
2 教學改革內容
“數(shù)字圖像處理與模式識別”課程面對的授課對象包括電子、自動化、計算機、光電、機械、車輛等各個專業(yè)的碩士研究生,他們在各自的研究領域都將面臨圖像處理及識別的實際問題,為了培養(yǎng)學生掌握該領域的基礎知識,并能迅速地在研究工作中發(fā)揮作用,必須學習本課程,并能靈活應用到各自的研究工作中。本課程從數(shù)字圖像處理技術的整體知識框架出發(fā),對圖像進行一系列處理技術的討論,經過參數(shù)分析與模式識別,使數(shù)字圖像處理與模式識別技術融為一體,為各個應用領域的理論研究和實際應用奠定基礎。
2.1為學生量身打造教材
目前圖像處理領域發(fā)展非常迅速:3D圖像處理技術、3G可視化圖像通信技術、高速公路不停車收費技術等都在日常生活中得到廣泛的應用,可研究生教材中涉及的教學內容還停留在上世紀90年代的水平,遠遠不能滿足當今社會的需求。為此,作者所在的課題組三位老師撰寫的國家“十一五”規(guī)劃教材《數(shù)字圖像處理及模式識別(第二版)》,教材更新了一些經典算法,同時根據我們課題組近年在圖像處理領域的最新科研成果,將新算法新技術融合到教材當中,使學生能夠接觸到本領域的前沿技術。另外作為教材的最后一章,作者將一個實際科研項目作為典型實例編入教材中,向學生展示了如何把教材中涉及的理論方法應用到實際工程之中。通過學習本教材,既可掌握經典的圖像處理算法,又接觸到目前比較先進的圖像處理算法,同時又可根據教材提供的很多應用實例和算法源代碼,促進學生掌握理論知識與實際問題的結合方法,盡快地運用學到的理論知識進行創(chuàng)新性科學研究。該教材也于2008年獲得北京市高等學校精品教材稱號。
另外教材附帶了一套自主開發(fā)的實驗軟件系統(tǒng),為學生提供實驗平臺,包含六個實驗:圖像的二維傅里葉變換及性質、圖像的編碼、圖像的參數(shù)分析、圖像的平滑與銳化、圖像的運動模糊及去模糊、圖像的匹配識別。該軟件界面友好,通用性強,結構開放,可二次開發(fā),可以激發(fā)學生在完成實驗的基礎上積極動腦去完善現(xiàn)有實驗,開發(fā)新的實驗。
2.2改進授課內容
根據研究生的特點,課堂上除了講授基礎的理論知識以外,主要針對當前比較熱門和先進的數(shù)字圖像處理方法,以及學生們比較感興趣的知識點,以專題研討的形式進行研究和討論。例如針對預防犯罪分子進行犯罪活動方面,可以通過人臉識別的方法在可視頻監(jiān)控的區(qū)域進行自動人臉特征提取,并用犯罪分子圖庫進行比對。大家對這個技術很感興趣,對技術細節(jié)進行了熱烈的討論,各抒己見,通過這種專題討論,活躍了課堂氣氛,增加了學生主動參與的機會,激發(fā)了學生的學習熱情和創(chuàng)造靈感。
同時教學中注重設計了一些新穎的課題,留給學生課后思考、調研,課上教師與學生進行研究和討論,增強教與學的雙向互動和交流,避免被動式灌輸知識,激發(fā)學生的學習積極性、主動性和創(chuàng)造性。
結合實際科研成果,將一些數(shù)字圖像處理系統(tǒng)的實例引入教學。例如將嵌入式多通道數(shù)字圖像采集處理系統(tǒng)作為例子,講解系統(tǒng)實現(xiàn)的原理、圖像處理算法的應用及編程實現(xiàn)過程等等,這樣既避免了抽象知識的講授,又滿足了學生對數(shù)字圖像處理系統(tǒng)的軟、硬件平臺設計方法的掌握,真正達到學以致用。 2.3講授手段綜合應用
除了常規(guī)的教學手段以外,更多地應用現(xiàn)代多媒體技術來授課,包括展示圖片、播放視頻。恰巧多媒體教學技術本身就是多種數(shù)字圖像處理技術的一個綜合應用,所以利用多媒體教學技術來講課就是本門課程涉及的各種技術在實際生產生活中的一個很好的應用實例。目前教學主要采用課堂講授,電子課件與板書相結合,課內實驗與課外實驗相輔助,摒棄灌輸式教學方法,倡導啟發(fā)式教育,講授課本知識的同時注意拓寬學生知識面,加強學生創(chuàng)新能力的培養(yǎng),使學生的理論基礎和實踐應用能力同步得到提高,取得了較好的教學效果,幾位教師的學生評價結果皆為優(yōu)秀。
通過搭建一些算法平臺,給學生提供可選擇、有側重、可設計的實驗環(huán)境,彌補本課程沒有專門實驗的缺點,通過這些平臺可以開啟學生的創(chuàng)新研究和實踐欲望。實踐環(huán)節(jié)提供自主開發(fā)的圖像采集與跟蹤系統(tǒng)軟硬件實驗,學生可自己對實驗進行設計并實時驗證,另外提供一些比較新穎的實驗題目供學生選做,在學習同時通過實驗加深對知識的理解和掌握。同時將相關課件、資料等放置到網絡,供學生訪問下載,并提供Email信箱與學生答疑和溝通。
2.4講授人員因需而變
除了授課教師外,根據當前研究熱點和學生感興趣的方向,邀請具有專門科研經驗和知識的博士生,以研討的形式進行某個知識點的討論,以拓展學生的知識面,實現(xiàn)寬泛的知識教育,同時使學生了解最前沿的學科方向。
2008年邀請了張健博士做了“H.264轉換編碼研究與改進”的專題講座;2009年邀請了姜薇博士做了“人臉識別算法研究”專題講座。通過博士生的講座,大家了解了研究生階段的科研工作,極大帶動了學生的求知欲,課堂討論熱烈,很多同學與兩位博士課下進行了多次交流,為他們在學術上起到啟迪作用。同時,大膽地邀請了一名同年級的碩士生站到講臺上,就“基于四元數(shù)FFT的水印嵌入算法”進行了專題討論,面對這個全新的領域,很多同學被深深震撼了,同時感到了壓力和差距,觸動學生從主觀意識上對本門課產生興趣,掀起理論課程聯(lián)系實際項目的學習熱潮。
2.5教學思想的討論與轉變
研究生教學的目的不是要學生只掌握書本的知識,也不是必須進行卷面考核。特別是本門課程的實踐性很強,所以本課程通過提供幾個具有綜合性、設計性的命題,結合我們提供的一些平臺,讓學生自己完成方案設計、命題的實現(xiàn),更鼓勵同學自己提出命題來進行研究實現(xiàn),以期使學生真正融會貫通本門課程的思想精髓,更好地解決理論知識和科研能力的銜接,也真正實現(xiàn)本門課程的以素質為基礎、知識為手段、實踐為中介、能力為目標的教學宗旨。
3 教學改革總結
由于本課題組教師在“數(shù)字圖像處理與模式識別”這門課中一直貫穿著先進的教育理念,得到了全校學生的認可,教學效果良好,2010年聽課人數(shù)達到了169人,并有不同專業(yè)的多名博士生進行了旁聽。
經過了幾位教師的努力,本門課的教學改革已見成效,使“教”與“學”達到了有機的平衡和統(tǒng)一,教師知道學生想學什么,學生知道理論知識如何應用,真正達到學以致用,并會在實際科研工作中總結問題,運用理論知識來解決實際問題,也達到了研究生教學改革的目的。
參考文獻:
[1]岡薩雷斯.數(shù)字圖像處理[M].第2版.北京:電子工業(yè)出版社,1998.
篇6
關鍵詞:神經網絡 圖像處理 機器人 草莓
中圖分類號:TP301.6 文獻標識碼:A 文章編號:1007-9416(2012)07-0091-02
國內外對圖像處理技術和神經網絡理論在果蔬商品化應用中的部分成果已進入了實用階段。隨著計算機科學的飛速發(fā)展和在許多領域中的成功應用,果蔬采收分級的實時自動化已經變得完全可能。但是,生物特征的多變性和隨機性與工業(yè)產品有著很大區(qū)別。在草莓采收、分級這一過程中,為了提高檢測的精度、速度和準確性,需要解決多種技術問題,如:光源的選擇和設置;圖像的采集方式和圖像的質量;硬件處理速度;模式識別算法;要求有更多分級算法的訓練樣本等。從長遠看,應該對揀選對象的形狀、表面、光學、熱學、化學、生物學等各方面的特征和生理機能進行更加深入的研究,這樣才有利于檢測技術改進,促使新的信息采集技術和傳感技術的產生。
草莓是一種營養(yǎng)豐富的高級水果,隨著人們生活水平的提高,草莓按其顏色、形狀及大小進行揀選分類、包裝將成為趨勢。因此,草莓形狀的判別的研究和草莓揀選設備的開發(fā)具有很重要的現(xiàn)實意義。
1、草莓形狀的判別
收割后的草莓按其顏色、大小、形狀均可分為不同的等級。因此,草莓形狀的判斷是揀選者根據對標準草莓規(guī)格的理解和經驗來判斷出結果。本設計中草莓形狀的識別部分采用了神經網絡的識別技術,神經網絡具有學習功能和很強的模式識別能力,即使當局部網絡受損時,仍然能夠恢復原來信息。神經網絡的信息分布式存儲于聯(lián)結權值系數(shù)中,使網絡具有很高的容錯性,而圖像識別中往往存在噪聲干擾或輸入圖像的部分損失,因此,神經網絡可以很好地解決圖像識別問題。另外,神經網絡的自組織和自學習功能,使其對圖像問題的識別和處理較傳統(tǒng)圖象識別方法顯示出極大的優(yōu)越性。因此,草莓揀選設備只要通過對標準形狀草莓的學習就可得到非常接近人的判別效果。
為此,本論文提出了一種新的算法來解決草莓揀選的問題,該算法是基于圖像處理技術、神經網絡算法而生成的一種草莓形狀判別算法。并利用該算法開發(fā)了草莓揀選設備。
2、草莓揀選設備的構成
草莓揀選設備硬件系統(tǒng)組成如圖1所示。CCD攝像機將所要識別、解釋的對象以圖像的形式記錄下來;插入計算機內部的圖像采集卡可以將攝像機采集的電信號轉變?yōu)閿?shù)字信號,即圖像數(shù)字化,以便計算機對其進行各種必要的處理;照明裝置為圖像采集提供合適的光源,以便對圖像進行處理和分析。
3、草莓形狀圖像分割及特征提取
人工揀選草莓時很容易根據草莓果實部分的形狀特征來判別其等級,但對草莓揀選設備來說,草莓是任意放置在傳送帶上的,計算機采集到的草莓圖像其方位是不確定的。因此,本設計采用了彩色圖像處理技術。圖2中,(a)圖是圖像卡采集到的草莓圖像信號以RGB彩色模型顯示在監(jiān)視器上。它的R輝度圖像如圖(b)所示。想要得到草莓的形狀特征圖像,就要對采集到的草莓彩色圖像做以下處理:
第一步:把彩色圖像轉換成黑白的二值圖像,經過濾波、填充、提取邊緣信號等處理后,最終得到整體輪廓線圖像(c);
第二步:彩色圖像減去R輝度圖像產生目標圖像(d);
第三步:目標圖像經二值和邊緣提取處理后,得到了果實輪廓線圖像,如(e)所示;
第四步:最后把整體圖像輪廓線圖像和果實輪廓線圖像這兩種圖像進行邏輯運算,然后得到曲線型草莓形狀特征圖像,如(f)所示。
4、基于神經網絡的判別
得到的草莓形狀特征可以用一組八參數(shù)來表示,要劃分A、B、C等級就需要控制兩個空氣驅動器。我們建立的人工神經網絡是基于BP算法的前向三層神經網絡,如圖3所示。選用了兩個結構簡單的BP網絡,輸入為8,正好每個參數(shù)對應一個輸入端單元;輸出為2,每個輸出單元控制一個空氣驅動器。在進行前向多層神經網絡的學習時,不斷調整隱層節(jié)點數(shù),經過試驗,采用8-4-2結構。
5、軟件程序的功能
判別草莓形狀的系統(tǒng)軟件程序是實現(xiàn)草莓的揀選功能的關鍵。系統(tǒng)軟件在功能上劃分為訓練部分和判斷部分。訓練部分包括圖像處理、特征提取和網絡訓練;判斷部分包括圖像處理、特征的提取和判斷以及草莓的移動控制。系統(tǒng)程序用MicrosoftC語言編寫,程序流程圖如圖4所示。
6、結語
本文通過計算機圖形處理技術、模式識別等理論的研究,結合神經網絡算法進行了草莓形狀判別的設計,在草莓形狀的有效特征提取和分類識別方面進行了理論上的研究,提出了基于前向三層神經網絡和計算機圖像處理的一種能對草莓形狀進行自動判別的新方法,為草莓的揀選機器人的開發(fā)提供了理論基礎。草莓揀選設備乃至其他水果揀選設備的開發(fā)對將要進入老齡化社會的我國來說是很有意義的。
參考文獻
[1]王耀南,李樹濤,毛建旭.計算機圖像處理與識別技術[M].北京:高等教育出版社,2001.237~260
[2]曹其新,呂恬生,永田雅輝等.草莓揀選機器人的開發(fā)[J].上海交通大學學報,1999,33(7):880~884.
[3]王年,任彬,黃勇等.基于神經網絡的汽車車型圖象自動識別[J].中國圖象圖形學報1999,4(8):669~672.
[4]福利(Foley,J.D.)等著.計算機圖形學原理及實踐C語言描述[M].北京:機械工業(yè)出版社,2002.6~36.
[5]徐麗娜.神經網絡控制[M].哈爾濱:哈爾濱工業(yè)出版社,1999.4~34.
[6]田村秀行編著,金喜子,喬雙譯.計算機圖像處理[M].北京科學出版社,2004.86~115.
篇7
關鍵詞:小波變換,可操縱金字塔,濾波器,紋理
0.引言:紋理特征是圖像的基本特征之一,是一種全局特征,它描述了圖像或者圖像區(qū)域所對應的景物的表面性質。包括表面結構組織及其與周圍環(huán)境關系的許多重要信息,紋理特征是一種統(tǒng)計特征,具有旋轉不變性,并具有較強的抗噪音能力,它被廣泛應用于圖像識別以及圖像檢索技術中。圖像的紋理特征的提取及其分析方法的采用對識別及其檢索的準確率具有很大的影響。小波變換和可操縱金字塔被廣泛應用于圖像處理問題中,比如圖像的融合,圖像分割,圖像增強,邊緣檢測等,小波變換和可操縱金字塔同樣可應用于圖像的紋理特征分析。
1.圖像紋理特征
紋理特征是圖像的基本特征之一,是一種全局特征,它描述了圖像或者圖像區(qū)域所對應的景物的表面性質。通常圖像紋理特征可用這些參數(shù)表征:能量、信息熵、梯度、尺度共生距、峰值、不變性。
2.小波變換與可操縱金字塔
篇8
關鍵詞:PCB;圖像處理;視覺檢測
中圖分類號:TP277文獻標識碼:A文章編號:1009-3044(2012)07-1648-06
當今世界科技發(fā)展日新月異,電子產業(yè)的發(fā)展直接制約著國民經濟的騰飛與否,而PCB電路板制作工藝的提高對促進電子產業(yè)的發(fā)展至關重要,能否有效精確地檢測PCB電路板的缺陷一直都是電子行業(yè)的研究熱點。國外的印刷電路板自動檢測技術一直領先于國內,國內的很多廠家不得不采用昂貴的外國技術,雖然近年國內的印刷電路板自動檢測技術發(fā)展迅速,但大都沒有取得令人非常滿意的結果。加入研究這一領域的熱潮,趕超外國的先進技技水平,打斷外國壟斷技術,對于發(fā)展國民經濟具有十分重要的意義。
1 PCB檢測系統(tǒng)的硬件設計
1.1 PCB檢測系統(tǒng)的硬件組成框圖
雖然本文所做的工作主要是軟件方面,但對于硬件系統(tǒng)的設計也是至關重要的,它對于建立有效的計算機視覺識別檢測系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價比和系統(tǒng)性能的基礎上,設計出合理的硬件系統(tǒng)[9]。PCB檢測系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測系統(tǒng)硬件組成框圖
1.2系統(tǒng)的硬件組成
系統(tǒng)的硬件組成[10]主要包括:計算機主機、CCD攝像機、圖像采集卡、照明系統(tǒng)及相關的設備。
2 PCB電路板缺陷檢測識別
PCB電路板在電子工業(yè)中的應用越來越廣泛,如何降低電路板的故障率、提高電路板的質量直接影響到整個產業(yè)的發(fā)展。因此,對于PCB電路板缺陷的識別技術的發(fā)展至關重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過焊等等,由于實驗室設備限制和個人水平所限,本文主要研究的內容是PCB電路板短路與斷路的檢測識別
近年來出現(xiàn)了很多圖像檢測算法,這些算法大致可分為三大類:有參考算法、無參考算法以及混合型算法。有參考算法分為兩大類:圖像對比法和模型對比法。無參考算法是一種不需要標準圖像的檢測算法,它是基于一定的設計規(guī)則來進行檢測的。混合型方法是將有參考算法與無參考算法混合使用,從而發(fā)揮出各自的優(yōu)點。比如,模板匹配法與數(shù)學形態(tài)學方法結合使用,或者連接表方法與數(shù)學形態(tài)學方法結合使用等。本文中短路與斷路的檢測識別采取了圖像對比法,即將經過一定處理后的圖像進行相減,從而分析相應的結果;而對焊點缺陷的識別主要采用模板匹配法與數(shù)學形態(tài)學方法結合使用。
2.1 PCB電路板缺陷檢測識別的主要流程圖
圖2為子程序流程圖;圖3為主程序流程圖。
2.2 PCB電路板短路與斷路的檢測識別
2.2.1邊緣檢測
在對圖像進行基本的處理過后可以將圖像與背景分割開來。邊緣檢測是圖像處理和計算機視覺中的基本問題,邊緣檢測的目的是標識數(shù)字圖像中亮度變化明顯的點。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。
這些包括:深度上的不連續(xù);表面方向不連續(xù);物質屬性變化;場景照明變化。邊緣檢測是圖像處理和計算機視覺中,尤其是特征提取中的一個研究領域。
圖像邊緣檢測大幅度地減少了數(shù)據量,并且剔除了可以認為不相關的信息,保留了圖像重要的結構屬性。有許多方法用于邊緣檢測,它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類。基于查找的方法通過尋找圖像一階導數(shù)中的最大和最小值來檢測邊界,通常是將邊界定位在梯度最大的方向。基于零穿越的方法通過尋找圖像二階導數(shù)零穿越來尋找邊界,通常是Laplacian過零點或者非線性差分表示的過零點。
1)Roberts算子
邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀D像的邊緣對應著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。真實圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡狀。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。
?f=(決定的。
因此最簡單的邊緣檢測算子是用圖像的垂直和水平差分來逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此當我們想尋找邊緣的時候,最簡單的方法是對每一個像素計算出(2,4)的向量,然后求出他的絕對值,然后進行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一個兩個2×2模板作用的結果。
2)Sobel算子
該算法通過2個3*3的模板,對選定的二維圖像中同樣大小窗口進行卷積,通常是一個模板對一個邊緣響應大,另一個模板對水平邊緣響應大,兩個卷積值對最大值作為該點對輸出。對于圖像上的任意點(i,j)進行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。
用sobel算子檢測階躍邊緣得到的邊緣寬度至少為兩個寬度。3)Laplacian邊緣檢測算子
Laplacian算子定義由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一種各向同性算子,在只關心邊緣的位置而不考慮其周圍的灰度象素差值時時比較合適,Laplacian算子對孤立象素的響應要比對邊緣或線的響應更要強烈,因此只適用于無噪聲圖像。
原圖像與用三種邊緣檢測算子處理后的圖像如下所示:圖6 Sobel邊緣檢測圖7 Laplacian邊緣檢測
從上面四幅圖分析比較可得出結論:用Roberts邊緣檢測得出的圖像較之其他方法更為清晰,噪點更少,圖像更為連續(xù),所以本文中采用Roberts算子來進行邊緣檢測。
2.2.2閾值分割
閾值分割法是一種基于區(qū)域的圖像分割技術,其基本原理是:通過設定不同的特征閾值,把圖像象素點分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設原始圖像為f(x,y),按照一定的準則f(x,y)中找到特征值T,將圖像分割為兩個部分,分割后的圖像為:
若取:b0=0(黑),b1=1(白),即為我們通常所說的圖像二值化。
在數(shù)字化的圖像數(shù)據中,無用的背景數(shù)據和對象物的數(shù)據經常放在一起,同時,圖像中還含有各種噪聲,因此可以根據圖像的統(tǒng)計性質,從概率的角度來選擇合適的閾值。
1)最大方差閾值法
把待處理圖像的直方圖在某一閾值處分割為兩組,當被分割成的兩組間的方差最大時,便可以決定閾值了。
設灰度圖像f(x,y)的灰度級為0-L,灰度級I的像素為Ni,則圖中:
總象素數(shù)N=∑j=0 i=LNi(式2-11)灰度級i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)
ρ2(k)是K的函數(shù),計算k取從0,1,2…L時ρ2(k)的值,當多的值為最大時,K即為閾值。
2)雙峰法
根據圖像的直方圖具有背景和對象物的兩個峰,分割兩個區(qū)域的閾值由兩個峰值之間的谷所對應的灰度值決定。設灰度圖像f(x,y)的灰度級為0-L,灰度i的像素為Pi,分別計算
因為實際PCB電路板有著許多的劃痕、污點等,使用最大方差閾值法時,會在處理后的圖像上產生許多誤點,而影響實際結果的分析,而雙峰法能夠順利地濾除這些干擾,這個結論在分析對比以上圖像時也可得出。所以本文選用了雙峰法來進行閾值分割。
2.2.3粒子分析與圖像對比
經過邊緣檢測和閾值分割的圖像中會存在許多瑕點,這些點會影響到最后的圖像識別與分析,有可能會增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析
將標準PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。
將缺陷PCB圖片減去標準PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。
3結束語
利用LABVIEW來進行PCB電路板缺陷的識別與檢測是一項非常好的課題,它在近些年已經得到了一定的發(fā)展,并將得到更大的進步。限于本人能力和時間,本文的研究還未涉及很深的領域,可以在以下方面加以改進:
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設計可以再利用其他語言如VISUAL BASIC,C++等編程語言加以輔助設計,相信可以取得更加令人滿意的結果。
2)由于實驗設備等其他因素,本文中只重點研究了PCB電路板短路與斷路的檢測識別,PCB電路板的其他缺陷還有待于進一步的分析研究、分類和總結,并設計出更好的檢測方法,以真正滿足PCB電路板檢測的需求。
3)照明設備的限制在很大程度上影響到了圖像的檢測效果,為取得PCB缺陷檢測的進一步進展,在照明設備的選擇上必須重視,并且設計出更好的圖像采集系統(tǒng)。
4)在識別與檢測手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經網絡的識別檢測,圖像的模糊決策等將有待于進一步研究。
總之,基于LABVIEW的機器視覺檢測系統(tǒng)已經取得了不錯的進展,高速發(fā)展的PCB制造技術和計算機技術對于PCB缺陷的檢測提出了更高的要求,同時也大大地促進了PCB缺陷檢測技術的發(fā)展。利用機器視覺檢測在未來的較長的一段時間內將占據檢測行業(yè)的半壁江山,相信在未來會取得更大的發(fā)展。
參考文獻:
[1]程學慶,房曉溪.LabVIEW圖形化編程與實例應用[M].北京:中國鐵道出版社,2005.
[2]胡仲波.基于虛擬儀器技術的PCB視覺檢測系統(tǒng)[D].南京:南京理工大學碩士學位論文,2006.
[3]段峰,王耀南.機器視覺技術及其應用綜述[J].自動化博覽,2002,19(3).
[4]周長發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.
[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設計從入門到精通[M].北京:清華大學出版社,2007.
[6]鄭偉.圖像法檢測印刷電路板缺陷[M].西安:西安理工大學,2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李強.PCB板缺陷自動檢測技術的分析研究[D].合肥:合肥工業(yè)大學,2002.
[9]傅茂名.基于形態(tài)邊緣檢測算法的一種改進[J].電子科技大學學報,2005(2).
[10]王思華.計算機視覺新技術及其在IC標記質量檢驗系統(tǒng)設計中的應用[J].電子技術應用,2000(9).
[11]岳永哲.圖像處理技術在閱卷系統(tǒng)中的應用[D].北京:北京工業(yè)大學,2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鵬,楊俊,何廣軍.基于圖像識別的自動閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).
[15]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術[J].山東科技大學學報:自然科學版,2009(3).
[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識別方法研究[J].電腦知識與技術,2008(28).
[17]周萬珍,鄭廣,王建霞,等.數(shù)字圖像處理技術在客觀題閱卷中的應用[J].數(shù)學的實踐與認識,2006(8).
[18]王勝春.基于SVM的信息卡識別系統(tǒng)[D].長沙:湖南師范大學,2008.
[19]吳志明.SMT系統(tǒng)中焊點位置的檢測[D].哈爾濱:哈爾濱工業(yè)大學,2006.
[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點信息的自動獲取[J].焊接學報,2005,39(6).
篇9
【摘 要】目前中學物理教學與實驗一般只涉及兩小球在直線上的碰撞,二維碰撞運動是新內容。筆者運用文獻研究法和實驗方法,分別利用數(shù)碼相機的“連拍合成技術”“高速連拍技術”和“攝像技術”對兩球斜碰過程進行圖形獲取、圖像處理、數(shù)據分析,分析總結得出盡量減小驗證二維動量守恒實驗誤差的技術方法,以便增強課程的科學性、可操作性與趣味性,進而提升學生的探究能力。
關鍵詞 視頻分析法;數(shù)碼相機;二維動量守恒;拍攝技術;誤差
【中圖分類號】G434 【文獻標識碼】B
【論文編號】1671-7384(2015)01-0073-03
在人教版高中物理選修3-5《動量守恒定律》一章中,教師用滑塊在氣墊導軌上的直線運動演示“驗證動量守恒定律”的實驗,這個實驗研究的是一維碰撞動量守恒,但實際生活中更多的是二維或是三維的斜碰,如臺球的碰撞、保齡球的碰撞、微觀粒子的碰撞和天體的碰撞等[1]。二維或三維運動是大學物理實驗教學中的重要內容[2],在現(xiàn)有的普通物理實驗教學中,一般只涉及兩小球在直線上的碰撞,二維碰撞運動是新內容。
利用視頻分析法探究小球“二維碰撞動量守恒”既有利于學生對動量守恒物理知識的完整理解,又有利于學生掌握利用多媒體技術及基本的數(shù)字化研究方法。本論文分別利用 “連拍合成技術”“高速連拍技術”和“攝像技術”三種技術對小球二維碰撞動量守恒進行探究實驗。
實驗準備
1.實驗工具與軟件:CASIO(EX—FH100)數(shù)碼相機、計算機、三腳架、光滑的玻璃平面、水平儀、兩個顏色不同大小質量相同的直徑為25mm的小球、Mr.captor頻閃截屏軟件、幾何畫板等。
2.實驗環(huán)境與條件:在進行實驗之前要保證平面和相機水平,玻璃面盡量光滑使摩擦力減少到最小。這里我們用到水平儀分別對相機與平面進行校準,如圖1和圖2。
實驗過程
用數(shù)碼相機的“連拍合成技術”“高速連拍技術”“攝像技術”結合頻閃截屏軟件與幾何畫板軟件,分別對兩球斜碰過程進行圖形獲取、圖像處理、數(shù)據分析。
1.連拍合成技術
(1)圖像獲取
通過相機的BS功能鍵進入到情景模式區(qū),選定“連拍影像合成”,如圖3。
拍攝的時候,相機會以5張/秒的連拍速度捕捉一個連貫的動作。兩個顏色不同、大小質量相同的玻璃球作為研究對象,在光滑平面上,讓綠色小球碰撞藍色小球,拍攝小球的二維碰撞過程,獲得連拍合成圖像,如圖4所示。
(2)圖像處理
①將圖片粘貼到“幾何畫板”中,利用“點工具”將圖片中的綠色小球和藍色小球分別用綠色圓點和藍色圓點表示出來。
②點擊工具欄中的自定義工具項目,選擇圓工具中過三點的圓(虛線),如圖5所示。選擇圖片中圓表面的任意三點,軟件就能將小球圓心標識出來。
③選擇移動箭頭,鼠標移動到圓上點擊鼠標右鍵,會出現(xiàn)如圖6所示的對話框,選擇隱藏圓。圓框消失后,將鼠標移動到圓表面的三個點,點擊右鍵,選擇隱藏點,依次將三點全部隱藏,最終圓心就能確定了。
④ 選中各點點擊“度量”菜單中的“橫坐標”“縱坐標”就可以顯示小球所在位置的坐標值,再點擊“顯示”菜單中的“隱藏照片”。
圖像處理結果如圖7所示。
(3)數(shù)據分析
選定各點坐標再點擊“數(shù)據”菜單中的“制表”,可以得到橫縱坐標的表格。由于玻璃板光滑,可以認為小球近似做勻速直線運動,速度可以通過得到,其中。經過計算算得在x方向動量誤差為9.7%,在y方向動量誤差為4.9%,平均誤差為7.3%。在誤差允許的范圍內,小球二維碰撞過程的動量守恒得到驗證。
(4)注意事項
此相機的連拍速度是5張/秒,如果物體運動速度太快,相機合成效果不明顯;物體運動速度太慢,畫面重疊,所以在做實驗前要了解相機的連拍速度,以便對小球運動的速度合理控制。
2.高速連拍技術
按連拍(HS)按鈕,如圖8所示,將連拍速度設置為40fps,最多連拍幅數(shù)設定為30,預先記錄連拍設置為0.3s。半按快門鈕,進行預先記錄拍攝,等到理想拍攝時機時,完全按下快門鈕,拍攝想要的圖片。兩個顏色不同、大小質量相同的玻璃球作為研究對象,在光滑平面讓綠球碰撞靜止的藍球,連拍小球的二維碰撞過程,然后通過幾何畫板對圖像進行拼接處理。
光滑平面連拍:綠球碰撞靜止的藍球,如圖9所示。
圖像處理與數(shù)據分析步驟與連拍合成技術相同,最后算得誤差平均值為3.5%。
3.視頻頻閃截屏技術
在拍攝方式中,將動畫方式旋鈕轉至(HD/STD),選擇高速動畫(HS),按動畫按鈕開始拍攝,分別在光滑平面讓藍球碰撞靜止的綠球和非光滑平面讓藍球與綠球互撞,碰撞完成后,再按動畫按鈕結束拍攝。然后用頻閃截屏軟件Mr.Captor對拍攝的視頻進行頻閃截屏,點擊“選項”菜單中“參數(shù)”命令,將彈出參數(shù)窗體,在“定時/視頻”中設置頻閃周期為0.1秒,設定圖片保存路徑。點擊“ ”按鈕,在屏幕上圈定單擺振動的截屏區(qū)域,再點擊鼠標右鍵,在彈出的菜單中選取“開始定時捕捉”命令,于是所捕捉的圖片被記錄在相應的文件夾中并被自動編號。最后通過幾何畫板對圖像進行拼接處理。在進行圖像處理時,處理好一張圖片之后,隱藏圖片,拖進下一個圖片,逐個處理,這樣每個小球運動的軌跡就能記錄在幾何畫板之中了。經過計算算得平均誤差為26.75%。
三種技術總結與對比
通過對這三種技術進行實驗,總結出每種技術的特點與差異,總結如表1。
根據以上分析,得出此實驗誤差與數(shù)碼相機的配置有極大的關系。教師可以根據教學條件以及課程的需要選擇以上方法探究二維碰撞動量守恒問題。
隨著科學技術的發(fā)展,數(shù)碼設備已經普及到千家萬戶。運用數(shù)碼相機探究二維運動打破了只限于探究一維運動的常規(guī),并且數(shù)碼相機攜帶方便,易于學生課下探究[3]。探究性學習包括提出問題、收集數(shù)據、形成解釋、評價結果、檢驗結果等過程,而運用數(shù)碼設備則可以幫助學生更便捷地收集數(shù)據、分析數(shù)據,有助于培養(yǎng)學生的科學探究能力。
篇10
關鍵詞:手寫筆體;信息查找;同步掃描;字符分割
中圖分類號:TP311文獻標志碼:A文章編號:1009-3044(2010)22-6282-02
1 圖像分割技術
圖像分割是圖像處理和前期視覺中的基本技術,是按照圖像的某些特征(灰度級、頻譜、紋理等)將圖像空間劃分成一些區(qū)域,在這些區(qū)域的內部,其特性是相同的或者是均勻的,兩個相鄰區(qū)域的特性則互不相同。圖像分割是有圖像處理轉為圖像分析的關鍵。一方面,它是目標圖像表達的基礎,對特定測量有重要影響。另一方面,圖像分割也是圖像的目標表達、特征提取和參數(shù)測量等分割所用的主要方法。[13-14] 對于一般復雜圖像,圖像分割較為復雜,比如Wang等[17]通過對生長區(qū)域進行分級,識別出由同一物體組成的整體區(qū)域,從而獲得物體的輪廓,但是可能導致區(qū)域空洞的出現(xiàn),但由于本系統(tǒng)在去除背景、對字符分割的這一特定條件下,處理過程相對較為簡單。
到目前為止,所有的圖像分割算法均是針對某具體問題而提出的,并沒有一種可適用于任何圖像的通用分割算法,這也可以從一個方面說明,為什么能研究出上千種方式各異的圖像分割算法,而且每年都是上百種的速度在遞增。盡管存在著數(shù)量龐大的各種圖像分割方法,但均可以將其分割處理的特點歸納為以下幾條:
1)分割產生的所有區(qū)域之和包括了原始圖像中原有的所有像素,即分割把原始圖像的每個像素都分到某個區(qū)域。
2)分割后的結果互不重疊,即原有像素不能同時分割到兩個區(qū)域。
3)分割后的各個區(qū)域有其獨有的特性,即同區(qū)域的像素具有某種共性。
4)分割后的不同區(qū)域具有不同的特性,分割后同一區(qū)域內任兩像素在該區(qū)域內相互連通,即分割后的區(qū)域是一個連通組元。
2 圖像分割途徑
圖像分割有三種不同的途徑。
1)將各像素劃歸到相應物體或區(qū)域的像素聚類方法即區(qū)域法;
2)通過直接確定區(qū)域間的邊界來實現(xiàn)分割的邊界方法;
3)首先檢測邊緣像素再將邊緣像素連接起來構成邊界形成分割。字符分割是為了便于對單個字符進行進一步的單獨處理。因為一般字符圖像均能滿足相鄰文字行列間至少有一行或者一列全為背景象素這一條件。系統(tǒng)在讀進來的圖像中一般會含有多個字符,識別的時候只能根據每個字符的特征來進行判斷,所以還要進行字符分割的工作。這一步工作就是把圖像中的字符獨立的分割出來。[15]
3 手寫體字符任意行分割算法設計
3.1 系統(tǒng)提出
本系統(tǒng)提出的“基于個人手寫筆體的信息查找”的概念是一個全新的概念,它既要求對于手寫體漢字本身結構信息的把握,又對捕獲單個字與周邊文字之間相對位置信息的規(guī)律性提出了要求。而以往人們在“筆跡鑒別”等領域所做的工作都是針對行、列分布較規(guī)范的整段文字或整篇文章進行的,對于如今我們面臨的空間分布極具任意性的個人手寫筆記而言,昔日的經典算法僅僅具備一定意義上的參考價值,謀求一種適用性更強、能夠對個人手寫筆記字符進行準確分割的算法成為了正確查找信息的重要前提。比如圖1這種比較典型的情形,進行行、列掃描的嵌套 設定閾值 將距離小于閾值的相鄰的兩部分進行分割,此時這樣的算法顯然就無用武之地了。
對于左右結構或者左中右結構的漢字,分割閾值的設置與個人的書寫習慣是一對比較難以解決的矛盾,例如《沁園春?長沙》的“沁”、汕頭的“汕”,前者由于“心”字的左邊一點在垂直投影上與“]”無重疊部分而恰恰同“シ”有交疊,故而將整字錯誤地分割為
而“汕”字則不光是左右被分開,連三點水最上面的一點也被獨立劃分為一塊,至于為什么“清”和“澈”就會被正確地框出呢?實質上是一個道理,注意用紅色圈出的部分。
由于手寫體的隨意性,文字大小不盡相同,這就要對文字尺寸進行歸一化,因此字符分割是非常重要的一步;同時字符分割又為之后的文字拼接提供了一條簡單易行的途徑。因此,若我們光從傳統(tǒng)的算法入手,將閾值設定得較小同時要求用戶刻意將字間距放大,那顯然這是不人性的設計、是治標不治本的下策。
3.2 分割算法
綜合考慮漢字結構的分布規(guī)律及書寫的隨意性,本系統(tǒng)采用了如下的字符分割算法:
1)首先對整幅圖像進行掃描,定出上、下、左、右四條邊界線(如圖中箭頭1、2、3、4所示)
2)對圖像進行第二次掃描,此次掃描目的是對分立的字符進行分割。基本思想是認為手寫的漢字大致是可以被一個正方形的邊框所包圍的,假設以列掃描作為外層循環(huán),如圖中3號箭頭所示,以其掃描到地第一個像素點的橫坐標為“虎”字的左邊界同時以該像素點的縱坐標rectpop.bottom作為列掃描的循環(huán)次數(shù),當掃描到如圖5號箭頭所示位置時,發(fā)現(xiàn)再往右掃一列時像素點的縱坐標便已經遠大于rectpop.bottom,故而馬上進行右邊界的分割,之后“虎”字的行掃描繼續(xù),當掃描到6號箭頭所示位置的下一行時,又發(fā)現(xiàn)掃描到的像素點的橫坐標遠大于rectpop.bottom,所以此時可以將“虎”字的下邊界定出,到此為止,第一個“虎”字的分割完成,而之后的第二個“虎”字的分割思想與之如出一轍。至于“威”字的分割,則與之前的兩個字的分割方法不同,由于掃描在一維上是從單一方向進行的,即對于列地掃描始終定格為從左到右,這就造成了其在空間分布上的獨立性,換句話說,對于該字的掃描就無法貫徹之前的以具體像素點左邊界的縱坐標rectpop.bottom作為列掃描的循環(huán)次數(shù),所以對于“威”字的掃描實質上是沿襲了整幅大圖像的掃描方式,只不過該字的右邊界已定(就是整幅圖像的右邊界),而其余三個邊界則只能老老實實地由行列嵌套循環(huán)定出。
又如圖3(i)所示,字與字之間的位置關系毫無規(guī)律性可循,系統(tǒng)首先依舊按照設定的算法進行整幅圖像的上、下、左、右四條邊界的確定,將整幅圖拆成如圖(ii)所示的左半部分以及剩余的右半部分,我們發(fā)現(xiàn):(ii)圖的情形與上一例如出一轍,但為什么與(ii)中的“水”字毗鄰的“森”字卻沒有以它的最底端作為其本身的下邊界而是以2號箭頭所示位置為其下邊界呢?原因是它的右邊還有字符。
當行掃描進行到(ii)中的“森”(稱其為森2)字最底端時,掃描線被其右邊的另一個“森”(稱其為森3)的像素點“擋住去路”,這一信息的反饋使得系統(tǒng)得知行掃描還未結束,所以確定森2的下邊界就等效為確定森3的下邊界,正如我們所分析的那樣,掃描結果是森2與森3的下邊界相同且均為整幅圖像的下邊界。
同樣道理,因為森3的至高點在森2的最低點上方,而行掃描在劃過森2的最低點后始終向下尋找森2的下邊界,這就使得森3 的上邊界成為了由前級附帶確定的因素。所以,整幅圖中,盡管單個字可以準確無誤地分割開來,但個別字邊界的確定卻是不盡如人意的。
圖3字符分割實例3
4 結束語
再嚴密的算法總是在邏輯框架下執(zhí)行一定順序的操作,本算法也同樣如此。我們的本意自然是希望得到如圖(iii)所示的理想結果,但任何一套算法都是對規(guī)律的總結,其相對適用性無法脫離一般性的約束,而手寫體的隨意性恰恰是以特殊性來考驗一般性,所以即使當前的算法對于個體分割具備了一定程度的正確性,其與我們設想的理想狀態(tài)還是有一定距離的。以上兩例充分說明本算法中前級對后級有影響,后級對前級同樣有牽制,前后級字符之間的相互制約構成了當前分割算法的核心體系。
參考文獻:
[1] 唐偉成.手寫英文字符識別系統(tǒng)[D].沈陽理工大學碩士論文,2009.
[2] 朱娜敏.精通Windows程序設計――基于Visual C++實現(xiàn)[M].北京:人民郵電出版社,2009.
[3] 郭一平. 數(shù)字圖像壓縮歷史的分析與檢測[D]. 大連理工大學碩士論文,2009
[4] 沈軍.一心兩用.“雙顯”讓游戲電影兩相宜[J].電腦愛好者,2010(5).
[6] 梁紅飛.四線電阻式觸摸屏測試系統(tǒng)的研究[M].中南大學碩士論文,2009.
[7] 趙志強.基于GPRS的便攜式信令控制系統(tǒng)的設計與實現(xiàn)[M].同濟大學碩士論文,2008.
[8] 何斌.Visual C++數(shù)字圖像處理[M].北京:人民郵電出版社,2005.
[9] 孫鑫.Visual C++深入講解[M].北京:電子工業(yè)出版社,2006.
[10] 師春禮.手寫體字符預處理與識別系統(tǒng)研究[M].碩士學位論文.北京:北京郵電大學,1995.
[11] 王麗華.基于神經網絡的圖像識別系統(tǒng)的研究[M].中國石油大學碩士論文,2008.
[12] 蔡櫻.中文手寫文稿的二值化與行列切分[J].中文信息學報,2000,14(1).
[13] 章毓晉.圖像理解與計算機視覺[M].北京:清華大學出版社,2000.
[14] 靳藩.神經計算與智能基礎[M].重慶:西南交通大學出版社,2000.
[15] 唐偉成.手寫英文字符識別系統(tǒng)[D].沈陽理工大學碩士論文,2009.
[17] 張宏林.Visual C++數(shù)字圖像模式識別技術及工程實踐[M].北京:人民郵電出版社,2003.
[18] 孫藝峰.基于多種特征的數(shù)字圖像分割理論和方法研究[M]. 遼寧師范大學碩士論文,2009.