《計算機視覺》 課件 1、緒論- 4、圖像的線特征表示_第1頁
《計算機視覺》 課件 1、緒論- 4、圖像的線特征表示_第2頁
《計算機視覺》 課件 1、緒論- 4、圖像的線特征表示_第3頁
《計算機視覺》 課件 1、緒論- 4、圖像的線特征表示_第4頁
《計算機視覺》 課件 1、緒論- 4、圖像的線特征表示_第5頁
已閱讀5頁,還剩214頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

計算機視覺戰(zhàn)略性新興領域“十四五”高等教育系列教材1、緒論人類視覺計算機視覺計算機視覺的發(fā)展經典計算機視覺理論計算機視覺的應用和挑戰(zhàn)課程內容及要求人類視覺人類約有80%的信息是通過視覺系統(tǒng)獲取的人類視覺的生理基礎:周圍環(huán)境中的物體在可見光的照射下,在人眼的視網膜上形成圖像,由感光細胞轉換成神經脈沖信號,經神經纖維傳入大腦皮層進行處理與理解。人類視覺電信號首先通過視神經傳遞到大腦的初級視覺皮層(V1區(qū)),位于枕葉。隨后,這些信號被傳遞到次級視覺皮層(如V2、V3),在這些區(qū)域中,信號被用來解析更復雜的圖像屬性。進一步的視覺信息傳遞到視覺聯合區(qū)域,如V4和V5,分別處理更細致的顏色和運動信息。大腦的顳葉和頂葉參與信息整合,顳葉處理面孔和物體識別,而頂葉處理空間定位和物體運動。1、緒論人類視覺計算機視覺機器視覺的發(fā)展經典機器視覺理論機器視覺的應用和挑戰(zhàn)課程內容及要求計算機視覺計算機視覺是是一門致力于使計算機能夠從圖像或視頻中“看”和“理解”現實世界的科學。計算機視覺試圖實現人類視覺的信息獲取和處理的全過程,通過對圖像和視頻的分析處理,實現類似人類視覺感知功能。輸入:圖像(images)或視頻(video)輸出:對象的恢復以及對對象信息的使用圖1-3計算機處理圖像的基本過程計算機視覺通過對圖像和視頻信號進行描述、存儲、識別與理解,感知三維環(huán)境中物體的幾何信息,包括形狀、位置、姿態(tài)、運動等。視覺機理視覺信息獲?。▓D像獲取)采樣、量化、表示視覺信息處理(圖像處理)圖像預處理、濾波、變換、分割、特征表示和檢測視覺信息理解(圖像理解)三維信息恢復和重建、運動信息提取研究目標:使機器像人那樣,通過視覺觀察和理解世界,具有自主適應環(huán)境的能力。1、緒論人類視覺計算機視覺計算機視覺的發(fā)展經典機器視覺理論機器視覺的應用和挑戰(zhàn)課程內容及要求計算機視覺的發(fā)展啟蒙階段(1960s-1980s):

計算機視覺基礎理論探索與建立的階段LarryRoberts的博士論文標志性地提出了從二維圖像中提取三維形狀的方法。重構主義階段(1980s-2000s):

傳統(tǒng)計算機視覺算法快速發(fā)展的階段建立專家系統(tǒng)來存儲先驗知識,然后與實際項目中提取的特征進行規(guī)則匹配。開創(chuàng)了以理解三維場景為目的的三維視覺研究DavidG.Lowe提出了基于知識的視覺(Knowledge-basedVision)的概念ChrisHarris和MikeStephens提出Harris角點檢測算法DavidLowe在1999年提出的SIFT(尺度不變特征變換)算法計算機視覺的發(fā)展分類主義階段(2000s-2010s):

計算機視覺技術的成熟與應用探索階段一系列關鍵技術的成熟以及新應用的探索PaulViola和MichaelJones提出的Viola-Jones人臉檢測算法成為了第一個能夠在實時環(huán)境中進行人臉檢測的算法支持向量機(SVM)和隨機森林等機器學習算法特征提取技術如HOG(方向梯度直方圖)和LBP(局部二值模式)大數據、大模型和大算力階段(2010s-至今):

大數據和大算力支撐下的深度學習技術迅猛發(fā)展并出現大模型的階段隨著計算機運算能力的指數級增長和ImageNet、PASCAL等超大型圖片數據庫的出現,深度學習技術帶領計算機視覺開啟了一個新階段

FasterR-CNN、YOLO、GANBERT、GPT等大型預訓練模型的適配和優(yōu)化,如OpenAI提出的CLIP模型[17],展示了跨模態(tài)學習的巨大潛力。1、緒論人類視覺計算機視覺計算機視覺的發(fā)展經典機器視覺理論機器視覺的應用和挑戰(zhàn)課程內容及要求Marr計算視覺理論DavidMarr(1945-1980)是英國心理學家。他將心理學、人工智能和神經生理學的結果結合起來,對視覺的研究做出了重要貢獻。他是計算視覺的奠基人。1982年馬爾(DavidMarr)《視覺》一書的問世,首次提出了視覺計算理論,是第一個系統(tǒng)的計算機視覺理論框架。Marr視覺理論(1) 計算理論:視覺系統(tǒng)的主要任務是從視網膜捕獲的二維圖像中重構出物體的三維表面形態(tài),這一過程通常被稱為“三維重建”。Marr將計算視覺分為三個層次:計算理論、表達與算法以及算法實現。(2) 表達與算法(2) 算法實現低層視覺中層視覺高層視覺圖像特征“要素圖”2.5D描述3D描述假定視覺系統(tǒng)是對視覺環(huán)境的被動響應假定視覺計算是由局部信息到整體信息的單向過程馬爾視覺計算理論認為,物體的表達形式為該物體的三維幾何形狀。(不完全正確)軟件和硬件Marr視覺理論信息處理的三個階段低層視覺(Low-levelvision)構成要素圖(primalsketch),要素圖由二維圖像中的邊緣點、直線段、曲線、頂點、紋理等基本幾何元素或特征組成。Marr視覺理論信息處理的三個階段中層視覺(Intermediate-levelvision)構成對環(huán)境的2.5維描述,在以觀察者為中心的坐標系中描述部分的、不完整的三維信息。Marr視覺理論信息處理的三個階段高層視覺(High-levelvision)從2.5維描述得到物體的完整三維描述,三維結構在以物體為中心的坐標系中表示。主動視覺理論Marr計算理論的不足:

缺乏靈活性和適應性;缺乏明確的目的性和主動性賓夕法尼亞大學的Bajcsy提出了“主動視覺”概念,強調視覺過程應融入人與環(huán)境的交互。馬里蘭大學的Aloimonos主張視覺應具目的性,指出在許多應用場景中,嚴格的三維重建并非必需,并提出了“目的和定性視覺”的理念。主動視覺理論主動視覺:重點研究“視覺注意力”機制,即腦皮層高層區(qū)域到低層區(qū)域的反饋機制。基于強化學習、可變形模型、生物啟發(fā)模型以及交互式視覺機制構建視覺系統(tǒng),以增強視覺系統(tǒng)的任務驅動能力和適應性,包括任務驅動的視覺模型、端到端學習、優(yōu)化視覺注意力分配、反饋機制以及多任務學習等。主動視覺的挑戰(zhàn)在于“如何根據特定任務優(yōu)化視覺系統(tǒng)”其關鍵是能夠識別和優(yōu)先處理對完成特定任務的視覺信息。多視幾何視覺理論多視幾何:多視幾何主要研究兩幅圖像對應點之間的對極幾何約束,三幅圖像對應點之間的三焦張量約束,空間平面點到圖像點,或空間點為平面點投影的多幅圖像點之間的單應約束等。攝像機標定:為了提高三維重建的精度,需要對相機內參數進行估計。相機標定包含二方面的內容:“成像模型選擇”和“模型參數估計”。(根據具體相機和具體應用確定)基于學習的視覺理論流形學習:流形學習就是從圖像表達學習其內在流形表達的過程,這種內在流形的學習過程一般是一種非線性優(yōu)化過程。流形學習一個困難的問題是沒有嚴格的理論來確定內在流形的維度。深度學習:ImageNet等大規(guī)模圖像數據集的出現VGG、AlexNet、ResNet等深度學習網絡模型LLMs1、緒論人類視覺計算機視覺計算機視覺的發(fā)展經典機器視覺理論計算機視覺的應用和挑戰(zhàn)課程內容及要求計算機視覺的應用領域安全監(jiān)控工業(yè)檢測軍事國防遙感氣象醫(yī)學診斷文化教育智能交通娛樂影視……安全監(jiān)控工業(yè)檢測軍事國防遙感氣象醫(yī)學診斷計算機視覺面臨的挑戰(zhàn)

人類視覺機理還不是完全清楚視覺感知技術有待變革多模態(tài)融合需要深入探索面向復雜開放場景的模型泛化性亟待提高……1、緒論人類視覺計算機視覺計算機視覺的發(fā)展經典機器視覺理論計算機視覺的應用和挑戰(zhàn)課程內容及要求課程內容和安排章節(jié)名稱教學內容及重點(▲)、難點(★)第一章

緒論1.1機器視覺1.2計算機視覺▲1.3機器視覺的發(fā)展▲1.4經典機器視覺理論▲1.5計算機視覺的應用與挑戰(zhàn)▲第二章

圖像表示和處理2.1圖像表示▲2.2圖像的基本性質▲2.3圖像處理數學基礎▲2.4圖像處理▲第三章

點特征表示3.1圖像點特征表示▲★3.2圖像特征點檢測算法

3.3圖像點特征應用▲★第四章線特征表示4.1邊緣檢測4.2Snake模型▲4.3ASM/AAM模型

4.4霍夫變換第五章區(qū)域分割5.1區(qū)域分割的定義5.2傳統(tǒng)數字圖像區(qū)域分割算法▲★5.3基于深度學習的區(qū)域分割算法▲★章節(jié)名稱教學內容及重點(▲)、難點(★)第六章紋理分析6.1紋理的概念▲★6.2經典紋理分析方法▲★6.3基于深度學習的紋理分析方法▲★第七章攝像機成像模型7.1成像原理▲★7.2攝像機成像模型▲7.3攝像機標定▲★第八章三維立體視覺重建8.1三維重建介紹▲★8.2多視幾何▲★8.3三維重建技術▲★8.4其他三維重建技術▲★第九章運動分析9.1運動分析簡介▲9.2時間差分法▲★9.3背景減除法▲9.4光流法▲★第10章計算機視覺應用10.1圖像分類▲10.2目標檢測▲10.3目標跟蹤▲課程要求基礎知識數學、圖像處理、圖形學、模式識別、人工智能、機器學習C/C++,matlab,Python程序設計參考文獻ComputerVision:AModernApproach,D.A.ForsythandJ.Ponce,2003,PearsonEducation;ImageProcessing,Analysis,andMachine,M.Sonka,V.Hlavac,andR.Boyle,2004,ThomsonLearning;ComputerVision:AlgorithmsandApplications,2ndEdition,RichardSzeliski,2022,Springer;計算機視覺——計算機理論與算法基礎,馬頌德,張正友,1998,科學出版社;計算機視覺——算法與系統(tǒng)原理,高文,陳熙霖,1999,清華大學出版社,廣西科學技術出版社CVPR,ICCV,ECCV,ACCV;IJCV機器視覺與其他學科的關系圖像處理(ImageProcessing)圖像處理,人是最終的解釋者計算機視覺,計算機是圖像的解釋者模式識別(PatternRecognition)根據從圖像中抽取的統(tǒng)計特性或結構信息,把圖像分成設定的類別人工智能(Artificialintelligence)主要研究智能系統(tǒng)的設計和有關智能的計算理論與方法計算機圖形學(ComputerGraphics)計算機圖形學是一種使用數學算法將二維或三維圖形轉化為計算機顯示器的柵格形式的科學機器視覺:從二維圖像數據到三維描述機器視覺與其他學科的關系計算機圖形學謝謝!計算機視覺戰(zhàn)略性新興領域“十四五”高等教育系列教材2、圖像表示和處理圖像表示圖像的基本性質圖像處理數學基礎圖像處理圖像表示圖像表示將連續(xù)函數采樣(sampled)為M行N列的矩陣將每個連續(xù)樣本量化(quantization)為一個整數值,即圖像函數的連續(xù)范圍被分成了K個區(qū)間采樣和量化的越精細,即增大M,N,K,連續(xù)圖像函數的近似性越好圖像表示連續(xù)圖像函數f(x,y)可通過平面上離散的柵格點來采樣圖像采樣點:兩個相鄰采樣點間,在x軸和y軸上的距離分別是Δx和Δy,稱距離Δx和Δy為采樣間隔,采樣后得到的矩陣fs(mΔx,nΔy)構成了離散圖像采樣圖像是連續(xù)圖像函數f(x,y)與采樣函數s(x,y)的乘積圖像表示根據Shannon采樣定理即采樣間隔應小于或等于圖像中感興趣的最小細節(jié)尺寸的一半。圖像表示采樣量化將采樣后的圖像fs(mΔx,nΔy)的像素值用一個整數來表示,為了是人能夠覺察出圖像的細微變化,量化的級別要足夠高大部分的圖像處理儀器都采用k個等間隔的量化方式,如果用b位來表示像素亮度的數值,那么亮度階就是k=2b通常使用每個像素8個比特,特殊的測量設備每個像素使用12個或更多的比特2、圖像表示和處理圖像表示圖像的基本性質圖像處理數學基礎圖像處理圖像的基本性質距離(distance)兩點p(x,y)和q(u,v)之間的距離:歐氏距離:城區(qū)距離:棋盤距離:

圖像的基本性質像素鄰接性(adjacency)4-鄰接:任意兩像素之間的距離為D4=18-鄰接:任意兩像素之間的距離為D8=1區(qū)域(region):由一些彼此鄰接的像素組成的集合連通性(contiguous)連通:一幅圖像的兩個像素之間存在一條路徑連通關系具有自反性、對稱性和傳遞性區(qū)域中沒有孔,稱為簡單連通,有孔的區(qū)域稱為復連通圖像的基本性質邊緣(edge)邊緣是圖像上灰度的不連續(xù)點,或者灰度變化劇烈的地方,它是一個有大小和方向的矢量邊界(border)區(qū)域R的邊界是其自身的像素集合,其中的每個點具有一個或多個R外的鄰接點邊界和邊緣不同,邊界是與區(qū)域有關的全局概念,而邊緣表示圖像函數的局部性質;邊界與邊緣也相互關聯,一種尋找邊界的方法是連接顯著的邊緣圖像的基本性質直方圖:給出了圖像中亮度值z出現的概率,一幅有L階的圖像直方圖由具有L個元素的一維數組表示算法:計算亮度直方圖創(chuàng)建大小為L的一維數組H數組H的所有元素初始化為0對于圖像f的所有元素,做如下處理:圖像的基本性質圖像中的噪聲實際圖像常受一些隨機誤差的影響而退化,這些退化稱為噪聲(noise)在圖像捕獲、傳輸或處理中都可能出現噪聲白噪聲(whitenoise):具有常量的功率譜,強度不隨著頻率的增加而衰減。高斯噪聲(Gaussiannoise)是服從正態(tài)分布的隨機變量,一維情況下的概率密度函數為:圖像的基本性質圖像中的噪聲噪聲有可能依賴于圖像內容,也可能與之無關加性噪聲(additivenoise):噪聲與出現的圖像信號無關乘性噪聲(multiplicativenoise):噪聲的幅值與信號本身的幅值相關用信噪比SNR度量圖像的品質,值越大越好計算噪聲貢獻的平方和:信號的所有平方和:信噪比:2、圖像表示和處理圖像表示圖像的基本性質圖像處理數學基礎圖像處理圖像處理數學基礎卷積傅里葉變換卷積(Convolution)二維函數f和h的卷積g記為f*h,由積分定義二維離散卷積傅立葉變換(FourierTransform)二維連續(xù)傅立葉變換及其逆變換二維離散傅立葉變換及其逆變換傅立葉變換傅立葉變換的結果F(u,v)通常為復數,令R(u,v)和I(u,v)分別表示F(u,v)的實部和虛部傅立葉頻譜:相位角:2、圖像表示和處理圖像表示圖像的基本性質圖像處理數學基礎圖像處理圖像處理圖像處理的目的是改善圖像數據,抑制不需要的變形或者增強某些對于后續(xù)處理重要的圖像特征像素亮度變換灰度映射直方圖均衡直方圖規(guī)定化圖像增強空域、頻域圖像復原像素亮度變換

灰度級變換

底片變換通過分段函數增強了圖像在亮度p1到p2間的對比度圖像二值化直方圖均衡化(histogramequalization)直方圖均衡化的目標是創(chuàng)建一幅在整個亮度范圍內具有相同亮度分布的圖像直方圖均衡化增強了靠近直方圖極大值附近的亮度的對比度,減小了極小值附近的對比度直方圖均衡化輸入直方圖H(p),輸入灰度級范圍為[p0,pk],直方圖均衡化的目標:找到一個單調的像素亮度變換q=T(p),使輸出直方圖G(q)在整個輸出亮度范圍[q0,qk]內是均勻的直方圖可看作離散的概率密度函數,變換T是單調的若圖像有M行N列,均衡化后的直方圖G(q)對應著均衡的概率密度函數,其函數值為一個常數直方圖均衡化公式代入:當考慮“理想的”連續(xù)概率密度時,可以得到精確的均衡化直方圖得到像素亮度變換T積分稱為累計直方圖,在數字圖像中用求和近似,結果直方圖并不是理想均衡的直方圖均衡化算法:直方圖均衡化對于L(256)個灰度級、大小為M×N的圖像,創(chuàng)建長為L的數組H,初始化為0,形成圖像直方圖H形成圖像直方圖H通過將直方圖進行歸一化和累加來計算累計直方圖Hc設置重新掃描圖像,根據變換T獲得直方圖近似為均勻分布的輸出圖像空域濾波局部預處理使用輸入圖像中像素的一個小鄰域內的像素信息,產生輸出圖像中新的對應像素的亮度值。這種預處理技術在使用信號處理的術語時被稱為濾波(filtering)。線性濾波:輸出圖像像素g(m,n)的計算結果是輸入圖像像素f(m,n)一個局部鄰域Ω的亮度線性組合。鄰域Ω中的像素貢獻通過系數h進行加權:

h:濾波器、卷積掩膜、核、窗口非線性濾波:基于鄰域進行非線性操作,如中值濾波空域濾波圖像平滑圖像平滑主要用來抑制噪聲,等價于抑制頻域中的高頻成分邊緣也屬于頻域中的高頻,平滑同時會模糊承載圖像中重要信息的邊緣,需要集中考慮具有邊緣保持功能的平滑方法此類方法的基本思路:僅使用鄰域中與被處理像素有類似性質的點進行平均平均(averaging)限制數據有效性下的平均(averagingwithlimiteddatavalidity)反梯度平均(averagingaccordingtoinversegradient)旋轉掩膜平均(averagingusingarotatingmask)中值濾波(medianfiltering)平均假設每個像素上的噪聲是一個均值為0,標準差為σ的獨立隨機變量,則可通過多次采集相同的靜態(tài)景物來獲得一幅平均圖像:平均圖像中的噪聲仍是隨機變量,均值為0,標準差為若只能獲得一幅帶有噪聲的圖像,則通過圖像的局部鄰域實現平均如果噪聲大小小于圖像中感興趣的最小尺寸,處理結果是可以接受的,但仍存在邊緣模糊的問題在單幅圖像中做平滑,需要假設圖像數據中的灰度級沒有變化,這種假設在圖像邊緣處顯然是不成立的平均平均是離散卷積的一個特例,對于3×3的鄰域,卷積掩膜h為:其他形式的卷積掩膜:加噪聲結果原始圖像10×10掩膜5×5掩膜限制數據有效性下的平均試圖僅使用滿足某種標準的像素做平均來避免模糊一個簡單的準則:設定非法數據范圍[min,max],只有具有非法灰度級別的像素值才被其鄰域的平均所取代;只有有效的數據才對鄰域的平均有貢獻反梯度平均在每個像素上,根據反梯度計算卷積掩膜其基本思想是:區(qū)域內部的亮度變化一般小于相鄰區(qū)域間的亮度變化設像素(m,n)是卷積掩膜的中心像素,像素點(i,j)相對于(m,n)的反梯度為 當時,卷積掩膜: 中心像素上:旋轉掩膜平均通過搜索當前像素鄰域的一致性部分來避免邊緣模糊,像素的平均操作只在具有一致性的區(qū)域內進行定義一個掩膜,將其在當前像素周圍進行旋轉。在旋轉過程中計算每個掩膜位置下像素值的平均值,并觀察這些平均值的變化設區(qū)域R的像素數目是n,且輸入圖像是f,用亮度散布σ2度量區(qū)域的一致性:中值濾波基本思想:用鄰域中亮度的中值代替圖像當前的點最大值最小值中點(max+min)/2最頻值窗口濾波加噪聲結果原始圖像3×3窗口2×2窗口頻域濾波假定原圖像f(x,y),經傅立葉變換為F(u,v),頻域濾波就是選擇合適的濾波器函數H(u,v)對F(u,v)的頻譜成分進行調整,然后經逆傅立葉變換得到增強的圖像g(x,y)。該過程可以通過下面流程描述:

G(u,v)=H(u,v)·F(u,v),H(u,v)稱為傳遞函數或濾波器函數。頻域濾波原理低通濾波高通濾波帶通濾波同態(tài)濾波低通濾波(Lowpassfilters)

圖像從空間域變換到頻率域后,其低頻分量對應圖像中灰度值變化比較緩慢的區(qū)域,高頻分量則表征圖像中物體的邊緣和隨機噪聲等信息。低通濾波是指保留低頻分量,而通過濾波器函數H(u,v)減弱或抑制高頻分量的在頻域進行的濾波。低通濾波與空域中的平滑濾波器一樣可以消除圖像中的隨機噪聲,減弱邊緣效應,起到平滑圖像的作用。D0是一個非負整數,D是從點(u,v)到頻率平面原點的距離即:理想低通濾波器的含義是指小于D0的頻率,即以D0為半徑的圓內的所有頻率分量可以完全無損地通過,而圓外的頻率,即大于D0的頻率分量則完全被除掉。理想低通濾波器二維理想低通濾波器的傳遞函數如下:低通濾波的能量和D0的關系能量在變換域中集中在低頻區(qū)域。以理想低通濾波作用于N×N的數字圖像為例,其總能量為一個以頻域中心為原點,r為半徑的圓就包含了百分之

的能量根據對保留能量的要求來確定濾波器的截止頻率。

頻域低通濾波所產生的模糊示例r=5r=45r=11盡管只有7%的(高頻)能量被濾除,但圖像中絕大多數細節(jié)信息都已丟失了當僅4%的高頻能量被濾除后,圖像中仍有明顯的振鈴效應。理想低通濾波器的平滑作用非常明顯,但由于變換有一個陡峭的波形,它的反變換h(x,y)有強烈的振鈴特性,使濾波后圖像產生模糊效果。因此這種理想低通濾波實用中不能采用?!罢疋彙爆F象H(u,v)h(x,y)理想低通濾波器巴特沃斯(Butterworth)低通濾波器巴特沃斯低通濾波器的傳遞函數為:D0為截止頻率,n為函數的階。一般取使H(u,v)最大值下降到最大值的0.5時的D(u,v)為截止頻率D0。Butterworth低通過濾器的截面圖H(u,v)作為D(u,v)/D0的函數的截面圖Butterworth低濾波效果D0=5D0=11D0=22D0=45n=2原始圖像D0特點:結果圖像的清晰度較理想低通濾波器有所改善,振鈴效應也有所減弱。應用時可調整D1值,既能達到平滑圖像的目的,又可以使圖像保持足夠的清晰度。梯形低通濾波器一般取使H(u,v)最大值下降至原來的1/2時的D(u,v)為截止頻率D0n=3D0指數低通濾波器特點:指數低通濾波器從通過頻率到截止頻率之間沒有明顯的不連續(xù)性,而是存在一個平滑的過渡帶。指數低通濾波器實用效果比Butterworth低通濾波器稍差,但仍無明顯的振鈴現象。

高通濾波(Highpassfilters)圖像的邊緣、細節(jié)主要在高頻,圖像模糊是由于高頻成分較弱產生的。為了消除模糊,突出邊緣,可以采用高通濾波的方法,使低頻分量得到抑制,從而達到增強高頻分量,使圖像的邊沿或線條變得清晰,實現圖像的銳化。理想高通濾波器梯形高通濾波器(GHPF)D1D0n=3巴特沃思(Butterworth)高通濾波器(BHPF)n=3指數高通濾波器(EHPF)IHPF濾波效果,D0=15,30,80。D0越小,振鈴效應越明顯。BHPF,比IHPF的結果平滑得多。EHPF濾波效果高通濾波器比較小結理想高通有明顯振鈴,圖像的邊緣模糊不清。Butterworth高通效果較好,振鈴不明顯,但計算復雜。指數高通效果比Butterworth差些,但振鈴也不明顯。梯形高通的效果是微有振鈴、但計算簡單,故較常用。帶阻濾波(Bandstopfilter)

帶通濾波(Bandpassfilter)在某些情況下,信號或圖像中的有用成分和希望除掉的成分主要分別出現在頻譜的不同頻段,這時允許或阻止特定頻段通過的傳遞函數就非常有用。帶阻濾波可在點(u0,v0)和(-u0,-v0)某個圓形鄰域D處設計帶阻濾波器,即抑制以(u0,v0)為中心,D0為半徑的鄰域中所有頻率都阻止通過的濾波器。它的濾波函數為:帶通濾波器與帶阻濾波器互補允許一定頻率范圍(阻止其它頻率范圍)Hp(u,v)可用帶阻濾波器HR(u,v)公式表示:

HP(u,v)=-[HR(u,v)-1](a)被正弦噪聲污染的圖像(b)圖像(a)的頻譜(c)巴特沃思帶阻濾波器(d)濾波效果物體受到照度明暗不勻的時候,圖象上對應照度暗的部分,細節(jié)難辨別。同態(tài)濾波(Homomorphicfiltering)根據成像模型,若照度為

i(x,y),反射系數為r(x,y),則:同態(tài)濾波可以消除不均勻照度的影響而又不損失圖象細節(jié)。依據:圖象的灰度由照射分量和反射分量合成。反射分量反映圖象內容,隨圖象細節(jié)不同在空間上作快速變化。照射分量在空間上通常均具有緩慢變化的性質。因此,照射分量的頻譜落在空間低頻區(qū)域,反射分量的頻譜落在空間高頻區(qū)域。但在頻率域中不能直接對照度場和反射系數場頻率分量分別進行獨立的操作,即如果定義:這里I(u,v)、R(u,v)分別是lni(x,y)和lnr(x,y)的傅里葉變換。同態(tài)濾波就是利用上式的形式將圖像中的照明分量和反射分量分開,這樣濾波函數就可以分別作用在這兩個分量上。同態(tài)濾波(Homomorphicfiltering)(1)兩邊取對數:

(2)兩邊取付氏變換:(3)用頻域函數

H(u,v)處理

F(u,v):(4)反變換到空域:(5)兩邊取指數:同態(tài)濾波處理步驟特點:能消除乘性噪聲,能同時壓縮圖象的整體動態(tài)范圍 和增加圖象中相鄰區(qū)域間的對比度同態(tài)濾波流程圖H(u,v)一方面減弱了低頻另一方面加強了高頻。(a)降低曝光度的Lena圖

(b)濾波后的圖像頻域技術與空域技術空域增強技術可轉化到頻域實現,頻域增強技術可轉化到空域實現。頻域里低通濾波器的轉移(或傳遞)函數對應空域里平滑濾波器的模板函數的傅里葉變換。頻域里高通濾波器的轉移函數對應空域里銳化濾波器的模板函數的傅里葉變換。頻域越寬,空域越窄,平滑作用越弱頻域越窄,空域越寬,模糊作用越強空域技術中無論使用點操作還是模板操作,每次都只是基于部分像素的性質。頻域技術每次都利用圖像中所有像素的數據,具有全局性,有可能更好地體現圖像的整體特性,如整體對比度和平均灰度值等。謝謝!計算機視覺戰(zhàn)略性新興領域“十四五”高等教育系列教材目錄1圖像點特征表示2圖像特征點檢測算法3圖像點特征應用4總結圖像的點特征表示目錄1圖像點特征表示2圖像特征點檢測算法3圖像點特征應用4總結圖像分割在圖像處理和計算機視覺領域中,角點(也稱做關鍵點)是指圖像中兩條邊緣的交匯點,這些點通常表現出與周圍背景有顯著差異的特征。角點的主要特性是局部區(qū)域內像素的梯度方向發(fā)生顯著變化,這種變化意味著無論圖像如何旋轉或視角如何變化,角點都是容易識別的。Hpatches數據集中圖像關鍵點示例定義目錄1圖像點特征表示2圖像特征點檢測算法3圖像點特征應用4總結1.Harris角點檢測人眼對角點的識別是通過一個局部的窗口滑動而觀察到的,主要可以分成三種情況:在各個方向上滑動窗口,窗口內區(qū)域灰度值較大變化,則認為窗口內遇到角點。(圖a)在各個方向上滑動窗口,窗口內區(qū)域灰度值未發(fā)生變化,則認為窗口內無角點。(圖b)在某個方向上滑動窗口,窗口內區(qū)域灰度值較大變化,但在另一些方向上灰度值未發(fā)生變化,則認為窗口內圖像可能是直線段。(圖c)Harris角點檢測算法步驟Harris角點檢測步驟主要包含以下三步:(1)統(tǒng)計局部窗口內灰度變化

Harris角點檢測算法步驟(2)計算角點響應函數

(3)角點判定

2.SIFT特征點檢測

在圖像處理和計算機視覺領域,特征點檢測和描述是識別、匹配和跟蹤對象的關鍵步驟。尺度不變特征變換(Scale-InvariantFeatureTransform,簡稱SIFT)是由DavidLowe在1999年提出的一種算法,旨在從圖像中提取具有尺度不變性的特征點,并對光照變化、噪聲以及視角改變具有強大的魯棒性。SIFT特征廣泛應用于圖像匹配、機器人導航、三維模型構建、手勢識別等領域。(1)SIFT特征點檢測核心概念SIFT特征點檢測通過在特征點在各個圖像尺度和位置上都有獨特得穩(wěn)定性特點,在多尺度空間中檢測極值點來尋找特征點。算法核心是建立一個多尺度空間,確保特征點對圖像尺度的變化保持不變性。通過高斯差分(DifferenceofGaussian,DoG)函數來近似拉普拉斯尺度空間,從而識別出在多個尺度空間中穩(wěn)定的關鍵點。(2)SIFT特征點檢測主要流程SIFT(尺度不變特征變換)算法是一個復雜的圖像處理過程,其可以分成一下四個主要步驟:尺度空間構建及極值點檢測、關鍵點定位、方向賦值、以及描述子生成。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程1)尺度空間構建及極值點檢測尺度空間理論是SIFT算法的核心,其目的是模擬圖像數據在不同尺度的表現。尺度空間通過連續(xù)的高斯模糊來構建,每個新尺度都是上一尺度圖像的高斯平滑版本。利用高斯差函數來識別對尺度和方向不變的潛在興趣點。尺度空間定義為一個函數L(x,y,σ),如式3-5所示:

2.SIFT特征點檢測(2)SIFT特征點檢測主要流程1)尺度空間構建及極值點檢測式3-6中,??是尺度參數,決定了模糊的程度。對于每個圖像金字塔層(octave),圖像首先被上一圖像金字塔層最后一個圖像的二倍降采樣得到,然后應用一系列的高斯核進行卷積,形成一組尺度圖像,如圖所示。在尺度空間中,極值點是潛在的特征點。通過比較一個像素點在當前尺度圖像中與其相鄰的8個像素點,以及在尺度上下的18個像素點(總共26個鄰域點)的灰度值,來確定該點是否為極值。如果一個像素在其鄰域中是最大或最小值,則被認為是潛在的特征點。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程1)尺度空間構建及極值點檢測這些潛在特征點被認為是對尺度和旋轉不變的,因為它們來自于多尺度的極值檢測。這一步驟可以通過DifferenceofGaussian(DoG)圖像來實現,如圖所示,DoG圖像是相鄰尺度間的高斯圖的差異,如公式3-7所示:

k是相鄰尺度間的固定常數比例。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程2)關鍵點定位關鍵點定位目的是從尺度空間極值點中精確地確定特征點的位置和尺度,并同時去除那些對匹配質量貢獻較低的點。SIFT算法通過擬合三維二次函數來對每一個候選的特征點進行精細定位。通過將近似DoG函數D(x,y,σ)在極值點附近進行泰勒展開,如公式3-8所示:

式3-8中,D表示在極值點位置的DoG函數值,(?D^T)/?x表示DoG函數的梯度,(?^2D)/(?x^2)表示DoG函數的Hessian矩陣,x=(x,y,σ)表示相對于初步檢測的極值點的偏移量。通過對公式3-8進行求解得到偏移量x的值,若偏移量過大,則認為極值點定位不夠精確,該點將會被丟棄。對于每一個精細定位后的關鍵點,通過計算其DoG函數值來判斷該點是否具有足夠的對比度。若該值小于某個閾值,則認為該點的對比度太低,不適合作為特征點,將會被丟棄。通過計算Hessian矩陣的兩個特征值的比率,可以判斷一個點是否位于邊緣上。若比率大于某個閾值,則該點會被認為是邊緣點,因此被丟棄。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程3)方向賦值方向賦值是為了增強關鍵點的旋轉不變性,即使在圖像旋轉時,關鍵點的描述仍能保持一致。首先需要計算關鍵點周圍的圖像梯度,可以通過公式3-9和3-10進行計算:

L(x,y)表示關鍵點所在尺度的圖像強度,m(x,y)表示梯度大小,θ(x,y)表示梯度方向。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程3)方向賦值對于每一個關鍵點,利用周圍區(qū)域的梯度信息構建方向直方圖,如圖3-4所示,通常分成36個柱,每個柱覆蓋10°,梯度的大小作為該方向的權重,因此直方圖的每個柱的值是該方向上梯度大小的加權和。直方圖構建完畢后,通過搜索直方圖的峰值來確定關鍵點的主方向。在某些情況下,若其他方向的值大于主方向的某個閾值(如80%),可以將其作為關鍵點的輔方向,因此同一個位置可能有兩個一樣的關鍵點,只是方向不同。最后,每個關鍵點根據其方向直方圖中的峰值被賦予一個或多個方向。這樣,每個關鍵點不僅被其位置和尺度描述,還被其方向描述,從而使得特征描述符對旋轉具有不變性。2.SIFT特征點檢測(2)SIFT特征點檢測主要流程4)描述子生成描述子生成將每個關鍵點轉換成一個具有強烈區(qū)分能力的特征向量,使得這些特征可以在不同的圖像之間進行有效匹配。首先,圍繞每個關鍵點定義一個16x16像素的鄰域窗口。該窗口是從關鍵點的尺度空間中進行選擇,窗口的大小會根據關鍵點所在的尺度進行調整。為了保持描述子的空間信息,這個16x16的窗口進一步被劃分為16個4x4的子區(qū)域。每個子區(qū)域將用來獨立地收集和描述局部特征。對于每個4x4的子區(qū)域,計算其中每個像素的梯度大小和方向。方向通常根據關鍵點的主方向進行調整,以保證描述子的旋轉不變性。調整后的方向可以通過公式3-11計算:

2.SIFT特征點檢測(2)SIFT特征點檢測主要流程4)描述子生成對每個4×4的子區(qū)域,根據調整后的梯度方向創(chuàng)建一個8柱的方向直方圖。每個柱覆蓋45度。梯度的大小用作加權因子,表示更明顯的梯度變化。此外,使用高斯窗口對梯度大小進行加權,對子區(qū)域中心附近的像素產生更大的影響。最終,所有的16個子區(qū)域的方向直方圖聯合形成一個128維(16×8個方向)的特征向量。若需要提高特征向量對光照變化的魯棒性,需要對這個128維向量進行歸一化處理。即減少了圖像光照變化對特征描述子的影響。SIFT特征點檢測算法由于其尺度不變性、旋轉不變性、局部性、魯棒性等特點,在圖像處理和計算機視覺領域中占有重要的地位,是學術和工業(yè)應用中常用的關鍵技術之一。3.HardNet點特征學習HardNet整體由兩部分構成:特征學習網絡L2Net基于一個訓練批次中困難樣本學習的SoftReg采樣策略L2Net結構3.HardNet點特征學習

困難樣本采樣示意3.HardNet點特征學習

困難樣本采樣示意

(3-12)3.Key.Net關鍵點檢測網絡Key.Net體系結構結合了手工和學習方法的成功思想,網絡中使用比例空間表示法提取不同級別的關鍵點,以檢測在各種比例尺上都存在的穩(wěn)健特征,并最大程度地提高可重復性得分Key.Net網絡結構,結合手工設計的濾波器核可學習濾波器3.Key.Net關鍵點檢測網絡Key.Net網絡結構,結合手工設計的濾波器核可學習濾波器

(3-13)3.Key.Net關鍵點檢測網絡Key.Net網絡結構,結合手工設計的濾波器核可學習濾波器

3.Key.Net關鍵點檢測網絡Key.Net網絡結構,結合手工設計的濾波器核可學習濾波器(2)多尺度金字塔我們將體系結構設計為對小尺度變化具有魯棒性,而無需計算多個前向特征。如圖3-7所示,該網絡包括輸入圖像的三個比例級別,這些級別的圖像模糊和降采樣了1.2倍。將由手工過濾器生成的所有特征圖連接起來,以饋每個比例級別中的學習過濾器堆棧。所有這三個流均具有權重,因此相同類型的錨點來自不同的級別,并形成最終關鍵點的候選集。然后將所有比例級別的特征圖上采樣,連接并饋入最后的卷積濾波器,以獲取最終的特征響應圖。目錄1圖像點特征表示2圖像特征點檢測算法3圖像點特征應用4總結圖像配準圖像配準是圖像處理研究領域中的一個典型問題和技術難點。具體地說,對于一組圖像數據集中的兩幅圖像,通過尋找一種空間變換把一幅圖像映射到另一幅圖像,使得兩圖中對應于空間同一位置的點一一對應起來,從而達到信息融合的目的。(a)參考圖像(b)待配準圖像(c)圖像配準結果圖像配準特征提取從參考圖像和待配準圖像中提取特征點,常用的特征點包括角點、邊緣點或尺度不變特征點(SIFT、SURF等)參考圖像待配準圖像特征點檢測特征提取特征匹配變換估計圖像變換圖像融合基本原理圖像配準輸入圖像……關鍵點檢測裁取圖像塊特征提取……參數估計與圖像變換特征匹配關鍵點檢測:從圖像中檢測出具有顯著特征的關鍵點,用于描述圖像的局部結構和特征。特征提取:對于每個關鍵點,提取出描述其局部特征的向量或描述子,以便后續(xù)的特征匹配過程使用。特征匹配:通過對比圖像中的關鍵點特征描述子,將兩幅圖像中相對應的關鍵點進行匹配,以建立它們之間的對應關系。參數估計與圖像變換:根據匹配的關鍵點對,估計出圖像之間的變換參數,并將其中一個圖像進行適當的幾何變換,以實現兩幅圖像的對齊。基于關鍵點特征的圖像配準圖像配準基于關鍵點特征的圖像配準可見光圖像連線圖SAR圖像棋盤圖配準圖圖像配準基于關鍵點特征的圖像配準

這些隨機選出的匹配點對是正確的,具有較高的定位精度,棋盤格圖像中的交匯點是光滑的,基本上沒有任何錯位現象。目錄1圖像點特征表示2圖像特征點檢測算法3圖像點特征應用4總結目錄總結本章介紹了圖像點的特征表示。圖像特征點是計算機視覺領域的核心概念之一,涉及圖像中穩(wěn)定且具有代表性的特征點的提取和描述。在此基礎上,介紹了主流的特征點檢測算法包括Harris角點檢測、SIFT、SURF等,適用于不同的應用場景。基于深度學習的HardNet特征學習算法以及結合手工特征和深度特征的Key.Net算法為讀者提供了最新的研究視野。這些特征點匹配算法為圖像中重要區(qū)域的快速定位奠定了基礎。圖像點特征在計算機視覺中有著廣泛的應用,總的來說,圖像點特征是計算機視覺領域不可或缺的基礎知識,掌握好這一概念和相關技術對于后續(xù)的視覺任務至關重要

謝謝!計算機視覺戰(zhàn)略性新興領域“十四五”高等教育系列教材4、線特征表示邊緣檢測:邊緣檢測算子SNAKEASM/AAMHough變換邊緣檢測圖像邊緣的產生 物體的邊界、表面方向的改變、不同顏色或材質、光照明暗的變化物體的邊界表面方向變化不同顏色區(qū)域光照明暗邊緣的定義定義:“邊緣是圖像中亮度突然變化的區(qū)域。”“圖像灰度構成的曲面上的陡峭區(qū)域?!薄跋袼鼗叶却嬖陔A躍變化或屋脊狀變化的像素的集合?!被叶葓D像中邊緣的類型階梯狀邊緣屋脊狀邊緣線條狀邊緣為什么要提取邊緣?邊緣是最基本的圖像特征之一:可以表達物體的特征邊緣特征對于圖像的變化不敏感幾何變化,灰度變化,光照方向變化可以為物體檢測提供有用的信息是一種典型的圖像預處理過程原始圖像輸出結果模式識別預處理特征提取如何提取邊緣?(灰度圖象)灰度圖象邊緣提取,主要的思想:抑制噪聲(低通濾波、平滑、去噪、模糊)邊緣特征增強(高通濾波、銳化)邊緣定位原始圖像中間結果圖像邊緣抑制噪聲增強邊緣邊緣定位圖像微分算子一階微分算子(梯度算子)Prewitt,Sobel

檢測最大值二階微分算子(Laplacian)檢測過零點微分算子檢測邊緣:一維信號一階導數的極大值點:二階導數的過零點:注意:僅僅等于0不夠,常數函數也為0,必須存在符號改變微分算子檢測邊緣:二維信號一階導數的極大值點:其中,圖像梯度向量:梯度幅值表示邊緣的強弱,梯度方向代表灰度變化最快的方向微分算子檢測邊緣:二維信號二階導數的過零點:拉普拉斯算子:各向同性的兩階微分算子,保持旋轉不變在數字圖像上計算梯度一維的情況:f(x)x-1x+1對于離散的數字信號,可以使用差分近似:相當于與如下模板進行卷積運算:-101×0.5在數字圖像上計算梯度使用差分運算在數值上近似一階微分運算-101-101豎直邊緣水平邊緣×0.5×0.5病態(tài)問題:一維信號的例子從圖像中取出某行像素值:邊緣在哪里?病態(tài)問題:一維信號的例子Question:假設噪聲的幅度很小,是否也很?。坷涸肼暈楦哳l的正旋波信號的微分不能由帶有噪聲的觀測信號的微分得到解決方法:先進行濾波峰值為邊緣的位置利用卷積運算的性質:峰值為邊緣的位置Sobel算子Prewitt算子Roberts算子圖像梯度算子的近似Prewitt算子-101-101-101計算均值,平滑噪聲檢測豎直邊緣-1-1-1000111計算均值,平滑噪聲檢測水平邊緣Prewitt算子,近似一階微分卷積模版:去噪+增強邊緣Sobel算子-101-202-101計算均值,平滑噪聲檢測豎直邊緣-1-2-1000121計算均值,平滑噪聲檢測水平邊緣Sobel算子,近似一階微分去噪+增強邊緣,給四鄰域更大的權重常見的梯度算子(a):Roberts算子 (b):3x3Prewitt算子(c):Sobel算子 (d):4x4Prewitt算子Sobel,Prewitt例子在數字圖像上計算二階微分拉普拉斯算子拉普拉斯算子的數字近似3*3卷積模版0-10-14-10-10-1-1-1-18-1-1-1-1拉普拉斯算子的特點拉普拉斯算子的運算結果是標量只有幅值,只使用一個模版便可計算得到方向屬性丟失實際中幾乎不單獨使用拉普拉斯算子:二次求導數,對噪聲非常敏感通常配合濾波器同時使用LaplacianofGaussian(LoG)首先用Gauss函數對圖像進行平滑,抑制噪聲然后對經過平滑的圖像使用Laplacian算子利用卷積的性質LoG算子等效于:

Gaussian平滑+Laplacian二階微分高斯拉普拉斯LaplacianofGaussianoperator過零點為邊緣的位置二維邊緣微分濾波器LoG算子:高斯拉普拉斯高斯高斯的導數在數字圖像上實現LoG00-1000-1-2-10-1-216-2-10-1-2-1000-100

LoG因其形狀,也稱為Mexicanhat

求和為0,即對平坦圖像區(qū)域的響應為0

一個近似的卷積模版:體現主要的形狀LoG:例子(a)LennaImage(b)Gaussian模版卷積(15*15)(c)Laplacian模版卷積(3*3)(a)(b)(c)分兩步實現LoG,可以提供更大的靈活性更小的模版尺寸LoG:例子(d)將(c)中大于0的像素置1,其余置0(e)在二值圖像(d)上檢測邊緣,使用形態(tài)學膨脹方法(f)結果顯示(d)(e)(f)幾個特點:(1)正確檢測到的邊緣:單像素寬度,定位準確(2)形成許多封閉的輪廓(spaghetti,意大利面條)(3)需要更加復雜的算法檢測過零點Canny邊緣檢測器最常用的邊緣檢測方法之一一個優(yōu)化的方案噪聲抑制邊緣增強邊緣定位J.Canny,“AComputationalApproachtoEdgeDetection”,

IEEETrans.onPAMI,8(6),1986.Canny邊緣檢測算法算法基本過程:計算圖像梯度梯度非極大值抑制雙閾值提取邊緣點幅值大小M(x,y)方向Theta(x,y)NMS:Non-MaximaSuppression計算圖像梯度:高斯函數的一階導數高斯函數的一階導數(DerivativeofGaussian)可以很近似地滿足以下三條邊緣檢測最優(yōu)準則:好的邊緣檢測結果:Gooddetection

對邊緣的響應大于對噪聲的響應好的定位性能:Goodlocalization

其最大值應接近邊緣的實際位置對同一邊緣有低的響應次數: 在邊緣附近只有一個極大值點計算圖像梯度:高斯函數的一階導數

(2)使用一階有限差分計算偏導數的兩個陣列:(1)求圖像與高斯平滑濾波器卷積:-11-1111-1-1相當于與模版進行卷積運算:代表對圖像的平滑程度計算圖像梯度:高斯函數的一階導數(3)幅值和方位角:M代表梯度幅值的大小,在存在邊緣的圖像位置處,M的值變大,圖像的邊緣特征被“增強”如何檢測邊緣?局部極值周圍存在相近數值的點非極大值抑制NMS非極大值抑制(NMS:Non-MaximaSuppression)主要思想:由梯度幅值圖像M(x,y),僅保留極大值。(嚴格地說,保留梯度方向上的極大值點。)得到的結果為N(x,y),具體過程:初始化N(x,y)=M(x,y)對于每個點,在梯度方向和反梯度方向各找n個像素點。若M(x,y)不是這些點中的最大點,則將N(x,y)置零,否則保持N(x,y)不變。N(x,y)單像素寬度:問題:額外的邊緣點,丟失的邊緣點非極大值抑制NMS

在梯度方向的沿線上檢測該點是否為局部極大值簡化的情形,只使用4個方向:{0,45,90,135}

得到的結果N(x,y)包含邊緣的寬度為1個像素對NMS結果進行二值化對上述得到的N(x,y)使用閾值進行二值化使用大的閾值,得到:少量的邊緣點許多空隙使用小的閾值,得到:大量的邊緣點大量的錯誤檢測使用雙閾值檢測邊緣兩個閾值T1,T2:T2>>T1由T1得到E1(x,y),低閾值邊緣圖:更大的誤檢測率由T2得到E2(x,y),高閾值邊緣圖:更加可靠邊緣連接:E1E1E1E1E2E2E2邊緣連接將E2(x,y)中相連的邊緣點輸出為一幅邊緣圖像E(x,y)對于E(x,y)中每條邊,從端點出發(fā)在E1(x,y)中尋找其延長的部分,直至與E(x,y)中另外一條邊的端點相連,否則認為E1(x,y)中沒有它延長的部分將E(x,y)作為結果輸出Canny算子例子原始圖像原始圖像經過Gauss平滑Canny算子例子梯度幅值圖像梯度幅值經過非極大值抑制Canny算子例子低閾值邊緣圖像高閾值邊緣圖像Canny輸出邊緣圖像使用Canny算子需要注意的問題Canny算子的優(yōu)點:參數較少計算效率得到的邊緣連續(xù)完整參數的選擇:Gauss濾波的尺度雙閾值的選擇(LOW=HIGH*0.4)漸增高斯濾波模版的尺寸漸增雙閾值的大小,保持low=high*0.44、線特征表示邊緣檢測:邊緣檢測算子SNAKEASM/AAMHough變換活動輪廓模型活動輪廓模型(ActiveContourModels)--Snake1987,Kass,Witkin,Terzopoulos;定義:能量達到最小值的曲線—snake的能量是根據它的形狀和在圖像中的位置確定的一種特殊的變形模板匹配必須通過交互為snake具體指定一個估計的形狀和開始的位置183活動輪廓模型184Snake算法的核心思想是通過最小化一個能量函數來逼近圖像中的邊緣。這個能量函數綜合考慮了輪廓的內在屬性(如連續(xù)性和光滑性)和圖像的特征信息(如梯度),從而實現對目標輪廓的精確描述。圖4-1Snake算法處理圖活動輪廓模型活動輪廓模型-----蛇形:(a)初始snake位置(點狀線),定義在真實輪廓附近;(b)snake能量函數最小化迭代;(c)snake被拉到真實輪廓處185活動輪廓模型用于最小化的能量是外力和內力的加權和內力由snake的形狀計算得到,外力從圖像中獲得或是從更高級的圖像理解處理中得到Snake被定義為和是輪廓點的x和y的坐標值,

曲線因為彎曲所產生的內部能量;從圖像中得到的力;外部的約束力186活動輪廓模型曲線內部能量的定義:

和規(guī)定了snake的彈性(elasticity)和剛性(stiffness)在點處令=0,這樣就允許snake在該點處出現二階不連續(xù),這時就會在該點出現角點187活動輪廓模型從圖像中得到的力基于輪廓線的函數項:

表示在點位置處的圖像灰度值;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論