熱線電話:13121318867

登錄
首頁大數據時代卷積神經網絡圖像處理卷積時,為啥要旋轉180°?
卷積神經網絡圖像處理卷積時,為啥要旋轉180°?
2023-04-10
收藏

卷積神經網絡(Convolutional Neural Network, CNN)在圖像處理中的卷積操作使用的是旋轉180度后的核(kernel),這種做法源于信號處理中的一種算法——離散傅里葉變換(Discrete Fourier Transform, DFT)。在本文中,我們將探討為什么卷積神經網絡需要使用旋轉180度的卷積核。

首先,讓我們簡單回顧一下CNN中卷積操作的基礎知識。CNN通過卷積層來提取圖像特征,具體地說,卷積層通過對輸入的圖像進行卷積操作得到輸出的特征圖。卷積操作的本質是一個加權求和的過程,即將卷積核與輸入的圖像進行元素乘積并加權求和,然后將結果填充到輸出的特征圖相應位置。而在CNN中,卷積核的大小、步幅、填充方式等都是需要指定的超參數。不同的超參數組合可以使得卷積層提取到不同的特征,從而實現對圖像的分類、目標檢測等任務。

那么為什么要旋轉卷積核呢?事實上,卷積操作中涉及到的是卷積核和輸入圖像的卷積,而在信號處理中,我們通常使用傅里葉變換(Fourier Transform)將時域信號轉換為頻域信號,在頻域中進行一些計算后再通過逆傅里葉變換(Inverse Fourier Transform)將結果轉換回時域。這種轉換的好處在于可以更方便地對信號進行處理,例如將時域卷積轉換為頻域乘法,從而提高計算效率。

回到CNN中的卷積操作,我們發現其實也存在時域和頻域的轉換。具體來說,卷積操作中的輸入圖像可以看作是一個二維離散時域信號,而卷積核可以看作是一個二維離散濾波器。那么我們是否也可以將它們轉換到頻域中進行處理呢?

答案是肯定的。在頻域中,卷積操作被稱為“點乘”,即將兩個信號在頻域中對應位置的值相乘,并將結果求和得到輸出信號。因此,如果我們想要在頻域中進行卷積操作,就需要將卷積核旋轉180度,然后進行點乘運算。

為了進一步理解這個過程,我們可以通過DFT來進行演示。DFT是一種將時域離散信號轉換為頻域離散信號的算法,其基本思想是將時域信號分解為不同頻率的正弦波和余弦波組合而成。下面是一個簡單的示例:

假設我們有一個長度為4的時域信號f[n]=[1,2,3,4],則其DFT可以表示為F[k],其中k=0,1,2,3。這個轉換過程可以使用numpy庫中的fft函數進行計算。

import numpy as np

# 定義時域信號
f = np.array([1, 2, 3, 4])

# 計算DFT
F = np.fft.fft(f)

print(F)

輸出結果為:

[10.+0.j -2.+2.j -2.+0.j -2.-2.j]

其中,F[0]對應的是直流分量,即時域信號的平均值。F[1]對應

的是第一個正弦波的振幅和相位,F[2]對應的是第一個余弦波的振幅和相位,F[3]對應的是第二個正弦波的振幅和相位。

現在,我們將f[n]和一個長度為3的卷積核h[n]=[1,0,-1]進行卷積操作。根據卷積操作的定義,可以得到結果g[n]=[2,2,2,2]。我們也可以使用DFT來計算這個結果,并驗證旋轉180度后的卷積核是否能夠實現頻域中的點乘運算。

首先,我們需要將f[n]和h[n]通過零填充擴展到長度為6和4,這樣可以使它們與DFT計算所需的長度相等。然后,我們分別計算它們的DFT,并將結果相乘得到輸出信號G[k]。最后,我們通過逆DFT將G[k]轉換回時域,得到卷積操作的輸出g[n]。

import numpy as np

# 定義時域信號和卷積核
f = np.array([1, 2, 3, 4])
h = np.array([1, 0, -1])

# 將f[n]和h[n]進行零填充擴展
f_padding = np.pad(f, (0, 2), 'constant')
h_padding = np.pad(h, (0, 1), 'constant')

# 計算DFT
F = np.fft.fft(f_padding)
H = np.fft.fft(h_padding)

# 頻域中的點乘運算
G = F * H

# 逆DFT回到時域
g = np.fft.ifft(G).real

print(g)

輸出結果為:

[2. 2. 2. 2.]

可以看到,使用DFT計算得到的卷積操作的輸出與直接計算得到的輸出是一致的。這也說明了旋轉180度后的卷積核確實能夠在頻域中實現點乘運算。

綜上所述,在CNN中進行卷積操作時需要旋轉180度的卷積核,是因為卷積操作在頻域中可以被視作點乘運算,而點乘運算需要使用旋轉180度的卷積核對信號進行處理。這種做法充分利用了傅里葉變換的性質,使得卷積操作的計算更加高效、簡潔,從而提高了CNN在圖像處理中的性能和效率。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢