熱線電話:13121318867

登錄
首頁精彩閱讀抽絲剝繭,深入剖析 Python 如何實現變量交換(CDA干貨分享)
抽絲剝繭,深入剖析 Python 如何實現變量交換(CDA干貨分享)
2022-01-19
收藏
抽絲剝繭,深入剖析 Python 如何實現變量交換

作者:大奎

來源:早起Python

Python 程序員肯定知道 a,b = b,a,這句話用來交換兩個變量。相較于其它語言需要引入一個 temp 來臨時存儲變量的做法,Python 的這種寫法無疑非常優雅。

佶屈聱牙的 C 寫法:

int a = 1; int b = 2; int temp; temp = a; a = b; b = temp;

簡潔優雅的 Python 寫法:

a,b = 1,2 a,b = b,a 

雖然語法非常方便,但我們始終不曾想過:它是怎么運作的?背后支撐它的機制是什么?下面讓我們一步步分析它。

通俗的說法

最常見的解釋是:

a,b = b,a 中右側是元組表達式,即 b,a 是一個兩個元素的 tuple(a,b)。表達式左側是兩個待分配元素,而 = 相當于元組元素拆包賦值操作。

這種方法,理解起來最簡單,但實際是這種情況么?

讓我們從字節碼上看下,是不是這種情況。

從字節碼一窺交換變量

大家可能不太了解 Python 字節碼。Python 解釋器是一個基于棧的虛擬機。Python 解釋器就是編譯、解釋 Python 代碼的二進制程序。

虛擬機是一種執行代碼的容器,相較于二進制代碼具有方便移植的特點。而 Python 的虛擬機就是棧機器。

Python 中函數調用、變量賦值等操作,最后都轉換為對棧的操作。這些對棧的具體操作,就保存在字節碼里。

dis 模塊可以反編譯字節碼,使其變成人類可讀的棧機器指令。如下,我們看反編譯 a,b=b,a 的代碼。

>>> import dis >>> dis.dis("a,b=b,a") 1 0 LOAD_NAME 0 (b) 2 LOAD_NAME 1 (a) 4 ROT_TWO 6 STORE_NAME 1 (a) 8 STORE_NAME 0 (b) 10 LOAD_CONST 0 (None) 12 RETURN_VALUE 

可見,在 Python 虛擬機的棧上,我們按照表達式右側的 b,a 的順序,先后壓入計算棧中,然后用一個重要指令 ROT_TWO,這個操作交換了 a 和 b 的位置,最后 STORE_NAME 操作將棧頂的兩個元素先后彈出,傳遞給 a 和 b 元素。

棧的特性是先進后出(FILO)。當我們按b,a順序壓入棧的時候,彈出時先出的就是a,再彈出就是b。STORE_NAME指令會把棧頂元素彈出,并關聯到相應變量上。

如果沒有第 4 列的指令 ROT_TWO,此次 STORE_NAME 彈出的第一個變量會是后壓棧的 a,這樣就是 a=a 的效果。有了 ROT_TWO 則完成了變量的交換。

好了,我們知道靠壓棧、彈棧和交換棧頂的兩個元素,實現了 a,b = b,a 的操作。

同時,我們也知道了,上訴元組拆包賦值的說法,是不恰當的。

那 ROT_TWO 是怎么具體操作的呢?

后臺怎么執行?

見名知意,可以猜出來 ROT_TWO 是交換兩個棧頂變量的操作。在 Python 源代碼的層面上,來看是如何交換兩個棧頂的元素。

下載 Python 源代碼,進入 Python/ceval.c 文件,在 1101 行,我們看到了 ROT_TWO 的操作。

TARGET(ROT_TWO){ PyObject *top = TOP(); PyObject *second = SECOND(); SET_TOP(second); SET_SECOND(top); FAST_DISPATCH();  } 

代碼比較簡單,我們用 TOP 和 SECOND 宏獲取了棧上的 a,b 元素,然后再用 SET_TOP、SET_SECOND 宏把值寫入棧中。以此完成交換棧頂元素的操作。

求值順序的奇怪現象!

下面,我們來看一個奇怪的現象,在這篇文章里,也可以看到這個現象。如下,我們試圖排序這個列表:

>>> a = [0, 1, 3, 2, 4] >>> a[a[2]], a[2] = a[2], a[a[2]] >>> a >>> [0, 1, 2, 3, 4] >>> a = [0, 1, 3, 2, 4] >>> a[2], a[a[2]] = a[a[2]],a[2] >>> a >>> [0, 1, 3, 3, 4]

按照理解 a,b = b,a 和 b,a=a,b 是一樣的結果,但從上例中我們看到,這兩者的結果是不同的。

導致這一現象的原因在于:求值的順序。毫無疑問,整個表達式先求右側的兩個元素,然后作為常數保存起來。最后賦值給左側的兩個變量。

最后賦值時,需要注意,我們從左到右依次賦值,如果 a[2] 先修改的話,勢必會影響到其后的 a[a[2]] 的列表下標。

你可以使用反匯編代碼,來分析產生這個現象的具體步驟。

奇怪的變回拆包現象??!

當我們使用常數作為右側元組,來給左側變量賦值時;或使用超過三個元素,來完成便捷交換時,其在字節碼層次上便不是 ROT_TWO 這種操作了。

>>> dis.dis("a,b,c,d=b,c,d,a") 1 0 LOAD_NAME 3 LOAD_NAME 6 LOAD_NAME 9 LOAD_NAME 12 BUILD_TUPLE 15 UNPACK_SEQUENCE 18 STORE_NAME 21 STORE_NAME 24 STORE_NAME 27 STORE_NAME 30 LOAD_CONST 33 RETURN_VALUE >>> 

很明顯,這里是在偏移 12 字節處 BUILD_TUPLE 組裝元組,然后解包賦值給左側變量。上文所述的通俗說法,在這里又成立了!

也就是說,當小于四個元素交換時,Python 采用優化的棧操作來完成交換。

當使用常量或者超過四個元素時,采用元組拆包賦值的方式來交換。

至于為什么是四個元素,應該是因為 Python 最多支持到 ROT_THREE 操作,四個元素的話,系統不知道該怎么優化了。但在新版本的 Python 中,我看到了 ROT_FOUR 操作,所以這時候,四個元素還是 ROT_* 操作來優化的。

>>>import opcode >>>opcode.opmap["ROT_THREE"] 3 

此例中,該版本 Python 支持 ROT_THREE 操作,你也可以使用 ROT_FOUR 查看自己 Python 是否支持,進而確定是否可以四個以上元素便捷交換。

總結

綜上,我們了解了 Python 中優雅的 a,b = b,a 交換變量方法的實現和運行原理,深入了解其求值順序和局限性,同時學習了深入分析 Python 代碼的思路和方法,如果對你有幫助,可以給本文點個贊,也歡迎分享出去讓更多人看見!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢