熱線電話:13121318867

登錄
首頁大數據時代為什么說python內置函數并不是萬能的?
為什么說python內置函數并不是萬能的?
2020-10-20
收藏

作者:豌豆花下貓

來源:Python貓

之前我們對比了兩種創建列表的方法,即字面量用法 [] 與內置類型用法 list(),進而分析出它們在運行速度上的差異。

在分析為什么 list() 會更慢的時候,文中說到它需要經過名稱查找與函數調用兩個步驟,那么,這就引出了一個新的問題:list() 不是內置類型么,為什么它不能直接就調用創建列表的邏輯呢?也就是說,為什么解釋器必須經過名稱查找,才能“認識”到該做什么呢?

其實原因很簡單:內置函數/內置類型的名稱并不是關鍵字,它們只是解釋器內置的一種便捷功能,方便開發者開箱即用而已。

PS:內置函數 built-in function 和內置類型 built-in type 很相似,但 list() 實際是一種內置類型而不是內置函數。我曾對這兩種易混淆的概念做過辨析,請查看這篇文章。為了方便理解與表述,以下統稱為內置函數。

1、內置函數的查找優先級最低

內置函數的名稱并不屬于關鍵字,它們是可以被重新賦值的。

比如下面這個例子:

# 正常調用內置函數
list(range(3))  # 結果:[0, 1, 2]

# 定義任意函數,然后賦值給 list
def test(n):
    print("Hello World!")
list = test
list(range(3)) # 結果:Hello World!

在這個例子中,我們將自定義的 test 賦值給了 list,程序并沒有報錯。這個例子甚至還可以改成直接定義新的同名函數,即"def list(): …"。

這說明了 list 并不是 Python 限定的關鍵字/保留字。

查看官方文檔,可以發現 Python3.9 有35個關鍵字,明細如下:

如果我們將上例的 test 賦值給任意一個關鍵字,例如"pass=test",就會報錯:SyntaxError: invalid syntax。

由此,我們可以從這個角度看出內置函數并不是萬能的:它們的名稱并不像關鍵字那般穩固不變,雖然它們處在系統內置作用域里,但是卻可以被用戶局部作用域的對象所輕松攔截掉!

因為解釋器查找名稱的順序是“局部作用域->全局作用域->內置作用域”,因此內置函數其實是處在最低優先級。

對于新手來說,這有一定的可能會發生意想不到的情況(內置函數有 69 個,要全記住是有難度的)。

那么,為什么python 不把所有內置函數的名稱都設為不可復寫的關鍵字呢?

一方面原因是它想控制關鍵字的數量,另一方面可能是想留給用戶更多的自由。內置函數只是解釋器的推薦實現而已,開發者可以根據需要,實現出與內置函數同名的函數。

不過,這樣的場景極少,而且開發者一般會定義成不同名的函數,以 Python 標準庫為例,ast模塊有 literal_eval() 函數(對標 eval() 內置函數)、pprint 模塊有 pprint() 函數(對標 print() 內置函數)、以及itertools模塊有 zip_longest() 函數(對標 zip() 內置函數)……

2、內置函數可能不是最快的

由于內置函數的名稱并非保留的關鍵字,以及它處于名稱查找的末位順序,所以內置函數有可能不是最快的。

上篇文章展示了 [] 比 list() 快 2~3 倍的事實,其實這還可以推廣到 str()、tuple()、set()、dict() 等等內置類型中,都是字面量用法稍稍快于內置類型用法。

對于這些內置類型,當我們調用 xxx() 時,可以簡單理解成正在做類的實例化。在面向對象語言中,類先實例化再使用,這是再正常不過的。

但是,這樣的做法有時也顯得繁瑣。為了方便使用,python 給一些常用的內置類型提供了字面量表示法,也就是""、[]、()、{} 等等,表示字符串、列表、元組和字典等數據類型。

一般而言,所有編程語言都必須有一些字面量表示,但基本都局限在數字類型、字符串、布爾類型以及 null 之類的基礎類型。

Python 中還增加了幾種數據結構類型的字面量,所以是更為方便的,同時這也解釋了為什么內置函數可能不是最快的。

一般而言,同樣的完備功能,內置函數總是比我們自定義的函數要快,因為解釋器可以做一些底層的優化,例如 len() 內置函數肯定比用戶定義的 x.len() 函數快。

有些人據此形成了“內置函數總是更快”的認識誤區。

解釋器內置函數相對于用戶定義函數,前者接近于走后門;而字面量表示法相對于內置函數,前者是在走更快的后門。

也就是說,在有字面量表示法的情況下,某些內置函數/內置類型并不是最快的!

小結

誠然,python 本身并不是萬能的,那它的任何語法構成部分(內置函數/類型),就更不是萬能的了。但是,一般我們會認為內置函數/類型總歸是“高人一等”的,是受到諸多特殊優待的,顯得像是“萬能的”。

本文從“list() 竟然會敗給 []”破題,從兩個角度揭示了內置函數其實存在著某種不足:內置函數的名稱并不是關鍵字,而內置作用域位于名稱查找的最低優先級,因此在調用時,某些內置函數/類型的執行速度就明顯慢于它們對應的字面量表示法。


——熱門課程推薦:

想從事務型數據分析師,您可以點擊>>>“數據分析師”了解課程詳情;

想從事數據分析師,您可以點擊>>>“大數據就業”了解課程詳情;

想成為人工智能工程師,您可以點擊>>>“人工智能就業”了解課程詳情;

想了解Python數據分析,您可以點擊>>>“Python數據分析師”了解課程詳情;

想咨詢互聯網運營,你可以點擊>>>互聯網運營就業班”了解課程詳情;

想了解更多優質課程,請點擊>>>

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢