熱線電話:13121318867

登錄
首頁大數據時代如何給列表降維?sum()函數的妙用
如何給列表降維?sum()函數的妙用
2020-07-22
收藏

最近python可是大火,各行各業的人都在學習python。既然要學習,那么基礎知識就一定要掌握。列表降維了解一下啦!python是如何實現列表將為的呢?其實,python 的內置函數 sum() 能夠接收兩個參數,當第一個參數是二維列表,第二個參數是一維列表的時候,就能夠實現列表降維的效果。下面,一起來看小編跟大家分享的這篇文章吧!

以下文章來源: Python貓

作者: 豌豆花下貓

上個月,學習群里的 S 同學問了個題目,大意可理解為列表降維 ,例子如下:

oldlist = [[1, 2, 3], [4, 5]]

# 想得到結果:
newlist = [1, 2, 3, 4, 5]

原始數據是一個二維列表,目的是獲取該列表中所有元素的具體值。從抽象一點的角度來理解,也可看作是列表解壓或者列表降維。

這個問題并不難,但是,怎么寫才比較優雅呢?

# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]

這種方法簡單粗暴,需要拼接什么內容,就取出來直接拼接。然而,如果原列表有很多子列表,則這個方法就會變得繁瑣了。

我們把原問題升級一下:一個二維列表包含 n 個一維列表元素,如何優雅地把這些子列表拼成一個新的一維列表?

方法一的做法需要寫 n 個對象,以及 n - 1 次拼接操作。當然不可行。下面看看方法二:

# 方法二,列表推導式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]

這個表達式中出現了兩個 for 語句,在第一個 for 語句中,我們先取出原列表的長度,然后構造 range 對象,此時 j 的取值范圍是 [0, n-1] 的閉區間。

在第二個 for 語句中,oldlist[j] 指的正是原列表的第 j 個子列表,for i in oldlist[j] 則會遍歷取出 j 子列表的元素,由于 j 取值的區間正對應于原列表的全部索引值,所以,最終達到解題目的。

這種方法足夠優雅了,而且理解也并不難。

然而,我們是否就能滿足于此了呢?有沒有其它奇技淫巧,哦不,是其它高級方法呢?F 同學貢獻了一個思路:

# 方法三,巧用sum:
newlist = sum(oldlist,[])

說實話,這個方法令我大感意外!sum() 函數不是用于求和的么?怎么竟然有此用法?

這個寫法利用了什么原理呢?由于我開始時不知道 sum() 函數可以接收兩個參數,不清楚它們是怎么用于計算的,所以一度很困惑。但是,當我知道 sum() 的完整用法時,我恍然大悟。

接下來也不賣關子了,直接揭曉吧。

語法:sum(iterable[, start]) ,sum() 函數的第一個參數是可迭代對象,如列表、元組或集合等,第二個參數是起始值,默認為 0 。其用途是以 start 值為基礎,再與可迭代對象的所有元素相“加”。

在上例中,執行效果是 oldlist 中的子列表逐一與第二個參數相加,而列表的加法相當于 extend 操作,所以最終結果是由 [] 擴充成的列表。

這里有兩個關鍵點:sum() 函數允許帶兩個參數,且第二個參數才是起點。 可能 sum() 函數用于數值求和比較多,然而用于作列表的求和,就有奇效。它比列表推導式更加優雅簡潔!

至此,前面的升級版問題就得到了很好的回答。簡單回顧一下,s 同學最初的問題可以用三種方法實現,第一種方法中規中矩,第二種方法正道進階,而第三種方法旁門左道(沒有貶義,只是說它出人意料,卻效果奇佳)。

這道并不難的問題,在眾人的討論與分享后,竟還引出了很有價值的學習內容。前不久,同樣是群內的一個問題,也產生了同樣的學習效果,詳見《Python進階:如何將字符串常量轉為變量?》。

我從中得到了一個啟示:應該多角度地思考問題,設法尋求更優解,同時,基礎知識應掌握牢固,并靈活貫通起來。

學無止境,這里我還想再開拓一下思路,看看能發現些什么。

1、如果原列表的元素除了列表,還有其它類型的元素,怎么把同類的元素歸并在一起呢?

2、如果是一個三維或更高維的列表,怎么更好地把它們壓縮成一維列表呢?

3、sum() 函數還有什么知識要點呢?

前兩個問題增加了復雜度,解決起來似乎沒有“靈丹妙藥”了,只能用笨方法分別拆解,逐一解壓。

第三個思考題是關于 sum() 函數本身的用法,我們看看官方文檔是怎么說的:

The iterable’s items are normally numbers, and the start value is not allowed to be a string.

For some use cases, there are good alternatives to sum(). The preferred, fast way to concatenate a sequence of strings is by calling ''.join(sequence). To add floating point values with extended precision, see math.fsum(). To concatenate a series of iterables, consider using itertools.chain().

sum() 的第二個參數不允許是字符串。如果用了,會報錯:

TypeError: sum() can't sum strings [use ''.join(seq) instead]

為什么不建議使用 sum() 來拼接字符串呢?哈哈,文檔中建議使用 join() 方法,因為它更快。為了不給我們使用慢的方法,它竟特別限定不允許 sum() 的第二個參數是字符串。

文檔還建議,在某些使用場景時,不要用 sum() ,例如當以擴展精度對浮點數求和時,推薦使用 math.fsum() ;當要拼接一系列的可迭代對象時,應考慮使用itertools.chain() 。

浮點數的計算是個難題,我曾轉載過一篇《如何在 Python 里面精確四舍五入?》,對此有精彩分析。而itertools.chain() 可以將不同類型的可迭代對象串聯成一個更大的迭代器,這在舊文《Python進階:設計模式之迭代器模式》中也有論及。

不經意間,sum() 函數的注意事項,竟把 Python 其它的進階內容都聯系起來了。小小的函數,竟成為學習之路上的一個樞紐。

前段時間,我還寫過 range() 、locals() 和 eval() 等內置函數,也是通過一個問題點,而關聯出多個知識點, 獲益良多。這些內置函數/類的魔力可真不小啊。

本文到此結束,希望對你有所幫助。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢