如何給列表降維？sum()函數的妙用-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁大數據時代如何給列表降維？sum()函數的妙用

如何給列表降維？sum()函數的妙用

2020-07-22

收藏

最近python可是大火，各行各業的人都在學習python。既然要學習，那么基礎知識就一定要掌握。列表降維了解一下啦！python是如何實現列表將為的呢？其實，python 的內置函數 sum() 能夠接收兩個參數，當第一個參數是二維列表，第二個參數是一維列表的時候，就能夠實現列表降維的效果。下面，一起來看小編跟大家分享的這篇文章吧！

以下文章來源： Python貓

作者：豌豆花下貓

上個月，學習群里的 S 同學問了個題目，大意可理解為列表降維，例子如下：

oldlist = [[1, 2, 3], [4, 5]]

# 想得到結果：
newlist = [1, 2, 3, 4, 5]

原始數據是一個二維列表，目的是獲取該列表中所有元素的具體值。從抽象一點的角度來理解，也可看作是列表解壓或者列表降維。

這個問題并不難，但是，怎么寫才比較優雅呢？

# 方法一，粗暴拼接法：
newlist = oldlist[0] + oldlist[1]

這種方法簡單粗暴，需要拼接什么內容，就取出來直接拼接。然而，如果原列表有很多子列表，則這個方法就會變得繁瑣了。

我們把原問題升級一下：一個二維列表包含 n 個一維列表元素，如何優雅地把這些子列表拼成一個新的一維列表？

方法一的做法需要寫 n 個對象，以及 n - 1 次拼接操作。當然不可行。下面看看方法二：

# 方法二，列表推導式：
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]

這個表達式中出現了兩個 for 語句，在第一個 for 語句中，我們先取出原列表的長度，然后構造 range 對象，此時 j 的取值范圍是 [0, n-1] 的閉區間。

在第二個 for 語句中，oldlist[j] 指的正是原列表的第 j 個子列表，for i in oldlist[j] 則會遍歷取出 j 子列表的元素，由于 j 取值的區間正對應于原列表的全部索引值，所以，最終達到解題目的。

這種方法足夠優雅了，而且理解也并不難。

然而，我們是否就能滿足于此了呢？有沒有其它奇技淫巧，哦不，是其它高級方法呢？F 同學貢獻了一個思路：

# 方法三，巧用sum：
newlist = sum(oldlist,[])

說實話，這個方法令我大感意外！sum() 函數不是用于求和的么？怎么竟然有此用法？

這個寫法利用了什么原理呢？由于我開始時不知道 sum() 函數可以接收兩個參數，不清楚它們是怎么用于計算的，所以一度很困惑。但是，當我知道 sum() 的完整用法時，我恍然大悟。

接下來也不賣關子了，直接揭曉吧。

語法：sum(iterable[, start]) ，sum() 函數的第一個參數是可迭代對象，如列表、元組或集合等，第二個參數是起始值，默認為 0 。其用途是以 start 值為基礎，再與可迭代對象的所有元素相“加”。

在上例中，執行效果是 oldlist 中的子列表逐一與第二個參數相加，而列表的加法相當于 extend 操作，所以最終結果是由 [] 擴充成的列表。

這里有兩個關鍵點：sum() 函數允許帶兩個參數，且第二個參數才是起點。 可能 sum() 函數用于數值求和比較多，然而用于作列表的求和，就有奇效。它比列表推導式更加優雅簡潔！

至此，前面的升級版問題就得到了很好的回答。簡單回顧一下，s 同學最初的問題可以用三種方法實現，第一種方法中規中矩，第二種方法正道進階，而第三種方法旁門左道（沒有貶義，只是說它出人意料，卻效果奇佳）。

這道并不難的問題，在眾人的討論與分享后，竟還引出了很有價值的學習內容。前不久，同樣是群內的一個問題，也產生了同樣的學習效果，詳見《Python進階：如何將字符串常量轉為變量？》。

我從中得到了一個啟示：應該多角度地思考問題，設法尋求更優解，同時，基礎知識應掌握牢固，并靈活貫通起來。

學無止境，這里我還想再開拓一下思路，看看能發現些什么。

1、如果原列表的元素除了列表，還有其它類型的元素，怎么把同類的元素歸并在一起呢？

2、如果是一個三維或更高維的列表，怎么更好地把它們壓縮成一維列表呢？

3、sum() 函數還有什么知識要點呢？

前兩個問題增加了復雜度，解決起來似乎沒有“靈丹妙藥”了，只能用笨方法分別拆解，逐一解壓。

第三個思考題是關于 sum() 函數本身的用法，我們看看官方文檔是怎么說的：

The iterable’s items are normally numbers, and the start value is not allowed to be a string.

For some use cases, there are good alternatives to sum(). The preferred, fast way to concatenate a sequence of strings is by calling ''.join(sequence). To add floating point values with extended precision, see math.fsum(). To concatenate a series of iterables, consider using itertools.chain().

sum() 的第二個參數不允許是字符串。如果用了，會報錯：

TypeError: sum() can't sum strings [use ''.join(seq) instead]

為什么不建議使用 sum() 來拼接字符串呢？哈哈，文檔中建議使用 join() 方法，因為它更快。為了不給我們使用慢的方法，它竟特別限定不允許 sum() 的第二個參數是字符串。

文檔還建議，在某些使用場景時，不要用 sum() ，例如當以擴展精度對浮點數求和時，推薦使用 math.fsum() ；當要拼接一系列的可迭代對象時，應考慮使用itertools.chain() 。

浮點數的計算是個難題，我曾轉載過一篇《如何在 Python 里面精確四舍五入？》，對此有精彩分析。而itertools.chain() 可以將不同類型的可迭代對象串聯成一個更大的迭代器，這在舊文《Python進階：設計模式之迭代器模式》中也有論及。

不經意間，sum() 函數的注意事項，竟把 Python 其它的進階內容都聯系起來了。小小的函數，竟成為學習之路上的一個樞紐。

前段時間，我還寫過 range() 、locals() 和 eval() 等內置函數，也是通過一個問題點，而關聯出多個知識點，獲益良多。這些內置函數/類的魔力可真不小啊。

本文到此結束，希望對你有所幫助。

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

python 降維

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇快速解釋如何使用pandas的inplace參數

下一篇怎么理解隨機森里中feature importance-特征重要性？

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊