
python列表生成式與列表生成器的使用
列表生成式:會將所有的結果全部計算出來,把結果存放到內存中,如果列表中數據比較多,就會占用過多的內存空間,可能會導致MemoryError內存錯誤或者導致程序在運行時出現卡頓的情況
列表生成器:會創建一個列表生成器對象,不會一次性的把所有結果都計算出來,如果需要獲取數據,可以使用next()函數來獲取,但是需要注意,一旦next()函數獲取不到數據,會導致出現StopIteration異常錯誤,可以使用for循環遍歷列表生成器,獲取所有數據
需要視情況而定,如果數據量比較大,推薦使用生成器
python2.7中就是range(生成式) 和 xrange(生成器)的區別
列表生成式是快速生成一個列表的一些公式
在列表中存放0~100的數:
普通的列表生成:
numbers=[]
for x in range(0,101):
numbers.append(x)
print(numbers)
用列表生成式生成列表:[要放入列表的數據 簡單的表達式1 表達式2]
#x for x in range(0,101) for循環遍歷出來的值,放入列表中
numbers=[x for x in range(0,101)]
print(numbers)
列表中存放0~100的偶數:
普通方法生成列表:
for x in range(0,101):
if x%2==0:
numbers.append(x)
print(numbers)
用列表生成式生成列表:
#for循環遍歷0~101的數字,如果數字對2取余==0,表示是偶數,x放在列表中
numbers=[x for x in range(0,101)if x%2==0]
print(numbers)
找出列表list1=['asd','adf','dafg','acbo']帶有a的字符
普通寫法:
rs_list=[]
for s in list1:
if 'a' in s:
rs_list.append(s)
print(rs_list)
列表生成式:
list2=[x for x in list1 if 'a' in x]
列表生成式支持雙層for循環
list3=[x*y for x in range(0,10) for y in range(20)]
print(list3)
生成器構造實例
# 使用類似列表生成式的方式構造生成器
g1 = (2*n + 1 for n in range(3, 6))
# 使用包含yield的函數構造生成器
def my_range(start, end):
for n in range(start, end):
yield 2*n + 1
g2 = my_range(3, 6)
print(type(g1))
print(type(g2))
輸出結果:
<class 'generator'>
<class 'generator'>
生成器的調用方式
要調用生成器產生新的元素,有兩種方式:
調用內置的next()方法
使用循環對生成器對象進行遍歷(推薦)
調用生成器對象的send()方法
實例1:使用next()方法遍歷生成器
print(next(g1))
print(next(g1))
print(next(g1))
print(next(g1))
輸出結果:
7
9
11
Traceback (most recent call last):
File "***/generator.py", line 26, in <module>
print(next(g1))
StopIteration
print(next(g2))
print(next(g2))
print(next(g2))
print(next(g2))
輸出結果:
7
9
11
Traceback (most recent call last):
File "***/generator.py", line 31, in <module>
print(next(g2))
StopIteration
可見,使用next()方法遍歷生成器時,最后是以拋出一個StopIeration異常終止。
實例2:使用循環遍歷生成器
for x in g1:
print(x)
for x in g2:
print(x)
兩個循環的輸出結果是一樣的:
7
9
11
可見,使用循環遍歷生成器時比較簡潔,且最后不會拋出一個StopIeration異常。因此使用循環的方式遍歷生成器的方式才是被推薦的。
需要說明的是:如果生成器函數有返回值,要獲取該返回值的話,只能通過在一個while循環中不斷的next(),最后通過捕獲StopIteration異常
實例3:調用生成器對象的send()方法
def my_range(start, end):
for n in range(start, end):
ret = yield 2*n + 1
print(ret)
g3 = my_range(3, 6)
print(g3.send(None))
print(g3.send('hello01'))
print(g3.send('hello02'))
輸出結果:
7
hello01
9
hello02
11
print(next(g3))
print(next(g3))
print(next(g3))
輸出結果:
7
None
9
None
11
結論:
next()會調用yield,但不給它傳值
send()會調用yield,也會給它傳值(該值將成為當前yield表達式的結果值)
需要注意的是:第一次調用生成器的send()方法時,參數只能為None,否則會拋出異常。當然也可以在調用send()方法之前先調用一次next()方法,目的是讓生成器先進入yield表達式。
生成器與列表生成式對比
既然通過列表生成式就可以直接創建一個新的list,那么為什么還要有生成器存在呢?
因為列表生成式是直接創建一個新的list,它會一次性地把所有數據都存放到內存中,這會存在以下幾個問題:
內存容量有限,因此列表容量是有限的;
當列表中的數據量很大時,會占用大量的內存空間,如果我們僅僅需要訪問前面有限個元素時,就會造成內存資源的極大浪費;
當數據量很大時,列表生成式的返回時間會很慢;
而生成器中的元素是按照指定的算法推算出來的,只有調用時才生成相應的數據。這樣就不必一次性地把所有數據都生成,從而節省了大量的內存空間,這使得其生成的元素個數幾乎是沒有限制的,并且操作的返回時間也是非??焖俚模▋H僅是創建一個變量而已)。
我們可以做個試驗:對比一下生成一個1000萬個數字的列表,分別看下用列表生成式和生成器時返回結果的時間和所占內存空間的大?。?nbsp;
import time
import sys
time_start = time.time()
g1 = [x for x in range(10000000)]
time_end = time.time()
print('列表生成式返回結果花費的時間: %s' % (time_end - time_start))
print('列表生成式返回結果占用內存大?。?s' % sys.getsizeof(g1))
def my_range(start, end):
for x in range(start, end):
yield x
time_start = time.time()
g2 = my_range(0, 10000000)
time_end = time.time()
print('生成器返回結果花費的時間: %s' % (time_end - time_start))
print('生成器返回結果占用內存大?。?s' % sys.getsizeof(g2))
輸出結果:
列表生成式返回結果花費的時間: 0.8215489387512207
列表生成式返回結果占用內存大?。?1528056
生成器返回結果花費的時間: 0.0
生成器返回結果占用內存大?。?8
可見,生成器返回結果的時間幾乎為0,結果所占內存空間的大小相對于列表生成器來說也要小的多。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25