熱線電話:13121318867

登錄
首頁精彩閱讀python列表生成式與列表生成器的使用
python列表生成式與列表生成器的使用
2018-07-31
收藏

python列表生成式與列表生成器的使用

列表生成式:會將所有的結果全部計算出來,把結果存放到內存中,如果列表中數據比較多,就會占用過多的內存空間,可能會導致MemoryError內存錯誤或者導致程序在運行時出現卡頓的情況
列表生成器:會創建一個列表生成器對象,不會一次性的把所有結果都計算出來,如果需要獲取數據,可以使用next()函數來獲取,但是需要注意,一旦next()函數獲取不到數據,會導致出現StopIteration異常錯誤,可以使用for循環遍歷列表生成器,獲取所有數據

需要視情況而定,如果數據量比較大,推薦使用生成器

 python2.7中就是range(生成式) 和 xrange(生成器)的區別

列表生成式是快速生成一個列表的一些公式

在列表中存放0~100的數:

普通的列表生成:    
numbers=[]
for x in range(0,101):
  numbers.append(x)
print(numbers)

用列表生成式生成列表:[要放入列表的數據    簡單的表達式1   表達式2]    
#x for x in range(0,101) for循環遍歷出來的值,放入列表中
numbers=[x for x in range(0,101)]
print(numbers)

列表中存放0~100的偶數:

普通方法生成列表:
    
for x in range(0,101):
  if x%2==0:
    numbers.append(x)
print(numbers)

用列表生成式生成列表:
    
#for循環遍歷0~101的數字,如果數字對2取余==0,表示是偶數,x放在列表中
numbers=[x for x in range(0,101)if x%2==0]
print(numbers)

找出列表list1=['asd','adf','dafg','acbo']帶有a的字符

普通寫法:    
rs_list=[]
for s in list1:
  if 'a' in s:
    rs_list.append(s)
print(rs_list)

列表生成式:    
list2=[x for x in list1 if 'a' in x]

列表生成式支持雙層for循環    
list3=[x*y for x in range(0,10) for y in range(20)]
print(list3)

生成器構造實例
    
# 使用類似列表生成式的方式構造生成器
g1 = (2*n + 1 for n in range(3, 6))
 
# 使用包含yield的函數構造生成器
def my_range(start, end):
  for n in range(start, end):
    yield 2*n + 1
 
g2 = my_range(3, 6)
print(type(g1))
print(type(g2))

輸出結果:

    <class 'generator'>
    <class 'generator'>

生成器的調用方式

    要調用生成器產生新的元素,有兩種方式:
    調用內置的next()方法
    使用循環對生成器對象進行遍歷(推薦)
    調用生成器對象的send()方法

實例1:使用next()方法遍歷生成器    
print(next(g1))
print(next(g1))
print(next(g1))
print(next(g1))

輸出結果:

    7
    9
    11
    Traceback (most recent call last):
      File "***/generator.py", line 26, in <module>
        print(next(g1))
    StopIteration    
print(next(g2))
print(next(g2))
print(next(g2))
print(next(g2))

輸出結果:

    7
    9
    11
    Traceback (most recent call last):
      File "***/generator.py", line 31, in <module>
        print(next(g2))
    StopIteration

可見,使用next()方法遍歷生成器時,最后是以拋出一個StopIeration異常終止。

實例2:使用循環遍歷生成器
    
for x in g1:
  print(x)
 
for x in g2:
  print(x)

兩個循環的輸出結果是一樣的:

    7
    9
    11

可見,使用循環遍歷生成器時比較簡潔,且最后不會拋出一個StopIeration異常。因此使用循環的方式遍歷生成器的方式才是被推薦的。

需要說明的是:如果生成器函數有返回值,要獲取該返回值的話,只能通過在一個while循環中不斷的next(),最后通過捕獲StopIteration異常

實例3:調用生成器對象的send()方法
def my_range(start, end):
  for n in range(start, end):
    ret = yield 2*n + 1
    print(ret)
 
g3 = my_range(3, 6)
print(g3.send(None))
print(g3.send('hello01'))
print(g3.send('hello02'))

輸出結果:

    7
    hello01
    9
    hello02
    11    
print(next(g3))
print(next(g3))
print(next(g3))

輸出結果:

    7
    None
    9
    None
    11

結論:

    next()會調用yield,但不給它傳值
    send()會調用yield,也會給它傳值(該值將成為當前yield表達式的結果值)

需要注意的是:第一次調用生成器的send()方法時,參數只能為None,否則會拋出異常。當然也可以在調用send()方法之前先調用一次next()方法,目的是讓生成器先進入yield表達式。

生成器與列表生成式對比

既然通過列表生成式就可以直接創建一個新的list,那么為什么還要有生成器存在呢?

因為列表生成式是直接創建一個新的list,它會一次性地把所有數據都存放到內存中,這會存在以下幾個問題:

    內存容量有限,因此列表容量是有限的;
    當列表中的數據量很大時,會占用大量的內存空間,如果我們僅僅需要訪問前面有限個元素時,就會造成內存資源的極大浪費;
    當數據量很大時,列表生成式的返回時間會很慢;

而生成器中的元素是按照指定的算法推算出來的,只有調用時才生成相應的數據。這樣就不必一次性地把所有數據都生成,從而節省了大量的內存空間,這使得其生成的元素個數幾乎是沒有限制的,并且操作的返回時間也是非??焖俚模▋H僅是創建一個變量而已)。

我們可以做個試驗:對比一下生成一個1000萬個數字的列表,分別看下用列表生成式和生成器時返回結果的時間和所占內存空間的大?。?nbsp;   
import time
import sys
 
time_start = time.time()
g1 = [x for x in range(10000000)]
time_end = time.time()
print('列表生成式返回結果花費的時間: %s' % (time_end - time_start))
print('列表生成式返回結果占用內存大?。?s' % sys.getsizeof(g1))
 
def my_range(start, end):
  for x in range(start, end):
    yield x
 
time_start = time.time()
g2 = my_range(0, 10000000)
time_end = time.time()
print('生成器返回結果花費的時間: %s' % (time_end - time_start))
print('生成器返回結果占用內存大?。?s' % sys.getsizeof(g2))
輸出結果:
    列表生成式返回結果花費的時間: 0.8215489387512207
    列表生成式返回結果占用內存大?。?1528056
    生成器返回結果花費的時間: 0.0
    生成器返回結果占用內存大?。?8
可見,生成器返回結果的時間幾乎為0,結果所占內存空間的大小相對于列表生成器來說也要小的多。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢