熱線電話:13121318867

登錄
首頁精彩閱讀簡單掌握Python中glob模塊查找文件路徑的用法
簡單掌握Python中glob模塊查找文件路徑的用法
2017-11-21
收藏

簡單掌握Python中glob模塊查找文件路徑的用法

glob模塊遵循Unix的shell規則來匹配文件名進行文件查找,下面我們結合匹配相關的字符區間與通配符知識,來簡單掌握Python中glob模塊查找文件路徑的用法

glob使用UNIX shell規則查找與一個模式匹配的文件名。只要程序需要查找文件系統中名字與某個模式匹配的一組文件,就可以使用這個模塊。
glob的模式規則與re模塊使用的正則表達式不相同。glob模式遵循標準UNIX路徑擴展規則。只是用幾個特殊字符來實現兩個不同的通配符和字符區間。模式規則要應用于文件名中的段。模式中的路徑可以是相對路徑或絕對路徑。
shell變量名和波浪線都不會擴展。
基本用法
1.glob.glob(pathname), 返回所有匹配的文件路徑列表。它只有一個參數pathname,定義了文件路徑匹配規則,這里可以是絕對路徑,也可以是相對路徑。
2.glob.iglob(pathname), 獲取一個可編歷對象,使用它可以逐個獲取匹配的文件路徑名。與glob.glob()的區別是:glob.glob同時獲取所有的匹配路徑,而glob.iglob一次只獲取一個匹配路徑。
3.eg:    
import glob
 
print glob.glob(r'E:\*\*.doc')
print glob.glob(r'.\*.py')
 
f = glob.iglob(r'.\*.py')
 
for py in f:
  print py

運行結果:
    
['E:\\test_file\\adplus.doc']
['.\\perfrom_test.py', '.\\pyTest.py', '.\\simulation_login.py', '.\\widget.py', '.\\__init__.py']
.\perfrom_test.py
.\pyTest.py
.\simulation_login.py
.\widget.py
.\__init__.py

下面我們分知識點詳細來講:
通配符
星號匹配一個文件名段中的0個或多個字符。    
import glob
for name in glob.glob('tmp/*'):
  print name

這個模式會匹配所有的路徑名,但是不會遞歸搜索到子目錄。
    
>>> ================================ RESTART ================================
>>>
tmp\checklog_status.sh
tmp\check_Adwords_v1.2.sh
tmp\check_traffic.sh
tmp\cut_nginxlog_V1.2.sh
tmp\ip_conn.sh
tmp\ip_keepalive.sh
tmp\nagios使用手冊.doc
tmp\nmap_ping
tmp\nrpe_install-1.3.sh
tmp\one
tmp\syn.sh
tmp\zabbix_agentd_2.0.10_win_V1.2.bat
tmp\zabbix_agentd_2.0.8_V1.3.sh
tmp\工作內容.doc

要列出子目錄中的文件,必須把子目錄包含在模式中。    
import glob
print 'Name explicitly:'
for name in glob.glob('tmp/one/*'):
  print '\t', name
print 'Name with wildcard:'
for name in glob.glob('tmp/*/*'):
  print '\t', name

第一種情況顯示列出子目錄名,第二種情況則依賴一個通配符查找目錄。    
>>> ================================ RESTART ================================
>>>
Name explicitly:
  tmp/one\another.txt
  tmp/one\file.txt
Name with wildcard:
  tmp\one\another.txt
  tmp\one\file.txt

單字節通配符
問號會匹配文件名中該位置的單個字符。    
import glob
for name in glob.glob('tmp/chec?_traffic.sh'):
  print name    
>>> ================================ RESTART ================================
>>>
tmp\check_traffic.sh

字符區間
使用字符區間([a-z]),可以匹配多個字符中的一個字符。    
import glob
for name in glob.glob('tmp/one/[a-z]*'):
  print name

區間可以匹配所有小寫字母。       
>>> ================================ RESTART ================================
>>>
tmp/one\another.txt
tmp/one\file.txt

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢