
Python專題三字符串的基礎知識
在Python中最重要的數據類型包括字符串、列表、元組和字典等.該篇主要講述Python的字符串基礎知識.
一.字符串基礎
字符串指一有序的字符序列集合,用單引號、雙引號、三重(單雙均可)引號引起來.如:
s1='www.csdn.NET' s2="www.csdn.Net" s3='''aaabbb'''
其中字符串又包括:
1.轉義字符串
像C語言中定義了一些字母前加"\"來表示常見的那些不能顯示的ASCII字符,python也有轉義字符.如下:
\\-反斜杠符號 \'-單引號 \"-雙引號 \ a-響鈴 \b-退格(Backspace)
\n-換行 \r-回車 \f-換頁 \v-縱向制表符 \t-橫向制表符 \e-轉義
\000-空 \oyy-八進制數yy代表的字符 \xyy-十進制yy代表的字符
2.raw字符串
Python中原始字符串(raw strings),r關閉轉義機制.告訴Python后面是連串,"\"不當轉義字符處理.例:
#轉義字符和raw字符
s1="aa\nbb"
print s1
s2=r"aa\nbb"
print s2
#輸出
aa
bb
aa\nbb
#raw原始字符串處理磁盤路徑
open(r'C:\temp\test.txt','a+')
open('C:\\temp\\test.txt','a+')
3.unicode字符串
告訴Python是Unicode編碼,Unicode(統一碼、萬國碼)是一種在計算機上使用的字符編碼.在Unicode之前用的都是ASCII碼,Unicode通過使用一個或者多個字節來表示一個字符.Python里面默認所有字面上的字符串都用ASCII編碼,可以通過在字符串前面加一個'u'前綴的方式聲明Unicode字符串,這個'u'前綴告訴Python后面的字符串要編成Unicode字符串.例:s=u'aa\nbb'
中文處理一直很讓人頭疼,推薦:Unicode和Python的中文處理
4.格式化字符串
字符串格式化功能使用字符串格式化操作符%(百分號)實現,在%的左側放置一個字符串(格式化字符串),而右側放置希望格式化的值,也可是元組和字典.如果需要在字符串里包括百分號,使用%%.如果右側是元組的話,則其中每一個元素都會被單獨格式化,每個值都對應一個轉化說明符.例:
"your age %d,sex %s,record %f"%(28,"Male",78.5)
輸出:'your age 28,sex Male,record 78.500000'
它有點類似于C語言的printf("%d",x),其中百分號%相當于C語言的逗號.其中字符串格式化轉換類型如下:
d,i 帶符號的十進制整數
o 不帶符號的八進制
u 不帶符號的十進制
x 不帶符號的十六進制(小寫)
X 不帶符號的十六進制(大寫)
e,E 科學計數法表示的浮點數(小寫,大寫)
f,F 十進制浮點數
c 單字符
r 字符串(使用repr轉換的任意Python)
s 字符串(使用str轉換的任意Python)
g,G 指數大于4或小于精度值和e相同,否則和f相同
二.字符串操作
字符串的基礎操作包括分割,索引,乘法,判斷成員資格,求長度等.
1.+連接操作
如:s1='csdn' s2='Eastmount' s3=s1+s2
print s1,s2 => 輸出:csdn Eastmount
print s3 => 輸出:csdnEastmount
2.*重復操作
如:s1='abc'*5
print s1 => 輸出:abcabcabcabcabc
3.索引s[index]
Python的索引格式string_name[index],可以訪問字符串里面的字符成員.
4.切片s[i:j]
Python中切片的基本格式是s[i:j:step],其中step表示切片的方向,起點不寫從0開始,終點不寫切到最后.如:
s='abcdefghijk'
sub=s[3:8]
print sub => 輸出defgh_
3 78 (起點是3 終點8不取)
其中當step=-1時表示反方向切片.如:
s='abcdefghijk'
sub=s[-1:-4:-1]
print sub => 輸出kji
因為最后一個"-1"表示從反方向切片,s[9]='j' s[-2]='j',正方向第一個'a'索引下標值為0,最后一個'k'索引下標值為-1.故'j'為-2,而sub[-1:-4:-1]表示從k(-1位置)切到h(-4位置,但不取該值).故結果為"kji".
如果想完成字符串逆序,s='www.baidu.com',則可s1=[-1::-1]即可.起點為m(-1),無終點表示切到最后.
5.字段寬度和精度
前面講述的format()函數中涉及到該知識,如'%6.2f'%12.345678 輸出"口12.35"其中6表示字段寬度,2表示精度,故補一個空格,同時采用四舍五入的方法結果輸出12.35.
同時,零(0)可表示數字將會用0填充,減號(-)用來實現左對齊數值,空白(" ")意味著正數前加上空格,在正負數對其時非常有用,加號表示不管正數還是負數都標識出符號,對齊時也有用.例:
#字段寬度和精度
num = 12.345678
s1 = '%6.2f'%num
print s1
#補充0
s2 = '%08.2f'%num
print s2
#減號實現左對齊
s3 = '%-8.2f'%num
print s3
#空白
print ('% 5d'%10) + '\n' + ('% 5d'%-10)
#符號
print ('%+5d'%10) + '\n' + ('%+5d'%-10)
#輸出
12.35
00012.35
12.35
10
-10
+10
-10
三.字符串方法
字符串從string模塊中"繼承"了很多方法,下面講解一些常用的方法:
find()
在一個較長的字符串中查找子字符串,它返回子串所在位置的最左端索引,如果沒有找到則返回-1.其格式為"S.find(sub [,start [,end]]) -> int",其中該方法可接受可選的起始點和結束點參數.而rfind()從右往左方向查找.
title = 'Hello Python,Great Python'
length = len(title)
print length
print title.find('Python')
print title.find('Python',10,30)
#輸出:
25
6
19
join()
其格式為"S.join(iterable) -> string",含義為"Return a string which is the concatenation of the strings in the iterable. The separator between elements is S."即用來在隊列中添加元素,但隊列中元素必須是字符串.它是split方法的逆方法.
seq = ['1','2','3','4']
sep = '+'
print sep.join(seq) #連接字符串列表 sep表示'+'連接
dirs = '','usr','bin','env'
print '/'.join(dirs)
print 'C:'+'\\'.join(dirs)
#輸出
1+2+3+4
/usr/bin/env
C:\usr\bin\env
split()
字符串分割函數,格式為"S.split([sep [,maxsplit]]) -> list of strings",將字符串分割成序列,如果不提供分割符,程序將會把所有空格作為分隔符.
#按空格拆分成4個單詞,返回list
s = 'please use the Python!'
li = s.split()
print li
print '1+2+3+4+5'.split('+')
#輸出
['please', 'use', 'the', 'Python!']
['1', '2', '3', '4', '5']
strip()
去掉開頭和結尾的空格鍵(兩側且不包含內部),S.strip([chars])可以去除指定字符.而函數lstrip()去除字符串最開始的所有空格,rstrip()去除字符串最尾部的所有空格.
replace()
該方法返回某字符串的所有匹配項均被替換后得到字符串,如文字處理程序中"查找并替換"功能.
translate()
該方法和replace一樣,可以替換字符串中某部分,但與前者的區別是translate只處理單個字符,它的優勢在于可以同時替換多個,有時候效率比replace高.
如:s='eastmount' s1=s.replace('e','E') => 替換后'Eastmount'
字符串判斷方法
isalnum()判斷是否都是有效字符(字母+數字),如判斷密碼帳號,輸出Ture\False.
isalpha()判斷是否是字母
isdigit()判斷是否是數字
islower()判斷是否全是小寫
isupper()判斷是否全是大寫
isspace()判斷是否是空格(' ')
lower()
該方法返回字符串的小寫字母版,在判斷用戶名不區分大小寫時使用.upper()轉換為大寫,title()函數將字符串轉換為標題——所有單詞的首字母大寫,而其他字母小寫,但是它使用的單詞劃分方法可能會得到不自然的結果.
s = 'this is a good idea'
s1 = s.upper()
print s1
s2 = s.title()
print s2
#輸出
THIS IS A GOOD IDEA
This Is A Good Idea
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25