
全棧數據工程師養成攻略:Python 基本語法
Python簡單易學,但又博大精深。許多人號稱精通Python,卻不會寫Pythonic的代碼,對很多常用包的使用也并不熟悉。學海無涯,我們先來了解一些Python中最基本的內容。
解釋型語言,無需編譯即可運行
提供了交互式命令行
基于對象的編程思想
跨平臺和良好的兼容性,在Windows、Mac、Linux上都可運行
簡單好用而且功能強大
很多同學在打開數據時會遇上亂碼問題,其原因是字符集的編碼問題。Linux和Mac默認的編碼集是UTF8,而Windows則是ASCII。如果數據編碼的字符集,和你使用Python進行處理時所用的字符集不同,則會出現亂碼問題。
這里是一篇參考文章,http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html,詳細地介紹了Python中文編碼所涉及的內容。
另外,我個人的習慣是在Python代碼的頭部加入以下內容,其中第二行聲明了使用UTF8字符集。
Python中的變量可以看作是一個個容器,里面存放著我們需要使用到的值。Python對變量名的要求和其他語言一樣:可以包括英文、數字以及下劃線,但不能以數字開頭,區分大小寫。當然我推薦,變量名用純英文就很好,并且取一些有意義的名稱,便于自己理解每個變量的作用。
Python是一門弱類型的語言,在使用變量時無需聲明其類型。Python中的變量包括以下幾類:數值、字符串、列表、元組、字典。
數值包括整型和浮點型,分別對應整數和浮點數,后者精度更高。
字符串也就是我們經常接觸到的文本,可以往里面放任意長度的內容,用單引號或雙引號括起來。應當注意,中文以及中文符號只能出現在字符串內,如果在下面第三行中使用了中文輸入法的逗號 , ,Python將報錯。
使用 + 可以拼接兩個字符串。
使用 len() 可以得到字符串的長度。
使用切片可以訪問字符串中的某個字符或某個片段。
列表好比一條隊伍,里面依次存放著多個變量。列表和字符串類似,但字符串中的每個元素都是字符,而列表中的每個元素可以是任意類型的變量。
使用 len() 可以獲得列表的長度。
列表元素的按下標訪問和賦值等操作,和字符串都是類似的。
使用 del 刪除列表中的某個元素。
元組和列表類似,唯一的不同是元組中的元素在初始化之后不能再更改,因此可以理解成一個只讀的變量。
字典是一種極為重要的變量類型,使用一個key來訪問相應的value,即一種鍵值對的數據形式。
所以能夠總結出字典和列表的不同。列表中的元素是有序對等的,所以是用下標來賦值和訪問,而字典中的元素是無序的,所以是用key來操作相應的value。
使用 has_key() 判斷字典中是否有某個key。
如果訪問不存在的key,Python將會報錯。在賦值的時候,如果key已經存在,則會用新的value覆蓋已有的value。
被注釋的代碼將不會運行,可以看作是寫給自己和其他程序猿閱讀的一些筆記和說明,提高代碼可讀性。
在Sublime中,選中需要注釋的內容,按Ctrl+/即可完成注釋。
在Python中,有一些字符串具有某些特定功能,如 import 、 class 等。我們在選擇變量名時,應注意避開這些保留字符。
在Python中,代碼塊的邊界不是通過大括號等符號進行顯式劃分,而是通過行的縮進實現的。連續相同縮進水平的代碼處于同一個代碼塊,在使用 for 、 while 、 if 、 try 等語法時需要注意每行代碼的縮進。
運算符的作用是根據已有的變量生成新的變量,主要有以下幾種:
算術運算符:+,-,*,/,%,即加、減、乘、除、取余
比較運算符:==,!=,>,<,>=,<=,即等于、不等于、大于、小于、大于等于、小于等于
賦值運算符:=,+=,-=,*=,/=,%=,即賦值、加賦值、減賦值、乘賦值、除賦值、取余賦值
邏輯運算符:and,or,not,即與、或、非
在寫代碼的時候,往往需要根據某些條件進行判斷,并根據判斷結果執行不同的分支代碼。
需要注意的是,但凡出現了 if 和 elif ,就需要加上相應的條件判斷,并且注意代碼的縮進。
在Sublime中輸入 if 會出現相應的提示,可以方便地補全代碼,在換行時光標也會自動跳到合適的縮進處。
如果需要打印從1到100的100個數,肯定不會傻傻地寫100行print代碼,而是會用循環來處理類似的重復性工作。
while 循環的思想是,只要某一條件成立,就不斷執行循環體里的代碼,直到條件不再成立。
for 循環的循環次數一般是事先預知的,將一個標志變量從某個起始值迭代到某個終止值后即結束。
循環控制主要包括三種: pass 、 continue 、 break 。
pass 表示什么也不做,只是占一行代碼的位置;continue 表示立即退出本輪循環,繼續執行后續輪循環;break 表示立即推出循環,后續循環也不再執行。
在處理數據時,很多地方都會涉及到時間,例如數據產生的時間。
先介紹一下時間戳的概念,時間戳指的是從1970年1月1日0時0分0秒開始,到某一時刻所經歷的秒數,可以是整數或者小數,后者的精度更高。
為什么需要時間戳這樣的一個概念?因為對于同一個時刻,不同人的描述可能不同,畢竟文本的形式千變萬化,而時間戳使得時間的表達得到了統一,每個時刻只能用唯一的整數或浮點數來表示,同時也便于計算時間差這樣的處理。
關于時間戳,最常用的處理便是時間戳和時間文本之間的轉換,例如將 2016年10月1日 10時0分0秒 轉為時間戳。
其中, %Y 、 %m 等都是時間字段,前者表示四位的年份,后者表示兩位的月份。
文件操作包括向文件中寫內容,以及從文件中讀內容,使用 open() 打開一個文件。
Python代碼中可能會出現一些可以預知的問題,例如字典訪問的key不存在。如果不加處理,發生問題的時候Python便會報錯并退出,可能之前跑了很久又要重頭再來。因此,我們需要對可能出現的異常進行捕捉和處理。異常的結構由 try 、 except 、 else 、 finally 四部分組成。
函數
函數的作用是代碼模塊化,將可重用的代碼封裝成一個函數,這樣在需要使用的時候就只需調用寫好的函數即可,而不用重新寫一遍代碼。
函數的使用包括兩個部分,函數的定義和函數的調用。除此之外,函數可以有一個或多個參數,參數之間以逗號分開,為函數的功能提供更多的靈活性。
補充學習
以上所介紹的,都是Python中最基礎和最常用的內容,先掌握這些就可以跟上后續章節。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25