
數據結構常見的八大排序算法
八大排序,三大查找是《數據結構》當中非?;A的知識點,在這里為了復習順帶總結了一下常見的八種排序算法。
常見的八大排序算法,他們之間關系如下:
排序算法
他們的性能比較:
性能比較
下面,利用Python分別將他們進行實現。
直接插入排序
算法思想:
直接插入排序
直接插入排序的核心思想就是:將數組中的所有元素依次跟前面已經排好的元素相比較,如果選擇的元素比已排序的元素小,則交換,直到全部元素都比較過。
因此,從上面的描述中我們可以發現,直接插入排序可以用兩個循環完成:
第一層循環:遍歷待比較的所有數組元素
第二層循環:將本輪選擇的元素(selected)與已經排好序的元素(ordered)相比較。
如果:selected>ordered,那么將二者交換
代碼實現
希爾排序
算法思想:
希爾排序
希爾排序的算法思想:將待排序數組按照步長gap進行分組,然后將每組的元素利用直接插入排序的方法進行排序;每次將gap折半減小,循環上述操作;當gap=1時,利用直接插入,完成排序。
同樣的:從上面的描述中我們可以發現:希爾排序的總體實現應該由三個循環完成:
第一層循環:將gap依次折半,對序列進行分組,直到gap=1
第二、三層循環:也即直接插入排序所需要的兩次循環。具體描述見上。
代碼實現:
簡單選擇排序
算法思想
簡單選擇排序
簡單選擇排序的基本思想:比較+交換。
從待排序序列中,找到關鍵字最小的元素;
如果最小元素不是待排序序列的第一個元素,將其和第一個元素互換;
從余下的N-1個元素中,找出關鍵字最小的元素,重復(1)、(2)步,直到排序結束。
因此我們可以發現,簡單選擇排序也是通過兩層循環實現。
第一層循環:依次遍歷序列當中的每一個元素
第二層循環:將遍歷得到的當前元素依次與余下的元素進行比較,符合最小元素的條件,則交換。
代碼實現:
堆排序
堆的概念
堆:本質是一種數組對象。特別重要的一點性質:任意的葉子節點小于(或大于)它所有的父節點。對此,又分為大頂堆和小頂堆,大頂堆要求節點的元素都要大于其孩子,小頂堆要求節點元素都小于其左右孩子,兩者對左右孩子的大小關系不做任何要求。
利用堆排序,就是基于大頂堆或者小頂堆的一種排序方法。下面,我們通過大頂堆來實現。
基本思想:
堆排序可以按照以下步驟來完成:
首先將序列構建稱為大頂堆;
(這樣滿足了大頂堆那條性質:位于根節點的元素一定是當前序列的最大值)
構建大頂堆
取出當前大頂堆的根節點,將其與序列末尾元素進行交換;
(此時:序列末尾的元素為已排序的最大值;由于交換了元素,當前位于根節點的堆并不一定滿足大頂堆的性質)
對交換后的n-1個序列元素進行調整,使其滿足大頂堆的性質;
Paste_Image
重復2.3步驟,直至堆中只有1個元素為止
代碼實現:
冒泡排序
基本思想
冒泡排序
冒泡排序思路比較簡單:
將序列當中的左右元素,依次比較,保證右邊的元素始終大于左邊的元素;
(第一輪結束后,序列最后一個元素一定是當前序列的最大值;)
對序列當中剩下的n-1個元素再次執行步驟1。
對于長度為n的序列,一共需要執行n-1輪比較
(利用while循環可以減少執行次數)
*代碼實現:
快速排序
算法思想:
快速排序
快速排序的基本思想:挖坑填數+分治法
從序列當中選擇一個基準數(pivot)
在這里我們選擇序列當中第一個數最為基準數
將序列當中的所有數依次遍歷,比基準數大的位于其右側,比基準數小的位于其左側
重復步驟1.2,直到所有子集當中只有一個元素為止。
用偽代碼描述如下:
1.i=L;j=R;將基準數挖出形成第一個坑a[i]。
2.j--由后向前找比它小的數,找到后挖出此數填前一個坑a[i]中。
3.i++由前向后找比它大的數,找到后也挖出此數填到前一個坑a[j]中。
4.再重復執行2,3二步,直到i==j,將基準數填入a[i]中
代碼實現:
歸并排序
算法思想:
歸并排序
歸并排序是建立在歸并操作上的一種有效的排序算法,該算法是采用分治法的一個典型的應用。它的基本操作是:將已有的子序列合并,達到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。
歸并排序其實要做兩件事:
分解----將序列每次折半拆分
合并----將劃分后的序列段兩兩排序合并
因此,歸并排序實際上就是兩個操作,拆分+合并
如何合并?
L[first...mid]為第一段,L[mid+1...last]為第二段,并且兩端已經有序,現在我們要將兩端合成達到L[first...last]并且也有序。
首先依次從第一段與第二段中取出元素比較,將較小的元素賦值給temp[]
重復執行上一步,當某一段賦值結束,則將另一段剩下的元素賦值給temp[]
此時將temp[]中的元素復制給L[],則得到的L[first...last]有序
如何分解?
在這里,我們采用遞歸的方法,首先將待排序列分成A,B兩組;然后重復對A、B序列
分組;直到分組后組內只有一個元素,此時我們認為組內所有元素有序,則分組結束。
代碼實現:
基數排序
算法思想
基數排序:通過序列中各個元素的值,對排序的N個元素進行若干趟的“分配”與“收集”來實現排序。
分配:我們將L[i]中的元素取出,首先確定其個位上的數字,根據該數字分配到與之序號相同的桶中
收集:當序列中所有的元素都分配到對應的桶中,再按照順序依次將桶中的元素收集形成新的一個待排序列L[]
對新形成的序列L[]重復執行分配和收集元素中的十位、百位...直到分配完該序列中的最高位,則排序結束
根據上述“基數排序”的展示,我們可以清楚的看到整個實現的過程
代碼實現
后記
寫完之后運行了一下時間比較:
1w個數據時:
10w個數據時:
從運行結果上來看,堆排序、歸并排序、基數排序真的快。數據分析培訓
對于快速排序迭代深度超過的問題,可以將考慮將快排通過非遞歸的方式進行實現。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25