【基礎演算法·基本功】-1常用排序演算法小節

05-08

內容提要：

＊排序常用術語介紹

＊冒泡排序

＊選擇排序

＊插入排序

＊希爾排序

＊歸併排序

＊快速排序

排序基礎知識

?排序的定義

將雜亂無章的數據元素，通過一定的方法按關鍵字順序排列的過程叫做排序。說得再通俗點，比如將一個班的人（數據元素）按照身高（關鍵字）站位，高的站前面，矮的站後面咯。

? 排序的分類

排序可分為內排序和外排序。

所謂內排序就是所有的數據和操作都在內存中完成。

而外排序就是說需要排序的數據太大，無法全部塞進內存，需要在內存和外存之間多次數據交換才能完成的排序。

?演算法優劣的術語說明

?穩定：如果Ai=Aj，開始Ai在Aj前面，排完序之後Ai依然在Aj前面。

?不穩定：

如果Ai=Aj，開始Ai在Aj前面，而排完序以後Ai有可能跑到Aj後面去了。

?時間複雜度：一個演算法執行完所消耗的時間。

?空間複雜度：執行一個演算法需要消耗的內存空間大小。

?常見演算法的複雜度及穩定性

好了看完上面一堆頭疼的術語介紹，接下來將為大家介紹幾種常用的內部排序演算法。

冒泡排序(Bubble Sort)

?常規冒泡排序

冒泡排序算是比較好理解的了。想小編當年入門的時候，就是仰仗著冒泡大法，從此踏入紅塵，一去不返……呃這個扯遠了，為什麼叫冒泡呢？這個後面再解釋。為了更好的說明問題，還是用一個數組A[n]，以升序（降序方法一樣）為例，來給大家一一講解。

?基本原理：

1）從序列的最左邊開始，將兩兩相鄰的兩個元素（例如A[0]和A[1],

A[1]和A[2], A[2]和A[3]等等）進行比較。將小的放左邊，將大的放右邊。例如A[i] > A[i+1]，那麼就交換A[i]和A[i+1]的位置。那麼經過一輪比較交換以後，A[n]里的值必然是A[0]~A[n]中的最大值。

2）對剩下的元素A[0]~A[n-1]也進行上述操作。完成後A[n-1]裡面存的就是A[0]~A[n-1]中的最大值。

3）不斷對剩下的元素進行上述操作，直到剩下元素只有A[0]時，排序完成。

看不懂嘛？那來試試圖片吧：

好了，講完了基本原理，來看看具體代碼是如何實現的吧。

可以看到，在冒泡後，相等元素的位置並不會改變。因此，冒泡演算法是穩定的。

? 冒泡排序改進版

此方法可稱為定向冒泡排序，它和冒泡排序的不同之處在於，定向冒泡從左到右把最大數搬到最後面的時候，再反向從右往左把最小值搬到最左邊。這種方法稍微比傳統冒泡好上那麼一丟丟。具體實施看代碼。

不理解嘛？沒關係，小編還為大家準備了動態圖。

定向冒泡的優勢，比如對序列{4, 5, 6, 7, 8,

2}排序，傳統冒泡要訪問5次序列，而定向冒泡排序只需要訪問一次就OK了。

選擇排序(Selection Sort)

說到選擇排序，這個也是灰常易於理解的。相信大家看一眼基本原理就懂了。還是以數組A[n]與升序排列為例說明問題。

基本原理：

1）先從A[0]~A[n]中找最小的元素A[i]，交換A[0]和A[i]的位置。

2）再從剩下的元素A[1]~A[n]中找最小的元素A[j]，交換A[1]和A[j]的位置。

3）不斷在剩下的元素中找最小的元素丟到開頭，直到剩下最後一個元素。

還不懂？再來看看個圖片：

代碼哪能少？

選擇排序每次將最小值丟到開頭的時候，有可能會打亂相等元素的位置。因此，它是不穩定的。也注意區分其和冒泡排序的區別：冒泡排序通過依次交換相鄰兩個順序不合法的元素位置，從而將當前最小（大）元素放到合適的位置；而選擇排序每遍歷一次都記住了當前最小（大）元素的位置，最後僅需一次交換操作即可將其放到合適的位置。

插入排序(Insertion Sort)

大家打過撲克牌嘛？我們在對手上的撲克牌進行排序的時候，是不是將右手上的牌插到左手上已經排序好的牌之間？這跟我們的插入排序是有點類似的。

還是以A[n]為例說明問題。

基本原理：

1）從A[0]開始，則A[0]可認為是已排序列。

2）取出下一個元素(比如A[1])，在已排序列中從右往左掃描，如果已排序列中的元素大於取出的元素，那麼就將該元素（已排序列中的）往後挪一個位置。

3）直到在已排序列中找到一個小於等於取出元素的元素。將取出元素插入該元素（已排序列中的）後一個位置。

4）不斷重複步驟2-3.直到所有元素都插入到已排序列。

還不明白？看看圖片

請問代碼在哪裡？？？

親，這麼詳細的注釋，

別跟我說你看不懂

可以看出，關於相等元素，排序前後並不會改變他們的位置。因此，插入排序又是穩定的。

希爾排序(Shell Sort)

希爾排序，也叫遞減增量排序，是插入排序的一種更高效的改進版本。其中希爾排序是基於以下幾點做出改進的：

1）直接插入排序對於幾乎排好的數據有著極高的效率。基本可以達到線性排序時的效率。

2）但是對於一般的亂序數據來說，直接插入排序由於每次只能將數據往後搬一位，從這點上來說它效率又是及其低下的。

基本原理：

1）將無序數據分割為若干個子序列，子序列不是逐段分割的，而是相隔特定的增量的子序列，對各個子序列進行直接插入排序；

2）然後再選擇一個更小的增量，再將數據分割為多個子序列進行直接插入排序......

3）不斷重複步驟2，直到最後增量變為1，即對所有數據使用直接插入排序（此時所有數據幾乎都排好了，直接插入效率較高），最終排序完成。

還是來看看圖片吧。

關於不同增量的選取對於希爾排序性能的影響，有不同的觀點。這裡就不過多贅述。

代碼！代碼！代碼在哪裡！！！？？？

值得一提的是，由於數據劃分為多個區域，在每個區域中，相同的元素可能在各自的插入排序中移動，最後其穩定性就會被打亂。因此希爾排序是不穩定的排序。

歸併排序(Merge Sort)

歸併排序（MERGE-SORT）是建立在歸併操作上的一種有效的排序演算法,該演算法是採用分治法（Divide and Conquer）的一個非常典型的應用。效率為O(nlogn)，1945年由馮·諾伊曼首次提出。歸併排序的實現分為遞歸實現與非遞歸(迭代)實現。這裡我們討論遞歸實現。歸併排序依賴于歸並操作。歸併操作(merge)，也叫歸併演算法，指的是將兩個順序序列合併成一個順序序列的方法。

基本原理：

1）申請內存空間A，大小為兩個已排序列之和。

2）設定兩個指針，分別指向兩個已排序列的首元素。

3）比較兩個指針指向的元素大小，將小的那個元素丟進內存空間A。同時指向該元素的指針向前移動一位。

4）不斷重複步驟3），直到任何一個序列的元素全被丟進空間A。那麼就把另外一個序列剩下的所有元素丟進空間A。

Understand？別說了，看圖吧。

兄弟，來，幹了這段代碼。

歸併排序是穩定的演算法。

快速排序(Quick Sort)

終於說到這個大boss了。為什麼叫快速排序呢？額，這個倒不是因為它很快。

快速排序由C. A. R. Hoare在1962年提出。它的基本思想是：開始選取一個基準數，通過一趟排序將基準數移到序列的合適位置，使得，左邊的這部分都小於等於基準數，右邊的部分都大於等於基準數，然後再按此方法對這兩部分數據分別進行快速排序，整個排序過程可以遞歸進行，以此達到整個數據變成有序序列。

那麼，對於一個序列，怎樣才能使基準數移動到正確位置，以便能使左邊的數都小於等於它，右邊的數都大於等於它呢？還是以數組A[N]為例，為大家慢慢道來：

1）設置兩個變數i、j，排序開始的時候：i=0，j=N；

2）以第一個數組元素作為關鍵數據，賦值給key，即key=A[0]；

3）從j開始向前搜索，即由後開始向前搜索(j--)，找到第一個小於key的值A[j]，將A[j]和A[i]互換；

4）從i開始向後搜索，即由前開始向後搜索(i++)，找到第一個大於key的A[i]，將A[i]和A[j]互換；

5）重複第3、4步，直到i=j；

6）3,4步中，沒找到符合條件的值，即3中A[j]不小於key,4中A[i]不大於key的時候改變j、i的值，使得j=j-1，i=i+1，直至找到為止。找到符合條件的值，進行交換的時候i， j指針位置不變。另外，i==j這一過程一定正好是i+或j-完成的時候，此時令循環結束。

還是來看看圖吧：

大家已經發現了，當序列中的每個元素都歸位的時候，整個序列也就都變得有序了。

看完了圖解是不是感覺賊得勁兒了呢？？

看代碼：

快速排序是不穩定的排序演算法。

OK。自此，常用的排序演算法已經介紹完畢，今天的表演到此結束，謝謝大家。

-END-

編輯：鄧發珩（華中科技大學管理學院本科一年級，2638512393@qq.com，個人公眾號:程序猿聲）

代碼: 鄧發珩

指導老師：秦時明岳（professor.qin@qq.com）

如有疑問，歡迎諮詢~

更多最新數據分析相關原創文章，請關注微信公眾號：數據魔術師