程序員必須掌握哪些演算法?


每種程序員的需求很不一樣,與其談具體的演算法,不如說最基本應掌握複雜度、窮舉、分治、回溯、貪心、動態規劃等演算法基礎理論。

P.S. 如果我當面試官問 遊戲編程裡面有哪些經典或者很酷的演算法? - Milo Yip 的回答 里類似的演算法,估計很難請人。實際工作需要不斷學習(甚至研究)領域相關的演算法去解決問題,沒有什麼必須掌握的。


我來緬懷一下當年OI和ACM的日子……題目都在 Welcome To PKU JudgeOnline 上。


初期(校賽及省賽水題難度):

一.基本演算法:

  • 枚舉. (poj1753,poj2965)
  • 貪心(poj1328,poj2109,poj2586)
  • 遞歸和分治法.
  • 遞推.
  • 構造法.(poj3295)
  • 模擬法.(poj1068,poj2632,poj1573,poj2993,poj2996)

二.圖演算法:

  • 圖的深度優先遍歷和廣度優先遍歷.
  • 最短路徑演算法(dijkstra,bellman-ford,floyd,heap+dijkstra)
    (poj1860,poj3259,poj1062,poj2253,poj1125,poj2240)
  • 最小生成樹演算法(prim,kruskal)
    (poj1789,poj2485,poj1258,poj3026)
  • 拓撲排序 (poj1094)
  • 二分圖的最大匹配 (匈牙利演算法) (poj3041,poj3020)
  • 最大流的增廣路演算法(KM演算法). (poj1459,poj3436)

三.數據結構.

  • 串 (poj1035,poj3080,poj1936)
  • 排序(快排、歸併排(與逆序數有關)、堆排) (poj2388,poj2299)
  • 簡單並查集的應用.
  • 哈希表和二分查找等高效查找法(數的Hash,串的Hash)
    (poj3349,poj3274,POJ2151,poj1840,poj2002,poj2503)
  • 哈夫曼樹(poj3253)
  • trie樹(靜態建樹、動態建樹) (poj2513)

四.簡單搜索

  • 深度優先搜索 (poj2488,poj3083,poj3009,poj1321,poj2251)
  • 廣度優先搜索(poj3278,poj1426,poj3126,poj3087.poj3414)
  • 簡單搜索技巧和剪枝(poj2531,poj1416,poj2676,1129)

五.動態規劃

  • 背包問題. (poj1837,poj1276)
  • 型如下表的簡單DP(可參考lrj的書 page149):
    E[j]=opt{D+w(i,j)} (poj3267,poj1836,poj1260,poj2533)
    E[i,j]=opt{D[i-1,j]+xi,D[i,j-1]+yj,D[i-1][j-1]+zij} (最長公共子序列) (poj3176,poj1080,poj1159)
    C[i,j]=w[i,j]+opt{C[i,k-1]+C[k,j]}.(最優二分檢索樹問題)

六.數學

  • 組合數學:
    1.加法原理和乘法原理.
    2.排列組合.
    3.遞推關係.
    (POJ3252,poj1850,poj1019,poj1942)
  • 數論.
    1.素數與整除問題
    2.進位位.
    3.同餘模運算.
    (poj2635, poj3292,poj1845,poj2115)
  • 計算方法.
    1.二分法求解單調函數相關知識.(poj3273,poj3258,poj1905,poj3122)

七.計算幾何學.

  • 幾何公式.
  • 叉積和點積的運用(如線段相交的判定,點到線段的距離等). (poj2031,poj1039)
  • 多邊型的簡單演算法(求面積)和相關判定(點在多邊型內,多邊型是否相交)
    (poj1408,poj1584)
  • 凸包. (poj2187,poj1113)

中級(校賽壓軸及省賽中等難度):
一.基本演算法:

  • C++的標準模版庫的應用. (poj3096,poj3007)
  • 較為複雜的模擬題的訓練(poj3393,poj1472,poj3371,poj1027,poj2706)

二.圖演算法:

  • 差分約束系統的建立和求解. (poj1201,poj2983)
  • 最小費用最大流(poj2516,poj2516,poj2195)
  • 雙連通分量(poj2942)
  • 強連通分支及其縮點.(poj2186)
  • 圖的割邊和割點(poj3352)
  • 最小割模型、網路流規約(poj3308)

三.數據結構.

  • 線段樹. (poj2528,poj2828,poj2777,poj2886,poj2750)
  • 靜態二叉檢索樹. (poj2482,poj2352)
  • 樹狀樹組(poj1195,poj3321)
  • RMQ. (poj3264,poj3368)
  • 並查集的高級應用. (poj1703,2492)
  • KMP演算法. (poj1961,poj2406)

四.搜索

  • 最優化剪枝和可行性剪枝
  • 搜索的技巧和優化 (poj3411,poj1724)
  • 記憶化搜索(poj3373,poj1691)

五.動態規劃

  • 較為複雜的動態規劃(如動態規劃解特別的旅行商TSP問題等)
    (poj1191,poj1054,poj3280,poj2029,poj2948,poj1925,poj3034)
  • 記錄狀態的動態規劃. (POJ3254,poj2411,poj1185)
  • 樹型動態規劃(poj2057,poj1947,poj2486,poj3140)

六.數學

  • 組合數學:
    1.容斥原理.
    2.抽屜原理.
    3.置換群與Polya定理(poj1286,poj2409,poj3270,poj1026).
    4.遞推關係和母函數.
  • 數學.
    1.高斯消元法(poj2947,poj1487, poj2065,poj1166,poj1222)
    2.概率問題. (poj3071,poj3440)
    3.GCD、擴展的歐幾里德(中國剩餘定理) (poj3101)
  • 計算方法.
    1.0/1分數規劃. (poj2976)
    2.三分法求解單峰(單谷)的極值.
    3.矩陣法(poj3150,poj3422,poj3070)
    4.迭代逼近(poj3301)
  • 隨機化演算法(poj3318,poj2454)
  • 雜題(poj1870,poj3296,poj3286,poj1095)

七.計算幾何學.

  • 坐標離散化.
  • 掃描線演算法(例如求矩形的面積和周長並,常和線段樹或堆一起使用)
    (poj1765,poj1177,poj1151,poj3277,poj2280,poj3004)
  • 多邊形的內核(半平面交)(poj3130,poj3335)
  • 幾何工具的綜合應用.(poj1819,poj1066,poj2043,poj3227,poj2165,poj3429)

高級(regional中等難度):
一.基本演算法要求:

  • 代碼快速寫成,精簡但不失風格
  • (poj2525,poj1684,poj1421,poj1048,poj2050,poj3306)
  • 保證正確性和高效性. poj3434

二.圖演算法:

  • 度限制最小生成樹和第K最短路. (poj1639)
  • 最短路,最小生成樹,二分圖,最大流問題的相關理論(主要是模型建立和求解)
    (poj3155, poj2112,poj1966,poj3281,poj1087,poj2289,poj3216,poj2446
  • 最優比率生成樹. (poj2728)
  • 最小樹形圖(poj3164)
  • 次小生成樹.
  • 無向圖、有向圖的最小環

三.數據結構.

  • trie圖的建立和應用. (poj2778)
  • LCA和RMQ問題(LCA(最近公共祖先問題) 有離線演算法(並查集+dfs) 和 在線演算法(RMQ+dfs)).(poj1330)
  • 雙端隊列和它的應用(維護一個單調的隊列,常常在動態規劃中起到優化狀態轉移的目的). (poj2823)
  • 左偏樹(可合併堆).
  • 後綴樹(非常有用的數據結構,也是賽區考題的熱點).(poj3415,poj3294)

四.搜索

  • 較麻煩的搜索題目訓練(poj1069,poj3322,poj1475,poj1924,poj2049,poj3426)
  • 廣搜的狀態優化:利用M進位數存儲狀態、轉化為串用hash表判重、按位壓縮存儲狀態、雙向廣搜、A*演算法. (poj1768,poj1184,poj1872,poj1324,poj2046,poj1482)
  • 深搜的優化:盡量用位運算、一定要加剪枝、函數參數儘可能少、層數不易過大、可以考慮雙向搜索或者是輪換搜索、IDA*演算法. (poj3131,poj2870,poj2286)

五.動態規劃

  • 需要用數據結構優化的動態規劃.(poj2754,poj3378,poj3017)
  • 四邊形不等式理論.
  • 較難的狀態DP(poj3133)

六.數學

  • 組合數學.
    1.MoBius反演(poj2888,poj2154)
    2.偏序關係理論.
  • 博奕論.
    1.極大極小過程(poj3317,poj1085)
    2.Nim問題.

七.計算幾何學.

  • 半平面求交(poj3384,poj2540)
  • 可視圖的建立(poj2966)
  • 點集最小圓覆蓋.
  • 對踵點(poj2079)

八.綜合題.
(poj3109,poj1478,poj1462,poj2729,poj2048,poj3336,poj3315,poj2148,poj1263)

=====================================================================


扯點建議:

如果你不是要死磕acm搞出成績來的話,多放點心思在數據結構上對以後的幫助會比較大,比如字元串相關的字典樹、哈希、自動機、後綴樹等等,而對腦力要求較高的比如博弈論和各種花式動態規劃(樹型DP、集合DP、插頭DP等等)就不用太關心了。


btw這些演算法和數據結構如果能精通的話,對你以後做數據挖掘和機器學習是有極大幫助的。

廣告時間:如果你對以上學習路徑有什麼困惑,或者你對以下問題感興趣:

* 為什麼面試官都喜歡考程序員基礎演算法?

* 如何高效、系統性地學習演算法和數據結構?

* 為什麼大家普遍覺得動態規劃較難理解?

* 學演算法是否有必要參加 OI / ACM 等演算法編程競賽?

* 如何平衡自己在演算法、競賽上和其它方面學習的精力投入?

* 學習傳統演算法對日後工作的幫助具體有多大?

* 學習傳統演算法對學習機器學習的幫助具體有多大?

那麼歡迎來到我的知乎 Live:

SimonS 的知乎 Live - 如何快速攻克傳統演算法和數據結構

SimonS 的知乎 Live - 如何成為當下合格的演算法工程師

SimonS 的知乎 Live - 機器學習入門需要哪些數學基礎


最重要的是如何找到適用的演算法

比如我最近做的東西是有機物結構式的搜索,用戶輸入一個結構式,軟體從一個巨大的(一億個已知結構)資料庫中返回和用戶輸入最相似的結構出來。例如我輸入

它返回

等。使用搜索引擎是 Elastic Search(因為我已經搭了一個搜其他屬性的)。限時 1s。


前面一些回答,尤其那個3k多贊的,算是知識點羅列嗎?找兩本書:初等演算法+演算法設計,把目錄貼出來,大概就是這個樣子了。

我對此類回答不太滿意。我來換一個角度解讀下吧。

其實程序員員掌握多少演算法並不關鍵,關鍵的是能不能理解演算法背後深層的理論,以及修練出解題的思路。

就好像排序中的堆排序,本質就是二叉樹的應用。

快速排序、希爾排序等本質都是分治法的思路。

等等

見的多了就會發現,很多演算法面向解決的問題明明相差很大,但底層實現都是非常類似;而又有些演算法面向的問題很類似,而底層實現又相差巨大。

現實世界的需求是千變萬化的,即使你掌握再多的演算法也不可能直接照搬某個演算法去解決你面對的問題。

關鍵的是要通過學習演算法過程中整理出解決問題的思路。例如面對高性能的需求附帶一些個性化的情況時,是用hash表解決,還是用二叉樹,選擇哪種具體的實現以及一些細節處的處理。

因此在現實環境中,嚴格按照某種演算法定義使用演算法的情況很少見,大多都是變種。甚至多種演算法拼湊組合。

而為什麼能產生這麼多演算法,這麼多變種演算法的原因,其實也是因為很多人在面對自己的需求時照搬經典演算法解決不了問題,所以修改或優化了演算法,才產生了變種演算法甚至新演算法。

所以,學習演算法不要單純去記憶演算法的定義和實現代碼,關鍵是要學會其中的思路。

這個跟寫代碼學習設計模式、架構模式等的情況是一樣的。真正嚴格匹配某種模式的情況很少,都是雜合。

關鍵是掌握其中的本質。就好像武功中的,看山還是山,看水還是水。無招勝有著的境界。

歡迎點贊和評論。


標準庫裡帶的那些(數據結構和演算法)。


具體取決於這個程序員是做什麼類型程序的。
廣泛的說,《數據結構》、《運籌學》、《Introduction to algorithms》這三本書里的演算法都應該了解,對於搜索類演算法應該熟悉,其餘至少知道大致思想和特點。
不要把動態規劃當演算法,因為dp其實是一種思想而不是演算法,要實現dp完全可以脫離原本的循環遍歷模式而使用各種最短路、記憶化搜索等等具體演算法。
此外,《機器學習與人工智慧》里的演算法都應了解並且掌握。現實問題大多數都是近似問題,不一定非要求最優解,近似演算法會經常派得上用場。
畢竟,做ACM與實際做軟體對演算法需求差異還挺大的,當然大公司專註做後台複雜計算的另說…


不見得要掌握那些的具體演算法,或者演算法怎麼編碼。
但是最應該掌握的是演算法複雜度,用在哪裡和怎麼應用。
做工作不是考試,具體不懂用法可以查資料,但是不知道演算法的限制瞎用,則沒有救了。

當然入門的學習,比如數據結構中提到的演算法和結構還是一定要掌握的。
再是類庫中的各種數據結構和用法。
都是需要掌握到熟練應用的。


從程序員面試角度,說說面試時需要掌握的演算法有哪些。

具體的請看下面列表。不過,如果是準備面試的話,我建議你通過做題來鞏固這些演算法知識。這裡推薦你到 http://www.lintcode.com 上面進行 Online Judge,以下類別的面試題目都有覆蓋到。

演算法部分

二分搜索 Binary Search
分治 Divide Conquer
寬度優先搜索 Breadth First Search
深度優先搜索 Depth First Search
回溯法 Backtracking
雙指針 Two Pointers
動態規劃 Dynamic Programming
掃描線 Scan-line algorithm
快排 Quick Sort

數據結構部分

棧 Stack
隊列 Queue
鏈表 Linked List
數組 Array
哈希表 Hash Table
二叉樹 Binary Tree
堆 Heap
並查集 Union Find
字典樹 Trie

----------3.31更新---------

有朋友留言說這些演算法覆蓋得太少,他都「基本掌握」了。需要做以下幾點補充說明。

1. 我在這裡總結的是程序面試必須掌握的演算法知識。所以選擇的是最常面試到的演算法內容。面試與做研究不同,不會要求那些極少用到而又及其高深的演算法。

2. 有的人覺得自己「基本掌握」了,但如果真的讓他來做兩道題,他也許花很長的時間都寫不出來完整的答案。甚至即使做出來了,還會有非常多的bug。在面試中,一個題目一般只有30-45分鐘的時間可以讓你作答,而且要求bug free。如果你做不到這樣,那就不可以說自己「基本掌握」。

3. 以上的演算法知識點,看起來很少,真正掌握、吃透,是要花很長時間的。個人覺得與其泛泛地了解一些演算法知識的皮毛,不如深入地把以上面試、工作中最常用到的演算法知識吃透。


我真心覺得會用 hashmap 的就是好程序員。


演算法(第4版) (豆瓣)


這個問答貼來自 Quora。

演算法

  1. 圖搜索 (廣度優先、深度優先)深度優先特別重要
  2. 排序
  3. 動態規劃
  4. 匹配演算法和網路流演算法
  5. 正則表達式和字元串匹配

數據結構

  1. 圖 (樹尤其重要)
  2. Map
  3. 棧/隊列
  4. Tries | 字典樹

額外推薦

  • 貪婪演算法
  • 概率方法
  • 近似演算法

上面是 Arjun Nayini 的推薦,下面是 Ken George 的推薦

註:下面這個沒有特定優先順序

演算法:

  • 三路劃分-快速排序
  • 合併排序(更具擴展性,複雜度類似快速排序)
  • DF/BF 搜索 (要知道使用場景)
  • Prim / Kruskal (最小生成樹)
  • Dijkstra (最短路徑演算法)
  • 選擇演算法

數據結構

  • HashMap (真的要知道所有哈希結構)
  • 圖和樹(紅黑樹很好學) (red-black trees are good to learn)
  • 堆(優先順序隊列)
  • 棧/隊列(必須知道的基礎內容)
  • Tries | 字典樹

有限狀態機,掌握這個才能開始寫一些複雜的程序。
數據結構,常用演算法要掌握,不過工作中基本用庫就夠了。


反轉二叉樹(逃


從homebrew的作者不會反轉二叉樹來看,沒有什麼演算法是必須掌握的


是ctrl-v和ctrl-c嗎?


我一直以為是四則運算,碼代碼不準備手冊的都是大神。


會加減乘除就可以啦



說點工作中必須的吧,別的不扯!
你以為工作中會讓你這個這個樹那個棧,什麼鏈表排序嘛?No!
如果你這樣想,恭喜你,「想多了!」
分割線
~~~~~~~~~~~~~~
很多公司的招聘要求是如此的扯,讓你會這個那個,而當你進去的時候,是做別的讓你都想不到,真的,想不到!
所以,你的簡歷要把招聘信息里的內容涉及到,哪怕不會,沒關係,你以為人力資源部都是技術高手嘛?No!一個比一個水!
話題轉過來!
那麼程序猿到底得學什麼呢?
看你做什麼了!做網頁,就php,.net,做遊戲就java,c++,做小程序,系統就C,然後看你是在windows平台還是Linux平台做。兄弟,建議你有針對性的去學。別像我,啥都學,到最後,啥都不精通,說多了都是淚。
送君一席話,活到老,學到老!


leetcode 刷完,你就知道答案了


推薦閱讀:

為什麼點贊手速過快會出現計贊 2 次?
零基礎自學 Android 並去找工作可行性大么?
「傳輸自動生成代碼並執行、生成所需文件」能否成為未來的下載方式?
在 GitHub 上保持 365 天全綠是怎樣一種體驗?
為什麼 Qt Creator 的編譯如此之慢?

TAG:程序員 | 演算法 | 編程 |