現在演算法工程師都有哪些分類?

需要的數學和計算機背分別是什麼樣的?需要哪些技能套餐.
比如說 機器學習演算法工程師至少要會分散式計算,mapreduce,pyton, 打底數學要會數理統計,概率,線性代數,向量微積分,精通需要....
希望各個方向的從業人員給個參考.


說明:以下是非專業人士的整理,我按自己的理解對演算法工程師進行了分類,不定時更新。


演算法工程師相關的專業回答可見SimonS 的知乎 Live - 如何成為當下合格的演算法工程師 @SimonS


一、演算法工程師簡介

(通常是月薪15k以上,年薪18萬以上,只是一個概數,具體薪資可以到招聘網站如拉鉤,獵聘網上看看)

演算法工程師目前是一個高端也是相對緊缺的職位;

演算法工程師包括

音/視頻演算法工程師(通常統稱為語音/視頻/圖形開發工程師)、圖像處理演算法工程師、計算機視覺演算法工程師、通信基帶演算法工程師、信號演算法工程師、射頻/通信演算法工程師、自然語言演算法工程師、數據挖掘演算法工程師、搜索演算法工程師、控制演算法工程師(雲台演算法工程師,飛控演算法工程師,機器人控制演算法)、導航演算法工程師( @之介 感謝補充)、其他【其他一切需要複雜演算法的行業】


專業要求:計算機、電子、通信、數學等相關專業;

學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;

語言要求:英語要求是熟練,基本上能閱讀國外專業書刊,做這一行經常要讀論文;

必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。

演算法工程師的技能樹(不同方向差異較大,此處僅供參考)

1 機器學習

2 大數據處理:熟悉至少一個分散式計算框架Hadoop/Spark/Storm/ map-reduce/MPI

3 數據挖掘

4 紮實的數學功底

5 至少熟悉C/C++或者Java,熟悉至少一門編程語言例如java/python/R

加分項:具有較為豐富的項目實踐經驗(不是水論文的哪種)


二、演算法工程師大致分類與技術要求

(一)圖像演算法/計算機視覺工程師類

包括

圖像演算法工程師,圖像處理工程師,音/視頻處理演算法工程師,計算機視覺工程師

要求

l
專業:計算機、數學、統計學相關專業;

l
技術領域:機器學習,模式識別

l
技術要求:

(1) 精通DirectX HLSL和OpenGL GLSL等shader語言,熟悉常見圖像處理演算法GPU實現及優化;

(2) 語言:精通C/C++;

(3) 工具:Matlab數學軟體,CUDA運算平台,VTK圖像圖形開源軟體【醫學領域:ITK,醫學圖像處理軟體包】

(4) 熟悉OpenCV/OpenGL/Caffe等常用開源庫;

(5) 有人臉識別,行人檢測,視頻分析,三維建模,動態跟蹤,車識別,目標檢測跟蹤識別經歷的人優先考慮;

(6) 熟悉基於GPU的演算法設計與優化和並行優化經驗者優先;

(7) 【音/視頻領域】熟悉H.264等視頻編解碼標準和FFMPEG,熟悉rtmp等流媒體傳輸協議,熟悉視頻和音頻解碼演算法,研究各種多媒體文件格式,GPU加速;


應用領域:

(1) 互聯網:如美顏app

(2) 醫學領域:如臨床醫學圖像

(3) 汽車領域

(4) 人工智慧


相關術語:

(1) OCR:OCR (Optical Character Recognition,光學字元識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上列印的字元,通過檢測暗、亮的模式確定其形狀,然後用字元識別方法將形狀翻譯成計算機文字的過程

(2) Matlab:商業數學軟體;

(3) CUDA: (Compute Unified Device Architecture),是顯卡廠商NVIDIA推出的運算平台(由ISA和GPU構成)。 CUDA?是一種由NVIDIA推出的通用並行計算架構,該架構使GPU能夠解決複雜的計算問題

(4) OpenCL: OpenCL是一個為異構平台編寫程序的框架,此異構平台可由CPU,GPU或其他類型的處理器組成。

(5) OpenCV:開源計算機視覺庫;OpenGL:開源圖形庫;Caffe:是一個清晰,可讀性高,快速的深度學習框架。

(6) CNN:(深度學習)卷積神經網路(Convolutional Neural Network)CNN主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形。

(7) 開源庫:指的是計算機行業中對所有人開發的代碼庫,所有人均可以使用並改進代碼演算法。


(二)機器學習工程師

包括

機器學習工程師

要求

l
專業:計算機、數學、統計學相關專業;

l
技術領域:人工智慧,機器學習

l
技術要求:

(1) 熟悉Hadoop/Hive以及Map-Reduce計算模式,熟悉Spark、Shark等尤佳;

(2) 大數據挖掘;

(3) 高性能、高並發的機器學習、數據挖掘方法及架構的研發;


應用領域:


(1)人工智慧,比如各類模擬、擬人應用,如機器人

(2)醫療用於各類擬合預測

(3)金融高頻交易

(4)互聯網數據挖掘、關聯推薦

(5)無人汽車,無人機

相關術語:

(1) Map-Reduce:MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想,都是從函數式編程語言里借來的,還有從矢量編程語言里借來的特性。


(三)自然語言處理工程師

包括

自然語言處理工程師

要求

l
專業:計算機相關專業;

l
技術領域:文本資料庫

l
技術要求:

(1) 熟悉中文分詞標註、文本分類、語言模型、實體識別、知識圖譜抽取和推理、問答系統設計、深度問答等NLP 相關演算法;

(2) 應用NLP、機器學習等技術解決海量UGC的文本相關性;

(3) 分詞、詞性分析、實體識別、新詞發現、語義關聯等NLP基礎性研究與開發;

(4) 人工智慧,分散式處理Hadoop;

(5) 數據結構和演算法;


應用領域:


口語輸入、書面語輸入
、語言分析和理解、語言生成、口語輸出技術、話語分析與對話、文獻自動處理、多語問題的計算機處理、多模態的計算機處理、信息傳輸與信息存儲 、自然語言處理中的數學方法、語言資源、自然語言處理系統的評測。

相關術語:

(2) NLP:人工智慧的自然語言處理,NLP (Natural Language Processing) 是人工智慧(AI)的一個子領域。NLP涉及領域很多,最令我感興趣的是「中文自動分詞」(Chinese word segmentation):結婚的和尚未結婚的【計算機中卻有可能理解為結婚的「和尚「】

(四)射頻/通信/信號演算法工程師類

包括

3G/4G無線通信演算法工程師, 通信基帶演算法工程師,DSP開發工程師(數字信號處理),射頻通信工程師,信號演算法工程師

要求

l
專業:計算機、通信相關專業;

l
技術領域:2G、3G、4G,BlueTooth(藍牙),WLAN,無線移動通信, 網路通信基帶信號處理

l
技術要求:

(1) 了解2G,3G,4G,BlueTooth,WLAN等無線通信相關知識,熟悉現有的通信系統和標準協議,熟悉常用的無線測試設備;

(2) 信號處理技術,通信演算法;

(3) 熟悉同步、均衡、信道解碼等演算法的基本原理;

(4) 【射頻部分】熟悉射頻前端晶元,紮實的射頻微波理論和測試經驗,熟練使用射頻電路模擬工具(如ADS或MW或Ansoft);熟練使用cadence、altium designer PCB電路設計軟體;

(5) 有紮實的數學基礎,如複變函數、隨機過程、數值計算、矩陣論、離散數學


應用領域:

通信

VR【用於快速傳輸視頻圖像,例如樂客靈境VR公司招募的通信工程師(數據編碼、流數據)】

物聯網,車聯網

導航,軍事,衛星,雷達


相關術語:

(1) 基帶信號:指的是沒有經過調製(進行頻譜搬移和變換)的原始電信號。

(2) 基帶通信(又稱基帶傳輸):指傳輸基帶信號。進行基帶傳輸的系統稱為基帶傳輸系統。傳輸介質的整個信道被一個基帶信號佔用.基帶傳輸不需要數據機,設備化費小,具有速率高和誤碼率低等優點,.適合短距離的數據傳輸,傳輸距離在100米內,在音頻市話、計算機網路通信中被廣泛採用。如從計算機到監視器、印表機等外設的信號就是基帶傳輸的。大多數的區域網使用基帶傳輸,如乙太網、令牌環網。

(3) 射頻:射頻(RF)是Radio Frequency的縮寫,表示可以輻射到空間的電磁頻率(電磁波),頻率範圍從300KHz~300GHz之間(因為其較高的頻率使其具有遠距離傳輸能力)。射頻簡稱RF射頻就是射頻電流,它是一種高頻交流變化電磁波的簡稱。每秒變化小於1000次的交流電稱為低頻電流,大於10000次的稱為高頻電流,而射頻就是這樣一種高頻電流。高頻(大於10K);射頻(300K-300G)是高頻的較高頻段;微波頻段(300M-300G)又是射頻的較高頻段。【有線電視就是用射頻傳輸方式】

(4) DSP:數字信號處理,也指數字信號處理晶元


(五)數據挖掘演算法工程師類

包括

推薦演算法工程師,數據挖掘演算法工程師

要求

l
專業:計算機、通信、應用數學、金融數學、模式識別、人工智慧;

l
技術領域:機器學習,數據挖掘

l
技術要求:

(1) 熟悉常用機器學習和數據挖掘演算法,包括但不限於決策樹、Kmeans、SVM、線性回歸、邏輯回歸以及神經網路等演算法;

(2) 熟練使用SQL、Matlab、Python等工具優先;

(3) 對Hadoop、Spark、Storm等大規模數據存儲與運算平台有實踐經驗【均為分散式計算框架】

(4) 數學基礎要好,如高數,統計學,數據結構

l
加分項:數據挖掘建模大賽;


應用領域

(1) 個性化推薦

(2) 廣告投放

(3) 大數據分析


相關術語

Map-Reduce:MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想,都是從函數式編程語言里借來的,還有從矢量編程語言里借來的特性。


(六)搜索演算法工程師

要求

l
技術領域:自然語言

l
技術要求:

(1) 數據結構,海量數據處理、高性能計算、大規模分散式系統開發

(2) hadoop、lucene

(3) 精通Lucene/Solr/Elastic Search等技術,並有二次開發經驗

(4) 精通Lucene/Solr/Elastic Search等技術,並有二次開發經驗;

(5) 精通倒排索引、全文檢索、分詞、排序等相關技術;

(6) 熟悉Java,熟悉Spring、MyBatis、Netty等主流框架;

(7) 優秀的資料庫設計和優化能力,精通MySQL資料庫應用 ;

(8) 了解推薦引擎和數據挖掘和機器學習的理論知識,有大型搜索應用的開發經驗者優先。


(七)控制演算法工程師類

包括了雲台控制演算法,飛控控制演算法,機器人控制演算法

要求

l
專業:計算機,電子信息工程,航天航空,自動化

l
技術要求:

(1) 精通自動控制原理(如PID)、現代控制理論,精通組合導航原理,姿態融合演算法,電機驅動,電機驅動

(2) 卡爾曼濾波,熟悉狀態空間分析法對控制系統進行數學模型建模、分析調試;

l
加分項:有電子設計大賽,機器人比賽,robocon等比賽經驗,有硬體設計的基礎;


應用領域

(1)醫療/工業機械設備

(2)工業機器人

(3)機器人

(4)無人機飛控、雲台控制等

(八)導航演算法工程師

要求

l 專業:計算機,電子信息工程,航天航空,自動化

l 技術要求(以公司職位JD為例)

公司一
(1)精通慣性導航、激光導航、雷達導航等工作原理;
(2)精通組合導航演算法設計、精通卡爾曼濾波演算法、精通路徑規劃演算法;
(3)具備導航方案設計和實現的工程經驗;
(4)熟悉C/C++語言、熟悉至少一種嵌入式系統開發、熟悉Matlab工具;

公司二
(1)熟悉基於視覺信息的SLAM、定位、導航演算法,有1年以上相關的科研或項目經歷;
(2)熟悉慣性導航演算法,熟悉IMU與視覺信息的融合;


應用領域

無人機、機器人等。


有圖像演算法工程師,要熟悉圖像演算法,會matlab模擬,會C/C++編程,能用彙編優化性能或者上gpu應該都是加分項


有通信演算法工程師,矩陣加傅立葉變換等等數學套餐,Matlab模擬加一門編程語言,最主要看的是對通信演算法的熟悉


有數據挖掘/機器學習方向的演算法工程師,估計題主好的就是這口了…編程能力最重,python/c/java都行,熟悉linux,知道mapreduce能講清楚或者答一個demo思路,數據結構演算法一半,主流機器學習演算法一半剩下就是看面試官喜好了


還有一些其它的類別,比如數值優化演算法工程師,機器人演算法工程師等


基本技能就是數據結構相關的演算法+編程能力+熟悉相關領域演算法


哪有那麼多演算法。一個項目可能就某個模塊需要某些演算法。難道你還能優化,優化,再優化。no no no。小心kpi不達標,被開除。當演算法工程師提交完最後一行代碼的時候就是開除他的最好時機。所以你還需要JAVA ssh。hadoop生態圈。爬蟲技術。so 現在項目已經離不開你了。安心拿高工資吧。然後假裝繼續研究演算法。其實是在刷知乎。


演算法嘛,我是搞圖像演算法的,圖像演算法單單寫出來也是不能用的,因為速度的問題,有fpga上的,dsp上的,pc上的。就拿pc上的來說,最快的還是c語言結合彙編實現的,首先需要做基礎的優化,就是數學上的,然後是程序邏輯上的,然後是多線程,然後還有指令集比如sse2.avx等。這些都做下來,才能達到現在的頂級狀態。所以你看有多少分類?


想多了,調庫調參寫SQL。


演算法工作內容=演算法+工程。拿機器學習來說,大公司專註演算法和數據,理論和業務熟就行。小公司出了理論還要有調庫完成業務的能力。簡單的話,學個python,sklearn就能處理很多問題。偏大數據方面,spark,hadoop,java,scala都要會。複雜模式就是用c++,結合各種數據結構實現演算法。比如語音解碼器裡面有自動機的合併,化簡,簡直是災難。


做演算法, 剛畢業工資平均是多少?


演算法對應的本科專業有哪些


感覺有大量重疊啊~~導航主要也是圖像演算法比較多吧...圖像是老大,其他的學習成本都不高...就圖像來說slam的資料也是甚少


問個問題,金融徵信,收集一些交易數據和透支以及還款數據,計算出信用分,需要用到什麼演算法呢?


python,不謝


推薦閱讀:

物理專業自學計算機應該學些什麼?
最近十年,編程領域有什麼重要進展?
用小猿搜題、學習寶這類產品是否真能搜到題?
為什麼圖片反覆壓縮後會普遍會變綠而不是其他顏色?
怎麼勸大四室友不要考計算機研?

TAG:演算法 | 計算機 | 機器學習 | 數字信號處理 | 數值分析 |