新入學的計算機研究生怎麼安排三年學習深度學習?

  1. 工業界深度學習的職位日常工作到底是做什麼的?
  2. 在問題1的基礎上追問,研究生三年時間有限,是儘可能多的熟悉模型多的做項目熟悉調參好,還是了解機器學習和深度學習數學原理搭配項目實踐好?畢竟師兄們沒怎麼看數學原理也能發sci。
  3. 工業界圖像識別和自然語言處理那個前景好?
  4. 不是很想讀博但是也可以考慮,專精深度學習出路好還是以各種機器學習方法和python庫為基礎偏向數據分析的工作出路好?
  5. 想去深圳,但是是不是北京對職業發展更好?


謝邀,剛一看這周有五個人邀請我回答,正好下班放假了就回答一下吧,不過人之患在於好為人師,怕會誤導看看就好

首先,我的背景是某高校的在讀博士生,現在在國內某個深度學習公司做實習生,所以同時擁有學術背景和工業背景,不過實習生還沒做多久但也看到了一些企業和高校的不同

1、深度學習工業界也分為偏研究的崗位和偏開發的崗位,我是研究崗大概要做的會有看論文復現模型改寫模型訓模型弄數據調參數寫專利寫論文,研究的崗位可能需要不錯的學術能力,能夠快速復現論文(用公司所使用的深度學習框架,keras那種框架可能過於簡單了,至少要有TF開發的水平吧,不過著名公司都有自己的深度學習框架,這麼一來理論功底紮實就有優勢了,沒有數學功底你連個複雜點的loss函數都復現不了,並不是所有的分類損失都是交叉熵哦,今天聽到對面一個同事在糾結loss可微不可微無法訓練的問題,理論功底是內功,深度學習框架只是招式或者武器罷了),開發崗位可能更加註重編程能力,你需要把代碼進行優化達到商業用途,把訓練好的模型封裝到SDK裡面去,不過除了某些學術背景或者研究氣息比較濃的業務部門,深度學習更需要的是全棧工程師(理論+各種開發一套上),AT兩家面試的時候都是這麼要求的,自己訓練的模型自己負責開發,所以深度學習工程師目前才這麼有價值,當然我也見過把深度學習當智障黑箱來用的同事,但是人家絕對不是智障,人家要麼有出眾的coding能力,要麼是個賊聰明嗅覺敏銳能夠發現問題在哪裡的人,當然這種人大多出現在深度學習要求不是很高或者學術界工業界都比較成熟了的業務上。

2、講道理SCI在DL領域真的沒有特別牛逼,調參能發CVPR,ECCV,ICCV,ICLR這些我才服,SCI你能發PAMI等我也服,調參並不代表不懂數學,不懂數學的調參那叫摸獎,懂原理的調參才能叫煉丹,煉丹你也要懂配方好么,玩軒轅劍的時候煉丹都要查攻略的。另外現在一個單通道CNN能發論文?現在各種net直接調用都變成一個SDK了,數學原理上的改進我們這種凡人是做不出來了,但是再不濟發篇論文也得是各種model的整合級聯,或者設計loss之類的,又或者把深度學習作為論文中的一個子環節吧,現在醫療圖像用個CNN水篇論文都要設計相對應的分割預處理之類的。工程還是理論,我覺得都很重要,如果偏要選一個那就看你以後是想讀博還是想就業吧,當然不管幹什麼,我建議你去好的公司裡面去實習,理論和工程都能得到提高,當然是指BAT和四小龍這一檔次的高水平公司,畢竟深度學習還是個工程學科,並且企業有更好的數據和更好的GPU集成伺服器,我在實驗室一個960顯卡都快哭了。

3、圖像和NLP都挺好的,實驗室主哪個就選哪個吧

4、這個不敢回答,我是專精深度學習的,但是傳統的機器學習和數據分析我也懂,因為兩者真的內在是很多互通的東西,懂深度學習不懂機器學習真的蠻難做到的

5、北京這邊可能機會真的更多一點,四小龍有三個在北京中關村這附近,BAT在北京也都有DL研究院(部門),更別說最近DL領域興起的地平線,馭勢科技,今日頭條等等很多公司,但是深圳也不差啊,並且房價也不差啊,相比之下我想待在杭州才是真的有點糾結呢


頭一次看到這麼詳細的提問:) 如果我沒猜錯,題主應該是北師大的吧。

1.工業界兩者都有。企業跟企業也不一樣,有些側重應用開發,可能會更傾向於用現成模型一些,有些則相反。

2.按你的情況來說,當然是要深入研究了,如果調參就是調整一下網路配置,跑個模型看看結果的話,那還要研究生幹啥,中專生培訓一下也是可以的。就以你提到的SSD為例,為何它叫single shot,跟R-CNN的proposal有什麼區別,跟yolo比又有什麼優勢,為何要用多尺度卷積替代yolo的全連接,如果讓你在SSD基礎上優化,你有什麼好思路?這些問題雖然基礎,但最好在學校的時候就搞清楚。

企業跟學校有一個很明顯的區別,那就是企業面對的是真實的客戶需求。企業的測試集往往要複雜得多!舉個例子,做車牌識別的時候,現場車牌圖像有可能存在變形,你就需要設計point transformer做回歸,那麼如何設計這個變換(以增強空間不變性)以及損失函數,就需要用到數學知識。而且你還需要寫程序把訓練數據的變形算出來,用於生成ground truth。總之,是否要用數學,完全取決於你做什麼,以及做到什麼程度。而且從你的描述看,我感覺你並不僅僅是為了畢業證。

搞清楚自己到底想要什麼,這點或許更為重要,更為迫切。

與之相對,企業想要什麼什麼樣的人,則往往比較清楚,而且目的很明確: 給企業帶來最大價值。跟學校不同,它往往是以最終結果為導向的,尤其是私企,怎麼有效怎麼來,多快好省地用好新技術,讓最終結果最佳,讓客戶最滿意。而學校則相對更重過程一些。

多: 多找技術資源,匹配應用需求。

快: 1.開發速度快2.運行速度快。慢了就被競爭對手超越了。

好: 最終效果要好。

省: 減少不必要的浪費,切忌走彎路。

3.我是做視覺的,NLP不熟悉,不過我倒是有一個朋友,在這方面是專家,我們討論過類似的問題,他感覺NLP業界的技術突破沒有視覺那麼大。也就意味著,NLP工業界的機會並沒有那麼多。相反,視覺雖然做的人多,但機會也很多。個人更推薦視覺。

4.數據分析領域不了解,我就不強答了。

5.如果你能忍受北京的霧霾,那我更推薦北京一些。

建議把標題和問題描述整理一下,簡明扼要,讓更多的人看到,看得更清楚。相信有類似疑問的人還挺多的。

另外,你師兄關於用什麼框架都一樣的說法,對你目前的狀態來說,我是基本贊同的。因為無論你用caffe還是tensorflow,只是表現形式不一樣而已,基本都在設計layer/net。說基本贊同,是因為部署的時候,需要考慮性能,擴展性等方面,所以也會有所取捨。從企業的角度,有些框架實現的layer多一些完善一些,可能會更省事,上面我不是講了嘛,企業要多快好省:) 不過你現在不必在這上面糾結太多了。

………………………………

居然讓我蒙對了,題主是北師大的。

以前題主提到,「北京985裡面還不錯的學校」,那首先果斷排除清北了。清北那不叫」還不錯」,那是相當不錯。這句話還可以排除北理工,農大。也就是去掉2個最高分,再去掉2個最低分,那麼就剩下:

人大,師大以及北航了。因為題主提到,他師兄是從人大考過來的,那就排除人大了。就剩北航和北師大。

由於題主還提到,他們學院是「信息技術學院」(名字有點記不清了)。一般來說,如果是純理工類的大學,其計算機相關學院里,不會帶有「應用」或「技術」等字樣,尤其是重點大學,而偏文科的大學裡設置計算機相關學院,則往往會有。所以相對北航來說,北師大的可能性要高一些。


謝邀。。

1. 工業界深度學習職位是偏向自己寫模型還是對偏向使用線程模型?或者說工業界深度學習的職位日常工作到底是做什麼的?和實驗室一樣嗎,僅僅是日復一日調別人的模型適應自己的數據(中性非貶義)?

工業界是偏向使用現成模型的,因為產出是最終導向。至於日常工作,應該說基於學術界或者美國大公司release的模型和現成代碼基礎上,結合實際產品進行低成本創新是最常見的工作模式。

當然也會有偏基礎和研究的工作職位,不過大都在美國。國內的話偏研究的工作通常會出現在錢多得花不完的大公司或是實驗室背景重的小公司,就國內浮躁的投資風格和技術氛圍,研究型職位還是太小眾,並且常常伴有急功近利的PR性質。

2. 在問題1的基礎上追問,研究生三年時間有限,是儘可能多的熟悉模型多的做項目熟悉調參好,還是了解機器學習和深度學習數學原理搭配項目實踐好?畢竟師兄們沒怎麼看數學原理也能發sci。

我覺得題主對調參的理解過於簡單,會調參的人通常都是懂原理的。師兄們沒看未必代表他們不懂,如果確實不懂那只是在灌水,當然灌水過程中學到的流程和框架使用對找工作也是有幫助的。SCI有另一個名字叫做Stupid Chinese Index,只是個索引而已,並不代表著水平。

3. 工業界圖像識別和自言語言處理那個前景好?

好該如何定義?人工智慧如火如荼,公司團隊滿地都是,但是問問誰掙到錢了,大多數其實是沉默的。當然就個人來說可能更關心待遇,那麼圖像和NLP應該差不多。有一點差別是搞圖像的人更多。

4. 不是很想讀博但是也可以考慮,專精深度學習出路好還是以各種機器學習方法和python庫為基礎偏向數據分析的工作出路好?

通過問題感覺題主目前是零基礎(no offense),遠不是糾結這個問題的時候,先學好基礎知識和Python編程再說。

5. 想去深圳,但是是不是北京對職業發展更好?

目前是的。


  1. 兩者皆需要。工業界注重實用價值,最小成本獲得最大收益;實驗室注重創新和突破,不計成本。
  2. 取決於你未來的目標:做研究or工程?發paper路千萬條,總有一條適合你。
  3. 兩張一百塊掉了你問我撿哪張?
  4. 還是第二個問題,選擇在你自己。深度學習基礎理論可以試試,應用很難。
  5. 各有利弊,等拿到offer再考慮,建議結合家庭與個人因素綜合考慮。

PS.關於Deep learning,美國NSF表示未來會繼續支持基礎理論研究,但放棄相關應用。預計會進入一段冰河時期。


謝邀。我覺得用好開源庫比較重要。你需要的是把演算法都理解了,自己會寫一些簡單的demo就可以。比如你最起碼得自己寫一個簡單的幾層的神經網路吧,這樣會對你理解起來有幫助。

用庫方面,深度學習就用tensorflow或torch,機器學習就用scikit-learn。首先會調用。然後能去做一些基本的競賽,會分析解決問題。最後好好練習。

推薦你看我前兩天剛寫的給工業界的機器學習建議,希望能幫到你:jindongwang/MachineLearning


我是去年十二月份公司內部轉崗到深度學習這塊的,因為大三的時候開過機器學習的課程,所以也就前期兩個月把基礎知識重新撿起來就能幹一些簡單的活了。我是專註於圖像分類模型,組裡的另一位同事專註於定位。所以一開始就是從AlexNet看起,一直到ResNet。那幾篇經典的論文至少看了十遍。雖然說那幾篇論文所涉及的數學並不多,但是網路設計的思路和出發點還是很值得學習的。看完論文以後就開始做實驗,從kaggle上的貓狗分類開始做,直到對caffe的整套流程了如指掌為止。然後針對業務上的數據集跑模型。現在都講究敏捷開發,產品是一個迭代的過程,一開始的準確率可以不用太高,所以首選肯定是成熟的網路結構。就拿我現在手頭上的任務為例,用AlexNet可以達到70%的準確率,用Network in Network可以達到75%的準確率(實驗過GoogleNet和ResNet,效果反而不如前兩個網路)。後來客戶說了,想要85%以上的準確率,那怎麼辦呢?沒辦法,自己硬著頭皮上唄。一開始是調整成熟網路,到了80%,然後就死活都上不去了。到最後只能自己從頭寫一個網路,對於自己寫的網路,十個裡面有9個都是無法收斂的。最後還是試驗出了一個比較好的網路,3000個訓練樣本的條件下能夠達到87%的準確率,而且收斂速度也很快,模型大小減少了66%。所以說,大部分時間都在跑現有的成熟網路,有改動也不過是調整調整卷積核大小之類的,以便更好的適應實際數據集。但是一旦現有的網路無法滿足KPI或者無法滿足客戶需求,你就得自己寫。如何寫,這就涉及到你的積累,這些積累包括數學上的,論文的閱讀量,亦或者是業務數據集的領域知識。掌握這些不一定能夠寫出好的網路結構,但是至少它們能夠給你思路。


謝邀,我用自己的工作說下對你問題的理解。

1. 當解決一個實際問題的時候,如果有現成的方法或者模型可以直接應用,我肯定會首先考慮現成的模型或者方法,避免自己造輪子,至少第一版解決方案肯定是這樣;模型上線後,有一個反饋調優的過程,最基本的調優就是調整參數,優化訓練集,或者嘗試其它已知的模型;但是如果已有的模型或者方法解決不了問題的時候,要麼自己寫,要麼確認這個問題確實不可解。還有一種情況就是KPI壓力造成的,已有的模型已經很不錯,但績效壓力驅使你去提升指標,那麼這時候,還是要麼嘗試牛逼的新的方法,要麼自己動手去寫了。

2. 我認為學生也好,從事研究工作也好,或者在工業界工作也好,只是交作業(發了文章,混個文憑;完成任務,拿到獎金)都是一件容易的事情;但真正提升自己的學術水平和解決問題的能力必然要付出很多努力。我不建議博覽群書,建議你認真鑽研幾個有代表性的方法,或者說,如果你論文或者課題中用了某個方法,那麼請你最好把它研究透,要不然工作簡歷上寫了這個項目,而面試的時候被問倒就不好了,有選擇性的專研幾個方法是很必要的;數學基礎也是非常必要的,因為方法總是在進化的,有好的數學基礎,才能跟得上方法的進化,可能你畢業後再也不會為寫文章發愁,但如果你以後還要在這個行業混,學術界的最新科技進展,還是要跟得上的,打好理論知識可能不是為了發文章,是為了讓你不落伍。

3. 有人說深度學習的工具傻瓜化以後,行業壁壘越來越小。之前一個做語音的,要想搞圖像,需要補一大堆背景知識,但現在幾行代碼搞定,因為深度學習解放了大家「提特徵」的工作。所以我覺得根本沒有必要糾結是圖像還是文本哪個火,學好深度學習,機器學習才是關鍵。

4. 建議無論是java,c++,python,先熟練掌握一種語言即可,如果熟練了一門,再學其他語言,基本小菜一碟。如果會很多種語言,沒種都是蜻蜓點水,那還不如精通一門。

5. 這個問題更沒有必要糾結,北京公司多,機會多正常。但騰訊在深圳,帶動了一大批創業公司;阿里在杭州,也是帶動了一大批創業公司。我相信頂尖的人才在哪裡都是頂尖的。


根據我們組的情況。

Q1. 工業界深度學習職位是偏向自己寫模型還是對偏向使用線程模型?或者說工業界深度學習的職位日常工作到底是做什麼的?和實驗室一樣嗎,僅僅是日復一日調別人的模型適應自己的數據(中性非貶義)?

一般流程是先用現成的模型設計,之後會根據情況慢慢調整進化。我們的經驗是,自己研發的模型最後會發現和已有論文的結構很像,是一種很蛋疼的感覺(當然,也有很大的好處)。

日常的工作: 讀論文,準備數據,訓練,debug,調整,滑水,對外的話還有一些部署和扯皮的工作。一般和你說的實驗室的日復一日的情況稍微有點差別,如果更加偏工業一點, 因為,你弄個滿足需求的模型就可以頂一陣子了,不用不斷的刷準確率。

Q2. 在問題1的基礎上追問,研究生三年時間有限,是儘可能多的熟悉模型多的做項目熟悉調參好,還是了解機器學習和深度學習數學原理搭配項目實踐好?畢竟師兄們沒怎麼看數學原理也能發sci。

了解原理。數學原理如果不是本科有非常強的數學基礎(比如說是數學系畢業的),不用在理論層面上要求特別高。 基本上, 你能推反向演算法也就OK了。

當然,你大刀饑渴難耐,非要搞理論,也沒人攔著你,不過看你說的實驗室環境,可能不會給你多大支持。DL這塊,基本還是試驗為主。

Q3. 工業界圖像識別和自言語言處理那個前景好?

不清楚,我們組兩個都有,但是主要是CV的工作。

兩者在DL下區分不是特別明顯,因為DL能力太通用了。日常工作不接觸高精尖的話,也就是換個數據集的事情。

Q4. 不是很想讀博但是也可以考慮,專精深度學習出路好還是以各種機器學習方法和python庫為基礎偏向數據分析的工作出路好?

讀博的話,我個人建議出國讀吧,外加家庭能給你不錯的物質和精神上的支持。現在談專不專精有點早,先能解決一個問題比較重要吧。

現在規劃工作這塊有點早了吧,靠編程能力/DL的理解和訓練,以不變應萬變吧。

Q5. 想去深圳,但是是不是北京對職業發展更好?

選城市是個多方面的因素,不應該僅僅看職業發展。只看職業的話,是北京相對好點。

詳情情況裡面一條條的再補充下。

  • Q1. 單純按照你說的就跑模型,不夠用的。要有自己修改和調整的能力。
  • Q2. 理論加實踐。
  • Q3. 我感覺這個還是看愛好吧,不要太多關注什麼火不火。說不定你畢業了,DL已經冷了。
  • Q4. 不要管預言了,找自己的愛好去做一做。說白了,985本碩應屆生,你會吃不上飯?另外, 一門python不夠。
  • Q5. 城市選擇要考慮多方面的因素,工作只是一個,這要根據個人情況決定。


更新:評論和私信有不少問我怎麼水論文的。可以參考我這篇回答從零基礎開始想發一篇深度學習的論文要提前準備什麼?寫論文的周期大概多久? - 知乎

水SCI我就這麼一說(還是很累的),大家不要抱著水論文的心態去做科研啊

太功利,走不遠。

手機強答一下。

搞深度學習方向發SCI真沒啥用,我一個大三本科生也水了一篇SCI。視覺就那幾個頂會,你看看那些paper哪個是調參數能調出來的。

數學不重要?在理論方面功夫所下甚少?那也就水篇SCI吧。

個人以為深度學習方向數學基礎不能差,跑跑人家模型大家熟悉框架後誰幹不了,公司為啥要你。我自己來說現在編程能力還說的過去,師兄安排一項工作基本我很快就能實現,但每次我都會問為什麼這麼約束/優化/改進?

在我看來那些大牛(團隊)之所以是大牛(團隊)除了能提出一些創新性的想法之外,還可以很快完成對應的實驗工作。說了這麼多,無非是想告訴你數學和編程都不能拉下。如果只是干一些修修補補,調調參數的工作,那畢業以後自己的核心競爭力在哪裡?還是要大力解放發展生產力。

最後關於就業,現在大三我還不知道自己去哪讀研,更不要提工作了。坐等大佬們來回答。


只會python,不想學其他語言,將來走上工作崗位,你將後悔。除非你的研究能力特別厲害,各大互聯網公司,尤其你想進的bat,都需要優秀的代碼能力。

研究某項開源工具,理解其中數學原理,並不衝突,只要你花了時間,絕對不是難事。

已經有一個很好的方向,深度學習和圖像識別,就不要想著數據分析了,演算法崗要比數據分析崗要吃香很多

三年時間,路還很長,多投入,勤奮一些吧。從你的提問看,我覺得你還不夠努力!


回答第一題和第二題

這兩個問題的背後是要想清楚「學以致用」中的用。工程上應用某個技術都是為了解決一個又一個具體問題,能解決問題的方法對於工業屆就有用,反之則意義不大。

第一題問到工業界的做法,這個在不同公司不同職位區別很大,很難一句話概括。筆者目前在一家技術創業公司,就說說我們在做什麼吧。因為是創業公司,人少任務急,所有問題都採用最直接的方式。但這不代表只是調參數,對於有些問題,一個隱層的全連接網路就能解決,超參數幾乎都不用調,更不會費時間搞複雜模型;另一些問題,所涉及領域與現有學術大牛的熱門研究幾乎無關聯,只能根據基本原理自己設計模型結構,有時還要把cnn,rnn幾種不不同的模型合起來用。希望這樣描述能幫你建立起一些基本概念。

第二個問題,如果打算畢業後進工業屆,大的建議是認真對待每個項目,能夠說清每個項目的目的,數據特徵,如何建模,模型訓練結果如何評價,評價指標不理想時如何調優,模型在實際應用中泛化性能如何,泛化性能不理想又如何改進。不論你做的項目是難是易,這些問題都是存在的。每做一個項目,想清楚這些問題,找工作時就會胸有成竹。當然,我說的比較偏應用類崗位,如果你去的是研究類崗位,側重點也會不同。

最後,關於你提到的編程語言和框架。掌握哪個都可以,關鍵是一定要掌握一門。掌握的標準是能夠用這門語言和框架自由實現和驗證自己的想法,這一點非常重要,當你提出一個牛x的解題思路時,你需要自己證明它是可行的,在工程應用上證明就是數據、模型、測試報告,不要讓編程的短板限制了你的思想。


我也來回答一下吧,目前研一,不過一直關注市場的發展。我是做聲紋識別和語音識別的,系統的搭建全都是用各種ML和DL,沒有一成不變的搭配。也要用開源平台,例如HTK和Kaldi。同時,工業界也是用已經做好的輪子去幹活的,畢竟成熟可靠;不過同樣的輪子,不同的搭配也會有很大的差別吧,就看能不能找到更好的配置了。

我們課題組不僅要會看paper,推公式,理解模型,跑實驗,還要自己想辦法解決問題,例如調優參數,改代碼,優化配置細節。最近導師還說要重新寫一套NN出來。所以對於問題2,真心需要理論工程一起抓,不過常用的那幾個模型要很有自己的見解,對於細節要能舉一反三。

至於論文發表,有發SCI也有發頂會,如果真的想發SCI2區或者CCF-B級的話(語音有ICASSP),真的不能認為調調參數就得了。在那裡發出來的論文都是有一定的獨創性,國際的大牛也有好多在上面。如果認為光會用工具跑實驗調參,就能發頂會或高level的SCI,多數是不行的。再說,弄懂模型的原理對於使用工具有事半功倍的效果,做學問不能止於不求甚解啊~而且弄懂了當中的數學原理之後,會很有成就感的

另外是找工作,貌似有高水平論文和比賽經驗對於找演算法的職位加分不少,項目也是一個很有份量的賣點~能不能找到心儀的工作就看研究生的造化了。至於圖像和自然語言哪個火……為什麼就沒有我的語音呢(((o(*°^°*)o)))!最後工作地點,深圳確實不錯,但北京不是也很棒嗎?CV這塊帝都的發展也很前沿,不過選地點這個還是題主好好自我考慮吧。


某211大學碩士導師,今年正好有相關背景的學生畢業。

學生剛入學的時候,會讓他們學一下機器學習的基本理論,推薦Ng的機器學習視頻,或者英文不好的看林軒田的機器學習基石系列。

後面就去找個Kaggle上面的題目,把網上top1的解決方案給出來的代碼仔細學習,悟性好的學生基本上就有點感覺了。

後面就是找這兩年頂會上面的論文精度,再找個點做一下發論文畢業。

學生代碼寫多了就慢慢會調參了,但是基本上也要畢業了,所以培養學生有種為人做嫁衣的感覺。


我的看法是人工智慧現在慢慢向著基礎設施的方向走,無論是騰訊,阿里,百度還是谷歌微軟,都在推自己的API。你要麼在學術上有所創新或者提升生產力的極限,要麼在應用上挖掘出新的前景也可以。

05年左右,那會充Q幣要麼買點卡,要麼打電話語音充十塊錢,或者去郵局匯款。但是現在在線支付運營商有了微信和支付寶,所以現在所有app的收費都在用微信和支付寶的API,這就是做成了基礎設施。對於基礎設施而言,先發優勢大,同質化高,它本身會越來越平民化便利化,面向使用者技術門檻會越來越低,漸漸深入到各行各業。你可以拿著這些API去結合具體行業背景。無論是圖像,聲音,還是很依賴insight的數據挖掘,都可以。(所以你去學學硬體?沒準用的上,真誠臉)


問題描述寫了這麼多,能看出來確實在思考問題,看到@jacky yang猜測你是北師大的,我是北師大碩士,這個學期開始一直待在中科院,之前在商湯待了半年多,既然是校友,那我從我的角度說一些觀點,希望能夠幫到你。如果還有問題,直接問我,按著我的特點問問研三的師兄師姐就知道我是誰了。

一般但不絕對的情況下,如果將來去工業屆,用caffe和mxnet居多,mxnet依賴少,更好發布,不過這兩天開源的caffe2,號稱code once,run anywhere,應該也不錯。如果將來勵志學術界,用tensorflow居多,相比於前者,你能更加快速的實現演算法原型,做深度學習,快速實驗,驗證想法的能力至關重要。再者,你師兄們說的這些框架沒區別,這話其實沒有錯,你說看不出來哪一樣了,這話也沒錯,但是如果你深刻理解了一些CNN的本質,就能理解師兄們說的話,從代碼而言,區別大,從數學而言,沒有區別。目前你還在前者,不要心急。

1、工業屆偏向在現有模型的基礎上,做些裁剪修改,在不損失精度的情況下提高計算效率。

2、多調參還是多了解數學演算法本質,這兩點不衝突。不要看不起調參,能做的都是大師,沒有深厚的數學功底,你是調不動的。做學術跟做工匠本質是一樣的,有的人看一眼就知道你這個參數合不合適,應該調大還是調小,大致調多少。當然調參不僅僅是調參,它應該包括網路的設計和裁剪等一切跟網路結構有關的任務。

3、我只做圖像,不了解語音,所以給不出意見。目前國內來看,語音界科大訊飛一家獨大,效果很好,圖像界百家爭鳴,巨頭+獨角獸們紛紛角逐,而且圖像包含可挖掘的信息很多。

4、目前來看,深度學習好於其他方法,當然經典方法是你打好數學基礎不得不走的路。

5、做機器學習北京好於其他地方的本質是高校林立,而其他地方沒這樣的優勢。不過三年之後不會是這樣,這點你可以放心。

至於語言問題,這點仁者見仁智者見智,我個人覺得你如果還考慮語言難易問題,那基本可以考慮轉行,這是必要而非可選的能力。學一門語言用於基本使用,有個兩天就夠了,當然後續你得不斷的學習,看別人開源代碼,這是我認為最快的途徑,不止學了語言,還順帶了解了api用法。如果你將來去工業屆做深度學習,Python和C++這是我推薦的。


最近在找實習,忍不住來吐槽dl/ml/cv方向的工作真的好難找(也可能我實在是太菜了)。

cv/dl方向真的不如數據挖掘的崗位和公司多,畢竟現在互聯網應用對數據挖掘的需求量更大一些。

樓主要是對框架源碼有研究可能比較好一些,最好能自己實現一下CNN網路。

感覺我可能不得不轉開發崗位了。。。


我能明白你的困惑,因為我剛從那個狀態走出來。

剛進入這個領域的時候你會發現其他人什麼都懂,自己啥都不懂 各種難以下手。

我希望告訴你的是,首先不要著急 然後要踏踏實實的學,一點一點把知識學紮實了!

深度學習機器學習的東西很多,所以要抓住一些根本的東西 以不變應萬變。對於基礎性知識一定要研究透。研究透一個 再去啃另一個。無論是平時做研究做實驗還是出去面試,只有你全都琢磨的透透的了,才能把事情做好 而且越往後上手越快。

當你覺得自己學的差不多的時候 去投簡歷面試,檢驗一下自己。


問題實在是不好答,建議你有機會去企業實習吧,招深度學習實習生的也很多,技術好機會還是很多的。12345,感覺你去做實習生後都可以自己解答。

關於2,深度學習理論,簡單的就那麼點,難得也不好搞,現在基本上都是老中醫刷榜階段,不過好多小領域已經過了刷榜階段了,也不好發了。

關於3,其實很多方法都是通用的,借來借去的,例如,原來RNN主要搞得是自然語言處理和語音這種序列數據,但現在搞到圖像上也多得很;CNN原來主要也在圖像上使用,現在也搞到自然語言處理里去了。

關於4,是個偽命題,你見過一點機器學習不懂的但深度學習特別好的么。別扣深了,機器學習方法要有個認識也花不多久,除了樹方法外,基本上都能用tensorflow去實現(當然,tf里也有隨機森林之流了)。


隔壁北郵大四來回答一波

其他答主回答挺全面了,我只想討論其中一個方面。樓主提到同學有不學數學原理就發sci的,針對這個情況,我想說兩個方面:

●如今ai/cv/nlp/dm等方向,會議的難度和受關注度,總體上要大於期刊。而會議大部分是ei檢索,哪怕頂會也很少sci。並且,國內計算機行業,如今更喜歡用ccf推薦會議里的a,b,c標準(一些劃定不合理的地方就不先吐槽了),對會議進行劃檔。國內學生黨們討論投的是a,b還是c,而不是和別的行業那樣,按ei和sci劃分。

●數學原理這個東西,個人一直認為,是決定你在這個領域發展上限的東西,並且最好的學習階段是在學校。工程技巧那些,確實也挺重要,但假以時日,誰都能學到些東西,私以為它決定了你工作的下限,主要在工作實踐中學到。所以,個人建議在訓練出*足夠用*的工程技巧的前提下,多花時間在數學原理和模型本質的思考上。

本人也處於學習階段,上述思考,僅供參考,願與題主共勉


調參不叫深度學習。如果你想做正經的研究,那麼就研究下訓練方法(不是調參,是類似於gan,貝葉斯優化之類),或者自己設計模型。如果你想在工業界立足,多接觸網路的壓縮、加速之類。


怎麼安排三年的深度學習的學習計劃,得以公司實際的工作要求的技能去掌握,這樣是比較靠譜的方式,最好能夠去實習~

實習的話,不同公司的差距可能會很大,之前我在讀研(非計算機專業)的時候,歷盡千辛萬苦自學,畢竟非科班的~ 啊啊啊,,有幸通過筆試面試,在國內某上市公司做深度學習演算法研發的實習生,實習期間表現還不錯,拿過公司舉辦的深度學習競賽第二名,,畢業後就直接留在了實習的公司,繼續做深度學習相關的工作。

實習期間,有導師帶,整個研發氛圍非常好,看paper不懂得地方,隨時都能找到同事討論,實習期間確實讓我迅速成長,research 和項目都做過~

我的另一個同學,在海康實習,計算機視覺方向,情況就比較不樂觀了,公司安排的項目基本上是讓他自己搞,沒人帶,進步很小,實習了一個月就回學校了

最近好多廈大師弟師妹在問我想找一份深度學習的實習或者工作,到底該掌握什麼,實在是回答得有點累了,索性整理成一個live 上市公司深度學習演算法研發 實習生心得 把我以前實習的一些心得寫出來,希望能幫到大家~


一年就夠。不是在讀可以更短。

機器學習就是這樣,易用。

想做研究的話,十年起。


推薦閱讀:

金融學如何應對人工智慧和大數據?
隨著大數據與人工智慧的興起,經濟學會不會被徹底改寫?
怎樣收集所在行業的精準數據?
大數據在銀行傳統信貸全流程中,有哪些關鍵作用?
Excel下的堆積型南丁格爾玫瑰圖怎麼畫(zuo)?

TAG:數據挖掘 | 數據分析 | 機器學習 | 大數據 | 深度學習DeepLearning |