自然語言處理方向值得讀博士么?

如題,題主在研究生階段(目前研二)一開始是研究主題模型的,後來轉到了深度學習(文本分類+情感分類),感覺自然語言處理這塊確實需要花很大的功夫去學習、研究才會出成果。最近谷歌AI落戶中國也在人工智慧領域掀起了新一輪熱潮,題主最近在猶豫自己需不需要或者能不能在自然語言處理方面進一步深造,因為不懂這方面在工業界的工作性質和在學術界的工作性質的具體區別,題主是傾向於能走在業界前沿的,不那麼快被淘汰這樣的,此外一個原因是讀博出來可能三十多歲年紀也大了,不懂會不會後悔這樣的。題主只是想徵詢一下過來人的建議,求輕拍~


自然語言處理日新月異,要想在這個領域打拚,需要的是終身學習的能力,讀博自然是比較正統的歷練方式。

不過不是所有人都適合讀博,我覺得至少以下三種情況不適合:不是真愛的人別讀,太著急賺錢的人別讀,抗壓能力差的別讀。

加油!


單純從研究角度來看,NLP還是很有意思的,有太多有意思的方向VQA,翻譯,對話等等。還可以做很多應用,比如今天在電視上看到清華的研究生們做的九歌還是很酷的。如果能做到understanding那就更好玩了。

但是加上讀博兩個字,就真不一樣了。paper driven的研究方式,各種壓力。

最最重要的是,你有沒有興趣!


也不是說隨便就決定讀博吧,是要考慮很多因素權衡各方面條件才決定是否讀。

選擇NLP這個方向是確定讀博的重要原因之一,NLP是OK的。因為,做NLP最佳的姿勢應該是成為本領域的研究員。AI的的泡沫和浪潮會隨著時間推移開始慢慢退火,篩選留下來的就是實打實研究過真東西的人,他們,才是在未來引導該領域的「專家」。那現在選擇繼續留在此方向深入研究應該是個,我認為,正確的決定。起碼我認為這是個入場券。

按照一開始說的,還得再考慮多一些其它因素,綜合確定要不要讀,就好。比如,你是那種坐得住,喜歡研究思考,思維習慣適應得了搞研究的人嗎,興趣愛好,學習能力等等個人模式之類的各方面。以及,對未來的打算,職業規劃,機會,家庭,等等都要考慮清楚。

反正我是在去年已經思考過這個問題了並且給了自己明確的答案了。

best regards.


我理解題主大概有兩點焦慮,第一是要不要讀博,第二如何在nlp學界和工業界平衡。

對於讀博來說,是一個馬拉松式的過程。除非真的喜歡,不眼紅讀博的時候自己本科碩士的同學提前工作趕在房價大漲一波買好了房子,當然現在想買一線的也已經晚了。而自己畢業才只能租回龍觀的房子,忍受這種落差,才能安心讀博。

如果決定要讀博,那說明題主不差錢 。nlp學術界跟工業界差別在越來越小,深度學習使得以前很難的技術都落到了實地,比如機器翻譯,閱讀理解。很多有意思的方向,說不定可以在將來變成現實。學術很厲害的人,在業界不一定很吃香。比如有人研究的方向是一個細微的方向,做embedding做的很深很深,但對語義理解並不是很了解。實際上業界不需要做的太深,因為在實際的數據面前效果不大。不過能在一個小方向想做的很好,應該也能在相關領域做的不錯。

就目前公司情況看,有的博士學術很強,有的工程也很厲害。整體水平更優,但也有不是博士也很厲害的人。


It depends. 這年輕的領域裡有很多東西已經過時,不值得「細讀」。 基本上現在重點是在 semantics,而不是 syntax。 重點是如何令人工智慧明白自然語言。

或者更簡單來說,如果教授是那種讓你不用上課而且 thesis 可以自由發揮的,可以讀,但如果是那種指定什麼什麼理論是「必修」的,而且指定你要做什麼項目,那還是 sayonara 比較好。

在「業界」,我覺得暫時也還未突破到 AI 可以理解自然語言的地步,但目標明顯是向這方向邁進的。

以上是假設你的目標是想研究怎樣 solve 這個問題。 但如果你很 passive 地打算「讀」些什麼,然後祈求它日後有用,這種態度其實不適合做研究(這是很 self-evident 的,是吧?)

現時,在業界應該有不少 NLP 的應用(below the level of general AI),他們需要人手,不過技術的層次似乎比較低(有些所謂「技術」其實簡直是「碼農」的功夫)。 但也不排除有些企業正在開發較高級的RD,但我個人不知道有哪間(當然,有 Google 和 Microsoft 等)。 其實如果企業做到 research-level 的東西,那和研究院做的工作應該差不多吧?

如果你/妳不喜歡用腦,只想做個助手,但你老闆的項目又「爆」不出來,那讀研的時間也不會有很多金錢上的回報,我估計。


NLP方向還是很有意思的,目前也很火,前景非常不錯。

至於是否要讀博,我個人覺得如果你不討厭學術,就可以讀,不能只看眼前的待遇和職業經驗,人生往長遠的角度看,讀博士進可攻退可守,長遠來說很值。


推薦閱讀:

用卷積神經網路做情感分析時(句子級),為什麼輸入向量可以隨機初始化,在訓練的時候調整?
希望推薦一本自然語言處理專業需要精讀的著作?
自然語言處理中的語義到底是個什麼概念?語義分析是要分析出什麼結果?
自然語言處理(NLP)和計算語言學之間的區別和聯繫是什麼?
做文本挖掘是否需要了解自然語言處理?

TAG:人工智慧 | 留學 | 自然語言處理 | 博士 | 讀博 |