標籤:

寫在讀博第二年零六個月的時候,一些心得和建議。

  • 讀博士到了標準五年項目的一半。想寫一些東西,關於專業知識,心態,以及一些讀博的心得建議。
  • 首先講一下專業知識吧,分為讀書,讀論文兩個部分,如果是讀IS、CS相關專業的博士生,或者是商院博士專註於做計算的,可以參考一下我推薦的書,應該對各位有所幫助。我個人覺著,對於讀博士的人來說,上課對於做研究是必要非充分條件,因此不要花太多時間在上課上。但是讀書學知識是一件持續終身的事情,與發不發論文,有沒有好前途沒有關係。
  • 讀書包括計量經濟學、機器學習、工具類書。
  • 計量經濟學:關於計量經濟學,主要分為微觀計量,宏觀計量,金融計量和IO計量。商學院的計量方法主要用的是微觀計量和IO計量。最近這兩年發展很火的的空間計量也有些人在發論文,但是我對這個方向興趣不大所以就不好給什麼推薦了,IS領域裡有人研究 online to offline的話題,用空間計量的方法越來越多,感興趣的人可以關注一下。
  • 入門
  • Wooldridge, Jeffrey.Introductory Econometrics: A Modern Approach.
  • 這本書好像出到第六版了,需要掌握全部的內容,尤其關注經典OLS的六個假設,以及如果放開經典假設限制的情況下,如何在非線性,多重共線,異方差的情況下進行檢驗。還有就是IV和對應的2SLS方法是怎麼用的。MLE和GMM估計挺重要的。再有就是了解一下Time series中的ARMA模型。怎麼定義掌握呢,就是參數可以背著書推導出來,數據模型可以用Stata run出來。網上應該可以找得到很多stata學習資料。
  • 進階
  • Wooldridge, Jeffrey. Econometric Analysis of Cross Section and Panel Data、
  • 這本書作為上一本書的深入,前三部分基本上就是用矩陣的形式又重寫了一遍計量方法,而且比較專註於在SEM的框架下建立模型。主要需要學好的是2SLS,GLS,GMM估計的比較和使用,Fix effect,Random effect,First Difference的比較和使用。第四部分的 Probit,Logit,Tobit,ATE都是很重要的內容,對應的MLE估計也要熟練掌握。至於Poisson, Hazard,不一定用得到,如果忘掉了,就等讀到對應的論文的時候再複習就好了。
  • Greene, William H. Econometric Analysis.
  • 這本書沒有堆太多的矩陣符號,要比上一本書讀起來舒服很多。他再DCM方面寫的很不錯,所以如果做structural model的人,請務必認真讀這本書的DCM部分。MLE和GMM的參數推導部分也比Wooldridge的書寫的更清楚,所以如果想認真弄明白這一部分的可以看看Green的書。
  • Joshua Angrist. Mostly Harmless Econometrics
  • 這本書主要是專註於DID和RD模型該怎麼設計的,用很乾貨的語言講了最基本的IV,Panel之類的內容。可以作為讀完前三本書以後的補充。可以說現在,整個地球都無法阻止商學院的教授用DID或者matching method發論文了。多看看隨書的go代碼會比較有幫助。
  • Hayashi, Fumio.Econometrics.
  • 林文夫的書,從數學含量上來講,比Woolridge的書要簡單,比Greene的書要難。但是全書的行文框架適合已經讀過前面的幾本書之後再看。會對於計量經濟學有更加深刻的理解。相比較於前面的幾本書,這本書對於時間序列數據介紹的更細緻。
  • 機器學習:機器學習是個相當大的概念,而且是個每年都在更新的學科,所以一般來說都是根據你研究的方向去選擇對應的機器學習演算法。我只寫四本我常常讀的書,除此之外,也可以看看周志華老師,馬毅老師,李航寫的書,他們都是這方面的專家。深度學習在過去的五年比較火,至於現在,遷移學習,元學習,生成對抗網路,可能都是未來的熱點。
  • 入門
  • Jiawei Han Data Mining : Concepts and Techniques
  • 這本書大而全,介紹了很多機器學習的演算法以及數據挖掘的演算法,算是我入門時候讀的書。但是現在看來,本書過於大而全,每一種演算法的介紹不是很細緻,需要讀者自己去下功夫另找書看。韓教授所介紹的Aprioir演算法和FP-Tree演算法,應該是比較有特色的數據挖掘演算法,一般來說在機器學習的書里是不會介紹的,感興趣的話可以多看一看。
  • Mehryar Mohri Foundations of Machine Learning
  • 這本書的PAC部分和VC Theorem部分都寫的很好,適合想要補充一些統計學背景的讀者。書里還加入了強化學習的內容,屬於最近幾年比較熱門的研究領域。
  • 進階
  • Christopher Bishop Pattern Recognition and Machine Learning
  • Trevor Hastie The Elements of Statistical Learning
  • 這兩本書可以在一起看,第一本是經典中的經典,偏貝葉斯學派,可惜只出了一版,放到現在看,所涉及的內容有一點老了,第二本書偏頻率學派,而且裡面還寫到了ICA演算法,因此給我的印象很好。第一本書是EE的教授寫的,第二本的書是統計系的教授寫的,所以一邊比較一邊看,可以直接的感受到不同學科背景對於機器學習的不同理解。讀完了以上四本書以後,應該對 Kernel,Boosting,Neutral Network,Graphical 等模型有所了解。
  • 專題:
  • Daniel Jurafsky Speech and Language Processing
  • 作為商學院的學生,把text mining學好是非常實用的。基本上現在分析文本數據,甚至是圖片數據,都是一篇文章的賣點,所以最好把這個領域的知識學好。 這本書如果不想全讀的話,起碼把前16章讀完,了解最常用的Bag of words,Vector Semantics ,HMM模型。
  • Yoshua Bengio Deep Learning
  • Bengio 是深度學習領域的大牛。大家現在聽到的Alpha go,Deepmind, 之類的東西,背後原理都是深度學習。作為商院的學生,這個東西學了並沒有什麼用。現在發出來的論文,作者也就是聲稱自己在用深度學習,實際上就是拿來挖挖數據而已,蹭一下深度學習的熱點,他們自己並沒有真的很懂什麼是深度學習。而如果是CS領域的,只是讀一兩本書還是不夠的,需要在自己學校的超算實驗室里配置環境,實際跑一下自己的演算法才好。
  • Nir Friedman Probabilistic Graphical Models
  • 概率圖模型在商學院的研究中很是有用。比如HMM,CMF,State Space,我的研究基本上就是這個領域的,感覺無論是理論故事還是實證模型,都有很多可以研究的空間,如果你也有興趣的話咱們可以一塊討論。
  • 工具類:其實就是一些數學書,但是又不是純數學類的書。因為如果不是推模型的話,看太多的純數學書沒什麼用處。還有就是數學是個博大精深的學科,作為商院的學生,根據目標學期中一兩個方向就已經不錯了。
  • Stephen Boyd Convex Optimization
  • 凸性優化並不會直接幫助我們寫論文,但是如果把凸性優化學好,有助於理解各種各樣的演算法。我並沒有特彆強的數學背景,想要做優化也不是讀完這一兩本書就能幹的了的。所以我只能說,以我的經驗,像常用的梯度下降,牛頓法,內插法等等常用的演算法,不要滿足於調個現成的方法,還是要深入理解的。至於其他的,如果用不到就不用學了。
  • David Bau III Numerical Linear Algebra
  • 商院的論文計算量不大,也對於計算時間和計算空間的強調比較少。但是當我看我的學長run數據了一整天才跑完一條stata語句的時候,我就知道他應該是要延期了。矩陣運算的書都差不多,推薦一本簡單實用的。需要熟練掌握的是三大分解:SVD,QR,和LU。再有就是用Iterative Method 求矩陣
  • MWG Microeconomic Theory
  • 高微應該屬於必修課,所以也不用特別推薦。只是吧,如果不推模型,高微學了沒什麼用。如果推模型,只讀一本高微還遠遠不夠。這書看完了唯一的用處就是能讓你看懂大部分的推模型論文。可是如果是做實證的話,哪有時間看推模型的論文呢?我覺著這本書的博弈論部分寫的不錯。如果想做IO計量的話,可以作為打基礎的書好好看一下。
  • George Casella Statistical Inference
  • 這本書寫的淺顯易懂,有大量的公式推導。適合在讀論文遇到條件期望,方差,協方差,pdf,cdf怎麼推但是一時有想不起來的時候查閱的書。再有就是當遇到像 NBD model,Zero-Inflated model,Erlang-2 model 這種不常見的模型的時候,也可以翻一下這本書。
  • 關於論文,包括讀論文,寫論文,發論文。我還沒有發過論文,所以就別亂講了。還是由某位發了A的前輩來講講經驗吧:
  • 關於讀論文:第一年泛讀,然後第二年開始專註其中的某一個方向
  • 時間是有限的,沒有必要把論文的通篇都認真讀過,只讀你認為有用的部分就可以了。可以是故事的講述,可以是模型的使用,也可以是數據分析。一般我會選四五篇相似話題,或者相似模型的論文一塊比較著看,如果看到了相同的部分,就是需要好好理解的內容。如果是不同的部分,就是這篇論文做出貢獻的內容。讀完一篇論文之後可以編號,大概把這篇論文的故事和主要的邏輯寫在封面上,不同論文之間的區別和聯繫也要寫清楚。以後寫文獻綜述的時候返回來再看論文的時候就比較有條理了。
  • 最近三年,個人認為IS比較熱門的話題如下:(應該說我只了解一點individual level的論文,由於我老闆不帶我寫firm level的論文,所以下面的話題僅限於individual level,至於有志於研究firm level的同學,比如 IT innovation,Project Development,IT investment,Value creation 歡迎補充):IT healthcare、Online Labor Market (Outsourcing)、Online Reviews (Online Rating)、IT Security、Platform Competition (Platform Governance)、Online Auction/Bidding、Geological Economy (Spatial analysis)、Mobile Economy。大部分的人在博士階段也就在當中的一兩個裡面選擇某個話題寫一些論文。所以在Seminar的時候多讀論文,在一兩年之內定下自己的方向和導師會比較好。
  • 常常的情況是你第一年被分給哪個老師,你的論文風格和研究話題就會向Ta的論文靠攏。然後你又沒再改過門庭的話,就八成跟你第一年遇到的老師寫論文了。而這個第一年帶你的老師就很有可能是面試的時候面你的人,因為Ta還有發論文的需要,所以招學生的時候才會根據Ta的偏好來招人。如果是沖著大牛導師來的。。。我是目測大牛導師沒空帶你,然後還會把你再分給某一個Assist寫論文然後做Co-Chair。因此,多和各位Assist搞好關係,他們具備最新的知識和技能,有發論文的動力,以及影響大牛導師對你的印象。
  • 在讀博士期間,寫論文有兩種常見的策略。一種是我的老師建議我的,主要好好寫一篇論文,奔著A去寫,去投,去改,在找工作之前可以拿到R&R或者forthcoming,然後有若干working paper,只要收了數據即可。我也在按照這個方式來干。還有一種策略是我師哥跟我講的,就是玩命的寫,但是不要著急投,在博四那一年一次性全部投出去,這樣子在CV上會有四五篇A刊在under review,看上去會很好看。反正你只要找到一個工作就行了,後面能不能發出來,以後再說。這兩種策略各有優缺點,可以根據自己的情況來選擇。
  • 如何和導師相處:我們都希望或者默認導師是知識,技術,做人上都比我們高一截,甚至可以作為人生榜樣的人。對我們無論是論文還是做人都關懷備至,認真負責。但是實際上呢,有可能的確是這樣,也可能Ta根本沒時間管你,或者導師有這樣那樣的缺陷。那作為年紀在23歲-40歲的你,應該如何與導師相處呢?導師常常被稱作老闆,那是因為他們決定你能不能畢業。所以我們要供著他們,哄他們高興。但是好好想一想,導師們需要我們為他們做什麼呢?能發A刊的想法?非常強的技術?或者是幫他們找數據?哦呵呵,他們自己一路讀博士上來,當了教授,當了editor ,也有coauthor,也有各種各樣的資源,他們真的會缺少你的那篇論文嗎?甚至他們還稀罕混跡學術圈嗎?導師不是一路輔導你寫論文的人,導師也不必須比一個博士更懂某些知識或者技術,甚至可以說,導師都不一定需要幫你在review的過程中去改論文或者去argue。導師有且只有的用處就是:Ta是你的第一個聽眾。我們寫論文的第一個目標就是把論文賣個導師,在Ta面前講一百遍,直到Ta從「嗯,這個沒意思」到「要不然你做做看?」再到「好的,讓我們投到ICIS看看別人怎麼說吧」最後到「你這就是ISR呀,來,咱們好好乾一波!」說服第一個人,再去說服系裡的其他教授。接著去投會議說服圈子裡的其他教授,直到在正式投論文之前,把所有人的意見都彙集再一塊,改完所有的建議,同時也把你那非常「有趣」的故事賣無數遍,然後就可以去投A刊了。因此對導師不要有太高的期待,論文是你自己的事情,Ta可能對你的工作很上心,也可能毫不感興趣,不要因為導師的態度而影響你自己的工作節奏。認真幹活,好好處理數據,把論文寫出來,拍在桌子上,然後去說服導師這是一份不錯的作品。而不是在你只有一個小idea的時候就去跟導師扯皮,來來回回一個月,改了半天proposal,最終它也只是個proposal,毫無意義。
  • 關於心態:珍愛生命,堅持鍛煉,少些期待,保持樂觀。
  • 對於讀博士的心態:
  • 我手裡有論文在寫,我老闆也覺著挺有希望發A的,可是吧,我對此一點也不興奮,寫論文就跟我每天要吃飯睡覺一樣,只是一項機械性的工作而已。算不上喜歡,算不上不喜歡。可能是我本來就是這種性格的人,也可能是因為讀了博士才變成了這樣的人,這是個內生性問題,我也不知道為什麼。希望各位讀了這篇文章的博士,你們每天都很高興地在做自己的事情吧。
  • 第二年同第一年最大的區別就是對於讀博士這件事情本身變得沒什麼期待了。一開始想發A刊,現在只想順利畢業。這彷彿並不是我一個人的想法,好像大部分的博士都有這個想法。所以怎麼辦呢?我覺著有用處的心態調整就是,只把讀博士當成一種人生經歷吧。也許它很孤獨,沒什麼實際用處,甚至讀到一半可能會對自己的專業變得沒什麼興趣,亦或是寫論文改論文的時候被諸多的負面評價打擊的毫無成就感。這些都是一種經歷。應該說博士是這世上性價比最低的一份工作了。從睜眼到閉眼都在操心論文的事情,而你的收益並不會因為你發了論文而有所增加。作為一個正常人,都會在這種缺乏激勵的機制下越來越沒有動力做事情。怎麼辦呢,把讀博士當成一件小事吧,別覺著我付出了五年的時間,我很努力,所以我就應該獲得更好的未來。這兩者之間沒有什麼必然聯繫。該去打球就去打球,該去談戀愛就去談戀愛,該回國和朋友聚會就回去聚會。世界照常運轉,你的論文不會因為你過的開心或者難受而有所變化。把模型掌握的紮實一些,把代碼寫的再熟練一些,即便找不到faculty的工作也總還是有飯吃的。
  • 對於未來找工作的心態:
  • 主要是年紀大了,心態上越來越沒什麼期待了。以前還在想,要發A刊,要當教授,要炒股票,還要做生意,現在想一想,其實哪個都幹不了。看看我的學長,覺著他除了會寫論文也幹不了其它的事情,可是現在想想自己,除了能做點數據分析,其實也幹不了其它的事情。所以對於找工作,倒是沒什麼太高的期待,只要能讓我干演算法相關的工作,都是可以接受的。
  • 關於這兩年半的收穫與損失:
  • 進入商學院第十年,計算收穫損失已經成了本能。儘管讀了博士,還是無法放下功利心,看看我認識的同學和教授,彷彿他們都很滿足自己的物質生活,對於收益和損失也很少去計較,每天的學術研究或者上課也讓他們很高興。所以像我這樣的人應該是不適合混學術圈的吧。兩年半的時間投入,獲得了對於專業知識的更加深入的學習,或者說就是在數學知識上學的更多了,對於知識的理解能力也變強了。這要感謝美國的教育體制,只要你喜歡,愛學什麼就學什麼,沒有專業的束縛,也沒有選課的限制。損失就是各種各樣的機會成本。尤其是很多以前的同學現在已經在一些一線或者新一線城市買了房子,或者是手裡握著即將上市公司的原始股,這些都是我讀了博士所失去的機會。而且我想等我博士畢業了,應該也還是填補不上這之間的差距的。剛開始還很緊張這個差距,而現在這個差距已經大到讓我放棄追趕了。畢竟房價還會繼續漲,原始股還會更值錢,但是我的博士學位卻滿大街都是。而且我身邊的博士也很少有找到好工作的。聽說博士還有一個不錯的出路就是去做官?然而這樣的博士往往都是北清人這三個學校的吧,哪個走仕途的博士有興趣的來分享一下經驗?哦呵呵,要是真有這個能力的人,應該也不屬於知乎的用戶吧。
  • 平均每半年都會出去玩一趟,東海岸和西海岸,加拿大,墨西哥我都去過了。其實只是單純的不喜歡在村子裡生活,所以想出去轉轉,讓心情好一點。看到朋友們在國內放假的時候po朋友圈,倒是一點也不羨慕,因為我的時間遠比進入職場的人更自由(但是我的工作時間要比他們長很多)。這也許是讀博士的好處吧。可是這種好處,真的是好處嗎?不會讓人變得更懈怠嗎?Whatever,工作了也是一樣的,很多人忙忙碌碌,最後一無是處。所以都看自己喜好吧。

推薦閱讀:

TAG:博士 | 商科 |