本科生進數據機器學習和挖掘實驗室能做一些什麼?

我是國內某211高校數學系大二本科生,目前已經聯繫上一個做機器學習、數據挖掘和數據分析的導師,下學期開始加入他的團隊。他的研究方向為基於小波分析的知識發現及應用研究、多Agent系統的理論研究、基於數據挖掘的網路入侵特徵識別方法研究、基於商空間粒度計算理論的知識發現方法及應用研究、信息資源的檢索與約簡演算法研究等等。

請問作為本科生我能做一些什麼?如何能快速從lab assistant到拿到project?我的打算是本科畢業後出國。

目前正在看斯坦福的機器學習公開課,自己嘗試在python上實現每一個演算法,同時還在自學一本數據挖掘入門的書。之前沒有接觸過機器學習和數據挖掘,學過MIT的計算機科學導論,演算法導論,演算法設計,離散數學,再加上學校學的微積分,線性代數,概率論,數理統計,常微分方程等數學課。


首先就是自然環境啦~實驗室是非常理想的自習,休(吃)閑(貨)娛(看)樂(片)的地方,列印資料等等很方便。

其次便是學術環境啦~項目,期刊論文,愛西批西第一手資料等等。加上一些派到某國去參加某些會議,搞些交流都有很多。

再次就是人脈資源啦~實驗室幾乎都是研究生,可以看看現在一流科研工作者的日常科(游)研(戲)生活。教授副教授也常來發一些有趣的東西,一些外校的論文什麼的。

關於為什麼我要把自然環境排在前面呢。

其實大學也不需要辣么功利,整體想著自己以後一定要怎麼樣怎麼樣怎麼樣出人頭地,怎麼樣留個學變成「別人家孩子」。將生活過得舒適也是很美好的。

實驗室有一個你的位置,你就有了一個除了寢室的家,這是一種歸屬感,是融入了整個實驗室的團體氛圍。有問題問學長,有目標就從一個個小目標開始,有想法跟教授說,有空閑時間看看劇,按部就班慢慢的來,不急不慌,很多事情自然而然就能落到自己的頭上。


假設1. 你導師有專業背景,具體來說,有NIPS、ICML、CVPR、KDD這些文章,2. 他願意指導你做學術,3. 你也夠聰明夠努力。

在這3個前提下,我覺得你有希望做出「靠譜」的學術論文,即使沒發表,也能拿出來說,能寫進CV,能用來套詞。如果3個前提缺少一個,肯定沒戲。


像機器一樣學習


腦袋空空,一心想著發paper


我在國內一所三流985讀書,現在大三,不是計算機專業,但也屬於信息大類

大一生活平平,也沒有什麼出彩的地方,大二有幸進入了老師的實驗室學習,可以說是對我來說比較關鍵的一個轉折點。

1. 學術上,接觸到脫離課本的新領域的知識。多讀讀論文,嘗試寫一寫,可以了解到許多新知識,比如學會如何寫一篇規範的學術文章,這些知識可能不能讓你考試分更高,但對個人綜合素養來說是很好的提升。

2. Paper這種東西,要水能特別水,如果機遇好的話,在師兄師姐之前的工作上推廣一下,寫個小paper不是什麼難事(當然樓主如果特牛的話當我沒說)。我做一個比喻就是圍城,學術圈外的人覺得這些搞科研的人都特厲害,但進入圈內後會發現除了Top的那些精英學者,混的人其實也不少。

3. 做科研最需要的不是智力,而是努力(對普通人來說)。如上一點說的,真正contribution的工作是少數的,相較之下,我們本科生多努力,也是可以混出幾篇來的,要相信自己。

4. 進入實驗室,沒有課的時候泡在實驗室,學習也好,娛樂休閑也好,接觸到都是一些研究生師兄師姐,相當於提前讀了個研,多划算!樓主想出國深造的話,提前了解一下國內研究生的模式,等於國內國外都讀了個研(滑稽,純屬扯淡,好像偏題了..)

5. 和師兄師姐搞好關係。實驗室也能提供很多學術以外的資源,生活上,師兄師姐能給傳授很多人生經驗,多和他們搞好關係,自己少走很多彎路!

6. 不要有太大的優越感,進入實驗室學習,容易讓自己產生心理膨脹(好吧,我曾經有過...)。其實,實驗室學習只是多條道路之一,大學各有各的活法,不要膨脹。

其他的,以後想到再更吧


覺得跟題主情況有點像,就說下自己的情況,我是普通211的大二學生,這學期靠會一點爬蟲進了一個機器學習的實驗室。

因為之前幾乎沒有相關的基礎,所以沒有什麼我能做的,只是一些邊緣工作。一直在自己看Michael Nielsen的Neural Networks and Deep Learning,不懂的和導師交流。

開始的時候是做爬蟲,爬一些圖片以便之後做數據集。最近導師讓我看Faster-RCNN數據集的製做。

第一次進實驗室,開始也沒想一定要做成什麼樣,主要是對機器學習感興趣,想要學點東西。所以現在也沒有樓上的回答那麼忙。大概就是這樣。


一樓的三點其實都沒問題,你可以先放下聰明,多花點努力。先從公開課,書籍資料出發培養興趣。比如吳恩達的機器學習公開課。機器學習很泛也很精,要泛讀然後精做。我導師8年左右時間研究支持向量機和特徵選擇,很小的一個點做了這麼久。當然這是純理論的。先從淺一點的理論出發,本科階段的科研其實就是嘗試,運氣好的說不定能中個SCI。以後出國什麼的都有好處。但是這個科研過程如果你不喜歡,以後可以選擇別的路。


還沒在知乎上回答過問題,不過看樓主很真誠,自己又有這方面經驗,就簡單說一下吧。

國內大概排名20的大學,現在大三,大二上學期專業分流後加入網路工程系的精英班(進這個班的原因是我對大數據和機器學習,數據挖掘非常感興趣),這個班級制度和研究生差不多,再加上導師特別好特別負責,一年來學了很多東西,雖然說基本都靠自學,但是毫無疑問是實驗室的環境在引導自己。目前一篇IEEE的論文正在二輪審核狀態。反正就是完全滿足了自己對所喜歡領域的探索需求。並且目前我也在學斯坦福機器學習的公開課,也在學機器學習的演算法,一直在幫一個博士生做論文的實驗,也會和實驗室其他的本科生一塊兒搞點兒項目或者比賽。


喂喂喂,題主,看你的描述,你確定你和我不是同一個人???

額 -_-|| 貌似我比你早一年入坑,大一就去了哦~

因為C++老師對我印象太好,先後推薦我去搞ACM和機器學習。但是去ACM時有課時衝突,加上當時正在研究最優化問題,和很多ACM知識關係不大,所以沒有深入ACM。

然後搞機器學習,生物信息學。

一年來,從未後悔,非常充實,非常開心。(可不要怕累哦~)


-_-# 好想進實驗室,打雜也好,而然沒有機會。


感覺大家都好厲害啊 (?òωó?) ,本科就有paper,並且老師好負責任。說說我們吧,本科去實驗室就是打比賽,各種各樣的在實驗里,有ACM,數模,安全類,軟體類,大家(都是本科生)一起學習,一起找工作,老師基本放養。


對於普通學校而言,你僅僅是個別導師的比賽和發垃圾論文工具而已。絲毫鍛煉不了什麼真本領。如果你是top20的學校可能好得多。我只針對普通學校。好好學英語,好好學數學。學術,paper等到博士再說吧。

我大學時候各種國家級獎拿了一堆。真沒用。和實際上的學術什麼的差距很大很大。


推薦閱讀:

當前量子計算技術前沿是什麼水平?
怎麼看待所謂的「人工智慧威脅論」?
CVPR 2016 有什麼值得關注的亮點?
有真正做Deep Learning的人出來說說Alpha Go的意義嗎?
2016世界機器人大會上有什麼亮點?

TAG:人工智慧 | 數據挖掘 | 計算機 | 機器學習 | 大數據 |