那些年我趕過的時髦技術趨勢

題圖是我大學時代最愛玩的一個遊戲,法老王-埃及豔后,這是一個以古代文明為背景的城市建設遊戲。最近又撿起來玩了玩,還是那個味兒,倍爽。

上次有人說,聽說tinyfool看到AlphaGo火了,馬上去趕時髦學機器學習,把我弄的哭笑不得。我給大家介紹下,我從業10多年是怎麼趕時髦的吧。

怎麼趕上搜索技術的時髦

98年,第一次上網,也是第一次看到Google,那時候簡直覺得Google就是天下第一的好東西。互聯網是個無窮無盡的寶庫。但是沒有Google這把鑰匙,你什麼也不知道。

那時候,我就對搜索技術很感興趣。一直在看各種技術文章,但是因為基礎的問題,對各種文章的描述也不是很懂。01年,我根據一些自己的理解,寫過一個原理性的單字倒排搜索引擎,那時候,我連怎麼做好中文分詞都不了解。05年,看文章知道了Lucene,但是一直沒有機會用,也沒上過手。

08年做技術諮詢的時候,客戶想上一套搜索,方案公司的報價是20萬。客戶詢問我們有沒有解決方案,我當時覺得是個千載難逢的好機會,我就跟霍炬商量好,我們試試看客戶滿意的話,未來還可以賣給別人。但是我們兩個當時的技術路線思路不同,我看好Lucene,基於Java開發簡便社區成熟,文檔全面,剛剛還出了本Lucene in action,他看好Tokyo Cabinet作者用C++寫的一個搜索內核。春節放假回家,我們各自寫一套,因為大家技術路線不同,所以越好不吵不鬧,看產品見真章。春節7天假後,我的更成熟一點,所以他的就放棄了。

馬上交付客戶,客戶很滿意,搜索流量暴增且每天都在持續增長,一個月不到,客戶的競爭對手打電話要求買一套。

這套系統曾用於飯統、點評、六間房、FtChinese,等公司。單一伺服器最大日搜索量2000萬次。

怎麼趕上移動互聯網的時髦

01-02年,J2ME剛剛推出來的時候,我就很有熱忱想在手機上寫程序,但是受限於當時J2ME的設計思想,以及當時手機的機能,玩了玩,我覺得這不是我要的可以編程的手機。

其後到iOS之前,所有流行過的手機操作系統和開發環境我都碰過。我研究過J2ME在Nokia s40上的開發,研究過Symbian,研究過Android 1.0 SDK,那時候還沒Android手機呢。

到了07年喬布斯宣布iPhone的時候,我覺得這就是我夢想的手機。但是那時候沒有原生SDK,只有一個Web SDK,我第一時間就開始玩,後來失望的放棄了。過了1年以後,喬布斯發布了當時還叫iPhoneOS SDK的iOS SDK第一版。當天,我就發郵件給在美國讀博士的朋友徐宥,請他用他的信用卡幫我買了一個開發者賬號。

有了開發者賬號後,我自己開發的第一個App是運行在我在朋友公司年會抽獎,運氣好,得到的iPod touch上的一個記賬軟體。這個軟體大概開發了2個星期以後,網易有道的人輾轉找到我,請我幫我開發有道詞典iOS版。

後來,有道詞典iOS版是我上線App Store的第一個App。

最近為什麼在趕機器學習的時髦

08-09年,我們做搜索創業的時候,我就開始自學機器學習。那時候,機器學習的理念還不是很流行,更多的說法還是人工智慧。還是徐宥博士,他讀完回國探親的時候,因為他是相關專業的博士,所以他給我做了最早的啟蒙。當時人工智慧行業的現狀,為什麼從規則開始往概率轉變。為什麼現在流行的概念是機器學習,什麼是監督學習和非監督學習,等等。

那時候開始對機器學習感興趣的主因是,我們做搜索的時候,大量的看跟Google有關係的東西,當Google有了大量數據積累後,大量的使用機器學習去改善自己的搜索結果,尋找更好的組織信息的方式,等等。

我是國內當時最早翻譯Google GFS、Mapreduce、Bigtable論文的人之一。Google公布這三篇論文後不久,Lucene的創造者Doug Cutting就領導創建了Hadoop社區,後來還創建了Mahout,這個當然後來不夠火。但是我們的研究和對市場的分析都認可,我們的搜索服務未來和機器學習服務是非常相配的,所以,我當時花了很大精力在學習機器學習和研究怎麼把他們搞成服務。我們可能也是做搜索服務的公司,最早給用戶提供搜索數據分析服務,關鍵詞提醒服務等等,這些都是從搜索服務延展到數據服務的例子。

後來,美國次貸危機造成我們A輪融資失敗以後,我們被經濟形勢嚇到了,公司關門了。後來,我們幾個先後去了盛大。而當時盛大對iOS方面的人也很缺乏,所以,我暫時就放下了機器學習。

那個時候,深度學習還沒有興起。大概是12年的一次imagenet的比賽上,深度學習的結果奪冠,然後各種比賽和論文都表現出深度學習的效果和便利性以後,才大行其道起來。

自學機器學習暫時放下以後,在我自己的網站,還讓我當時的下屬,在我的指導下,搭了一個貝葉斯的文章分類器做自動抓取,自動分類,放了很多年。最近,關了上一家公司,才又有時間和心思專心學了一段時間機器學習和深度學習。當然,有動力去好好學,也是跟深度學習最近有了非常多可惜的進展有關。

不得不告訴大家的是,AlphaGo真的不算裡面多重要的一個。當然AlphaGo有其非常大的價值,因為它是外界最容易理解的,也是最容易被誤解的。就跟當年的深藍一樣,其實深藍本身對這個世界的價值不大,但是深藍引發了大家對機器智能的興趣,激起很多相關的討論和研究,這是它的價值。

結論

本來寫這篇文章也是一時好玩,算是解釋解釋為什麼看上去你們總覺得我在趕時髦,而我其實沒有。只是我之前很有興趣的很多事情,慢慢的走到了歷史的前台,成為了當時的時髦技術而已。

其實我覺得如果你有心去趕時髦的話,往往可能會錯過風口,因為這個世界的風口一直在變。如果你堅持做一些你喜歡的東西,有時候,風口會自己撞過來。


推薦閱讀:

李宏毅機器學習2016 第六講 深度學習
Python · 決策樹(零)· 簡介
刷臉進站+語音購票,AI 時代已經來臨
機器學習系列-廣義線性模型
MIT線性代數課程精細筆記[第九課]

TAG:计算机技术 | 机器学习 | 深度学习DeepLearning |