zhh-2015在分散式系統和資料庫領域研究水平和工程能力怎樣?

微博賬戶 @zhh-2015

Github codefollower/Lealone · GitHub

相關問題: 研究者July在計算機和機器學習領域的水平怎麼樣? - 計算機科學

梁斌penny在計算機和機器學習領域的水平怎麼樣? - 創業

至於提問題的原因嘛 呵呵,zhh-2015自己在微博上說了 「經常在微博上看到有人在知乎上問某某某的水平怎麼樣,然後一堆人噴……為什麼沒人噴我啊,看來我噴得還不夠,沒知名度,沒人鳥,好桑心……一點存在感都沒有……」 幫他實現下願望吧!


以下是我的一點想法,對事不對人。

資料庫尤其是分散式資料庫這個圈子不大,真正懂點東西的很少,但是關注這個圈子的人很多,畢竟資料庫幾乎人人都用,只不過用某個資料庫並不意味著真的有多麼懂。在這個圈子內討論問題是很容易被懂行的人發現漏洞的,而在這個圈子外的人可能根本看不出問題還覺得是大神。所以想看一個人是不是真的大神,只能看其他圈內大神是否認同這個人的能力,而不能看圈外的人怎麼說。說白了這很像學術圈的「同行評審」。其他圈子的無論是不是大神都是不能評價資料庫圈子的人是否牛逼的,就像搞ML的不能給搞系統的審paper一樣。

但是呢, 圈子內的人通常都很忙,一般不會在知乎或者微博說這說那,所以很多時候是看不到圈子內的人撕逼的。更何況也不是誰都那麼喜歡撕逼的,反正井水不犯河水沒必要平白無故得罪人。那麼我們是不是就很難發現到底誰是真大神誰是假大神呢?也不至於,至少是有辦法看出誰確實牛逼的——通過看這個人做過什麼。

最簡單的,對於HBase/Cassandra這些比較流行的開源資料庫,如果有能力去提patch貢獻代碼(幫忙改文檔啥的不算),說明對這個資料庫懂一些;如果能提很多個patch最終成為committer,說明很懂。所以一個人如果是committer,那肯定可以算是大神;但反過來說如果沒成為commiter,卻不能說一定不夠牛逼,只能說概率上是沒有committer牛逼的。其他開源項目的道理也類似。

而對於非開源、企業內部的東西來說,Google搞的那些東西業界公認很牛逼,阿里的OceanBase不管業界是否公認牛逼但至少人家抗住雙11,所以在這些部門的核心員工一定也都很牛逼。

再其次,對於想自己搞資料庫甚至以此創業的人來說,那麼搞出來一個資料庫並推廣出去有很多用戶在生產環境用,那麼就算牛逼。在真正被用戶認可之前,自己吹自己資料庫多牛逼只能是商業行為,並不能作為技術實力的認可。做資料庫創業的團隊/個人不少,最終的評價體系都是如此。雖然說很多時候一個技術被人用其實並不是技術好而是商業推廣給力,但能推廣出去的技術一定不會太差。

除了能確定牛逼的之外,其餘的人說實話是「既不能證明牛逼,也不能證明一定不牛逼」。所以希望被人認可的話,只能靠做出一些能被圈內同行認可的事情了。比如我就挺希望有人覺得我牛逼的,所以我想當committer來證明我牛逼。而如果有個人既沒有做出能被認可的事情,又覺得自己很牛逼,那麼就要多加小心了。

同樣對沒進到這個圈子的人來說,在這個人還沒做出什麼牛逼東西之前,也不要輕易覺得這個人牛逼,否則一旦認為一個不夠牛逼的人牛逼,是會被圈子內的人與這個不牛逼的人一起被當做笑話看的。


如何評價開源資料庫lealone的分散式事務模型? - 資料庫 看這個鏈接就知道什麼水平


不知道 zhh 是誰,單純對做分散式資料庫的人水平如何還需要評價感到好奇。

這樣一個實用性如此之強的領域,想要評價一個人應該還是很容易的。

畢竟,所謂水平,無非就是理論水平和工程水平兩個方面。

就理論水平而言,如果能夠像牟老師( @牟帥 )那樣發一篇 OSDI 或 SOSP,那除了有限的幾個人,其他人連評價的資格都沒有。當然其他的稍差一點的好會議,比如 ATC,VLDB 什麼的,自然也基本能證明一個人的水準。

至於工程方面就更簡單了。公認的 benchmark 那麼多,使用場景更是隨處都是。那麼如果他有「做出來或參與過的東西跑出了*可重現的*並且很好的數據,或者實際使用之後效果很不錯」之類的事迹,那麼也能夠都能夠作為一個人很厲害的論據。

自己很厲害但是沒表現出來給別人看這樣的人自然是有的。

不過我覺得如果以上兩類事迹都沒有的話,旁人應該沒有認為他很牛的必要。


這兄弟關注好久了,但從沒留過言。所以也來摻和摻和:)

一句話,挺偏激的。話說回來,不偏激也不會窩在一個地方這麼搞好幾年,確實讓人佩服。。從此角度,各種噴、嘴仗、各種極端的言論也就容易理解了。

coding能力應該不錯,但是做的東西如何不好說,畢竟要從整體層面來把握,個人覺得偏激的思維肯定會有所影響。拿 @吳鏑 同學提到的分散式事務,至少要說說啥特性(設計目標)吧,人家Spanner開篇就表態,externally consistent,那由此目標到設計思路到關鍵問題到細節就順暢了,否則一句話直接看代碼。。無語。其實國外很講究這些,看了好多論文應該能注意到的,若沒有隻能說又是偏激所致,陷在細節里了。

另外如 @張帥 在某篇回復提到的,理論實踐並重,分散式系統、傳統資料庫都是如此。而實踐又和現實中問題、需求密不可分,這才是工程技術(個人理解和科學還不一樣,科學,牛逼的人自己蹦躂出來都行)進步的真正推動力。在傳統資料庫領域混了不少年頭,別說各大RDBMS廠商是客戶需求推動的,連MySQL都是,到如今都是盯著幾個大客戶如FB需求看。拿NewSQL業界領先的google、阿里看,也是如此,有自己的強需求場景推動是最大的優勢。

所以這位兄弟這麼閉門造車,個人不太看好。包括劉奇等搞TiDB,技術情懷非常佩服,但是沒有那麼強的現實需求推動,怎麼搞?如hadoop一樣先克隆再依靠開源迅速形成自己的生態和需求?希望能複製成功吧。

再回到分散式事務,咋覺得越來越有為了搞而搞的感覺?基於Paxos的分散式事務確實亮點。分散式事務傳統RDBMS早就有了,但是各種可用性問題,有些情況還得手工決定事務結果,真是弱。。不過Spanner里提到的痛點,排第一是MySQL手工分片,谷歌那麼大規模必然痛苦,而分散式事務排最次。而且也說了,真正用分散式事務的很少。淘寶實踐也表明了,不用分散式事務也活的很好。OB1.0,也許只是為了「超越」 OB 0.5。。?扯遠了呵呵。

總之,希望這位兄弟別那麼偏激啦:)


個人觀點:在技術圈成為「網紅」的技術不至於太差。一個懂技術的和一個做技術的當面聊一次就能基本判斷對方水不水。在技術圈子更好地應該是對某個項目或某項工作的讚賞和借鑒,不該過於關注背後的人,更不該是盲目崇拜,因為顛覆是技術發展的核心。不太了解帖子中提到的人,但是能給圈子或者同行帶來收穫,能讓其他人學到東西,促進行業發展,就足夠了。

在技術圈,有人喜歡推廣自己為了積累人脈、推廣、促進交流、提升技術是很好的。當然,如果是沖著當網紅說明他想吃自己老本,沒有技術追求,因為技術圈不需要網紅。


zhh觀點:

Java最屌,C++,go是辣雞

Cassandra最屌,Hbase ,OceanBase是辣雞

2PC最屌,Paxos,Raft是辣雞

寫英文文檔是辣雞,真的屌讓老外學中文


阿里出身的DBA都比較高調


不論如何,他是做出來東西的人,牛逼。總之比嘴炮們強多了。


和zhh聊過,不知道本人真名叫什麼。個人感覺。技術水平是夠高的。自學能力,毫無疑問,是秒殺普通人的。比較有性格,如果主管不太能包容他的話,可能不太好在團隊中立足。而nb的產品往往是在團隊中產生的。因此可能還要看能不能找到合適他的環境去發揮長處。加油吧


慢慢發覺,是個噴子,不過挺好!挺喜歡的,安靜等於心死。


垃圾坑。

他噴TDDL,我覺得噴的沒啥問題。畢竟他曾經也是TDDL的開發者之一,TDDL這種proxy方式確實跟現在最火的Newsql差點意思,不過TDDL在ali這麼多年太穩定了,滿足需求就行,其他也所謂了。

噴oceanbase,ob開始的開源版確實結構上有些問題,算toy級別的東西。問題是ob感覺一直在變動,而且據說內部版本跟現在開源的版本差別還是挺大的。

至於水平,題主可以去github看他的代碼。起碼他研究過Cassandra,HBase的代碼。而且也沒重新實現一套分散式資料庫,使用的都是比較成熟的開源系統在搭建NewSql這一層,大的方嚮應該沒問題。

至於他的系統咋樣,我覺得沒有經過嚴格測試前還是持有保留態度。畢竟開發分散式資料庫還是一個大的工程,做一個通用的高性能分散式OLTP資料庫還是很難的。不過作為個人來說,勇於自己寫開源系統,而不是簡單做某些paper的輪子,我覺得還是值得敬佩的。


精神支持


研究水平不了解,工程能力還是比較強的。最近出於好奇也在看Cassandra。


為啥都匿名?


看了一眼微博,這哥們各種創新顛覆世界啊,為毛我就是沒聽過啊!!!


就以Z哥瀟洒淡泊的個性,再加上已經很不錯了的技術,就足以是我的榜樣了


推薦閱讀:

大數據計算框架除了 MapReduce 還有哪些呢,不應該是 MapReduce 去解決所有問題吧?
到現在為止,NoSQL運動給資料庫系統留下什麼寶貴的思想?
為什麼很多分散式系統都是以DAG(Directed acyclic graph )實現運算的?
分散式系統工程如何搭建,有沒有一套完整的系統的實踐方法論,比如,存儲服務?
分散式系統工程師要不要轉行做機器學習?

TAG:資料庫 | 機器學習 | 分散式系統 | 分散式 |