標籤:

國產資料庫發展情況如何?

請問:國產資料庫軟體的發展情況如何,技術上面與國際大品牌的差距主要體現在哪裡。


對國產資料庫, 有些常見的誤區, 和朋友們簡單探討一下:

誤區一: 國產資料庫都是基於國外某系統的;

確實有很多國產資料庫基於開源系統, 如PostgreSQL/MySQL, 或者在Hadoop等平台上開發; 也有引進Informix的; 但是也有例外, 比如達夢資料庫是自主原創的大型通用國產資料庫;

誤區二: 國產資料庫靠國家補貼, 拿科研經費存活

最近五年來, 國產資料庫基本拿不到國家補貼, 政府項目支持非常少, 目前幾乎全靠市場行為存活; 主要的資金來源為吸引投資燒錢和產品銷售; 目前國產化的大形勢很好, 因此市場的潛在機會不少;

誤區三: 國產資料庫主要的客戶是政府和國企, 是靠"關係"得來的.

客戶關係是任何企業都需要認真維護和建立的, 這個和國產資料庫沒有特別關係; 國外廠商在政府關係方面的投入和專業性方面都遠勝於弱小的國產廠商;

誤區四: 國產資料庫不需要技術含量, 因為客戶是有關係的政府和國企

資料庫是管理數據資產的軟體, 穩定是前提, 其他的如性能, 功能和 易用性都體現在"技術含量"上; 和大型互聯網公司不同, 這些用戶幾乎都沒有專業的DBA團隊來維護國產資料庫, 上線也缺乏一定的規範; 應用系統的提供商, 應用的種類也非常多,很多系統都是邊開發邊上線,應用和資料庫系統不經過調優和測試直接在生產系統上操作的事情層出不窮,壓力很容易傳遞到後台的國產資料庫上,因此國產資料庫其實需要更高的技術含量, 因為應用的水平通常不高;

誤區五: 國產資料庫很容易研發和實施

確實基於PG研發國產資料庫, 是非常容易的, 因為只要聲明是基於PG,就可以隨意使用它來構建自己的國產資料庫。 但是在用戶那邊用上它並不容易, 因為對於國產資料庫的潛在用戶, 通常對國產資料庫還是有一定的疑慮, 另外他們原來的系統, 或者應用開發商的開發模式和經驗,大多是基於Oracle的;對用戶來說, 給你一個測試機會就很不錯了, 改應用或者要求改變基於Oracle的開發模式去開發新系統來適應基於PG, MySQL或者Informix, 用戶和開發商需要承擔額外的代價和風險, 是非常困難的; 這導致基於PG等和Oracle不充分兼容的國產資料庫難以推廣和實施;

誤區六: 自主研發的國產資料庫和PG, MySQL等系統還有很大差距

如果說知名度來說, 確實有很大差距; 但是從技術上來說, 自主研發的達夢資料庫在標準化, 功能, 性能以及和Oracle的兼容性等多方面已經遠遠超越了PG和MySQL等著名的開源資料庫,特別是Oracle兼容性,在經過多年的實戰後,獲得了巨大的提升,這也是在傳統業務領域國產資料庫能爭取到一定市場份額的原因。


作為行業內人員,對自己的理解做些簡單描述,拋磚引玉。

一、資料庫開發難度

資料庫研發是和操作系統相提並論的高難度工作。參考對資料庫和分散式很感興趣,學習路線是什麼?這篇文章里說到了很多學習過程,從學術上就能看到其複雜度。然而這還只是萬里長征的開始,學術到產品還有道巨大的鴻溝。

資料庫是基礎性軟體,好比汽車的引擎一樣,是系統的關鍵部件,具有「牽一髮而動全身「的特性。這就要求資料庫具有相當高的成熟度。這種成熟度需要在技術、產品、工程、支持以及行業經驗上具有相當長時間的積累。

傳統的關係型資料庫中,例如Oracle、IBM DB2等,都歷經幾十年才達到現在的版本。任何一款資料庫從研發到產品都是一個歷經磨難的過程,一般需要6年以上的時間才能走出0到1 的階段,然後再在行業和實際應用場景中不斷地歷煉打磨,逐步過渡到成熟期。

開源資料庫我們也能過一遍資料庫的歷史。老一點的,Mysql第一個版本到如今歷經22年了;Postgres是1986年開始學術研究,1996年第一個版本。新一點的,Cassandra是2008年第一個initial release,發布open source版本,11年底1.0;到目前是3.11的版本;MongoDB: 2007年就開始開發,到目前3.4的版本;VoltDB是09年開始,7年後才開始出來見人。

另外,金融級資料庫產品面對的是諸如銀行、證券、保險等頭部行業大型企業,對產品上的複雜度和成熟度又提出了更高層次的要求。因此,其生命周期還要更長。

二、資料庫產品化的難度

產品的研發是一個不斷前進積累打磨的過程。

還是拿汽車行業做案例,同樣是引擎,跑車的引擎和家用車引擎差別在哪裡?為什麼F1賽車經久不衰,就是廠商知道,產品需要不斷精益求精,不斷地挑戰,不斷地應對日益增長的需求場景變化。

再拿產品測試做案例,巨杉SequoiaDB經過6年的發展,測試用例有12000多個,自動化測試覆蓋率超過99%,測試開發團隊和產品開發團隊人員1:1,有過之無不及,測試的開發水平要求高過大部分的研發工程師。每一個小迭代,基本要跑一周,機房的測試伺服器從來沒有停過。

但這又怎樣,和Oracle、DB2比是小巫見大巫。

再拿需求到產品轉化過程來看。應用產品客戶的需求很容易理解,而資料庫這種基礎產品,客戶一句話的需求轉化到技術產品的語言是一道巨大的鴻溝,不同用戶的需求就交織在一起,如何將需求轉而到定義產品開發的功能,「這是一個問題」。

所有這些不歷經沒日沒夜地現場支持也沒法實現。另外,如何能夠嚴格把控核心代碼和控制產品發展路線也至關重要,畢竟是產品,不能靠技術支持堆人力。

我想「贏在細節,輸在格局」這句話對每個產品都適用。

三、中國資料庫發展的缺點和優勢

先說缺點,最大的還是技術傳承和基因。拿Michael Stonebraker老爺子做案例,一生經歷了Ingres,Postgres,Informix,C-Store, H-Store再到VoltDB。其他的資料庫也是如此,都是幾十年一種傳幫帶的基因。

中國因為近年來才開始發展資料庫,主要還是從開源產品諸如Mysql和Postgres里吸取養分;也有收購引入Informix再開始的;創新從來也不是瞬間的事情,站在巨人的肩膀無可厚非。只不過需要有個積累的過程。

我們自己也是從北美DB2的基因派生出來,到中國本土又結合了華為的基因,才落地生根。

說到優點,就是中國是個巨大的市場土壤,想想中國的用戶數,手機使用頻率,應用場景的多樣化,在中國的環境里打磨出來的產品適用於任何地方,這點信心是有的,我們在和Gartner探討資料庫發展方向時感受特別明顯。

現在是中國資料庫發展的黃金期,也祝願所有的同行一起來推動自主資料庫的發展。


達夢資料庫已經在國家電網、南方電網、中鐵建、中航信、中國神華等一大批的央企的核心系統中獲得了大規模的應用,並且已經走出國門,在東南亞、非洲、南美都有應用。有些話可能隨口說起來比較容易,國產資料庫並不是大家想像中的那麼弱,真正想知道怎麼樣,唯有自己親身實踐才知道。


國產資料庫老三家:達夢,南大,神通,都各自擁有一定的市場份額,主要是依靠政府關係。在中小型數據量,業務場景不複雜的情況下還是可以用的,但是隨著業務複雜性的升級,數據量的增加,並發量的提高,越來越玩不轉,性能、穩定性與ORACLE,MYSQL等差距就體現的越來越明顯。

所以國產廠商現在想在分散式計算上有所突破,研發所謂的MPP資料庫,不過以中國特色來看5年內不會有什麼成功的產品,畢竟從開源單機資料庫基礎上搞了十幾年才有今天像達夢等這般差強人意的資料庫,再搞個10年也未必在分散式上有什麼成就,何況MPP從根源上就存在一些不可逾越的技術鴻溝。

總之理想很豐滿,現實很骨感。至於其他廠家,星環以Hadoop為原型,貌似搞得風生水起,研發人員很多,有一定的技術實力,在OLAP場景上值得一試。題主說的上海引跑科技不是做資料庫的公司,沒有資料庫研發的技術底蘊,它只是在PostgreSQL之上做分散式資料庫中間件,很多互聯網公司也都有自己的分散式資料庫中間件,而且兼容的資料庫類型更多,但無一例外都只能解決部分業務問題,中間件不是萬能的,能解決一些痛點就好。


國產不國產實際意義不大。你說tidb是國產不?


國產資料庫這幾年確實在快速成長,gbase的8a mpp分析性資料庫集群一路走來,在大數據領域的td,vertica,gp等國外資料庫廠商中衝出重圍,快速佔領了,金融,電信,政企,安全等行業的大數據市場


比較產品成熟度、最終用戶群以及研發能力。南大通用從公司成立開始只做資料庫,從不涉及其他領域。因為專業所以精彩。有世界級產品、金融電信等高端用戶以及10多年的專業資料庫研發底蘊。只敢用GBase。


支持國產資料庫,尤其是gbase資料庫,目前國內應用很廣泛,口碑挺不錯


我覺得國產裡面還是南大通用的產品好一些!在不同的應用領域有不同特色的產品。通用型資料庫產品更是繼承了IBM的基因,在國產產品中沒有能超越他們的。而且好像南大通用的資料庫產品在電信,金融核心業務系統中佔有率很高,是其他國產資料庫產品做不到的。


國產不用GBASE的產品話不知道用什麼。全系列的資料庫產品。內存 oltp olap 嵌入式 目錄 安全 加密 UP大數據平台 一體機 BI 數據觀。全生態全解決方案。其他國產廠商沒得比。


推薦閱讀:

寫一個資料庫最難的地方在哪?最精華的地方在哪?分幾步?
如何評價國產高性能存儲引擎 TerarkDB ?
华为自研的数据库gaussdb怎么样?
維護人員不小心把資料庫刪除了要賠償嗎?
OpenTSDB 是一種基於 HBase 編寫的分散式、可擴展的時間序列資料庫。
它適用什麼場景呢?

TAG:資料庫 |