國內有哪些研發資料庫的公司?

…題主今年即將畢業找工作,對內存資料庫研發非常感興趣,已經閱讀了Redis底層存儲相關的源碼,並根據自己的研究需要修改了源碼。希望畢業時能找到一份和內存資料庫研發相關的工作。所以想請教一下各位前輩,目前國內做資料庫的都有那些公司?


阿里雲資料庫ApsaraDB相應的團隊配套就涉及到OS內核、存儲、引擎(TP、AP)、資料庫內核、管控、監控、數據流動、計算、搜索、服務等,是個複雜和精美的協作團隊, 已經有10幾個資料庫相關產品,在市場地位和收入上都有不錯的表現,團隊有業內非常有經驗的人,歡迎大家加入,團隊主力主要在北京和杭州!

註:

ApsaraDB產品總覽:https://promotion.aliyun.com/ntms/product/apsaradb.html?spm=5176.8006303.416540.25.KcLaUg ,歡迎造訪!


國產的大型商業資料庫

  如南大通用、人大金倉,神州通用等等都已經在國內的商業市場有了自己的不小份額,這些公司主要是國企強勢持股,有一部分政績任務在裡面,所以受到的支持,擁有的資源也都是比較多的。

  不過由於不開源,我們無法準確的知道他們的技術含量如何,但是大概率引擎層面使用已有的演算法,在調度層自己做的比較複雜的封裝。

  這類資料庫的意義在於填補國內商用資料庫的空白,技術本身的創新意義不是太大。

  目前中國電信似乎也發布了自己的商業資料庫,號稱已經在內部廣泛使用了,目前還沒有更進一步的信息。

國產創業公司

  PingCap目前如火如荼,產品本身是具有非常大的創新意義的,更重要的是它本身是開源的,讓分散式事務處理變得更簡單,對開發者更透明了。SequoiaDB巨杉資料庫本身是基於開源產品做的各種解決方案,創新性個人認為不大,但是作為一個創業公司,能夠拿下眾多銀行的合作,想必一定有自己非常過硬的技術實力。

大型企業內部產品

  其實每個大公司內部基本上都有自己的資料庫產品,比如阿里的OceanDB,百度的MolaDB等等,他們毫無疑問是技術實力最強的,但是由於本身不是對外的商業產品,所以不好討論他們的價值。

存儲引擎

  由於我們本身是做存儲引擎的,不得不打個廣告,以上提到的國產公司,從引擎層面目前沒有全新的引擎(TiDB印象中是對LSM演算法做了封裝,不確定),現在國內在自主研發新的引擎演算法的知道的有我們Terark和華為(很多年了,一直沒有找到新的消息)。最近我們專註於技術本身的改進,很多信息沒有披露,期望將來能給大家帶來更好的產品。


我司做資料庫,產品是 TiDB:pingcap/tidb。目前已經有一些上線用戶,團隊技術實力也很強。歡迎大家加入,目前公司在北京,不過也有不少同學是remote的。樓主可以發簡歷到 shenli AT pingcap.com


oracle nosql資料庫在國內有內核開發團隊


SAP 資料庫(西安,上海,北京):

HANA - Sql Parser, E2E, Replication for Bigdata,HANA Express

ASE(原Sybase ASE) - Parser, Optimizer部分,Executor部分,HADR部分

IQ不清楚

Powerdesigner部分


達夢資料庫(武漢達夢),人大金倉資料庫(北京人大金倉),南大通用資料庫(天津南大通用),神州通用資料庫(天津神州通用資料庫),OpenBASE(東軟集團)。


剛好我今年校招,資料庫這塊我也有關注。

之前在阿里雲實習,對阿里的情況比較了解。阿里雲 @余鋒帶的資料庫部,大概一個組負責一個資料庫,常用的mysql, pg, redis, mongodb都有;螞蟻 @正祥帶的Oceanbase,都是不錯的選擇。OLAP方面有ODPS(MaxCompute),就是我實習的部門了,強烈推薦。

華為資料庫和大數據組最近挖了不少牛人,今年錢給的又多,可以考慮。

中興資料庫組也聯繫過,但是沒有面試,好處是如果你足夠厲害,有藍劍計劃,分房子哦。

百度和騰訊也有資料庫組,但是面試沒有分到這個方向,具體不了解就不多說了。

另外,還有一些小公司,如果不是特別了解,個人感覺應屆生還是先去大公司學習一下比較好。


巨杉資料庫還可以,只是目前招人更偏向售前售後技術人員


我們公司正在研發國產高性能資料庫,目前KV資料庫查詢性能比memcache高37%,更新插入性能高21%。產品開發5個月了,歡迎試用,網址:http://www.haisql.com/fwzc/soft/

與memcached性能對比的測試方法:

1) 運行 memcached, 需要指定8192M內存, 以便可以測試百萬以上的數據量, 指定埠號是1983

memcached -m 8192 -p 1983

我們的程序是動態申請內存, 因此, 不需要指定預先分配的內存量, 直接運行就可以了

haisql_memcache_chinese

我們的軟體默認運行埠是1971

每次測試後需要清理運行環境, memcached直接ctrl_C退出就可以了.

我們的軟體因為退出時默認自動保存內存數據, 因此,需要在退出程序後,執行 rm *.txt;sync;sync 清理掉自動保存的數據, 相當於清空全部數據,這樣下次啟動時就是空數據表了.

2)測試軟體 memcslap,

先測試 讀性能 測試軟體自動寫入1萬條記錄, 然後測試讀取900萬次, 我們的軟體執行時間是28.3秒, memcache執行時間是38.8秒, 我們的軟體比memcache快37%

我們的軟體讀性能如下: 讀4.1Kbyte的數據包大小, 4核8線程3.4G主頻DDR3內存, 讀900萬次數據, 900並發, 花費時間28.32秒, 讀性能31.8萬QPS.

第1次是memcached的測試結果, 第2次是我們的軟體測試結果

guo@guo-desktop:~$ memcslap --concurrency=900 --servers=127.0.0.1:1983 --test=get

Threads connecting to servers 900

Took 38.828 seconds to read data

guo@guo-desktop:~$ memcslap --concurrency=900 --servers=127.0.0.1:1971 --test=get

Threads connecting to servers 900

Took 28.320 seconds to read data

測試 寫性能 測試軟體測試寫入100萬條記錄, 我們的軟體執行時間是3.38秒, memcache執行時間是4.078秒, 我們的軟體比memcache快21%

我們的軟體寫性能如下: 寫4.1Kbyte的數據包大小, 4核8線程3.4G主頻DDR3內存, 寫100萬次數據, 100並發, 花費時間3.38秒, 寫性能29.6萬TPS.

第1次是memcached的測試結果, 第2次是我們的軟體測試結果

guo@guo-desktop:~$ memcslap --concurrency=100 --servers=127.0.0.1:1983

Threads connecting to servers 100

Took 4.078 seconds to load data

guo@guo-desktop:~$ memcslap --concurrency=100 --servers=127.0.0.1:1971

Threads connecting to servers 100

Took 3.380 seconds to load data


再補充幾個吧。

阿里集團的AIS的資料庫內核組,負責集團包括優土高德的資料庫內核,區別於RDS的是RDS面向雲上的中小客戶。

騰訊的TEG的數據平台部有個PG組,計費平台部有個TDSQL(MySQL)。


推薦閱讀:

Win有沒有可能完全反盜版?
PC下一次的技術革命會在那些方面?
你認為優美的電腦壁紙有哪些?
如何評價號稱下一代 FreeBSD 的 NextBSD?
系統運行速度的快慢,硬碟比CPU更重要?

TAG:資料庫 | 操作系統 | 分散式系統 | 內存資料庫 | 分散式資料庫 |