國內有哪些研發資料庫的公司？

01-18

…題主今年即將畢業找工作，對內存資料庫研發非常感興趣，已經閱讀了Redis底層存儲相關的源碼，並根據自己的研究需要修改了源碼。希望畢業時能找到一份和內存資料庫研發相關的工作。所以想請教一下各位前輩，目前國內做資料庫的都有那些公司？

阿里雲資料庫ApsaraDB相應的團隊配套就涉及到OS內核、存儲、引擎（TP、AP）、資料庫內核、管控、監控、數據流動、計算、搜索、服務等，是個複雜和精美的協作團隊, 已經有10幾個資料庫相關產品，在市場地位和收入上都有不錯的表現，團隊有業內非常有經驗的人，歡迎大家加入，團隊主力主要在北京和杭州！

註：

ApsaraDB產品總覽：https://promotion.aliyun.com/ntms/product/apsaradb.html?spm=5176.8006303.416540.25.KcLaUg ，歡迎造訪！

國產的大型商業資料庫

　　如南大通用、人大金倉，神州通用等等都已經在國內的商業市場有了自己的不小份額，這些公司主要是國企強勢持股，有一部分政績任務在裡面，所以受到的支持，擁有的資源也都是比較多的。

　　不過由於不開源，我們無法準確的知道他們的技術含量如何，但是大概率引擎層面使用已有的演算法，在調度層自己做的比較複雜的封裝。

　　這類資料庫的意義在於填補國內商用資料庫的空白，技術本身的創新意義不是太大。

　　目前中國電信似乎也發布了自己的商業資料庫，號稱已經在內部廣泛使用了，目前還沒有更進一步的信息。

國產創業公司

　　PingCap目前如火如荼，產品本身是具有非常大的創新意義的，更重要的是它本身是開源的，讓分散式事務處理變得更簡單，對開發者更透明了。SequoiaDB巨杉資料庫本身是基於開源產品做的各種解決方案，創新性個人認為不大，但是作為一個創業公司，能夠拿下眾多銀行的合作，想必一定有自己非常過硬的技術實力。

大型企業內部產品

　　其實每個大公司內部基本上都有自己的資料庫產品，比如阿里的OceanDB，百度的MolaDB等等，他們毫無疑問是技術實力最強的，但是由於本身不是對外的商業產品，所以不好討論他們的價值。

存儲引擎

　　由於我們本身是做存儲引擎的，不得不打個廣告，以上提到的國產公司，從引擎層面目前沒有全新的引擎（TiDB印象中是對LSM演算法做了封裝，不確定），現在國內在自主研發新的引擎演算法的知道的有我們Terark和華為（很多年了，一直沒有找到新的消息）。最近我們專註於技術本身的改進，很多信息沒有披露，期望將來能給大家帶來更好的產品。

我司做資料庫，產品是 TiDB：pingcap/tidb。目前已經有一些上線用戶，團隊技術實力也很強。歡迎大家加入，目前公司在北京，不過也有不少同學是remote的。樓主可以發簡歷到 shenli AT pingcap.com

oracle nosql資料庫在國內有內核開發團隊

SAP 資料庫（西安，上海，北京）：

HANA - Sql Parser, E2E, Replication for Bigdata，HANA Express

ASE（原Sybase ASE) - Parser, Optimizer部分，Executor部分，HADR部分

IQ不清楚

Powerdesigner部分

達夢資料庫（武漢達夢），人大金倉資料庫（北京人大金倉），南大通用資料庫（天津南大通用），神州通用資料庫（天津神州通用資料庫），OpenBASE（東軟集團）。

剛好我今年校招，資料庫這塊我也有關注。

之前在阿里雲實習，對阿里的情況比較了解。阿里雲 @余鋒帶的資料庫部，大概一個組負責一個資料庫，常用的mysql, pg, redis, mongodb都有；螞蟻 @正祥帶的Oceanbase，都是不錯的選擇。OLAP方面有ODPS(MaxCompute)，就是我實習的部門了，強烈推薦。

華為資料庫和大數據組最近挖了不少牛人，今年錢給的又多，可以考慮。

中興資料庫組也聯繫過，但是沒有面試，好處是如果你足夠厲害，有藍劍計劃，分房子哦。

百度和騰訊也有資料庫組，但是面試沒有分到這個方向，具體不了解就不多說了。

另外，還有一些小公司，如果不是特別了解，個人感覺應屆生還是先去大公司學習一下比較好。

巨杉資料庫還可以，只是目前招人更偏向售前售後技術人員

我們公司正在研發國產高性能資料庫，目前KV資料庫查詢性能比memcache高37%，更新插入性能高21%。產品開發5個月了，歡迎試用，網址：http://www.haisql.com/fwzc/soft/

與memcached性能對比的測試方法：

1) 運行 memcached, 需要指定8192M內存，以便可以測試百萬以上的數據量, 指定埠號是1983

memcached -m 8192 -p 1983

我們的程序是動態申請內存，因此，不需要指定預先分配的內存量, 直接運行就可以了

haisql_memcache_chinese

我們的軟體默認運行埠是1971

每次測試後需要清理運行環境, memcached直接ctrl_C退出就可以了.

我們的軟體因為退出時默認自動保存內存數據, 因此,需要在退出程序後,執行 rm *.txt;sync;sync 清理掉自動保存的數據, 相當於清空全部數據,這樣下次啟動時就是空數據表了.

2)測試軟體 memcslap,

先測試讀性能測試軟體自動寫入1萬條記錄, 然後測試讀取900萬次, 我們的軟體執行時間是28.3秒, memcache執行時間是38.8秒, 我們的軟體比memcache快37%

我們的軟體讀性能如下: 讀4.1Kbyte的數據包大小, 4核8線程3.4G主頻DDR3內存, 讀900萬次數據, 900並發, 花費時間28.32秒, 讀性能31.8萬QPS.

第1次是memcached的測試結果, 第2次是我們的軟體測試結果

guo@guo-desktop:~$ memcslap --concurrency=900 --servers=127.0.0.1:1983 --test=get

Threads connecting to servers 900

Took 38.828 seconds to read data

guo@guo-desktop:~$ memcslap --concurrency=900 --servers=127.0.0.1:1971 --test=get

Threads connecting to servers 900

Took 28.320 seconds to read data

測試寫性能測試軟體測試寫入100萬條記錄, 我們的軟體執行時間是3.38秒, memcache執行時間是4.078秒, 我們的軟體比memcache快21%

我們的軟體寫性能如下: 寫4.1Kbyte的數據包大小, 4核8線程3.4G主頻DDR3內存, 寫100萬次數據, 100並發, 花費時間3.38秒, 寫性能29.6萬TPS.

第1次是memcached的測試結果, 第2次是我們的軟體測試結果

guo@guo-desktop:~$ memcslap --concurrency=100 --servers=127.0.0.1:1983

Threads connecting to servers 100

Took 4.078 seconds to load data

guo@guo-desktop:~$ memcslap --concurrency=100 --servers=127.0.0.1:1971

Threads connecting to servers 100

Took 3.380 seconds to load data

再補充幾個吧。

阿里集團的AIS的資料庫內核組，負責集團包括優土高德的資料庫內核，區別於RDS的是RDS面向雲上的中小客戶。

騰訊的TEG的數據平台部有個PG組，計費平台部有個TDSQL（MySQL）。