未來已來,Google Cloud Spanner 展開 NewSQL 時代

摘要Google 今日宣布了其 Cloud Spanner 雲端資料庫服務的 Beta 版測試啟動。此次 Google 將 Spanner 商業化,也進一步驗證了 NewSQL 作為未來資料庫發展方向的正確性。

Cloud Spanner 是構建在 Google Cloud Platform(GCP)平台上的全球級分散式關係型資料庫服務,也是 Google 長期以來在內部使用的 Spanner 資料庫的公有雲版本。

Spanner 發佈於 2012 年 9 月,是 Google 的全球級的分散式資料庫。整個集群分布在全球多個數據中心的數百萬機器中。除了驚人的擴展性之外,還提供外部一致性以及高可用性。Spanner 及其之上的 F1 一起支撐了 Goolge 廣告業務的後台,替換掉 MySQL sharding 集群。Spanner 的發布讓工業界第一次看到在如此大的規模上運行的 NewSQL 系統。

長期以來這套最先進的資料庫系統只為 Google 內部的業務服務,無法滿足其它企業對資料庫水平擴展、高可用、強一致的需求,市場需要一款能夠幫助這些企業改變困境且可被廣泛使用的產品。

TiDB 的誕生是受到 Spanner 論文的啟發,其核心原理和實現架構都與 Spanner 高度相似。作為 Spanner 的開源實現,TiDB 具備分散式強一致性事務、在線彈性水平擴展、故障自恢復的高可用、跨數據中心多活等核心 NewSQL 特性。TiDB 打破了 RDBMS 和 NoSQL 之間的界限,融合了 OLTP 和 OLAP 應用使用場景。使用戶專註於業務層的開發,而數據層的水平擴展,高可用,故障轉移,一致性分散式事務,在線變更 Schema,複雜 Query,統統交給資料庫本身來解決。

作為一款開源產品,TiDB 立足於社區,使用的門檻和成本更低。同時,上層完整地實現了 MySQL 協議,兼容市面上大多數 MySQL 工具,用戶遷移使用的成本更低,體驗上也與原有方案非常接近。並且,TiDB 還提供了完備的周邊工具,包括數據導入導出,數據遷移,增量備份。既可以作為一個 MySQL 的 Slave 實時同步,也可以通過自身的 Binlog 將數據同步到其它異構的資料庫系統,通過 Binlog 機制也很容易實現消息訂閱/消費模型,更加靈活地與用戶的業務架構進行融合。商業版本更是提供完備的集群部署、診斷監控、安全審計工具。

另外,考慮到一些對數據安全敏感的用戶(例如銀行、券商、政府機關)很難將自己的數據放在公有的雲服務中,這些用戶更希望能有私有部署方案。TiDB 並不綁定某個雲平台,與用戶現有的架構集成更加靈活,而且便於私有化部署。

此次 Google 將 Spanner 商業化,也進一步驗證了 NewSQL 作為未來資料庫發展方向的正確性。作為 NewSQL 的代表,目前 TiDB 已正式用於生產環境,現有上線用戶數十家,POC 150 多家。


推薦閱讀:

理解這兩點,也就理解了paxos協議的精髓
分散式 tensorflow 指南
成為HBase Committer後
分散式系統理論 - 從放棄到入門
CAP 理論常被解釋為一種「三選二」定律,這是否是一種誤解?

TAG:数据库 | 分布式系统 | 开源 |