標籤:

關係型資料庫 RDBMS 的舊與新 -- 談談 NewSQL

這是最好的時代,也是最壞的時代。

在這個時代我們有各種技術可以選擇,在這個時代我們有各種技術要選擇。

作者簡介

陳運海

DaoCloud 數據平台架構師,長期關注資料庫系統、分散式系統、區塊鏈等領域。

言必稱互聯網

在計算機科技這塊蓬勃發展的領域,新技術形態和新的商業模式源源不斷的湧現、令人眼花繚亂。世紀之初的以流量為王互聯網泡沫破滅,並不能阻擋當下互聯網行業繼續攀登高峰,只是在這將近20年的時間裡,消費者與互聯網從業人員有足夠長的時間一點一滴地將行業基礎夯實,將原來的浮雲壘高台,變為了今天一個實實在在的行業。

互聯網已經從計算機網路、通信領域的一個名詞慢慢演變成了一個形容詞,互聯網行業、互聯網應用(Internet application)中的互聯網代表著高並發、敏態IT、快速伸縮、數據驅動、精益運營等等,一切都顯得區別於傳統的行業、傳統的應用。

支撐互聯網應用的 PaaS 平台已經日漸清晰,以 Docker 為代表的容器技術,在勢頭上已經力壓虛擬機,為互聯網應用提供了標準的運行環境。而在上層的集群管理、編排標準,大而全的 Kubernetes 和不甘於繼續做小巧靈巧的 Swarm,聯合開源社區的眾多玩家(Spring Cloud, Tyk, Prometheus)等,共同打造了包含負載均衡、彈性伸縮、服務註冊與發現、應用監控等功能的面向互聯網應用的高可用 PaaS 平台。

另一方面,互聯網應用典型的高並發訪問量、大數據存儲量以及跨地理區域等特性使得傳統的基於關係型資料庫的應用架構無所適從,NewSQL 的誕生與當前互聯網應用的需求密不可分。

NewSQL is a class of modern relational database management systems that seek to provide the same scalable performance of NoSQL systems for online transaction processing (OLTP)read-write workloads while still maintaining the ACID guarantees of a traditional database system.

有著遠大願景的 NewSQL 試圖比肩擴展性佔優的 NoSQL,並且實現傳統關係型資料庫所擅長的滿足 ACID 特性的事務處理。然而考慮到關係型資料庫,從 Edgar F. Codd 的文章 A Relational Model of Data for Large Shared Data Banks 發展到 NoSQL 盛行再到今天,學術界與工業界並進的資料庫理論和工程差不多已經經歷了四十多年了,那麼,標榜為 New 的 NewSQL,到底 New 在哪裡?NewSQL 是真有其貨還是只是商業上的一種遊戲?

關係模型與 SQL 標準

在關係型資料庫流行並成為資料庫領域真正意義上的標準之前,曾經出現過幾個往往被一筆帶過的模型的資料庫,基本上都可以歸類為導航型資料庫,它們在物理結構上面向的是磁帶存儲,在邏輯結構上是現實世界某種程度的映射。例如:層級模型是以樹形結構組織數據的,每個子節點只會擁有唯一的父節點。公司內部的組織結構就是我們所熟悉一個層次結構。

A navigational database is a type of database in which records or objects are found primarily by following references from other objects.

不得不提的一個層次模型資料庫是誕生於 1968 年的 IBM 的 IMS(Information manangement system)。相傳在 1966 年,美國國家航空航天局找到了 IBM,尋求一款軟體,以求在登月工程中能夠有效的跟蹤管理數以萬計的火箭零部件。

If we could put a man on the Moon, could we also create a computer program to track the millions of rocket parts it takes?

如今,IMS 依然老當益壯,在大型製造業、銀行依然承擔著重要的角色,還會時不時的舉辦社區活動。但是它已經淡出了我們這些標榜為互聯網從業人員的視線,畢竟在推崇開源、微服務、敏態 IT、輕資產的互聯網行業,它已經顯得格格不入了。

但是它對整個資料庫領域,甚至整個計算機科學都留下了不可磨滅的貢獻,時至今日,再楞頭的程序員,也不會輕易把自己深陷在應用自己管理、查詢數據的泥淖里。

It helped introduce the idea that an application』s code should be separate from the data that it operates on. This allows developers to write applications that only focus on the access and manipulation of data, and not the complications and overhead associated with how to actually perform these operations.

1970 年,同樣是 IBM 的 Edgar Codd 發表了資料庫發展史上重量級的一篇文章 A Relational Model of Data for Large Shared Data Banks(文章地址:cs.uwaterloo.ca/~david/),Edgar 在這著名的文章里,以數學理論為基礎,論證了為了做到對稱探索(Symmetric Exploitation),即用戶可以根據任何已知的屬性組合去探索剩下的未知屬性,必須要消除導航資料庫中的幾個依賴:

  • 排序依賴
  • 索引依賴
  • 訪問路徑依賴

很多人認為關係型資料庫的成功在於其完美的數學模型,但是不可忽視的另外一面,關係型資料庫在資料庫發展的混沌時期,為其打開了一面窗,原本導航型資料庫,關注點在於數據的寫入和基於路徑的信息檢索,而關係型資料庫,讓人們看到了數據分析的曙光。

之後藉助於硬體技術特別是存儲設備的發展,出現了支持 Semi-random access 的磁碟,關係型資料庫如魚得水,加上之後演繹出的關係代數、 E-R 模型、SQL 標準、 Codds 12 rules、數據倉庫等等,使其主導了資料庫領域近 40 年。

The introduction of low-cost hard drives that provided semi-random access to data led to new models of database storage better suited to these devices. Among these, the relational database and especially SQL became the canonical solution from the 1980s through to about 2010.

關係型資料庫中的 關係 並不是指我們直觀感受到的表與表之間通過外鍵關聯在一起的 關係,關係(Relation)是一個數學上的概念,其定義為:

給定 n 個集合 S1, S2, ..., Sn,R 是一個 n 元數組(n-tuples),它的第一個元素取自集合S1,第二個元素取自集合S2,以此類推。我們將 R 稱之為基於該 n 個集合的一個 Relation,Sj為 R 的第 j 個域(Domain)。

簡要的表述:

R 是集合 S1 × S2 × ... × Sn 笛卡爾積的一個子集

在工業界,1979 年誕生的 Oracle、1983 年誕生的 DB2,90 年代開源領域的 MySQL 和 PostgreSQL,都是各位耳熟能詳的幾個有名的資料庫。

資料庫領域下一個大事件就是 SQL 的標準化了。由於 Edgar 並未在那篇著名的論文中指定關係型資料庫具體實現方法,只是描述了關係模型,據此,市面上出現了多個關係型資料庫,各個系統的存儲引擎各不相同,數據的組織形式千差萬別。面向過程的資料庫操作語言顯然是不合適的。

比如,某一個學校組織了一次考試,為了錄入每個學生的成績,教務處老師需要處理以下細節:

1.成績表的存儲位置

2.各個列的組織形式

3.分隔符

4.解壓縮演算法

...

你也一定會同意,這樣不行!的確,這樣對應用的侵入性太強。我們哪裡在寫應用,我們在寫瑣碎的計算細節!

SQL 是高級的非過程化資料庫操縱語言,它允許用戶在高層數據結構上工作,不要求用戶指定對數據的存放方法,也不需要用戶了解其具體的數據操縱方式。它將資料庫以一個簡單的界面呈現出來,能使具有底層結構完全不同的資料庫系統和不同資料庫之間,使用相同的 SQL 作為數據的輸入、運算與管理。

你只需要用這種標準化的語言,告訴資料庫你要做什麼,而不是告訴它,為了做這件事情,所要一步步地怎麼做。

回到錄入成績那個例子,你只需要對資料庫執行以下操作:

create table score(id int, name string, level char);insert into score values(12, John, B)insert into score values(19, Lily, A);...

查詢獲得 A 的學生名單?小菜一碟:

select * from score where level = A;

解耦合是計算機領域一個長盛不衰的話題,縱便有 data locality,存儲計算分離也是一股強大的潮流;應用和資料庫解耦合催生了資料庫,編程與運行平台的解耦合催生了高級編程語言、編譯器;應用與承載平台的解耦合催生了容器技術、Docker。

扯遠了,有一點是要記清楚的,耦合存在的意義就是被解開,就像記錄存在的意義就是被打破一樣。

互聯網時代的探索

互聯網應用猶如一頭咆哮的巨獸,對於習慣了傳統應用的人們來說,彷彿先民在《山海經》里所描繪的巨獸。

面對互聯網應用的高並發、大容量和跨地域等挑戰,Sharding 是分而治之的最為樸素的解決方案,基本思想就是面對九頭蛇這種怪獸,召集九個有能力對付一條蛇的獵人,一起投入戰鬥。

Sharding 的具體做法是把一個 Database 切分成幾個部分放到不同的伺服器上,以分散式的手段增強資料庫的性能。Sharding 又有水平切分和垂直切分的區別,如果資料庫中 table 較多,可以把不同的表放在不同的伺服器上,這便是垂直切分。如果某些 table 的數據量特別大,需要對其進行水平切分,將這個表的數據分發到多個伺服器上。在互聯網應用場景,一般以水平切分為主,實現上以資料庫中間件(Database middleware)為主,之後的討論不特別說明的情況,Sharding 都是指水平切分。

由於原理上的限制,Sharding方案幾乎很難做到有效的擴展。比如,某大型互聯網應用預測需要 Sharding 5 台資料庫,數據分發策略為:

hash(some_field_in_record) % 5

後來由於業務訪問量增加,需要 7 台資料庫伺服器的時候,相應的數據分發策略為:

hash(some_field_in_record) % 7

為了保障老數據還能夠正確的訪問,這裡就需要做數據的重新分發了,那麼大數量的數據重新載入,是一個很漫長而痛苦的過程。互聯網應用,一般都不能承受如此長時間的服務中斷。可以選擇在備庫上操作,但是過程相當也煩瑣。

當然,深入一點的有一致性 Hash 演算法,但往往會造成分片資料庫之間的負載傾斜,理論上並無很好的解決辦法。

另外,Sharding 方案對事務的支持蛻化嚴重,有 Sharding 表參與的關聯大部分需要應用開發者自己實現其邏輯。

Sharding middleware works well for simple operations like reading or updating a single record.It is more difficult, however, to execute queries that update more than one record in a transaction or join tables.

最終一些公司放棄了 Sharding 中間件的努力,開始開發它們自己的資料庫管理系統,開啟了 NoSQL 之路。傳統的資料庫系統往往為了一致性和正確性,而犧牲了高可用性和高性能。這種 trade-off 對於基於 Web 的互聯網應用是不合適的,它們需要更多的是系統的高可用性和高並發下的性能,被關係型資料庫拒之門外的非結構化數據也是這一過程重要的推手。創新之路最早開始對於一些簡單的互聯網應用,它們只是重複不斷地寫入記錄,根據主鍵執行 look-up 查詢,這樣一來,關係模型和 SQL 都成了累贅,數據的寫入和查詢都是通過更為高效的 API 來完成,因此,最開始 NoSQL 是 No more SQL 的簡稱。

後來,在易用性上也有一些系統慢慢加入了部分 SQL 的支持,除此之外, NoSQL 在高可用性、性能等方面也有著不錯的表現,NoSQL 最終演變成 Not Only SQL。

然而,放棄了關係模型,支持的 SQL 也只是標準的一小部分,在 API 方面 NoSQL 沒有也不可能有一個通用的標準,也就是在 NoSQL A 系統上運行的應用是不可能遷移到 NoSQL B 上的,也就是平常我們所說的技術棧綁定。NoSQL 更像是一個桀驁不馴的野馬,伯樂視之若千里馬,也有人被摔的鼻青臉腫。

NoSQL 中兩個最有名的系統當屬 Google 的 Bigtable 和 Amazon 的 Dynamo 了,它們開始都是只對內服務的(現在已經開放為雲服務),其他的企業和組織開始根據它們的設計理念,集結開源社區的力量,創建了幾個有名的系統,包括 Cassandra, HBase 和 MongoDB。

NewSQL 的回歸

計算機行業的發展是一個很有趣的過程,一些對自己需求、現有系統充分了解的大牛們,嫌棄現存的系統對他們強加了太多的限制,於是他們另起爐灶,搞了一套新的好用的東西。之後為了造福於天下,惠及眾生,接入了通用性,加入各種各樣的介面和規範,成了標準化的產品,繼續被新一輪大牛嫌棄並拋棄。

引入了分散式的架構的 NoSQL,在擴展性、高可用性和性能上相對於傳統關係型資料庫有著很大的提升,然而它們付出的代價是去除了事務支持和關係模型,同時,大部分系統都為了高可用性而放棄了系統的強一致性,而採用最終一致性模型,加上缺少 SQL 和統一的 API 規範,普通的應用開發者很難在這樣的系統上正確地構建他們互聯網應用。包括 Google 內部的應用開發人員,也有著類似的抱怨。

Developers of many OLTP applications found it difficult to build these applications without a strong schema system, cross-row transactions, consistent replication and a powerful query language.

OLTP 應用開發者關注的重點在資料庫的高並發、事務的支持上,這些事務的讀寫,具有以下幾個典型特徵:

1.Short-lived (i.e., no user stalls)

2.Touch a small subset of data using index lookups (i.e., no full table scans or large distributed joins)

3.Repetitive (i.e., executing the same queries with different inputs)

而之後的數據分析、數據挖掘等,則不屬於 OLTP 的範疇,也不屬於 NewSQL 針對的場景。

NewSQL 是某種程度的回歸,它試圖重新拾起被 NoSQL 拋棄的 ACID,ACID 是資料庫事務正確執行的四個基本要素,也就是 NewSQL 試圖重拾事務。

  • Atomicity 原子性
  • Consistency 一致性
  • Isolation 隔離性
  • Durability 持久性

這裡的一致性,與分散式系統常說的一致性並非同一個概念,傳統關係型資料庫往往是單機版的,這裡的一致性指的是事務,不管成功與否,都不會破壞任意已經定義好的關於數據的約束,比如外鍵約束。而分散式系統中的一致性,也並不是同一份數據的多個副本是完全一致的,而是說不同的觀察者,對於同一個數據,讀取的內容是一致的。

引入了事務的支持,NewSQL 為了更好的解放開發者,進一步加入了 SQL 的支持和分散式一致性的支持。

NewSQLs enable applications to execute a large number of concurrent transactions to ingest new information and modify the state of the database using SQL (instead of a proprietary API). If an application uses a NewSQL DBMS, then developers do not have to write logic to deal with eventually consistent updates as they would in a NoSQL system.

在 Whats Really New with NewSQL? 那篇文章里,作者對於當前存在的 NewSQL 資料庫,大致有以下三個分類:

採用全新架構的新系統

分散式 Shared-nothing 基因,零歷史包袱,多節點並發控制,多副本容錯,分散式查詢與優化。

Send the query to the data rather than bring the data to the query

獨立管理數據存儲,對數據有更直接、更細粒度的控制,不依賴現有的分散式存儲系統、分散式文件系統。

Examples: ClustrixDB,CockroachDB,Google Spanner,MemSQL,NuoDB

重新實現的 Sharding 中間件

中心化的中間件負責查詢分發、協調事務處理、管理數據與副本分布、節點管理;數據節點負責數據的存儲與查詢,並接收中間件發來的讀寫請求,返回結果等。

對應用呈現了一個單體的邏輯層的資料庫,不需要修改底層的DBMS。基於傳統 RDBMS 的應用甚至可以不修改任何代碼就能夠無縫的遷移。

Examples: AgilData Scalable Cluster,MariaDB MaxScale,ScaleArc,ScaleBase.

全新架構的雲資料庫

DataBase as a Service(DBaaS),雲服務提供商負責運維,用戶只需按需申請資源並按需付費。

Examples: Amazon Aurora,ClearDB.

從文章作者流露於紙面的態度,我們做一個越俎代庖的猜測,作者並不是很認可分類二,有興趣的同學可以閱讀一下原文。另外,其他的 NewSQL 系統也注意到了協議兼容的好處,比如 CockroachDB 兼容 PostgreSQL wire protocol,ClustrixDB 號稱兼容 MySQL 等。

Really new ?

回歸到 NewSQL 的 New 之爭,這部分過於專業,還是建議感興趣的同學們閱讀原文,我們在這裡只一個大概的總結。在 Whats Really New with NewSQL?(文章地址:db.cs.cmu.edu/papers/20) 文章作者從以下幾個方面,對 NewSQl 所採用的技術進行了分析:

  • 面向內存的存儲
  • 數據分區
  • 並發控制
  • 二級索引
  • 副本機制
  • 故障恢復

The main takeaway from our analysis is that NewSQL database systems are not a radical departure from existing system architectures but rather represent the next chapter in the continuous development of database technologies. Most of the techniques that these systems employ have existed in previous DBMSs from academia and industry. But many of them were only implemented one-at-a-time in a single system and never all together. What is therefore innovative about these NewSQL DBMSs is that they incorporate these ideas into single platforms. Achieving this is by no means a trivial engineering effort. They are by-products of a new era where distributed computing resources are plentiful and affordable, but at the same time the demands of applications is much greater.

陽光之下,並無新事。NewSQL 所採用的各種技術已經廣泛應用在多個資料庫中,只是這一次,NewSQL 把這些技術組合在了一起。作者期待 NewSQL 開啟一個新的時代,肯定了 NewSQL 特別是 NewSQL 在工程方面的成就,畢竟:

Distributed systems engineering is full of tradeoffs.

未來之光 HTAP

業務的支撐、數據的採集只是企業數據閉環中的一部分,盤活數字資產,打造數據驅動型、商務智能型的公司,是當前互聯網行業的一大願景。然而,由於底層數據的存儲結構很難同時折中 Fast analytics 和 Fast inserts and updates 的性能,當今大部分企業依然需要藉助於另外一套系統——OLAP。

OLTP 流入系統的數據,通過源源不斷 ETL 等過程,導入到 OLAP 分析型資料庫,之後通過報表分析和數據挖掘、機器學習等手段,生成決策結果,反作用於業務,調整業務,構成數據閉環。

同時維護了兩套數據的 OLTP 和 OLAP 由於數據的冗餘,成倍增加了系統的存儲開銷;依賴於 ETL 的數據複製,決策系統的時效性受到了很大的影響;同時,固定時間的 ETL 過程也對兩個系統的性能施加了很大的壓力。

人們對大統一的追求是永無止境的。在 Whats Really New with NewSQL? 文章中,作者預測資料庫系統的下一個大的趨勢就是整合 OLTP 和 OLAP,也就是所謂的 Hybrid Transaction-Annlytical Processing。

大數據巨頭 Cloudera 在 2015 年推出的 Kudu 存儲引擎試圖達到這一目標,不過根據目前的 Google trends,這個項目並沒有太火。NewSQL 中的諸多廠商都有這樣的 Roadmap(雖有廠商號稱它們已經是 HTAP 系統,但筆者更傾向於這是一個任重道遠的任務),比如 CockroachDB,ClustrixDB,MemSQL。

借一張圖來說明 HTAP 的優勢。

參考文獻

[1] Codd, E.F (1970). "A Relational Model of Data for Large Shared Data Banks". Communications of the ACM. Classics. 13 (6): 377–387.

[2]Andrew Pavlo , Matthew Aslett, Whats Really New with NewSQL?, ACM SIGMOD Record, v.45 n.2, June 2016 [doi>10.1145/3003665.3003674]

[3] J. C. Corbett, J. Dean, M. Epstein, A. Fikes, C. Frost, J. Furman, S. Ghemawat, A. Gubarev, C. Heiser, P. Hochschild, W. Hsieh, S. Kanthak, E. Kogan, H. Li, A. Lloyd, S. Melnik, D. Mwaura, D. Nagle, S. Quinlan, R. Rao, L. Rolig, Y. Saito, M. Szymaniak, C. Taylor, R. Wang, and D. Woodford. Spanner: Google』s Globally-Distributed Database. In OSDI, 2012.

[4] David F. Bacon, Nathan Bales, Nico Bruno, Brian F. Cooper, Adam Dickinson, Andrew Fikes, Campbell Fraser, Andrey Gubarev, Milind Joshi, Eugene Kogan, Alexander Lloyd, Sergey Melnik, Rajesh Rao, David Shue, Christopher Taylor, Marcel van der Holst, and Dale Woodford.2017. Spanner: Becoming a SQL System. In Proceedings of the 2017 ACM International Conference on Management of Data (SIGMOD 17). ACM, New York, NY, USA, 331-343. DOI: doi.org/10.1145/3035918

[5] ClustrixDB. clustrix.com/

[6] CockroachDB. cockroachlabs.com/

[7] Navigational database.

en.wikipedia.org/wiki/N

[8] Kudu. kudu.apache.org/


推薦閱讀:

1.3 Mysql 安裝與使用-基礎配置-NodeJs+Express+Mysql實戰
MySQL時間序列存儲引擎的設計與實現
sysbench測試類型oltp 執行了哪些操作
為何Redis用樂觀鎖,而MySQL資料庫卻沒有?
memcached 和 mysql 結合使用的兩種實現選擇?

TAG:MySQL | 資料庫 |