計算機論文精選-20180613

計算機論文精選-20180613

來自專欄計算機論文精選

1. BatchDB: Efficient Isolated Execution of Hybrid OLTP+OLAP Workloads for Interactive Applications【SIGMOD 17】

OLTP和OLAP是兩類重要的應用負載,通常都會保存兩份數據分別大家OLTP和OLAP系統,這種方式不僅存儲、系統維護成本很高,而且OLAP系統的數據往往不是最新的,導致不能實時進行決策。近些年,關於如何設計同時適用於OLTP和OLAP兩種負載的數據存儲系統成為了研究的熱點,比如SAP HANA、Hyper、MemSQL等,但是這些系統在同時執行兩種負載的時候,性能會有很大的干擾,相比執行單獨的負載,系統性能降低了3到5倍。這篇論文針對同時運行兩種負載帶來的性能干擾的問題提出了BatchDB.BatchDB以空間換性能隔離的策略,存儲的數據保存兩份,一份用於OLTP負載,一份用於OLAP負載,同時OLTP更新的數據及時的更新到OLAP的數據副本。兩個副本分別針對兩種負載進行優化,為了保證副本數據同步,BatchDB設計了一種新的query和update執行、調度的策略,並且使用了RDMA(基於InfiniBand)技術。通過使用TPCC和TPC-H對BatchDB進行評測,BatchDB比單獨的OLTP或者OLAP存儲引擎以及混合引擎性能都要好。

2. A Memory Bandwidth-Efficient Hybrid Radix Sort on GPUs【SIGMOD 17】

排序是許多資料庫操作的核心,例如索引創建,排序合併連接和用戶請求的輸出排序。隨著GPU表現出來的強大計算能力,在GPU上排序是一個優化排序的新的途徑。在過去的幾年裡,有一些GPU上的排序方法被提出,比如基數排序在GPU上的實現,可以達到每秒對32位的關鍵字進行數十億次排序。傳統CPU排序一個嚴重的問題就是內存帶寬的限制。本文提出一個新的排序方法可以減少將近一半的內存傳輸,對2GB的數據(每條記錄佔8位元組)可以在50ms完成排序。他們的方法主要是基於高效GPU排序方法和流水線異構排序演算法,減輕了與PCIe數據傳輸相關的開銷。本文提出的GPU排序方法,相比傳統的CPU排序方法具有很好的性能優勢,為排序提供了一個新的思路,具有重要的參考價值。


更多內容請關注微信公眾號「論文精選」以及微信小程序「SkimPaper」,每天準時為您推薦體系結構、分散式系統、人工智慧等相關領域優秀論文解讀。同時也歡迎大家積極投稿,分享您讀到的優秀論文。

推薦閱讀:

單機存儲引擎的基礎方法
硬碟任性丟數據,但分散式存儲一定可靠嗎?
CAP,ACID,我們能做什麼
結構化數據和非結構化數據存儲
基於量子糾纏的低延遲雙活存儲系統

TAG:排序演算法 | 圖形處理器GPU | 分散式存儲 |