使用CUDA加速SQL查詢的研究狀況目前如何,未來的發展會怎樣?
01-13
最近看到UVA在做這方面的研究想要通過cuda來加速SQL的查詢
http://www.cs.virginia.edu/~skadron/Papers/bakkum_sqlite_gpgpu10.pdf
老方向了。甚至還有開源的系統 antonmks/Alenka
以及workshop http://gid.us.to/你這個問題是要問什麼?這個問題已經被研究過了。
遠一點的有2005年的Fast computation of database operations using graphics processors,近一點的有2010年的Accelerating SQL database operations on a GPU with CUDA。你說的未來的發展指的是什麼?如果說產業界的話,未來應該是有很大的市場空間的,資料庫需要更大的吞吐和更小的延遲,加速是很有前景的。學術界的話,類似課題十幾年前已經有研究了,基本的體系結構已有,不過還有很多課題可以研究,畢竟異構加速需要研究的東西太多了。現在大部分的GPU加速SQL都還在研究中,商業產品比較少。可以推薦一個比較好的產品 -- Kinetica,Kinetica - Fast, scalable and proven GPU database for massive datasets。關於GPU 加速database的研究,推薦看看這篇survey,湊合看吧,但是需要的知識點都提到了 Gpu-accelerated database systems: Survey and open challenges GPU-Accelerated Database Systems: Survey and Open ChallengesUvA 不是很熟,你指的是Peter?Ana? Peter是大牛,跟著走肯定沒錯的,他們最近的確有在做GPU 和 DB 的課題,可以關注以下他們在sigmod 16/17的文章?
如果說查詢方面的話postgresql里有個PGstorm,而且貌似很久了。
不過要說針對gpu優化,估計還是有很多方面可以繼續做的吧!scidb從存儲上支持向量存儲,繼續順著這個思路走,可以繼續拓展。另外,gpu優化還是要針對數據倉庫之類,數據密集一些,尤其是列存的場景下如何優化,或者說資料庫之上支持的圖片,視頻數據存儲如何進行gpu 處理方面資料庫更全面的查詢優化推薦閱讀:
※Oracle資料庫在違章表裡面,怎麼找出30天內違章大於3次的人?
※Python3 pandas如何加快SQL Server讀寫速度?
※請教一個SQL,詳情請看問題補充?
※為什麼用SQL而不是Excel+VBA?
※sql中為什麼select要放在from之前?