新財年,阿里雲表格存儲還想再找幾個專家
來自專欄 分散式NoSQL資料庫
2017年,表格存儲在杭州、北京、上海均組建了研發團隊。新的一年,業務多點開花,發展速度很快,對引擎穩定和新功能發布會提出更高挑戰,因此我們希望再尋找3~4人,地點在杭州、北京、上海。
去年的招聘貼裡面,我們曾經介紹過表格存儲,重複的就不說了(原文會貼在最後)。在剛過去的這個財年,我們上線了全自動負載均衡系統,有了這個功能,系統會自動在全集群內削峰填谷,運維不再為突然暴漲的業務困擾,用戶不必絞盡腦汁評估未來業務規模,也不必為購買何種實例規格而困擾,這是真正的「為使用付費」。同時,系統也會持續不斷的對每張表使用不同的壓縮演算法和壓縮參數進行採樣,最終每張表都將被賦予最合適的壓縮配置。我們優化了讀寫代碼路徑以大幅度降低延時絕對值和性能波動範圍,也做了自動配置計算以適配異構機器,也將在幾個月後發布一些激動人心的新功能。除此之外,我們還安排時間做了較大的代碼重構,讓人和代碼互相熟悉,作為程序員,我們明白代碼絕不僅僅是工具...
今年的招聘,我們希望多一些專業上的寬度,可以說是既寬鬆又嚴格。寬鬆是不要求有資料庫內核(存儲、事務、查詢)開發經歷,嚴格是說在分散式系統涉及的相關方面(編碼壓縮,一致性,容錯系統,操作系統內核,性能優化等)有較深的鑽研,是某個細分領域的專家。我們也歡迎有代碼能力的資深DBA一起改進系統,讓面向運維融入系統的每個模塊。歡迎自薦推薦。
表格存儲技術交流群:
- 釘釘(活躍,各種諮詢、討論較多)
- 微信(不活躍,僅為方便聯繫)
https://weixin.qq.com/g/AQVodwEG2oo-96tM (二維碼自動識別)
以下是去年招聘內容:
表格存儲(TableStore)於阿里雲建立之初的2009年立項開發,對標Google 三駕馬車(GFS, BigTable, Map-Reduce)中的BigTable。經過8年的打磨,表格存儲已經在阿里巴巴集團內部獲得了廣泛的使用,涵蓋電商、金融、日誌、互聯網社交、物聯網等業務領域,支撐著阿里巴巴集團的許多基礎應用,包括郵箱和釘釘等。隨著公有雲的興起,表格存儲在2013年正式對開發者提供服務,開發者豐富的場景進一步打磨了表格存儲的易用性,穩定性和性能。隨著阿里雲全球化的業務擴展,表格存儲作為基礎產品之一也完成了全球部署,在阿里雲全球每一個數據中心,用戶都可以開通表格存儲服務。
要做好一款資料庫,除了由衷的熱愛,更需要數年持續不斷的學習和改進。
過去的幾年,我們一方面專註打磨存儲引擎,在架構和工程方面做了一系列優化:索引文件格式的優化來降低內存的需求;細緻的數據編碼來降低存儲成本;數據收發零拷貝;小對象序列化和反序列化的性能優化;無鎖的數據結構來減少衝突和線程切換;run2complete來減少context switch的開銷等。第二方面,在分散式存儲,多租戶的支持,自動分裂和負載均衡方面積累了大量的創新,提供了性能和容量的水平擴展,實現自動的負載調度和均衡,提供多租戶的隔離,和多集群(同城、異地)之間的複製等。第三方面,緊貼業務需求,滿足互聯網應用和cloud-native應用的高並發和高吞吐的需求,推出了一系列賦能客戶應用和架構的功能,PK列串列自增功能,極大地簡化了釘釘架構和互聯網IM應用的架構;多版本和TTL功能,簡化用戶數據的管理和減少存儲成本;Stream功能,增量修改的實時導出,與批量和實時計算系統的無縫連接;基於主鍵前綴的事務,方便用戶更好的完成業務邏輯等等。
當下,表格存儲挑戰無處不在。隨著人工智慧和物聯網的興起,數據的價值被更廣泛的挖掘。第一,數據量指數級的增長,容災,全球訪問等需求凸顯出來,我們需要打造一個跨地域的分散式表格存儲。第二,數據模型的多樣化和訪問的多樣化,Key-value,Document,多級索引,SQL查詢等,我們需要打造一個支持多種數據模型和查詢方式的表格存儲。第三,數據價值的挖掘,對接多樣化的AI和計算平台,我們需要打造一個開放生態的表格存儲。
歡迎加入,一起打造表格存儲2.0,這裡將是一個展現你實力的舞台。
工作地點:杭州、北京、上海
簡歷/諮詢可以發至shiquany at http://gmail.com 或者留言、私信
技能要求:
- 良好的C/C++編程能力,寫過大型系統更佳
- 熟悉NoSQL資料庫或者關係型資料庫存儲底層原理,閱讀過開源代碼更佳
- 熟悉資料庫事務/一致性協議/SQL引擎優化,閱讀/實現過相關功能更佳
- 基本功過硬(演算法、數據結構、代碼能力),熱愛編程,即使沒有相關經驗,也非常歡迎
原文鏈接:https://zhuanlan.zhihu.com/p/26938784
看到這句話說明是真愛,歡迎轉發^_^
推薦閱讀:
※論文筆記:[SRDS 2004] The Phi Accrual Failure Detector
※閱讀筆記:PowerGraph: Distributed Graph-Parallel Computation on Natural Graphs
※面試必備:什麼是一致性Hash演算法?
※集群資源調度系統設計架構總結
※Designing Data-Intensive Applications 讀書筆記 - 第五章 Replication