計算機論文精選-20180531

計算機論文精選-20180531

來自專欄計算機論文精選

1. A NonStop Kernel 【SOSP 1981】

本文描述了NonStop操作系統內核的關鍵原語(primitive)。用這些原語描述了一個允許容錯的資源接入的機制,進程對。

NonStop是由天騰電腦公司於1976年推出的一系列伺服器計算機,從NonStop 產品線開始,其後是惠普Integrity NonStop 產品線擴展。NonStop系統是一個容錯的、可擴展的、專為在線交易處理而設計的分散式計算機系統。由於NonStop系統是基於集成的硬體/軟體堆棧,所以惠普還為他們開發了一種特殊的操作系統:NonStop OS。NonStop系統經常被銀行,證券交易所,電信提供商和其他需要極高運行時間的企業使用。

NonStop系統在一定程度上是自我修復的。它使用多個獨立的相同處理器和冗餘存儲設備和控制器,以在硬體或軟體故障的情況下提供自動高速「 故障轉移 」。

NonStop系統具有大規模並行處理(MPP)架構,並提供線性可擴展性。每個CPU(系統可以擴展到多達4000個CPU)運行自己的操作系統副本。

傳統的多計算機系統都使用共享存儲器並直接在共享數據對象上工作。但是NonStop是一個「無共享」架構,這種「無共享」的安排也被稱為鬆散耦合的多處理。除了處理故障之外,這種「無共享 」的消息傳遞系統的設計也極大地適應了商業對於高負載的需求。處理器總數每增加一倍會讓系統吞吐量翻番,最多達到4000個處理器的頂配。相比之下,傳統的多處理器系統的性能受到某些共享存儲器,匯流排或開關的速度的限制。增加超過4到8個處理器也不會再提升系統速度。儘管是由較簡單的小型計算機技術構建,NonStop能夠很好地與IBM最大的大型機競爭。

2. Exploiting Virtual Synchrony in Distributed Systems 【SOSP 1987】

這篇文章描述了用於分散式編程的虛擬同步環境的應用,這是ISIS2系統中分散式編程工具集的基礎。虛擬同步環境允許進程被組織為進程組,使諸如廣播到組的事件成為一個實體,組成員變化,甚至一個活動從一個地方遷移到另一個地方似乎會立即發生。 換句話說,是同步地發生。這種方法的主要優點是分散式應用程序的許多方面可以被獨立處理,而不會影響正確性。而且,在假設是同步系統的基礎上設計的用戶代碼通常可以並行執行。作者表明,這種方法在構建分散式和容錯軟體時比其他方法更直接,更靈活,更有可能產生正確的解決方案。

ISIS項目和該研究的提出是因為當時的軟體開發方法不足以應對分散式系統應用的開發需求。該研究旨在為分散式編程提供一個工具包,以幫助解決分散式系統中最常見的子問題。在本文中提到的子問題有流程組和組通信,決定如何回應請求,並發,同步,複製數據,檢測和響應故障,動態重新配置,穩定存儲,恢復,事務,保護,一致性。每個子問題都對應了ISIS2中的一個單獨工具。

設計工具包的關鍵問題是確保這些工具的功能是正交的,因為正是這一點允許程序員將應用程序分解成可以獨立解決的組件,再逐漸將組件擴展成一個完整的系統。


更多內容請關注微信公眾號「論文精選」以及微信小程序「SkimPaper」,每天準時為您推薦體系結構、分散式系統、人工智慧等相關領域優秀論文解讀。同時也歡迎大家積極投稿,分享您讀到的優秀論文。

推薦閱讀:

從零開始開發一個單機存儲引擎
接受「不完美」:分散式事務學習總結
Elasticell和Jepsen測試
DevOps 漫談:基於OpenCensus構建分散式跟蹤系統
論文筆記:Paxos Made Simple

TAG:計算機科學 | 學術論文 | 分散式系統 |