標籤:

公有雲按秒計費的難度是什麼?

上周CSDN邀請我做了一次視頻直播:雲平台分散式調度系統的演進(註冊騰訊雲立享免費參課) - 直播課 - CSDN學院 - 在線學習教程 - 會員免費

由於沒有露臉,導致觀眾熱情不高,據我的托兒說最多也才百來個人在線觀看,好在問答環節挺激烈的,這也使我讓托兒準備的幾個防冷場問題都沒有用上

其中有個觀眾提的問題是:

AWS最近推出了按秒計費的能力,請問按秒計費這個功能的實現難度如何,有哪些重大挑戰?

其實當時我覺得這個問題不是一個特別好的問題,跟直播主題的關聯性也沒那大,就沒有花太多時間去回答。但近兩天又有幾個朋友在微信上跟我說,最近按秒計費這個東西被炒上天了,你們騰訊雲打不打算搞?

於是我打算花30分鐘快速寫完這篇文章,表達一下我的看法,當然這也只是我個人的看法,不代表也未接受任何其它個人和團體的看法和要求。

首先,很無奈的一點是,按秒計費特性的火爆遠遠超出了我的認知。

我好幾年前開始重新設計和開發了雲的調度框架(李力:國內的雲計算平台有沒有不是依靠 OpenStack 搭建的?)。上線運行一段時間後我又去做了一段時間vpc和cbs。2015年初我被調回cvm團隊時,做的第一個需求就是:虛擬機支持按秒計費

如果讓我回想當時做這個需求的難點和主要挑戰,我還真想不出什麼太典型的東西來 ,更多的事情反而是一些邏輯模塊本身由於初期的一些不合理的設計細節導致性能和可靠性的降低。因為按秒計費對監控粒度的要求非常高,並且它的結算周期的變短也導致了更大規模的計量計費,使得性能要求和實時性要求都相比原來大幅提高了。

我們的框架(可以看看文章上面的直播鏈接,好像已經免費了)設計的核心就是性能和可靠性保障,所以並未大動干戈,解決了一些具體的問題之後,按秒計費也就很快支持了。相信絕大部分用戶記不得我們是如何發布這個功能的,因為我們只是在官網上放了個鏈接,告訴大家可以來購買了。

我的錯愕便是由此而生,畢竟兩年前我比現在要輕10公斤,感官上已經是非常遙遠的歷史了,從未想到這會是2017年下半年雲計算領域一個時髦的辭彙。

我查了下知乎記錄,我還回復過相關的問題(李力:買一小時的雲計算服務可行嗎?)

以騰訊雲的按量計費主機為例,賬單明細是這樣的

不論是虛擬機、彈性外網IP還是彈性磁碟等資源,騰訊雲目前的模式都提供了按秒計算、按小時結算的模式。也就是說你所購買的資源可以只使用幾秒,價格也只會算這幾秒的錢,然後會在下一個小時的結算周期扣費。

在技術上,按量計費其實是比較簡單的,只需要把監控的能力做到細緻和準確就好了。

其次,我想探討一下按秒計費為啥能火?

也許是陰謀論,我隱約想到兩個原因

一是技術上的問題,二是宣傳上的問題。

先說技術上的問題吧。前文已經大概說過,在騰訊雲兩年多前做按秒計費時其實沒感覺太多要死要活的技術難關要攻克,大多只是一些局部的優化和加固。竊以為,也許在業界按秒計費變成一個重大特性的原因是,他們遇到了更多的問題。

既然要闡述兩年前的技術,引用我近兩年前的回答(李力:雲計算在中國的市場格局是怎樣的?)

雲計算要體現出革命性的突破,是需要挑戰到這麼多年來我們一直堅信和死守的運營實踐和技術基礎。

簡單的說,雲計算給技術帶來的挑戰就是——『堆疊』。虛擬化使計算、存儲、網路資源堆疊起來,從扁平化到有層次性,同時問題和故障也就堆疊起來了。我們需要事無巨細,把新架構帶來的新問題逐一攻破,比如存儲堆疊我們要用走網路的塊存儲,網路的堆疊要用sdn/vpc來代替vlan,kvm里影子表影響性能只能靠cpu的硬體特性來解決。

總的來說,所有的公有雲廠商做的事情都是——填坑。坑有無數個,有的坑淺,只是在扁平化時不重要;有些坑深,必須要集中力量將其填起,還要在長期的運營過程中不斷優化不斷改近;有些坑一眼望去怎麼也解決不了,那又要想辦法從它旁邊繞過去,最好還對用戶無感知。

那麼,對用戶來說,公有雲的意義是什麼呢?是幫用戶把坑填了,幫用戶把運營上能簡化的都簡化好了。用戶使用可靠的公有雲就相當於站在了可靠的運營能力和實踐經驗上。雲就是互聯網的水和電,用戶不用再自己購買劣質煤修建發電廠,甚至他都不用關心電廠在哪裡,從此他的生命中與此相關的就只有電網公司年薪百萬的抄表工了。

總的來說,即使是狹義的雲計算(虛擬機),它也是包羅萬象。在一個複雜的系統當中,調度和優化都因規模而指數增長。

就像是寫代碼,對於單個函數而言,我們總是要限制它的圈複雜度在一定的範圍之內,以便維護和閱讀,但不管是什麼技巧,如果一個項目的總體複雜性非常高,那麼它的複雜度總是要體現在某一個地方的。抽象、分層、不要重複、把邏輯交給該做的模塊、把坑交給別的團隊的人,都是減少複雜而不能消除複雜。

多年以後我們總是回過頭去看OpenStack,它的局部代碼優美無比,它的設計理念大氣潮流,它的語法糖用得精巧卓絕,但所有它沒有做的都變成了災難,比如高可用和性能。同樣是完成一組功能的系統,有的幾個人就能維護起來,有的需要數百人才搞得定。而後者往往會認為系統的複雜性是固有而非人為增加的,這樣的系統不僅替國家增加了就業率,減緩了社會壓力,也讓從業人員覺得高山仰止,安心做一顆螺絲釘,對動輒數個月做一個版本接納認同。

那麼,加班、奉獻、感動了很久之後,版本上線,符合預期,確實是讓人激動和亢奮。但是,如果你在挑戰本不應該有的挑戰,在解決自己獨創的問題,在感動別人的日常,那麼,我覺得這裡的意義就不是太大了。

這樣的故事很多,每次想到又有資本家多掏了那麼多工資,我都替他們感到惋惜。

當然了,也可能是我杞人憂天了,也許小夥伴們是每天工作三小時,然後在公司待十三個小時的呢,只是故意在宣傳上吹噓著一些功能,反正用戶也不一定懂嘛

輿論是可以引導的,薛之謙們只要肯掏錢,還能讓新浪微博的排序演算法發生變化呢。我們自以為是在獨立思考,天天接收著一大堆扭曲的信息,這些信息要麼傲慢,要麼偏見:只要是我有的,那就是東半球最牛逼的,只要是我沒有的,那就是SB才會用的……

即使是在技術領域,也充斥著各種導師、專家、先行者,統稱為大忽悠,他們有的是收了錢辦事,有的是純粹自己腦子進水,把一些瞎XX扯的東西吹成silver bullet,時常組織一些線下聚會,我年輕的時候去過幾次,聚會的topic一言以蔽之:XX大法好

香農的資訊理論里說了:越小概率的事發生了信息量越大。那麼我的產品沒有爆點,沒有做出小概率的事(難做的功能)應該怎麼辦呢?那就把好做的功能吹成難做的功能嘛,信息熵立馬指數級增加,順便創造出更多的就業崗位

胡扯這麼多,最後做個總結

雲計算里的工作並不總是高大上的,這應該是個常態,做好每一件事,填好每一個坑,牛逼了吹一吹,犯錯了趕緊改,要是覺得歲月靜好不刺激,那就多去重構重構框架吧

(午休時間到,上班去)


推薦閱讀:

一鍵清理網站木馬文件,從此網站擁有專屬保鏢 ——阿里雲虛擬主機推出木馬查殺功能
2017年資料庫技術盤點
阿里雲到底是個什麼東西,與亞馬遜的雲服務相比較,它處於什麼位置?
我國雲計算迎來「黃金窗口」期
虛擬雲桌面(基於VMware WSX)

TAG:雲計算 |