似是而非的JS - 非同步調用可以轉化為同步調用嗎?

源起

小飛是一名剛入行前端不久的新人,因為進到了某個大公司,儼然成為了學弟學妹眼中大神,大家遇到js問題都喜歡問他,這不,此時他的qq彈出了這樣一條消息

"hi,大神在嗎?我有個問題想問,現在我們的代碼裡面有這樣的東西,可是得不到正確的返回結果

function getDataByAjax () {nreturn $.ajax(...postParam)n}nvar data = getDataByAjax()nif (data) {n console.log(data.info)n}n

"哦,你這裡是非同步調用,不能直接獲得返回值,你要把if語句寫到回調函數中",小飛不假思索的說到,對於一個『專業』的fe來說,這根本不是一個問題。

「可是我希望只是改造getDataByAjax這個方法,讓後面的代碼成立。」

「研究這個沒有意義,非同步是js的精髓,同步的話會阻塞js調用,超級慢的,但是你要一再堅持的話,用async:true就好了」

「不愧是大神,我回去立刻試一試,么么噠」

兩天後,她哭喪著臉登上了qq

「試了一下你的方法,但是根本行不通,哭~~」

「別急,我看看你這個postParam的參數行嗎」

{n...n dataType: jsonp,nasync: truen...n}n

"這是一個jsonp請求啊,老掉牙的東西了,,jsonp請求是沒有辦法同步的"

「我知道jsonp請求的原理是通過script標籤實現的,但是,你看,script也是支持同步的呀,你看w3school.com.cn/tags/at

「額,那可能是jquery沒有實現吧,哈哈」

「大神,你能幫我實現一個jsonp的同步調用方式嘛,拜託了(星星眼)」

雖然他有點奇怪jquery為什麼沒有實現,但是既然w3school的標準擺在那裡,碼兩行代碼又沒什麼,

export const loadJsonpSync = (url) => {nvar result;n window.callback1 = (data) => (result = data)nlet head = window.document.getElementsByTagName(head)[0]nlet js = window.document.createElement(script)n js.setAttribute(type, text/javascript)n js.setAttribute(async, sync)nnn// 這句顯式聲明強調src不是按照非同步方式調用的n js.setAttribute(src, url)n head.appendChild(js)nreturn resultn}n

額,運行起來結果竟然是undefined!w3cshool的文檔竟然也不準,還權威呢,我看也不怎麼著,小飛暗自想到。

「剛才試了一下,w3school文檔上寫的有問題,這個非同步屬性根本就是錯的」

「可是我剛還試過一次這個,我確認是好的呀」

<script src="loop50000 && put(frist).js"></script>n<script src="put(second).js"></script>n

(有興趣的同學可以實現以下兩個js,並且加上async的標籤進行嘗試。)

「這個,我就搞不清楚了」,小飛訕訕的說到

對方已離線

抽象

關於這個問題,相信不只是小飛,很多人都難以解答。為什麼ajax可以做到同步,但jsonp不行,推廣到nodejs上,為什麼readFile也可以做到同步(readFileSync),但有的庫卻不行。

(至於script的async選項我們暫時避而不談,是因為現在的知識維度暫時還不夠,但是不要著急,下文中會給出明確的解釋)

現在,讓我們以計算機科學的角度抽象這個問題:

我們是否可以將非同步代碼轉化為同步代碼呢?(ASYNCCALL => SYNCCALL)

既然是抽象問題,那麼我們就可以不從工程角度/性能角度/實現語言等等等方面來看(同步比非同步效率低下),每增加一個維度,複雜程度將以幾何爆炸般增長下去。

首先,我們來明確一點,==在計算機科學領域==同步和非同步的定義

同步(英語:Synchronization),指對在一個系統中所發生的事件(event)之間進行協調,在時間上出現一致性與統一化的現象。在系統中進行同步,也被稱為及時(in time)、同步化的(synchronous、in sync)。--摘自百度百科

非同步的概念和同步相對。即時間不一致,不統一

明確了這一點,我們可以藉助甘特圖來表示同步和非同步

其中t1和t2是同步的,t1和t3是非同步的。

答案就在操作系統原理的大學教材上,我們有自旋鎖,信號量來解決問題,偽代碼如下

spinLock () {n// 自旋鎖n fork Wait 3000 unlock() //開啟一個非同步線程,等待三秒後執行解鎖動作n loop until unlock // 不斷進行空循環直到解鎖動作nPut unlockn}nn//pv原語,當信號量為假時立即執行下一步,同時將信號量置真n//反之將當前執行棧掛起,置入等待喚醒隊列n//uv原語,將信號量置為假,並從等待喚醒隊列中喚醒一個執行棧nSemaphore () {n pv()n fork Wait 3000 uv()n pv()n uv()nPut unlockn}n

很好,至此都可以在操作系統原理的教材上翻到答案。於是我們在此基礎上添加約束條件

僅僅依賴於js本身,我們是否可以將非同步代碼轉化為同步代碼呢?(ASYNCCALL => SYNCCALL)

論證

帶著這個問題,我們翻看一下jquery的源碼

github.com/jquery/jquer

可以看出, ajax的同步機制本質上是由XMLHttpRequest實現的,而非js原生實現。

同樣的道理,我們再翻看一下nodejs的源碼

github.com/nodejs/node/

從readFileSync->tryReadSync->readSync一路追下去,會追到一個c++ binding, github.com/nodejs/node/

if (req->IsObject()) {n ASYNC_CALL(read, req, UTF8, fd, &uvbuf, 1, pos);n} else {n SYNC_CALL(read, 0, fd, &uvbuf, 1, pos)n args.GetReturnValue().Set(SYNC_RESULT);n}n

同步的奧妙在於c++的宏定義上,這是一種藉由c++來實現的底層同步方式。

觀察了這兩種最廣泛的非同步轉同步式調用,我們發現均沒有採用js來實現。

似乎從現象層面上來看js無法原生支持,但是這還不夠,我們探究在js語義下上面的自旋鎖/信號量的特性模擬實現(我知道你們一定會嗤之以鼻,==js本身就是單線程的,只是模擬了多線程的特性== 我無比贊同這句話,所以這裡用的不是實現,而是特性模擬實現),另外,由於settimeout具有fork相似的非同步執行特性,所以我們用setitmeout暫時代替fork

自旋鎖

1.第一個實現版本

var lock = truensetTimeout(function () {nlock = falsen}, 5000)nnwhile(lock);nconsole.log(unlock)n

我們預期在5000ms後執行unlock語句,但是悲劇的是,整個chrome進程僵死掉了。

為了解釋清楚這個問題,我們讀一下阮一峰老師的event loop模型

ruanyifeng.com/blog/201

看樣子咱們已經清楚的了解了event loop這個js運行順序的本質(同步執行代碼立即執行,非同步代碼入等待隊列),那麼,我們可以基於此給出js vm的調度實現(eventloop的一種實現),當然,咱們為了解釋自旋鎖失敗只需要模擬非同步操作, 同步操作,和循環就好

//taskQueue:任務隊列n//runPart:當前正在執行的任務(同步指令集)n//instruct: 正在執行的指令nnfunction eventloop (taskQueue) {nwhile(runPart = taskQueue.shift()) {nwhile(instruct = runPart.shift()) {nconst { type, act, codePart } = instructnswitch(type) {ncase SYNC:n console.log(act)nif (act === loop)n runPart.unshift({n act: loop,n type: SYNCn})nbreakncase ASYNC:n taskQueue.push(codePart)nbreakn}n}n}n}n

然後轉化我們的第一個版本自旋鎖

let taskQueue = [n[n{act: var lock = true, type: SYNC}, //var lock = truen{n act: setTimeout,n type: ASYNC,n codePart: [n{act: lock = false, type: SYNC}n]n}, // setTimeout(function () { lock = false }, 5000)n/*{n act: loop,n type: SYNCn },*/ // while(lock);n{n act: console.log(sync),n type: SYNCn} // console.log(unlock)n]n]n

測試一下,符合evnet loop的定義,然後放開注釋,我們成功的讓loop block住了整個執行過程,lock = false永遠也沒有機會執行!!!

(真實的調度機制遠比這個複雜的多得多的,有興趣的可以看看webkit~~~的jscore的實現哈)

知道了原理,我們就來手動的改進這部分代碼

2.改進的代碼

var lock = truensetTimeout(function () {nlock = falsen console.log(unlock)n}, 5000)nnfunction sleep() {nvar i = 5000nwhile(i--);n}nnvar foo = () => setTimeout(function () {n sleep()nlock && foo()n})nfoo()n

這個版本的改進我們對while(true);做了切塊的動作,實際上這種技巧被廣泛的應用到改善頁面體驗的方面,所以,有些人因為時序無法預知而抗拒使用settimeout這種想法是錯誤的!

blog.csdn.net/kongls08/

小測驗1: 改寫eventloop和taskQueue,使它支持改進後的代碼

可是,如果把代碼最後的foo() 變成 foo() && console.log(wait5sdo),

我們的代碼依然沒有成功,why

注意看我們標紅的地方,如果你完成了小測驗1,就會得到和這張圖一致的順序

==同步執行的代碼片段必然在非同步之前。==

所以,無論從理論還是實際出發,我們都不得不承認,在js中,把非同步方法改成同步方法這個命題是水月鏡花

哦對了,最後還需要解釋一下最開始我們埋下的坑, 為什麼jsonp中的async沒有生效,現在解釋起來真的是相當輕鬆,即document.appendChild的動作是交由dom渲染線程完成的,所謂的async阻塞的是dom的解析,而非js引擎的阻塞。實際上,在async獲取資源後,與js引擎的交互依舊是push taskQueue的動作,也就是我們所說的async call

推薦閱讀: 關於dom解析請大家參考webkit技術內幕第九章資源載入部分

峰迴路轉

相信很多新潮的同學已經開始運用切了async/await語法,在下面的語法中,getAjax1和console之間的具有同步的特性

async function () {nvar data = await getAjax1()n console.log(data)n}n

講完了event loop和非同步的本質,我們來重新審視一下async/await。

老天,這段代碼親手推翻了==同步執行的代碼片段必然在非同步之前。== 的黃金定律!

驚不驚喜,意不意外,這在我們的模型里如同三體里的質子一樣的存在。我們重新審視了一遍上面的模型,實在找不到漏洞,找不到任何可以推翻的點,所以真的必須承認,async/await絕對是一個超級神奇的魔法。

到這裡來看我們不得不暫時放棄前面的推論,從async/await本身來看這個問題

相信很多人都會說,async/await是CO的語法糖,CO又是generator/promise的語法糖,好的,那我們不妨去掉這層語法糖,來看看這種代碼的本質, 關於CO,讀的人太多了,我實在不好老生常談,可以看看這篇文章,咱們就直接繞過去了,這裡給出一個簡易的實現

cnblogs.com/jiasm/p/580

function wrap(wait) {nvar itern iter = wait()nconst f = () => {nconst { value } = iter.next()n value && value.then(f)n}n f()n}nnfunction *wait() {nvar p = () => new Promise(resolve => {n setTimeout(() => resolve(), 3000)n})nyield p()n console.log(unlock1)nyield p()n console.log(unlock2)n console.log(its sync!!)n}n

終於,我們發現了問題的關鍵,如果單純的看wait生成器(注意,不是普通的函數),是不是覺得非常眼熟。這就是我們最開始提出的spinlock偽代碼!!!

這個已經被我們完完全全的否定過了,js不可能存在自旋鎖,事出反常必有妖,是的,yield和*就是表演async/await魔法的妖精。

generator和yield字面上含義。Gennerator叫做生成器,yield這塊ruby,python,js等各種語言界爭議很大,但是大多數人對於『讓權』這個概念是認同的(以前看到過maillist上面的爭論,但是具體的內容已經找不到了)

擴展閱讀---ruby元編程 閉包章節yield(ruby語義下的yield)

所謂讓權,是指cpu在執行時讓出使用權利,操作系統的角度來看就是『掛起』原語,在eventloop的語義下,似乎是暫存起當時正在執行的代碼塊(在我們的eventloop裡面對應runPart),然後順序的執行下一個程序塊。

我們可以修改eventloop來實現讓權機制

小測驗2 修改eventloop使之支持yield原語

至此,通過修改eventloop模型固然可以解決問題,但是,這並不能被稱之為魔法。

和諧共存的世界

實際上通過babel,我們可以輕鬆的降級使用yield,(在es5的世界使用讓權的概念!!)

看似不可能的事情,現在,讓我們撿起曾經論證過的

==同步執行的代碼片段必然在非同步之前。== 這個定理,在此基礎上進行進行逆否轉化

==在非同步代碼執行之後的代碼必然不是同步執行的(非同步的)。==

這是一個圈子裡人盡皆知的話,但直到現在他才變得有說服力(我們繞了一個好長的圈子)

現在,讓我們允許使用callback,不使用generator/yield的情況下完成一個wait generator相同的功能!!!

function wait() {nconst p = () => ({value: new Promise(resolve => setTimeout(() => resolve(), 3000))})nlet state = {nnext: () => {n state.next = programPartnreturn p()n}n}nfunction programPart() {n console.log(unlocked1)n state.next = programPart2nreturn p()n}nfunction programPart2() {n console.log(unlocked2)n console.log(its sync!!)nreturn {value: void 0}n}nreturn staten}n

太棒了,我們成功的完成了generator到function的轉化(雖然成本高昂),同時,這段代碼本身也解釋清楚了generator的本質,高階函數,片段生成器,或者直接叫做函數生成器!這和scip上的翻譯完全一致,同時擁有自己的狀態(有限狀態機)

推薦閱讀 計算機程序的構造和解釋 第一章generator部分

小測驗3 實際上我們提供的解決方式存在缺陷,請從作用域角度談談

其實,在不知不覺中,我們已經重新發明了計算機科學中大名鼎鼎的CPS變換

en.wikipedia.org/wiki/C

最後的最後,容我向大家介紹一下facebook的CPS自動變換工具--regenerator。他在我們的基礎上修正了作用域的缺陷,讓generator在es5的世界裡自然優雅。我們向facebook脫帽致敬!!github.com/facebook/reg

後記

同步非同步 可以說是整個圈子裡面最喜歡談論的問題,但是,談來談去,似乎絕大多數變成了所謂的『約定俗稱』,大家意味追求新技術的同時,卻並不關心新技術是如何在老技術上傳承發展的,知其然而不知其所以然,人云亦云的寫著似是而非的js。

==技術,不應該浮躁==

PS: 最大的功勞不是CO,也不是babel。regenerator的出現比babel早幾個月,而且最初的實現是基於esprima/recast的,關於resprima/recast,國內似乎了解的並不多,其實在babel剛剛誕生之際, esprima/esprima-fb/acron 以及recast/jstransfrom/babel-generator幾大族系圍繞著react產生過一場激烈的鬥爭,或許將來的某一天,我會再從實現細節上談一談為什麼babel笑到了最後~~~~

推薦閱讀:

酷盤停止服務了, 如何看待這個問題?
如何同步一份日程給公司所有人?
Dropbox 好在哪裡?
印象筆記Evernote同步失敗怎麼辦?
100個節拍器同時啟動最後自行同步是什麼原理?

TAG:异步 | JSONP | 同步 |