Node的“事件循環”(Event Loop)是它能夠處理大並發、高吞吐量的核心。這是最神奇的地方,據此Node.js基本上可以理解成“單線程”,同時還允許在後台處理任意的操作。這篇文章將闡明事件循環是如何工作的,你也可以感受到它的神奇。
事件驅動編程
理解事件循環,首先要理解事件驅動編程(Event Driven Programming)。它出現在1960年。如今,事件驅動編程在UI編程中大量使用。JavaScript的一個主要用途是與DOM交互,所以使用基於事件的API是很自然的。
簡單地定義:事件驅動編程通過事件或狀態的變化來進行應用程序的流程控制。一般通過事件監聽實現,一旦事件被檢測到(即狀態改變)則調用相應的回調函數。聽起來很熟悉?其實這就是Node.js事件循環的基本工作原理。
如果你熟悉客戶端JavaScript的開發,想一想那些.on*()方法,如element.onclick(),他們用來與DOM元素相結合,傳遞用戶交互。這個工作模式允許在單個實例上觸發多個事件。Node.js通過EventEmitter(事件發生器)觸發這種模式,如在服務器端的Socket和 “http”模塊中。可以從一個單一實例觸發一種或一種以上的狀態改變。
另一種常見的模式是表達成功succeed和失敗fail。現在一般有兩種常見的實現方式。首先是將“Error異常”傳入回調,一般作為第一個參數傳遞給回調函數。第二種即使用Promises設計模式,已經加入了ES6。注* Promise模式采用類似jQuery的函數鏈式書寫方式,以避免深層次的回調函數嵌套,如:
代碼如下:
$.getJSON('/getUser').done(successHandler).fail(failHandler)
“fs”(filesystem)模塊大多采用往回調中傳入異常的風格。在技術上觸發某些調用,例如fs.readFile()附加事件,但該API只是為了提醒用戶,用來表達操作成功或失敗。選擇這樣的API是出於架構的考慮,而非技術的限制。
一個常見的誤解是,事件發生器(event emitters)在觸發事件時也是天生異步的,但這是不正確的。下面是一個簡單的代碼片段,以證明這一點。
代碼如下:
function MyEmitter() {
EventEmitter.call(this);
}
util.inherits(MyEmitter, EventEmitter);
MyEmitter.prototype.doStuff = function doStuff() {
console.log('before')
emitter.emit('fire')
console.log('after')}
};
var me = new MyEmitter();
me.on('fire', function() {
console.log('emit fired');
});
me.doStuff();
// 輸出:
// before
// emit fired
// after
注* 如果 emitter.emit 是異步的,則輸出應該為
// before
// after
// emit fired
EventEmitter經常表現地很異步,因為它經常用於通知需要異步完成的操作,但EventEmitter API本身是完全同步的。監聽函數內部可以按異步執行,但請注意,所有的監聽函數將按被添加的順序同步執行。
機制概述和線程池
Node本身依賴多個庫。其中之一是libuv,神奇的處理異步事件隊列和執行的庫。
Node利用盡可能多的利用操作系統內核實現現有的功能。像生成響應請求(request),轉發連接(connections)並委托給系統處理。例如,傳入的連接通過操作系統進行隊列管理,直到它們可以由Node處理。
您可能聽說過,Node有一個線程池,你可能會疑惑:“如果Node會按次序處理任務,為什麼還需要一個線程池?”這是因為在內核中,不是所有任務都是按異步執行的。在這種情況下,Node.JS必須能在操作時將線程鎖定一段時間,以便它可以繼續執行事件循環而不會被阻塞。
下面是一個簡單的示例圖,來表示他內部的運行機制:
┌───────────────────────┐
╭──►│ timers │
│ └───────────┬───────────┘
│ ┌───────────┴───────────┐
│ │ pending callbacks │
│ └───────────┬───────────┘ ┌──────────────┐
│ ┌───────────┴───────────┐ │ incoming: │
│ │ poll │◄──┤ connections, │
│ └───────────┬───────────┘ │ data, etc. │
│ ┌───────────┴───────────┐ └──────────────┘
╰───┤ setImmediate │
└───────────────────────┘
關於事件循環的內部運行機制,有一些理解困難的地方:
所有回調都會經由process.nextTick(),在事件循環(例如,定時器)一個階段的結束並轉換到下一階段之前預設定。這就會避免潛在的遞歸調用process.nextTick(),而造成的無限循環。
“Pending callbacks(待回調)”,是回調隊列中不會被任何其他事件循環周期處理(例如,傳遞給fs.write)的回調。
Event Emitter 和 Event Loop
通過創建EventEmitter,可簡化與事件循環的交互。它是一個通用的封裝,可以讓你更容易地創建基於事件的API。關於這兩者如何互動往往讓開發者感到混亂。
下面的例子表明,忘記了事件是同步觸發的,可能導致事件被錯過。
代碼如下:
// v0.10以後,不再需要require('events').EventEmitter
var EventEmitter = require('events');
var util = require('util');
function MyThing() {
EventEmitter.call(this);
doFirstThing();
this.emit('thing1');
}
util.inherits(MyThing, EventEmitter);
var mt = new MyThing();
mt.on('thing1', function onThing1() {
// 抱歉,這個事件永遠不會發生
});
上面的'thing1'事件,永遠不會被MyThing()捕獲,因為MyThing()必須在實例化後才能偵聽事件。下面的是一個簡單的解決方法,不必添加任何額外的閉包:
代碼如下:
var EventEmitter = require('events');
var util = require('util');
function MyThing() {
EventEmitter.call(this);
doFirstThing();
setImmediate(emitThing1, this);
}
util.inherits(MyThing, EventEmitter);
function emitThing1(self) {
self.emit('thing1');
}
var mt = new MyThing();
mt.on('thing1', function onThing1() {
// 執行了
});
下面的方案也可以工作,不過要損失一些性能:
代碼如下:
function MyThing() {
EventEmitter.call(this);
doFirstThing();
// 使用 Function#bind() 會損失性能
setImmediate(this.emit.bind(this, 'thing1'));
}
util.inherits(MyThing, EventEmitter);
另一個問題是觸發Error(異常)。找出您應用程序中的問題已經很難了,但沒了調用堆棧(注* e.stack),則幾乎不可能調試。當Error被遠端的異步請求調用堆棧將丟失。有兩個可行的解決方案:同步觸發或確保Error跟其他重要信息一起傳入。下面的例子演示了這兩種解決方案:
代碼如下:
MyThing.prototype.foo = function foo() {
// 這個 error 會被異步觸發
var er = doFirstThing();
if (er) {
// 在觸發時,需要創建一個新的保留現場調用堆棧信息的error
setImmediate(emitError, this, new Error('Bad stuff'));
return;
}
// 觸發error,馬上處理(同步)
var er = doSecondThing();
if (er) {
this.emit('error', 'More bad stuff');
return;
}
}
審時度勢。當error被觸發時,是有可能被立即處理的。或者,它可能是一些瑣碎的,可以很容易處理,或在以後再處理的異常。此外通過一個構造函數,傳遞Error也不是一個好主意,因為構造出來的對象實例很有可能是不完整的。剛才直接拋出Error的情況是個例外。
結束語
這篇文章比較淺顯地探討了有關事件循環的內部運作機制和技術細節。都是經過深思熟慮的。另一篇文章會討論事件循環與系統內核的交互,並展現NodeJS異步運行的魔力。