介紹
低層次的語言,如C,具有低級別的內存管理命令,如:malloc()和free(),需要開發者手工釋放內存。然而像javascript這樣的高級語言情況則不同,對象(objects, strings 等)創建的時候分配內存,當他們不在使用的時候內存會被自動回收,這個自動回收的過程被稱為垃圾回收。因為垃圾回收的存在,讓javascript等高級語言開發者產生了一個錯誤的認識,以為可以不用關心內存管理。
內存生命周期
不管什麼樣的編程語言,內存的生命周期基本上是一致的。
分配你需要的內存
使用他進行讀寫操作
當內存不需要的時候,釋放資源
步驟1和步驟2對於所有語言都一樣,能明顯覺察到。至於步驟3,低級別語言需要開發者顯式執行。而對於像javascript這樣的高級語言,這部分操作是交給解析器完成的,所以你不會覺察到。
javascript中的分配操作
值的初始化
在為變量賦值的時候,javascript會完成內存的分配工作。
. 代碼如下:
var n = 123; // 為數字分配內存
var s = "azerty"; // 為字符串分配內存
var o = {
a: 1,
b: null
}; // 為包含屬性值的object對象分配內存
var a = [1, null, "abra"]; // 為包含值的數組分配內存
function f(a){
return a + 2;
} // 為函數分配內存(函數是可調用的對象)
// 函數表達式同樣也是對象,存在分配內存的情況
someElement.addEventListener('click', function(){
someElement.style.backgroundColor = 'blue';
}, false);
通過函數調用完成分配
一些函數當執行完畢之後,同樣存在對象分配的情況發生。
. 代碼如下:
var d = new Date();
var e = document.createElement('div'); // 分配一個 DOM 元素
一些方法會分配新值或者對象。
. 代碼如下:
var s = "azerty";
var s2 = s.substr(0, 3); // s2 是一個新的字符串
// 由於字符串是不變的,javascript會為[0, 3]范圍的內容創建一個新的字符串
var a = ["ouais ouais", "nan nan"];
var a2 = ["generation", "nan nan"];
var a3 = a.concat(a2); // 把 a 和 a2 結合在一起,產生一個新的數組
對值的使用
對值的使用,其實也就是對分配後的內存執行讀寫操作。這些操作包括:對變量或者對象的屬性進行讀寫操作,或者向函數傳遞參數。
當不再需要的時候,釋放內存
絕大多數內存管理的問題都發生在這個階段。最難做的事情是,如何判定分配的內存不再需要。這往往需要開發者做出判定,程序在什麼時候不再需要內存,並釋放他所占資源。
高級語言的解析器中嵌入了一個叫做“垃圾收集器”的程序,他的工作是用來跟蹤內存的分配和使用,判定內存是否被需要,在不再需要的時候執行資源釋放操作。他只能獲得一個近似值,因為判斷一個內存是否被需要,這是個不確定的問題(不能通過一種算法解決)。
垃圾回收
正如上文所述,我們無法准確的做到自動判定“內存不再需要”。所以,垃圾回收對該問題的解決方案有局限性。本節將解釋必要的概念,了解主要的垃圾收集算法和它們的局限性。
引用
垃圾回收中一個主要的概念是引用。在內存管理中,當一個對象無論是顯式的還是隱式的使用了另外一個對象,我們就說他引用了另外一個對象。例如,javascript對象存在一個隱式的指向原型的引用,還有顯式指向他的屬性值的引用。
在這裡,對象的概念超出了javascript傳統意義上對象的概念,他還包括函數作用域和全局作用域。
使用引用計數算法的垃圾回收
下面要介紹的是一種最理想化的算法,引入了 “對象不再需要” 和 “沒有其他對象引用該對象” 的概念。當該對象的引用指針變為0的時候,就認為他可以被回收。
例子:
. 代碼如下:
var o = {
a: {
b:2
}
}; // 創建了兩個對象. 一個對象(a)被另外一個對象(o引用的對象)引用,並把a作為他的屬性
// 該對象又被變量o引用
// 很明顯,這時沒有對象能被回收
var o2 = o; // 變量 o2 再次引用了該對象
o = 1; // o 不再引用該對象,只有o2還在引用該對象
var oa = o2.a; // oa引用 o2 的屬性對象 a
// 該對象被其他兩個對象引用,分別是o2的屬性a和oa變量
o2 = "yo"; // 該對象已經不再被其他對象引用了,但是他的屬性a任然被oa變量引用,所以他還不能被釋放
oa = null; // 現在屬性a也不再被別的對象引用,該對象可以被回收了
限制:循環
該算法有其局限性,當一個對象引用另外一個對象,當形成循環引用時,即時他們不再被需要了,垃圾收集器也不會回收他們。
. 代碼如下:
function f(){
var o = {};
var o2 = {};
o.a = o2; // o 引用 o2
o2.a = o; // o2 引用 o
return "azerty";
}
f();
// 兩個對象被創建,並形成相互引用
// 函數調用結束之後,他們不會脫離函數作用域,雖然他們不會被使用,但不會被釋放
// 這是因為,引用計數的算法判定只要對象存在被引用的情況,那麼就不能對其執行垃圾回收
現實中的例子
ie6、7中,在dom對象上使用引用計數的算法,這裡會存在內存洩露的問題。
. 代碼如下:
var div = document.createElement("div");
div.onclick = function(){
doSomething();
}; // div 通過 click 屬性引用了事件處理程序
// 當事件處理函數中訪問了div變量的時候,會形成循環引用,將導致兩個對象都不會被回收,造成內存洩露
標記 - 清除算法
他引入了“對象不再需要”和“對象不可訪問(對象不可達)”的概念。該算法假設有一系列的根對象(javascript中的根對象就是全局對象),每隔一段時間,垃圾收集器就會從根對象開始,遍歷所以他引用的對象,然後再遍歷引用對象引用的對象,以此類推。使用這種方式,垃圾收集器可以獲得所有可訪問的對象,回收那些不可訪問的對象。
這種算法比之前的算法好些,0引用的對象會被設置為不可訪問對象,同時他也避免了循環引用造成的困惱。
截止2012年,大多數現代浏覽器使用的是這種“標記-清除算法”的垃圾回收器。JavaScript垃圾收集領域(代/增量/並發/並行的垃圾收集),在過去的幾年改善了與之相關的算法,但是垃圾收集算法本身(標記-清除算法)和“如何判定一個對象不再需要”並沒有得以改善。
周期不再是一個問題
在第一個例子中,函數調用結束之後,這兩個對象不會被全局對象引用,也不會被全局對象引用的對象引用。因此,他們會被javascript垃圾回收器標記為不可訪問對象。這種事情同樣也發生在第二個例子中,當div和事件處理函數被垃圾回收器標記為不可訪問,他們就會被釋放掉。
限制:對象需要明確的標記為不可訪問
這種標記的方法存在局限,但是我們在編程中被沒有接觸到他,所以我們很少關心垃圾回收相關的內容。