介紹
本章是關於ECMAScript面向對象實現的第2篇,第1篇我們討論的是概論和CEMAScript的比較,如果你還沒有讀第1篇,在進行本章之前,我強烈建議你先讀一下第1篇,因為本篇實在太長了(35頁)。
英文原文:http://dmitrysoshnikov.com/ecmascript/chapter-7-2-oop-ecmascript-implementation/
注:由於篇幅太長了,難免出現錯誤,時刻保持修正中。
在概論裡,我們延伸到了ECMAScript,現在,當我們知道它OOP實現時,我們再來准確定義一下:
代碼如下:
ECMAScript is an object-oriented programming language supporting delegating inheritance based on prototypes.
ECMAScript是一種面向對象語言,支持基於原型的委托式繼承。
我們將從最基本的數據類型來分析,首先要了解的是ECMAScript用原始值(primitive values)和對象(objects)來區分實體,因此有些文章裡說的“在JavaScript裡,一切都是對象”是錯誤的(不完全對),原始值就是我們這裡要討論的一些數據類型。
數據類型
雖然ECMAScript是可以動態轉化類型的動態弱類型語言,它還是有數據類型的。也就是說,一個對象要屬於一個實實在在的類型。
標准規范裡定義了9種數據類型,但只有6種是在ECMAScript程序裡可以直接訪問的,它們是:Undefined、Null、Boolean、String、Number、Object。
另外3種類型只能在實現級別訪問(ECMAScript對象是不能使用這些類型的)並用於規范來解釋一些操作行為、保存中間值。這3種類型是:Reference、List和Completion。
因此,Reference是用來解釋delete、typeof、this這樣的操作符,並且包含一個基對象和一個屬性名稱;List描述的是參數列表的行為(在new表達式和函數調用的時候);Completion是用來解釋行為break、continue、return和throw語句的。
原始值類型
回頭來看6中用於ECMAScript程序的數據類型,前5種是原始值類型,包括Undefined、Null、Boolean、String、Number、Object。
原始值類型例子:
代碼如下:
var a = undefined;
var b = null;
var c = true;
var d = 'test';
var e = 10;
這些值是在底層上直接實現的,他們不是object,所以沒有原型,沒有構造函數。
大叔注:這些原生值和我們平時用的(Boolean、String、Number、Object)雖然名字上相似,但不是同一個東西。所以typeof(true)和typeof(Boolean)結果是不一樣的,因為typeof(Boolean)的結果是function,所以函數Boolean、String、Number是有原型的(下面的讀寫屬性章節也會提到)。
想知道數據是哪種類型用typeof是最好不過了,有個例子需要注意一下,如果用typeof來判斷null的類型,結果是object,為什麼呢?因為null的類型是定義為Null的。
代碼如下:
alert(typeof null); // "object"
顯示"object"原因是因為規范就是這麼規定的:對於Null值的typeof字符串值返回"object“。
規范沒有想象解釋這個,但是Brendan Eich (JavaScript發明人)注意到null相對於undefined大多數都是用於對象出現的地方,例如設置一個對象為空引用。但是有些文檔裡有些氣人將之歸結為bug,而且將該bug放在Brendan Eich也參與討論的bug列表裡,結果就是任其自然,還是把typeof null的結果設置為object(盡管262-3的標准是定義null的類型是Null,262-5已經將標准修改為null的類型是object了)。
Object類型
接著,Object類型(不要和Object構造函數混淆了,現在只討論抽象類型)是描述 ECMAScript對象的唯一一個數據類型。
Object is an unordered collection of key-value pairs.
對象是一個包含key-value對的無序集合
對象的key值被稱為屬性,屬性是原始值和其他對象的容器。如果屬性的值是函數我們稱它為方法 。
例如:
代碼如下:
var x = { // 對象"x"有3個屬性: a, b, c
a: 10, // 原始值
b: {z: 100}, // 對象"b"有一個屬性z
c: function () { // 函數(方法)
alert('method x.c');
}
};
alert(x.a); // 10
alert(x.b); // [object Object]
alert(x.b.z); // 100
x.c(); // 'method x.c'
動態性
正如我們在第17章中指出的,ES中的對象是完全動態的。這意味著,在程序執行的時候我們可以任意地添加,修改或刪除對象的屬性。
例如:
代碼如下:
var foo = {x: 10};
// 添加新屬性
foo.y = 20;
console.log(foo); // {x: 10, y: 20}
// 將屬性值修改為函數
foo.x = function () {
console.log('foo.x');
};
foo.x(); // 'foo.x'
// 刪除屬性
delete foo.x;
console.log(foo); // {y: 20}
有些屬性不能被修改——(只讀屬性、已刪除屬性或不可配置的屬性)。 我們將稍後在屬性特性裡講解。
另外,ES5規范規定,靜態對象不能擴展新的屬性,並且它的屬性頁不能刪除或者修改。他們是所謂的凍結對象,可以通過應用Object.freeze(o)方法得到。
代碼如下:
var foo = {x: 10};
// 凍結對象
Object.freeze(foo);
console.log(Object.isFrozen(foo)); // true
// 不能修改
foo.x = 100;
// 不能擴展
foo.y = 200;
// 不能刪除
delete foo.x;
console.log(foo); // {x: 10}
在ES5規范裡,也使用Object.preventExtensions(o)方法防止擴展,或者使用Object.defineProperty(o)方法來定義屬性:
代碼如下:
var foo = {x : 10};
Object.defineProperty(foo, "y", {
value: 20,
writable: false, // 只讀
configurable: false // 不可配置
});
// 不能修改
foo.y = 200;
// 不能刪除
delete foo.y; // false
// 防治擴展
Object.preventExtensions(foo);
console.log(Object.isExtensible(foo)); // false
// 不能添加新屬性
foo.z = 30;
console.log(foo); {x: 10, y: 20}
內置對象、原生對象及宿主對象
有必要需要注意的是規范還區分了這內置對象、元素對象和宿主對象。
內置對象和元素對象是被ECMAScript規范定義和實現的,兩者之間的差異微不足道。所有ECMAScript實現的對象都是原生對象(其中一些是內置對象、一些在程序執行的時候創建,例如用戶自定義對象)。內置對象是原生對象的一個子集、是在程序開始之前內置到ECMAScript裡的(例如,parseInt, Match等)。所有的宿主對象是由宿主環境提供的,通常是浏覽器,並可能包括如window、alert等。
注意,宿主對象可能是ES自身實現的,完全符合規范的語義。從這點來說,他們能稱為“原生宿主”對象(盡快很理論),不過規范沒有定義“原生宿主”對象的概念。
Boolean,String和Number對象
另外,規范也定義了一些原生的特殊包裝類,這些對象是:
1.布爾對象
2.字符串對象
3.數字對象
這些對象的創建,是通過相應的內置構造器創建,並且包含原生值作為其內部屬性,這些對象可以轉換省原始值,反之亦然。
代碼如下:
var c = new Boolean(true);
var d = new String('test');
var e = new Number(10);
// 轉換成原始值
// 使用不帶new關鍵字的函數
с = Boolean(c);
d = String(d);
e = Number(e);
// 重新轉換成對象
с = Object(c);
d = Object(d);
e = Object(e);
此外,也有對象是由特殊的內置構造函數創建: Function(函數對象構造器)、Array(數組構造器) RegExp(正則表達式構造器)、Math(數學模塊)、 Date(日期的構造器)等等,這些對象也是Object對象類型的值,他們彼此的區別是由內部屬性管理的,我們在下面討論這些內容。
字面量Literal
對於三個對象的值:對象(object),數組(array)和正則表達式(regular expression),他們分別有簡寫的標示符稱為:對象初始化器、數組初始化器、和正則表達式初始化器:
代碼如下:
// 等價於new Array(1, 2, 3);
// 或者array = new Array();
// array[0] = 1;
// array[1] = 2;
// array[2] = 3;
var array = [1, 2, 3];
// 等價於
// var object = new Object();
// object.a = 1;
// object.b = 2;
// object.c = 3;
var object = {a: 1, b: 2, c: 3};
// 等價於new RegExp("^\\d+$", "g")
var re = /^\d+$/g;
注意,如果上述三個對象進行重新賦值名稱到新的類型上的話,那隨後的實現語義就是按照新賦值的類型來使用,例如在當前的Rhino和老版本SpiderMonkey 1.7的實現上,會成功以new關鍵字的構造器來創建對象,但有些實現(當前Spider/TraceMonkey)字面量的語義在類型改變以後卻不一定改變。
代碼如下:
var getClass = Object.prototype.toString;
Object = Number;
var foo = new Object;
alert([foo, getClass.call(foo)]); // 0, "[object Number]"
var bar = {};
// Rhino, SpiderMonkey 1.7中 - 0, "[object Number]"
// 其它: still "[object Object]", "[object Object]"
alert([bar, getClass.call(bar)]);
// Array也是一樣的效果
Array = Number;
foo = new Array;
alert([foo, getClass.call(foo)]); // 0, "[object Number]"
bar = [];
// Rhino, SpiderMonkey 1.7中 - 0, "[object Number]"
// 其它: still "", "[object Object]"
alert([bar, getClass.call(bar)]);
// 但對RegExp,字面量的語義是不被改變的。 semantics of the literal
// isn't being changed in all tested implementations
RegExp = Number;
foo = new RegExp;
alert([foo, getClass.call(foo)]); // 0, "[object Number]"
bar = /(?!)/g;
alert([bar, getClass.call(bar)]); // /(?!)/g, "[object RegExp]"
正則表達式字面量和RegExp對象
注意,下面2個例子在第三版的規范裡,正則表達式的語義都是等價的,regexp字面量只在一句裡存在,並且再解析階段創建,但RegExp構造器創建的卻是新對象,所以這可能會導致出一些問題,如lastIndex的值在測試的時候結果是錯誤的:
代碼如下:
for (var k = 0; k < 4; k++) {
var re = /ecma/g;
alert(re.lastIndex); // 0, 4, 0, 4
alert(re.test("ecmascript")); // true, false, true, false
}
// 對比
for (var k = 0; k < 4; k++) {
var re = new RegExp("ecma", "g");
alert(re.lastIndex); // 0, 0, 0, 0
alert(re.test("ecmascript")); // true, true, true, true
}
注:不過這些問題在第5版的ES規范都已經修正了,不管是基於字面量的還是構造器的,正則都是創建新對象。
關聯數組
各種文字靜態討論,JavaScript對象(經常是用對象初始化器{}來創建)被稱為哈希表哈希表或其它簡單的稱謂:哈希(Ruby或Perl裡的概念), 管理數組(PHP裡的概念),詞典 (Python裡的概念)等。
只有這樣的術語,主要是因為他們的結構都是相似的,就是使用“鍵-值”對來存儲對象,完全符合“關聯數組 ”或“哈希表 ”理論定義的數據結構。 此外,哈希表抽象數據類型通常是在實現層面使用。
但是,盡管術語上來描述這個概念,但實際上這個是錯誤,從ECMAScript來看:ECMAScript只有一個對象以及類型以及它的子類型,這和“鍵-值”對存儲沒有什麼區別,因此在這上面沒有特別的概念。 因為任何對象的內部屬性都可以存儲為鍵-值”對:
代碼如下:
var a = {x: 10};
a['y'] = 20;
a.z = 30;
var b = new Number(1);
b.x = 10;
b.y = 20;
b['z'] = 30;
var c = new Function('');
c.x = 10;
c.y = 20;
c['z'] = 30;
// 等等,任意對象的子類型"subtype"
此外,由於在ECMAScript中對象可以是空的,所以"hash"的概念在這裡也是不正確的:
代碼如下:
Object.prototype.x = 10;
var a = {}; // 創建空"hash"
alert(a["x"]); // 10, 但不為空
alert(a.toString); // function
a["y"] = 20; // 添加新的鍵值對到 "hash"
alert(a["y"]); // 20
Object.prototype.y = 20; // 添加原型屬性
delete a["y"]; // 刪除
alert(a["y"]); // 但這裡key和value依然有值 – 20
請注意, ES5標准可以讓我們創建沒原型的對象(使用Object.create(null)方法實現)對,從這個角度來說,這樣的對象可以稱之為哈希表:
代碼如下:
var aHashTable = Object.create(null);
console.log(aHashTable.toString); // 未定義
此外,一些屬性有特定的getter / setter方法,所以也可能導致混淆這個概念:
代碼如下:
var a = new String("foo");
a['length'] = 10;
alert(a['length']); // 3
然而,即使認為“哈希”可能有一個“原型”(例如,在Ruby或Python裡委托哈希對象的類),在ECMAScript裡,這個術語也是不對的,因為2個表示法之間沒有語義上的區別(即用點表示法a.b和a["b"]表示法)。
在ECMAScript中的“property屬性”的概念語義上和"key"、數組索引、方法沒有分開的,這裡所有對象的屬性讀寫都要遵循統一的規則:檢查原型鏈。
在下面Ruby的例子中,我們可以看到語義上的區別:
代碼如下:
a = {}
a.class # Hash
a.length # 0
# new "key-value" pair
a['length'] = 10;
# 語義上,用點訪問的是屬性或方法,而不是key
a.length # 1
# 而索引器訪問訪問的是hash裡的key
a['length'] # 10
# 就類似於在現有對象上動態聲明Hash類
# 然後聲明新屬性或方法
class Hash
def z
100
end
end
# 新屬性可以訪問
a.z # 100
# 但不是"key"
a['z'] # nil
ECMA-262-3標准並沒有定義“哈希”(以及類似)的概念。但是,有這樣的結構理論的話,那可能以此命名的對象。
對象轉換
將對象轉化成原始值可以用valueOf方法,正如我們所說的,當函數的構造函數調用做為function(對於某些類型的),但如果不用new關鍵字就是將對象轉化成原始值,就相當於隱式的valueOf方法調用:
代碼如下:
var a = new Number(1);
var primitiveA = Number(a); // 隱式"valueOf"調用
var alsoPrimitiveA = a.valueOf(); // 顯式調用
alert([
typeof a, // "object"
typeof primitiveA, // "number"
typeof alsoPrimitiveA // "number"
]);
這種方式允許對象參與各種操作,例如:
代碼如下:
var a = new Number(1);
var b = new Number(2);
alert(a + b); // 3
// 甚至
var c = {
x: 10,
y: 20,
valueOf: function () {
return this.x + this.y;
}
};
var d = {
x: 30,
y: 40,
// 和c的valueOf功能一樣
valueOf: c.valueOf
};
alert(c + d); // 100
valueOf的默認值會根據根據對象的類型改變(如果不被覆蓋的話),對某些對象,他返回的是this——例如:Object.prototype.valueOf(),還有計算型的值:Date.prototype.valueOf()返回的是日期時間:
代碼如下:
var a = {};
alert(a.valueOf() === a); // true, "valueOf"返回this
var d = new Date();
alert(d.valueOf()); // time
alert(d.valueOf() === d.getTime()); // true
此外,對象還有一個更原始的代表性——字符串展示。 這個toString方法是可靠的,它在某些操作上是自動使用的:
代碼如下:
var a = {
valueOf: function () {
return 100;
},
toString: function () {
return '__test';
}
};
// 這個操作裡,toString方法自動調用
alert(a); // "__test"
// 但是這裡,調用的卻是valueOf()方法
alert(a + 10); // 110
// 但,一旦valueOf刪除以後
// toString又可以自動調用了
delete a.valueOf;
alert(a + 10); // "_test10"
Object.prototype上定義的toString方法具有特殊意義,它返回的我們下面將要討論的內部[[Class]]屬性值。
和轉化成原始值(ToPrimitive)相比,將值轉化成對象類型也有一個轉化規范(ToObject)。
一個顯式方法是使用內置的Object構造函數作為function來調用ToObject(有些類似通過new關鍵字也可以):
代碼如下:
var n = Object(1); // [object Number]
var s = Object('test'); // [object String]
// 一些類似,使用new操作符也可以
var b = new Object(true); // [object Boolean]
// 應用參數new Object的話創建的是簡單對象
var o = new Object(); // [object Object]
// 如果參數是一個現有的對象
// 那創建的結果就是簡單返回該對象
var a = [];
alert(a === new Object(a)); // true
alert(a === Object(a)); // true
關於調用內置構造函數,使用還是不適用new操作符沒有通用規則,取決於構造函數。 例如Array或Function當使用new操作符的構造函數或者不使用new操作符的簡單函數使用產生相同的結果的:
代碼如下:
var a = Array(1, 2, 3); // [object Array]
var b = new Array(1, 2, 3); // [object Array]
var c = [1, 2, 3]; // [object Array]
var d = Function(''); // [object Function]
var e = new Function(''); // [object Function]
有些操作符使用的時候,也有一些顯示和隱式轉化:
代碼如下:
var a = 1;
var b = 2;
// 隱式
var c = a + b; // 3, number
var d = a + b + '5' // "35", string
// 顯式
var e = '10'; // "10", string
var f = +e; // 10, number
var g = parseInt(e, 10); // 10, number
// 等等
屬性的特性
所有的屬性(property) 都可以有很多特性(attributes)。
1.{ReadOnly}——忽略向屬性賦值的寫操作嘗,但只讀屬性可以由宿主環境行為改變——也就是說不是“恆定值” ;
2.{DontEnum}——屬性不能被for..in循環枚舉
3.{DontDelete}——糊了delete操作符的行為被忽略(即刪不掉);
4.{Internal}——內部屬性,沒有名字(僅在實現層面使用),ECMAScript裡無法訪問這樣的屬性。
注意,在ES5裡{ReadOnly},{DontEnum}和{DontDelete}被重新命名為[[Writable]],[[Enumerable]]和[[Configurable]],可以手工通過Object.defineProperty或類似的方法來管理這些屬性。
代碼如下:
var foo = {};
Object.defineProperty(foo, "x", {
value: 10,
writable: true, // 即{ReadOnly} = false
enumerable: false, // 即{DontEnum} = true
configurable: true // 即{DontDelete} = false
});
console.log(foo.x); // 10
// 通過descriptor獲取特性集attributes
var desc = Object.getOwnPropertyDescriptor(foo, "x");
console.log(desc.enumerable); // false
console.log(desc.writable); // true
// 等等
內部屬性和方法
對象也可以有內部屬性(實現層面的一部分),並且ECMAScript程序無法直接訪問(但是下面我們將看到,一些實現允許訪問一些這樣的屬性)。 這些屬性通過嵌套的中括號[[ ]]進行訪問。我們來看其中的一些,這些屬性的描述可以到規范裡查閱到。
每個對象都應該實現如下內部屬性和方法:
1.[[Prototype]]——對象的原型(將在下面詳細介紹)
2.[[Class]]——字符串對象的一種表示(例如,Object Array ,Function Object,Function等);用來區分對象
3.[[Get]]——獲得屬性值的方法
4.[[Put]]——設置屬性值的方法
5.[[CanPut]]——檢查屬性是否可寫
6.[[HasProperty]]——檢查對象是否已經擁有該屬性
7.[[Delete]]——從對象刪除該屬性
8.[[DefaultValue]]返回對象對於的原始值(調用valueOf方法,某些對象可能會拋出TypeError異常)。
通過Object.prototype.toString()方法可以間接得到內部屬性[[Class]]的值,該方法應該返回下列字符串: "[object " + [[Class]] + "]" 。例如:
代碼如下:
var getClass = Object.prototype.toString;
getClass.call({}); // [object Object]
getClass.call([]); // [object Array]
getClass.call(new Number(1)); // [object Number]
// 等等
這個功能通常是用來檢查對象用的,但規范上說宿主對象的[[Class]]可以為任意值,包括內置對象的[[Class]]屬性的值,所以理論上來看是不能100%來保證准確的。例如,document.childNodes.item(...)方法的[[Class]]屬性,在IE裡返回"String",但其它實現裡返回的確實"Function"。
代碼如下:
// in IE - "String", in other - "Function"
alert(getClass.call(document.childNodes.item));
構造函數
因此,正如我們上面提到的,在ECMAScript中的對象是通過所謂的構造函數來創建的。
Constructor is a function that creates and initializes the newly created object.
構造函數是一個函數,用來創建並初始化新創建的對象。
對象創建(內存分配)是由構造函數的內部方法[[Construct]]負責的。該內部方法的行為是定義好的,所有的構造函數都是使用該方法來為新對象分配內存的。
而初始化是通過新建對象上下上調用該函數來管理的,這是由構造函數的內部方法[[Call]]來負責任的。
注意,用戶代碼只能在初始化階段訪問,雖然在初始化階段我們可以返回不同的對象(忽略第一階段創建的tihs對象):
代碼如下:
function A() {
// 更新新創建的對象
this.x = 10;
// 但返回的是不同的對象
return [1, 2, 3];
}
var a = new A();
console.log(a.x, a); undefined, [1, 2, 3]
引用15章函數——創建函數的算法小節,我們可以看到該函數是一個原生對象,包含[[Construct]] ]和[[Call]] ]屬性以及顯示的prototype原型屬性——未來對象的原型(注:NativeObject是對於native object原生對象的約定,在下面的偽代碼中使用)。
代碼如下:
F = new NativeObject();
F.[[Class]] = "Function"
.... // 其它屬性
F.[[Call]] = <reference to function> // function自身
F.[[Construct]] = internalConstructor // 普通的內部構造函數
.... // 其它屬性
// F構造函數創建的對象原型
__objectPrototype = {};
__objectPrototype.constructor = F // {DontEnum}
F.prototype = __objectPrototype
[[Call]] ]是除[[Class]]屬性(這裡等同於"Function" )之外區分對象的主要方式,因此,對象的內部[[Call]]屬性作為函數調用。 這樣的對象用typeof運算操作符的話返回的是"function"。然而它主要是和原生對象有關,有些情況的實現在用typeof獲取值的是不一樣的,例如:window.alert (...)在IE中的效果:
代碼如下:
// IE浏覽器中 - "Object", "object", 其它浏覽器 - "Function", "function"
alert(Object.prototype.toString.call(window.alert));
alert(typeof window.alert); // "Object"
內部方法[[Construct]]是通過使用帶new運算符的構造函數來激活的,正如我們所說的這個方法是負責內存分配和對象創建的。如果沒有參數,調用構造函數的括號也可以省略:
代碼如下:
function A(x) { // constructor А
this.x = x || 10;
}
// 不傳參數的話,括號也可以省略
var a = new A; // or new A();
alert(a.x); // 10
// 顯式傳入參數x
var b = new A(20);
alert(b.x); // 20
我們也知道,構造函數(初始化階段)裡的shis被設置為新創建的對象 。
讓我們研究一下對象創建的算法。
對象創建的算法
內部方法[[Construct]] 的行為可以描述成如下:
代碼如下:
F.[[Construct]](initialParameters):
O = new NativeObject();
// 屬性[[Class]]被設置為"Object"
O.[[Class]] = "Object"
// 引用F.prototype的時候獲取該對象g
var __objectPrototype = F.prototype;
// 如果__objectPrototype是對象,就:
O.[[Prototype]] = __objectPrototype
// 否則:
O.[[Prototype]] = Object.prototype;
// 這裡O.[[Prototype]]是Object對象的原型
// 新創建對象初始化的時候應用了F.[[Call]]
// 將this設置為新創建的對象O
// 參數和F裡的initialParameters是一樣的
R = F.[[Call]](initialParameters); this === O;
// 這裡R是[[Call]]的返回值
// 在JS裡看,像這樣:
// R = F.apply(O, initialParameters);
// 如果R是對象
return R
// 否則
return O
請注意兩個主要特點:
1.首先,新創建對象的原型是從當前時刻函數的prototype屬性獲取的(這意味著同一個構造函數創建的兩個創建對象的原型可以不同是因為函數的prototype屬性也可以不同)。
2.其次,正如我們上面提到的,如果在對象初始化的時候,[[Call]]返回的是對象,這恰恰是用於整個new操作符的結果:
代碼如下:
function A() {}
A.prototype.x = 10;
var a = new A();
alert(a.x); // 10 – 從原型上得到
// 設置.prototype屬性為新對象
// 為什麼顯式聲明.constructor屬性將在下面說明
A.prototype = {
constructor: A,
y: 100
};
var b = new A();
// 對象"b"有了新屬性
alert(b.x); // undefined
alert(b.y); // 100 – 從原型上得到
// 但a對象的原型依然可以得到原來的結果
alert(a.x); // 10 - 從原型上得到
function B() {
this.x = 10;
return new Array();
}
// 如果"B"構造函數沒有返回(或返回this)
// 那麼this對象就可以使用,但是下面的情況返回的是array
var b = new B();
alert(b.x); // undefined
alert(Object.prototype.toString.call(b)); // [object Array]
讓我們來詳細了解一下原型
原型
每個對象都有一個原型(一些系統對象除外)。原型通信是通過內部的、隱式的、不可直接訪問[[Prototype]]原型屬性來進行的,原型可以是一個對象,也可以是null值。
屬性構造函數(Property constructor)
上面的例子有有2個重要的知識點,第一個是關於函數的constructor屬性的prototype屬性,在函數創建的算法裡,我們知道constructor屬性在函數創建階段被設置為函數的prototype屬性,constructor屬性的值是函數自身的重要引用:
代碼如下:
function A() {}
var a = new A();
alert(a.constructor); // function A() {}, by delegation
alert(a.constructor === A); // true
通常在這種情況下,存在著一個誤區:constructor構造屬性作為新創建對象自身的屬性是錯誤的,但是,正如我們所看到的的,這個屬性屬於原型並且通過繼承來訪問對象。
通過繼承constructor屬性的實例,可以間接得到的原型對象的引用:
代碼如下:
function A() {}
A.prototype.x = new Number(10);
var a = new A();
alert(a.constructor.prototype); // [object Object]
alert(a.x); // 10, 通過原型
// 和a.[[Prototype]].x效果一樣
alert(a.constructor.prototype.x); // 10
alert(a.constructor.prototype.x === a.x); // true
但請注意,函數的constructor和prototype屬性在對象創建以後都可以重新定義的。在這種情況下,對象失去上面所說的機制。如果通過函數的prototype屬性去編輯元素的prototype原型的話(添加新對象或修改現有對象),實例上將看到新添加的屬性。
然而,如果我們徹底改變函數的prototype屬性(通過分配一個新的對象),那原始構造函數的引用就是丟失,這是因為我們創建的對象不包括constructor屬性:
代碼如下:
function A() {}
A.prototype = {
x: 10
};
var a = new A();
alert(a.x); // 10
alert(a.constructor === A); // false!
因此,對函數的原型引用需要手工恢復:
代碼如下:
function A() {}
A.prototype = {
constructor: A,
x: 10
};
var a = new A();
alert(a.x); // 10
alert(a.constructor === A); // true
注意雖然手動恢復了constructor屬性,和原來丟失的原型相比,{DontEnum}特性沒有了,也就是說A.prototype裡的for..in循環語句不支持了,不過第5版規范裡,通過[[Enumerable]] 特性提供了控制可枚舉狀態enumerable的能力。
代碼如下:
var foo = {x: 10};
Object.defineProperty(foo, "y", {
value: 20,
enumerable: false // aka {DontEnum} = true
});
console.log(foo.x, foo.y); // 10, 20
for (var k in foo) {
console.log(k); // only "x"
}
var xDesc = Object.getOwnPropertyDescriptor(foo, "x");
var yDesc = Object.getOwnPropertyDescriptor(foo, "y");
console.log(
xDesc.enumerable, // true
yDesc.enumerable // false
);
顯式prototype和隱式[[Prototype]]屬性
通常,一個對象的原型通過函數的prototype屬性顯式引用是不正確的,他引用的是同一個對象,對象的[[Prototype]]屬性:
a.[[Prototype]] ----> Prototype <---- A.prototype
此外, 實例的[[Prototype]]值確實是在構造函數的prototype屬性上獲取的。
然而,提交prototype屬性不會影響已經創建對象的原型(只有在構造函數的prototype屬性改變的時候才會影響到),就是說新創建的對象才有有新的原型,而已創建對象還是引用到原來的舊原型(這個原型已經不能被再被修改了)。
代碼如下:
// 在修改A.prototype原型之前的情況
a.[[Prototype]] ----> Prototype <---- A.prototype
// 修改之後
A.prototype ----> New prototype // 新對象會擁有這個原型
a.[[Prototype]] ----> Prototype // 引導的原來的原型上
例如:
代碼如下:
function A() {}
A.prototype.x = 10;
var a = new A();
alert(a.x); // 10
A.prototype = {
constructor: A,
x: 20
y: 30
};
// 對象a是通過隱式的[[Prototype]]引用從原油的prototype上獲取的值
alert(a.x); // 10
alert(a.y) // undefined
var b = new A();
// 但新對象是從新原型上獲取的值
alert(b.x); // 20
alert(b.y) // 30
因此,有的文章說“動態修改原型將影響所有的對象都會擁有新的原型”是錯誤的,新原型僅僅在原型修改以後的新創建對象上生效。
這裡的主要規則是:對象的原型是對象的創建的時候創建的,並且在此之後不能修改為新的對象,如果依然引用到同一個對象,可以通過構造函數的顯式prototype引用,對象創建以後,只能對原型的屬性進行添加或修改。
非標准的__proto__屬性
然而,有些實現(例如SpiderMonkey),提供了不標准的__proto__顯式屬性來引用對象的原型:
代碼如下:
function A() {}
A.prototype.x = 10;
var a = new A();
alert(a.x); // 10
var __newPrototype = {
constructor: A,
x: 20,
y: 30
};
// 引用到新對象
A.prototype = __newPrototype;
var b = new A();
alert(b.x); // 20
alert(b.y); // 30
// "a"對象使用的依然是舊的原型
alert(a.x); // 10
alert(a.y); // undefined
// 顯式修改原型
a.__proto__ = __newPrototype;
// 現在"а"對象引用的是新對象
alert(a.x); // 20
alert(a.y); // 30
注意,ES5提供了Object.getPrototypeOf(O)方法,該方法直接返回對象的[[Prototype]]屬性——實例的初始原型。 然而,和__proto__相比,它只是getter,它不允許set值。
代碼如下:
var foo = {};
Object.getPrototypeOf(foo) == Object.prototype; // true
對象獨立於構造函數
因為實例的原型獨立於構造函數和構造函數的prototype屬性,構造函數完成了自己的主要工作(創建對象)以後可以刪除。原型對象通過引用[[Prototype]]屬性繼續存在:
代碼如下:
function A() {}
A.prototype.x = 10;
var a = new A();
alert(a.x); // 10
// 設置A為null - 顯示引用構造函數
A = null;
// 但如果.constructor屬性沒有改變的話,
// 依然可以通過它創建對象
var b = new a.constructor();
alert(b.x); // 10
// 隱式的引用也刪除掉
delete a.constructor.prototype.constructor;
delete b.constructor.prototype.constructor;
// 通過A的構造函數再也不能創建對象了
// 但這2個對象依然有自己的原型
alert(a.x); // 10
alert(b.x); // 10
instanceof操作符的特性
我們是通過構造函數的prototype屬性來顯示引用原型的,這和instanceof操作符有關。該操作符是和原型鏈一起工作的,而不是構造函數,考慮到這一點,當檢測對象的時候往往會有誤解:
代碼如下:
if (foo instanceof Foo) {
...
}
這不是用來檢測對象foo是否是用Foo構造函數創建的,所有instanceof運算符只需要一個對象屬性——foo.[[Prototype]],在原型鏈中從Foo.prototype開始檢查其是否存在。instanceof運算符是通過構造函數裡的內部方法[[HasInstance]]來激活的。
讓我們來看看這個例子:
代碼如下:
function A() {}
A.prototype.x = 10;
var a = new A();
alert(a.x); // 10
alert(a instanceof A); // true
// 如果設置原型為null
A.prototype = null;
// ..."a"依然可以通過a.[[Prototype]]訪問原型
alert(a.x); // 10
// 不過,instanceof操作符不能再正常使用了
// 因為它是從構造函數的prototype屬性來實現的
alert(a instanceof A); // 錯誤,A.prototype不是對象
另一方面,可以由構造函數來創建對象,但如果對象的[[Prototype]]屬性和構造函數的prototype屬性的值設置的是一樣的話,instanceof檢查的時候會返回true:
代碼如下:
function B() {}
var b = new B();
alert(b instanceof B); // true
function C() {}
var __proto = {
constructor: C
};
C.prototype = __proto;
b.__proto__ = __proto;
alert(b instanceof C); // true
alert(b instanceof B); // false
原型可以存放方法並共享屬性
大部分程序裡使用原型是用來存儲對象的方法、默認狀態和共享對象的屬性。
事實上,對象可以擁有自己的狀態 ,但方法通常是一樣的。 因此,為了內存優化,方法通常是在原型裡定義的。 這意味著,這個構造函數創建的所有實例都可以共享找個方法。
代碼如下:
function A(x) {
this.x = x || 100;
}
A.prototype = (function () {
// 初始化上下文
// 使用額外的對象
var _someSharedVar = 500;
function _someHelper() {
alert('internal helper: ' + _someSharedVar);
}
function method1() {
alert('method1: ' + this.x);
}
function method2() {
alert('method2: ' + this.x);
_someHelper();
}
// 原型自身
return {
constructor: A,
method1: method1,
method2: method2
};
})();
var a = new A(10);
var b = new A(20);
a.method1(); // method1: 10
a.method2(); // method2: 10, internal helper: 500
b.method1(); // method1: 20
b.method2(); // method2: 20, internal helper: 500
// 2個對象使用的是原型裡相同的方法
alert(a.method1 === b.method1); // true
alert(a.method2 === b.method2); // true
讀寫屬性
正如我們提到,讀取和寫入屬性值是通過內部的[[Get]]和[[Put]]方法。這些內部方法是通過屬性訪問器激活的:點標記法或者索引標記法:
代碼如下:
// 寫入
foo.bar = 10; // 調用了[[Put]]
console.log(foo.bar); // 10, 調用了[[Get]]
console.log(foo['bar']); // 效果一樣
讓我們用偽代碼來看一下這些方法是如何工作的:
[[Get]]方法
[[Get]]也會從原型鏈中查詢屬性,所以通過對象也可以訪問原型中的屬性。
O.[[Get]](P):
代碼如下:
// 如果是自己的屬性,就返回
if (O.hasOwnProperty(P)) {
return O.P;
}
// 否則,繼續分析原型
var __proto = O.[[Prototype]];
// 如果原型是null,返回undefined
// 這是可能的:最頂層Object.prototype.[[Prototype]]是null
if (__proto === null) {
return undefined;
}
// 否則,對原型鏈遞歸調用[[Get]],在各層的原型中查找屬性
// 直到原型為null
return __proto.[[Get]](P)
請注意,因為[[Get]]在如下情況也會返回undefined:
代碼如下:
if (window.someObject) {
...
}
這裡,在window裡沒有找到someObject屬性,然後會在原型裡找,原型的原型裡找,以此類推,如果都找不到,按照定義就返回undefined。
注意:in操作符也可以負責查找屬性(也會查找原型鏈):
代碼如下:
if ('someObject' in window) {
...
}
這有助於避免一些特殊問題:比如即便someObject存在,在someObject等於false的時候,第一輪檢測就通不過。
[[Put]]方法
[[Put]]方法可以創建、更新對象自身的屬性,並且掩蓋原型裡的同名屬性。
O.[[Put]](P, V):
代碼如下:
// 如果不能給屬性寫值,就退出
if (!O.[[CanPut]](P)) {
return;
}
// 如果對象沒有自身的屬性,就創建它
// 所有的attributes特性都是false
if (!O.hasOwnProperty(P)) {
createNewProperty(O, P, attributes: {
ReadOnly: false,
DontEnum: false,
DontDelete: false,
Internal: false
});
}
// 如果屬性存在就設置值,但不改變attributes特性
O.P = V
return;
例如:
代碼如下:
Object.prototype.x = 100;
var foo = {};
console.log(foo.x); // 100, 繼承屬性
foo.x = 10; // [[Put]]
console.log(foo.x); // 10, 自身屬性
delete foo.x;
console.log(foo.x); // 重新是100,繼承屬性
請注意,不能掩蓋原型裡的只讀屬性,賦值結果將忽略,這是由內部方法[[CanPut]]控制的。
// 例如,屬性length是只讀的,我們來掩蓋一下length試試
function SuperString() {
/* nothing */
}
SuperString.prototype = new String("abc");
var foo = new SuperString();
console.log(foo.length); // 3, "abc"的長度
// 嘗試掩蓋
foo.length = 5;
console.log(foo.length); // 依然是3
但在ES5的嚴格模式下,如果掩蓋只讀屬性的話,會保存TypeError錯誤。
屬性訪問器
內部方法[[Get]]和[[Put]]在ECMAScript裡是通過點符號或者索引法來激活的,如果屬性標示符是合法的名字的話,可以通過“.”來訪問,而索引方運行動態定義名稱。
代碼如下:
var a = {testProperty: 10};
alert(a.testProperty); // 10, 點
alert(a['testProperty']); // 10, 索引
var propertyName = 'Property';
alert(a['test' + propertyName]); // 10, 動態屬性通過索引的方式
這裡有一個非常重要的特性——屬性訪問器總是使用ToObject規范來對待“.”左邊的值。這種隱式轉化和這句“在JavaScript中一切都是對象”有關系,(然而,當我們已經知道了,JavaScript裡不是所有的值都是對象)。
如果對原始值進行屬性訪問器取值,訪問之前會先對原始值進行對象包裝(包括原始值),然後通過包裝的對象進行訪問屬性,屬性訪問以後,包裝對象就會被刪除。
例如:
代碼如下:
var a = 10; // 原始值
// 但是可以訪問方法(就像對象一樣)
alert(a.toString()); // "10"
// 此外,我們可以在a上創建一個心屬性
a.test = 100; // 好像是沒問題的
// 但,[[Get]]方法沒有返回該屬性的值,返回的卻是undefined
alert(a.test); // undefined
那麼,為什麼整個例子裡的原始值可以訪問toString方法,而不能訪問新創建的test屬性呢?
答案很簡單:
首先,正如我們所說,使用屬性訪問器以後,它已經不是原始值了,而是一個包裝過的中間對象(整個例子是使用new Number(a)),而toString方法這時候是通過原型鏈查找到的:
代碼如下:
// 執行a.toString()的原理:
1. wrapper = new Number(a);
2. wrapper.toString(); // "10"
3. delete wrapper;
接下來,[[Put]]方法創建新屬性時候,也是通過包裝裝的對象進行的:
代碼如下:
// 執行a.test = 100的原理:
1. wrapper = new Number(a);
2. wrapper.test = 100;
3. delete wrapper;
我們看到,在第3步的時候,包裝的對象以及刪除了,隨著新創建的屬性頁被刪除了——刪除包裝對象本身。
然後使用[[Get]]獲取test值的時候,再一次創建了包裝對象,但這時候包裝的對象已經沒有test屬性了,所以返回的是undefined:
代碼如下:
// 執行a.test的原理:
1. wrapper = new Number(a);
2. wrapper.test; // undefined
這種方式解釋了原始值的讀取方式,另外,任何原始值如果經常用在訪問屬性的話,時間效率考慮,都是直接用一個對象替代它;與此相反,如果不經常訪問,或者只是用於計算的話,到可以保留這種形式。
繼承
我們知道,ECMAScript是使用基於原型的委托式繼承。鏈和原型在原型鏈裡已經提到過了。其實,所有委托的實現和原型鏈的查找分析都濃縮到[[Get]]方法了。
如果你完全理解[[Get]]方法,那JavaScript中的繼承這個問題將不解自答了。
經常在論壇上談論JavaScript中的繼承時,我都是用一行代碼來展示,事實上,我們不需要創建任何對象或函數,因為該語言已經是基於繼承的了,代碼如下:
代碼如下:
alert(1..toString()); // "1"
我們已經知道了[[Get]]方法和屬性訪問器的原理了,我們來看看都發生了什麼:
1.首先,從原始值1,通過new Number(1)創建包裝對象
2.然後toString方法是從這個包裝對象上繼承得到的
為什麼是繼承的? 因為在ECMAScript中的對象可以有自己的屬性,包裝對象在這種情況下沒有toString方法。 因此它是從原理裡繼承的,即Number.prototype。
注意有個微妙的地方,在上面的例子中的兩個點不是一個錯誤。第一點是代表小數部分,第二個才是一個屬性訪問器:
代碼如下:
1.toString(); // 語法錯誤!
(1).toString(); // OK
1..toString(); // OK
1['toString'](); // OK
原型鏈
讓我們展示如何為用戶定義對象創建原型鏈,非常簡單:
代碼如下:
function A() {
alert('A.[[Call]] activated');
this.x = 10;
}
A.prototype.y = 20;
var a = new A();
alert([a.x, a.y]); // 10 (自身), 20 (繼承)
function B() {}
// 最近的原型鏈方式就是設置對象的原型為另外一個新對象
B.prototype = new A();
// 修復原型的constructor屬性,否則的話是A了
B.prototype.constructor = B;
var b = new B();
alert([b.x, b.y]); // 10, 20, 2個都是繼承的
// [[Get]] b.x:
// b.x (no) -->
// b.[[Prototype]].x (yes) - 10
// [[Get]] b.y
// b.y (no) -->
// b.[[Prototype]].y (no) -->
// b.[[Prototype]].[[Prototype]].y (yes) - 20
// where b.[[Prototype]] === B.prototype,
// and b.[[Prototype]].[[Prototype]] === A.prototype
這種方法有兩個特性:
首先,B.prototype將包含x屬性。乍一看這可能不對,你可能會想x屬性是在A裡定義的並且B構造函數也是這樣期望的。盡管原型繼承正常情況是沒問題的,但B構造函數有時候可能不需要x屬性,與基於class的繼承相比,所有的屬性都復制到後代子類裡了。
盡管如此,如果有需要(模擬基於類的繼承)將x屬性賦給B構造函數創建的對象上,有一些方法,我們後來來展示其中一種方式。
其次,這不是一個特征而是缺點——子類原型創建的時候,構造函數的代碼也執行了,我們可以看到消息"A.[[Call]] activated"顯示了兩次——當用A構造函數創建對象賦給B.prototype屬性的時候,另外一場是a對象創建自身的時候!
下面的例子比較關鍵,在父類的構造函數拋出的異常:可能實際對象創建的時候需要檢查吧,但很明顯,同樣的case,也就是就是使用這些父對象作為原型的時候就會出錯。
代碼如下:
function A(param) {
if (!param) {
throw 'Param required';
}
this.param = param;
}
A.prototype.x = 10;
var a = new A(20);
alert([a.x, a.param]); // 10, 20
function B() {}
B.prototype = new A(); // Error
此外,在父類的構造函數有太多代碼的話也是一種缺點。
解決這些“功能”和問題,程序員使用原型鏈的標准模式(下面展示),主要目的就是在中間包裝構造函數的創建,這些包裝構造函數的鏈裡包含需要的原型。
代碼如下:
function A() {
alert('A.[[Call]] activated');
this.x = 10;
}
A.prototype.y = 20;
var a = new A();
alert([a.x, a.y]); // 10 (自身), 20 (集成)
function B() {
// 或者使用A.apply(this, arguments)
B.superproto.constructor.apply(this, arguments);
}
// 繼承:通過空的中間構造函數將原型連在一起
var F = function () {};
F.prototype = A.prototype; // 引用
B.prototype = new F();
B.superproto = A.prototype; // 顯示引用到另外一個原型上, "sugar"
// 修復原型的constructor屬性,否則的就是A了
B.prototype.constructor = B;
var b = new B();
alert([b.x, b.y]); // 10 (自身), 20 (集成)
注意,我們在b實例上創建了自己的x屬性,通過B.superproto.constructor調用父構造函數來引用新創建對象的上下文。
我們也修復了父構造函數在創建子原型的時候不需要的調用,此時,消息"A.[[Call]] activated"在需要的時候才會顯示。
為了在原型鏈裡重復相同的行為(中間構造函數創建,設置superproto,恢復原始構造函數),下面的模板可以封裝成一個非常方面的工具函數,其目的是連接原型的時候不是根據構造函數的實際名稱。
代碼如下:
function inherit(child, parent) {
var F = function () {};
F.prototype = parent.prototype
child.prototype = new F();
child.prototype.constructor = child;
child.superproto = parent.prototype;
return child;
}
因此,繼承:
代碼如下:
function A() {}
A.prototype.x = 10;
function B() {}
inherit(B, A); // 連接原型
var b = new B();
alert(b.x); // 10, 在A.prototype查找到
也有很多語法形式(包裝而成),但所有的語法行都是為了減少上述代碼裡的行為。
例如,如果我們把中間的構造函數放到外面,就可以優化前面的代碼(因此,只有一個函數被創建),然後重用它:
代碼如下:
var inherit = (function(){
function F() {}
return function (child, parent) {
F.prototype = parent.prototype;
child.prototype = new F;
child.prototype.constructor = child;
child.superproto = parent.prototype;
return child;
};
})();
由於對象的真實原型是[[Prototype]]屬性,這意味著F.prototype可以很容易修改和重用,因為通過new F創建的child.prototype可以從child.prototype的當前值裡獲取[[Prototype]]:
代碼如下:
function A() {}
A.prototype.x = 10;
function B() {}
inherit(B, A);
B.prototype.y = 20;
B.prototype.foo = function () {
alert("B#foo");
};
var b = new B();
alert(b.x); // 10, 在A.prototype裡查到
function C() {}
inherit(C, B);
// 使用"superproto"語法糖
// 調用父原型的同名方法
C.ptototype.foo = function () {
C.superproto.foo.call(this);
alert("C#foo");
};
var c = new C();
alert([c.x, c.y]); // 10, 20
c.foo(); // B#foo, C#foo
注意,ES5為原型鏈標准化了這個工具函數,那就是Object.create方法。ES3可以使用以下方式實現:
代碼如下:
Object.create ||
Object.create = function (parent, properties) {
function F() {}
F.prototype = parent;
var child = new F;
for (var k in properties) {
child[k] = properties[k].value;
}
return child;
}
// 用法
var foo = {x: 10};
var bar = Object.create(foo, {y: {value: 20}});
console.log(bar.x, bar.y); // 10, 20
此外,所有模仿現在基於類的經典繼承方式都是根據這個原則實現的,現在可以看到,它實際上不是基於類的繼承,而是連接原型的一個很方便的代碼重用。
結論
本章內容已經很充分和詳細了,希望這些資料對你有用,並且消除你對ECMAScript的疑問,如果你有任何問題,請留言,我們一起討論。