Java遍歷集合方法分析（實現原理、算法性能、適用場合）

DIV+CSS佈局教程網 >> 網頁腳本 >> JavaScript入門知識 >> 關於JavaScript >> Java遍歷集合方法分析（實現原理、算法性能、適用場合）

編輯：關於JavaScript

概述

Java語言中，提供了一套數據集合框架，其中定義了一些諸如List、Set等抽象數據類型，每個抽象數據類型的各個具體實現，底層又采用了不同的實現方式，比如ArrayList和LinkedList。

除此之外，Java對於數據集合的遍歷，也提供了幾種不同的方式。開發人員必須要清楚的明白每一種遍歷方式的特點、適用場合、以及在不同底層實現上的表現。下面就詳細分析一下這一塊內容。

數據元素是怎樣在內存中存放的？

數據元素在內存中，主要有2種存儲方式：

1、順序存儲，Random Access（Direct Access）：

這種方式，相鄰的數據元素存放於相鄰的內存地址中，整塊內存地址是連續的。可以根據元素的位置直接計算出內存地址，直接進行讀取。讀取一個特定位置元素的平均時間復雜度為O(1)。正常來說，只有基於數組實現的集合，才有這種特性。Java中以ArrayList為代表。

2、鏈式存儲，Sequential Access：

這種方式，每一個數據元素，在內存中都不要求處於相鄰的位置，每個數據元素包含它下一個元素的內存地址。不可以根據元素的位置直接計算出內存地址，只能按順序讀取元素。讀取一個特定位置元素的平均時間復雜度為O(n)。主要以鏈表為代表。

Java中以LinkedList為代表。

Java中提供的遍歷方式有哪些？

1、傳統的for循環遍歷，基於計數器的：

遍歷者自己在集合外部維護一個計數器，然後依次讀取每一個位置的元素，當讀取到最後一個元素後，停止。主要就是需要按元素的位置來讀取元素。這也是最原始的集合遍歷方法。

寫法為：

for (int i = 0; i < list.size(); i++) {
list.get(i);
}

2、迭代器遍歷，Iterator：

Iterator本來是OO的一個設計模式，主要目的就是屏蔽不同數據集合的特點，統一遍歷集合的接口。Java作為一個OO語言，自然也在Collections中支持了Iterator模式。

寫法為：

Iterator iterator = list.iterator();
while (iterator.hasNext()) {
iterator.next();
}

3、foreach循環遍歷：

屏蔽了顯式聲明的Iterator和計數器。

優點：代碼簡潔，不易出錯。

缺點：只能做簡單的遍歷，不能在遍歷過程中操作（刪除、替換）數據集合。

寫法為：

for (ElementType element : list) {
}

每個遍歷方法的實現原理是什麼？

1、傳統的for循環遍歷，基於計數器的：

遍歷者自己在集合外部維護一個計數器，然後依次讀取每一個位置的元素，當讀取到最後一個元素後，停止。主要就是需要按元素的位置來讀取元素。

2、迭代器遍歷，Iterator：

每一個具體實現的數據集合，一般都需要提供相應的Iterator。相比於傳統for循環，Iterator取締了顯式的遍歷計數器。所以基於順序存儲集合的Iterator可以直接按位置訪問數據。而基於鏈式存儲集合的Iterator，正常的實現，都是需要保存當前遍歷的位置。然後根據當前位置來向前或者向後移動指針。

3、foreach循環遍歷：

根據反編譯的字節碼可以發現，foreach內部也是采用了Iterator的方式實現，只不過Java編譯器幫我們生成了這些代碼。

各遍歷方式對於不同的存儲方式，性能如何？

1、傳統的for循環遍歷，基於計數器的：

因為是基於元素的位置，按位置讀取。所以我們可以知道，對於順序存儲，因為讀取特定位置元素的平均時間復雜度是O(1)，所以遍歷整個集合的平均時間復雜度為O(n)。而對於鏈式存儲，因為讀取特定位置元素的平均時間復雜度是O(n)，所以遍歷整個集合的平均時間復雜度為O(n2)（n的平方）。

ArrayList按位置讀取的代碼：直接按元素位置讀取。

transient Object[] elementData;
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
E elementData(int index) {
return (E) elementData[index];
}

LinkedList按位置讀取的代碼：每次都需要從第0個元素開始向後讀取。其實它內部也做了小小的優化。

transient int size = 0;
transient Node<E> first;
transient Node<E> last;
public E get(int index) {
checkElementIndex(index);
return node(index).item;
}
Node<E> node(int index) {
if (index < (size >> 1)) { //查詢位置在鏈表前半部分，從鏈表頭開始查找
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else { //查詢位置在鏈表後半部分，從鏈表尾開始查找
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}

2、迭代器遍歷，Iterator：

那麼對於RandomAccess類型的集合來說，沒有太多意義，反而因為一些額外的操作，還會增加額外的運行時間。但是對於Sequential Access的集合來說，就有很重大的意義了，因為Iterator內部維護了當前遍歷的位置，所以每次遍歷，讀取下一個位置並不需要從集合的第一個元素開始查找，只要把指針向後移一位就行了，這樣一來，遍歷整個集合的時間復雜度就降低為O(n)；

（這裡只用LinkedList做例子）LinkedList的迭代器，內部實現，就是維護當前遍歷的位置，然後操作指針移動就可以了：

代碼：

public E next() {
checkForComodification();
if (!hasNext())
throw new NoSuchElementException();
lastReturned = next;
next = next.next;
nextIndex++;
return lastReturned.item;
}
public E previous() {
checkForComodification();
if (!hasPrevious())
throw new NoSuchElementException();
lastReturned = next = (next == null) ? last : next.prev;
nextIndex--;
return lastReturned.item;
}

3、foreach循環遍歷：

分析Java字節碼可知，foreach內部實現原理，也是通過Iterator實現的，只不過這個Iterator是Java編譯器幫我們生成的，所以我們不需要再手動去編寫。但是因為每次都要做類型轉換檢查，所以花費的時間比Iterator略長。時間復雜度和Iterator一樣。

使用Iterator的字節碼：

Code:
new # // class java/util/ArrayList
dup
invokespecial # // Method java/util/ArrayList."<init>":()V
astore_
aload_
invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
astore_
goto 
aload_
invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
pop
aload_
invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z
ifne 
return

使用foreach的字節碼：

Code:
new # // class java/util/ArrayList
dup
invokespecial # // Method java/util/ArrayList."<init>":()V
astore_
aload_
invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
astore_
goto 
aload_
invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
checkcast # // class loop/Model
astore_
aload_
invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z
ifne 
return

各遍歷方式的適用於什麼場合？

1、傳統的for循環遍歷，基於計數器的：

順序存儲：讀取性能比較高。適用於遍歷順序存儲集合。

鏈式存儲：時間復雜度太大，不適用於遍歷鏈式存儲的集合。

2、迭代器遍歷，Iterator：

順序存儲：如果不是太在意時間，推薦選擇此方式，畢竟代碼更加簡潔，也防止了Off-By-One的問題。

鏈式存儲：意義就重大了，平均時間復雜度降為O(n)，還是挺誘人的，所以推薦此種遍歷方式。

3、foreach循環遍歷：

foreach只是讓代碼更加簡潔了，但是他有一些缺點，就是遍歷過程中不能操作數據集合（刪除等），所以有些場合不使用。而且它本身就是基於Iterator實現的，但是由於類型轉換的問題，所以會比直接使用Iterator慢一點，但是還好，時間復雜度都是一樣的。所以怎麼選擇，參考上面兩種方式，做一個折中的選擇。

Java的最佳實踐是什麼？

Java數據集合框架中，提供了一個RandomAccess接口，該接口沒有方法，只是一個標記。通常被List接口的實現使用，用來標記該List的實現是否支持Random Access。

一個數據集合實現了該接口，就意味著它支持Random Access，按位置讀取元素的平均時間復雜度為O(1)。比如ArrayList。

而沒有實現該接口的，就表示不支持Random Access。比如LinkedList。

所以看來JDK開發者也是注意到這個問題的，那麼推薦的做法就是，如果想要遍歷一個List，那麼先判斷是否支持Random Access，也就是 list instanceof RandomAccess。

比如：

if (list instanceof RandomAccess) {
//使用傳統的for循環遍歷。
} else {
//使用Iterator或者foreach。
}

以上所述是小編給大家介紹的Java遍歷集合方法分析（實現原理、算法性能、適用場合），希望對大家有所幫助！

上一頁:Bootstrap每天必學之響應式導航、輪播圖
下一頁:下雪了 javascript實現雪花飛舞

關於JavaScript

js實現的切換面板實例代碼: 最近小菜鳥看了妙味課堂的js視頻，學習了一點知識，在這裡總結一下，代碼寫的有點臃腫，剛開始學，不知道
禁用backspace網頁回退功能的實現代碼: 實例如下：<script language=JavaScript>document.on
詳解Bootstrap插件: 在前面布局組件章節中所討論到的組件僅僅是個開始。Bootstrap 自帶 12 種 jQuery

JavaScript基礎知識 JSON基礎正則表達式關於JavaScript JavaScript技巧 jQuery入門知識 AJAX入門 JavaScript綜合知識

DIV CSS 佈局教程網

相關文章