Java-Collection Framework

JAVA的集合框架（Java Collection Framework）是JAVA的基础知识，在我们的开发过程中几乎是时时刻刻都要用到的东西。但是因为其中的接口和类很多，我们未必会对其完全熟悉。这里，我就做个简单的归纳和介绍。

从上我们可以看出，最顶端其实就是4个接口：Collection ，List ，Set ，和Map 。其中List和Set是继承自Collection，而Map则自成一脉。这些接口都是在java.util路径下的，都属于java的基础类库rt.jar。

这里我们需要说明一下的是，java.util.Collections，是不属于java的集合框架的。它是一个集合的工具类。比如我们常用它的排序方法：Collections.sort(List), Collections.sort(List, Comparator)。

如何遍历Collection中的每一个元素？不论Collection的实际类型如何，它都支持一个iterator()的方法，该方法返回一个迭代子，使用该迭代子即可逐一访问Collection中每一个元素。典型的用法如下：

　　　　Iterator it = collection.iterator();// 获得一个迭代子

　　　　while(it.hasNext()) {

　　　　　　Object obj = it.next();// 得到下一个元素

　　　　}

由Collection接口派生的两个接口是List和Set。

知识点：

Collection是最基本的集合接口，一个Collection代表一组Object，即Collection的元素。

Collection包括Set、Map和List三个接口：

1、List是有序的Collection，使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引（元素在List中的位置，类似于数组下标）来访问List中的元素，这类似于Java的数组。和下面要提到的Set不同，List允许有相同的元素。

　　除了具有Collection接口必备的iterator()方法外，List还提供一个listIterator()方法，返回一个 ListIterator接口，和标准的Iterator接口相比，ListIterator多了一些add()之类的方法，允许添加，删除，设定元素，还能向前或向后遍历。

实现List接口的常用类有ArrayList，LinkedList，Vector和Stack：

ArrayList类：

ArrayList以数组的形式存放对象，可以自动增加，存放时有序存放，且对象可以重复，

　　ArrayList实现了可变大小的数组。它允许所有元素，包括null。ArrayList没有同步。

size，isEmpty，get，set方法运行时间为常数。但是add方法开销为分摊的常数，添加n个元素需要O(n)的时间。其他的方法运行时间为线性。

　　每个ArrayList实例都有一个容量（Capacity），即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加，但是增长算法并没有定义。当需要插入大量元素时，在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

　　和LinkedList一样，ArrayList也是非同步的（unsynchronized）。

LinkedList类

LinkedList是以链表的形式存放对象，这样就克服了ArrayList的插入、删除的不便，但查询效率不如ArrayList高。

　　LinkedList实现了List接口，允许null元素。此外LinkedList提供额外的addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast()等方法在 LinkedList的首部或尾部。这些操作使LinkedList可被用作堆栈（stack），队列（queue）或双向队列（deque）。

　　注意LinkedList没有同步方法。如果多个线程同时访问一个List，则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List：

　　　　List list = Collections.synchronizedList(new LinkedList(...));

Vector类

　　Vector非常类似ArrayList，但是Vector是同步的。由Vector创建的Iterator，虽然和ArrayList创建的 Iterator是同一接口，但是，因为Vector是同步的，当一个Iterator被创建而且正在被使用，另一个线程改变了Vector的状态（例如，添加或删除了一些元素），这时调用Iterator的方法时将抛出ConcurrentModificationException，因此必须捕获该异常。

Stack 类

　　Stack继承自Vector，实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。基本的push和pop 方法，还有peek方法得到栈顶的元素，empty方法测试堆栈是否为空，search方法检测一个元素在堆栈中的位置。Stack刚创建后是空栈。

总结：

ArrayList和Vector的区别：ArrayList是非线程安全的，效率高；Vector是基于线程安全的，效率低

Vector与ArrayList有些相似，但Vector是线程安全的，即同一时刻允许有多个线程同时访问。

2.Set：集合中对象不按特殊方式排序，并且没有重复对象。它的有些实现类能够对集合中的对象按照特定方式排序。

Set特点：元素无放入顺序，元素（即对象）不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的）

Set接口的两个实现类：HashSet和TreeSet，LinkedHashSet。

HashSet类按照哈希算法来存取对象，具有很好的存取和查找性能。由于采用这种算法，所以应该覆盖Object类中的equals()方法和hashCode()方法，否则可能会使HashSet无法正常工作。

有重复对象equals()方法返回为true；

重复对象hashCode()方法返回相同的整数；

不同的对象，应使hashCode()返回的整数尽量不同，这样可减少调用equals()方法的次数，提高程序运行效率。

TreeSet类：实现了SortedSet接口，能够对集合中的对象进行排序。在元素添加的同时，根据给出的排序规则，进行排序。

唯一性保证：根据排序规则，compareTo()方法返回为0，就可以认定两个对象中有一个是重复对象。

TreeSet类：（底层由平衡二叉树实现）。

总结：Set是一种不包含重复的元素的Collection，即任意的两个元素e1和e2都有e1.equals(e2)=false，Set最多有一个null元素。很明显，Set的构造函数有一个约束条件，传入的Collection参数不能包含重复的元素。

　　请注意：必须小心操作可变对象（Mutable Object）。如果一个Set中的可变元素改变了自身状态导致Object.equals(Object)=true将导致一些问题。

3、Map：请注意，Map没有继承Collection接口，Map提供key到value的映射。一个Map中不能包含相同的key，每个key只能映射一个 value。Map接口提供3种集合的视图，Map的内容可以被当作一组key集合，一组value集合，或者一组key-value映射。

Map接口有三个实现类：HashMap，HashTable，TreeMap，LinkedHashMap

Map的两个比较常用的实现：HashMap和TreeMap。

Hashtable类

　　Hashtable继承Map接口，实现一个key-value映射的哈希表。任何非空（non-null）的对象都可作为key或者value。

　　添加数据使用put(key, value)，取出数据使用get(key)，这两个基本操作的时间开销为常数。

Hashtable通过initial capacity和load factor两个参数调整性能。通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大，这会影响像get和put这样的操作。

使用Hashtable的简单示例如下，将1，2，3放到Hashtable中，他们的key分别是”one”，”two”，”three”：

Hashtable numbers = new Hashtable();

　　　　numbers.put(“one”,new Integer(1));

　　　　numbers.put(“two”,new Integer(2));

　　　　numbers.put(“three”,new Integer(3));

　　要取出一个数，比如2，用相应的key：

　　　　Integer n = (Integer)numbers.get(“two”);

　　　　System.out.println(“two = ” + n);

由于作为key的对象将通过计算其散列函数来确定与之对应的value的位置，因此任何作为key的对象都必须实现hashCode和equals方法。hashCode和equals方法继承自根类Object，如果你用自定义的类当作key的话，要相当小心，按照散列函数的定义，如果两个对象相同，即obj1.equals(obj2)=true，则它们的hashCode必须相同，但如果两个对象不同，则它们的hashCode不一定不同，如果两个不同对象的hashCode相同，这种现象称为冲突，冲突会导致操作哈希表的时间开销增大，所以尽量定义好的hashCode()方法，能加快哈希表的操作。

　　如果相同的对象有不同的hashCode，对哈希表的操作会出现意想不到的结果（期待的get方法返回null），要避免这种问题，只需要牢记一条：要同时复写equals方法和hashCode方法，而不要只写其中一个。

　　Hashtable是同步的。

HashMap类：

HashMap和Hashtable类似，不同之处在于HashMap是非同步的，并且允许null，即null value和null key。，但是将HashMap视为Collection时（values()方法可返回Collection），其迭代子操作时间开销和HashMap 的容量成比例。因此，如果迭代操作的性能相当重要的话，不要将HashMap的初始化容量设得过高，或者load factor过低。

TreeMap类：

TreeMap实现了SortedMap接口，能对键对象进行排序。添加元素时根据给出的排序规则进行排序。

WeakHashMap类

　WeakHashMap是一种改进的HashMap，它对key实行“弱引用”，如果一个key不再被外部所引用，那么该key可以被GC回收。

HashMap非线程安全，高效，支持null；HashTable线程安全，低效，不支持null。

总结：

　　如果涉及到堆栈，队列等操作，应该考虑用List，对于需要快速插入，删除元素，应该使用LinkedList，如果需要快速随机访问元素，应该使用ArrayList。

　　如果程序在单线程环境中，或者访问仅仅在一个线程中进行，考虑非同步的类，其效率较高，如果多个线程可能同时操作一个类，应该使用同步的类。

　　要特别注意对哈希表的操作，作为key的对象要正确复写equals和hashCode方法。

　　尽量返回接口而非实际的类型，如返回List而非ArrayList，这样如果以后需要将ArrayList换成LinkedList时，客户端代码不用改变。这就是针对抽象编程。

http://blog.csdn.net/zolalad/article/details/16344661

参考：http://blog.csdn.net/abbuggy/article/details/7720666

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。