Java集合笔记

[toc]

集合框架概述

一方面，面向对象语言对事物的体现都是以对象的形式，为了方便对多个对象的操作，就要对对象进行存储。另一方面，使用Array存储对象方面具有一些弊端，而Java集合就像一种容器，可以动态地把多个对象的引用放入容器中。
- 数组在内存存储方面的特点：
  - 数组初始化以后，长度就确定了；
  - 数组声明的类型，就决定了进行元素初始化时的类型；
- 数组在存储数据方面的弊端：
  - 数组初始化以后，长度就不可变了，不便于扩展；
  - 数组中提供的属性和方法少，不便于进行添加、删除、插入等操作，且效率不高。同时无法直接获取存储元素的个数；
  - 数组存储的数据是有序的、可以重复的。–>存储数据的特点单一；
Java集合类可以用于存储数量不等的多个对象，还可用于保存具有映射关系的关联数组。

集合框架

两种体系

Java集合可分为Collection和Map两种体系：

Collection接口：单列数据，定义了存取一组对象的方法的集合，未提供直接实现类
- List：元素有序、可重复的集合
- Set：元素无序、不可重复的集合
Map接口：双列数据，保存具有映射关系”key-value对”的集合，提供了直接的实现类

继承和实现关系

|—-Collection接口：单列集合

|—-List接口

|—-Vector实现类

|—-ArrayList实现类

|—-LinkedList实现类

|—-Set接口

|—-HashSet实现类

|—-LinkedHashSet实现类

|—-SortedSet接口

|—-TreeSet实现类

|—-Map接口：双列集合

|—-Hashtable实现类

|—-Properties实现类

|—-HashMap实现类

|—-LinkedHashMap实现类

|—-SortedMap接口

|—-TreeMap实现类

JDK提供的集合API位于java.util包内，下图中：

实线表示继承关系
虚线表示实现关系

Collection接口继承树

Map接口继承树

Collection接口

Collection接口是List、Set和Queue接口的父接口，该接口里定义的方法既可用于操作Set集合，也可用于操作List和Queue集合。

JDK不提供此接口的任何直接实现，而是提供更具体的子接口(如：Set和List)实现。

在Java5之前，Java集合会丢失容器中所有对象的数据类型，把所有对象都当成Object类型处理；从 JDK 5.0 增加了泛型以后，Java集合可以记住容器中对象的数据类型。

Collection接口中的方法

添加

add(Object obj)

Collection collection = new ArrayList();
		
collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection);

addAll(Collection coll)

Collection collection2 = new ArrayList();
collection2.add(new Date());
collection2.addAll(collection);
System.out.println(collection2);

获取有效元素的个数

int size()

Collection collection = new ArrayList();
		
collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());
		
System.out.println(collection.size());

清空集合

void clear()

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.size());
collection.clear();
System.out.println(collection.size());

是否是空集合

boolean isEmpty()

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.size());
collection.clear();
System.out.println(collection.isEmpty());

是否包含某个元素
- boolean contains(Object obj)：是通过元素的equals方法来判断是否是同一个对象

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.contains(123));

boolean containsAll(Collection c)：也是调用元素的equals方法来比较的。拿两个集合的元素挨个比较。

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.containsAll(Arrays.asList(123,"BB")));

删除

boolean remove(Object obj) ：通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

collection.remove("AA");
System.out.println(collection);

boolean removeAll(Collection coll)：取当前集合的差集

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection);

Collection collection2 = new ArrayList();
collection2.add("BB");
collection2.add(123);
collection.removeAll(collection2);
System.out.println(collection);

取两个集合的交集

boolean retainAll(Collection c)：把交集的结果存在当前集合中，不影响c

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection);


Collection collection2 = new ArrayList();
collection2.add("BB");
collection2.add(123);
collection.retainAll(collection2);
System.out.println(collection);

集合是否相等

boolean equals(Object obj)

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection);


Collection collection2 = new ArrayList();
collection2.addAll(collection);
System.out.println(collection.equals(collection2));

转成对象数组

Object[] toArray()

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(Arrays.toString(collection.toArray()));

获取集合对象的哈希值

hashCode()

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.hashCode());

遍历

iterator()：返回迭代器对象，用于集合遍历

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

System.out.println(collection.iterator());  // java.util.ArrayList$Itr@7506e922

使用contains、containsAll、remove、removeAll、retainAll、equals方法时，被添加的数据对象所在类需要重写equals方法。

Iterator迭代器

Iterator迭代器接口

Iterator对象称为迭代器(设计模式的一种)，主要用于遍历 Collection 集合中的元素。
GOF给迭代器模式的定义为：提供一种方法访问一个容器(container)对象中各个元素，而又不需暴露该对象的内部细节。 迭代器模式，就是为容器而生。类似于“公交车上的售票员”、“火车上的乘务员”、“空姐”。
Collection接口继承了java.lang.Iterable接口，该接口有一个iterator()方法，那么所有实现了Collection接口的集合类都有一个iterator()方法，用以返回一个实现了Iterator接口的对象。
Iterator仅用于遍历集合，Iterator本身并不提供承装对象的能力。如果需要创建Iterator对象，则必须有一个被迭代的集合。
集合对象每次调用iterator()方法都得到一个全新的迭代器对象，默认游标都在集合的第一个元素之前。

Iterator接口的方法

返回类型	方法	描述
`boolean`	`hasNext()`	如果迭代具有更多元素，则返回`true` 。
`E`	`next()`	返回迭代中的下一个元素。
`default void`	`remove()`	从底层集合中删除此迭代器返回的最后一个元素（可选操作）。

在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用，且下一条记录无效，直接调用it.next()会抛出NoSuchElementException异常。

remove()示例

Iterator iter = coll.iterator();
while(iter.hasNext()){
  Object obj = iter.next();
  if(obj.equals("Tom")){
  	iter.remove();
  }
}

注意：

Iterator可以删除集合的元素，但是是遍历过程中通过迭代器对象的remove方法，不是集合对象的remove方法。

如果还未调用next()或在上一次调用next方法之后已经调用了remove方法，再调用remove都会报IllegalStateException。

遍历Collection元素

Collection collection = new ArrayList();

collection.add("AA");
collection.add("BB");
collection.add(123);
collection.add(new Date());

方式一：使用next()方法

System.out.println(iterator.next());
System.out.println(iterator.next());
System.out.println(iterator.next());
System.out.println(iterator.next());

方式二：使用for循环

1
2
3

for (int i = 0; i < collection.size(); i++) {
	System.out.println(iterator.next());
}

方式三：使用while循环

// hasNext():判断是否还有下一个元素
while (iterator.hasNext()) {
  // next():①指针下移 ②将下移以后集合位置上的元素返回
	System.out.println(iterator.next());
}

方式四：使用foreach循环

// 内部调用迭代器
for (Object object : collection) {
	System.out.println(object);
}

List接口

鉴于Java中数组用来存储数据的局限性，我们通常使用List替代数组
List集合类中元素有序、且可重复，集合中的每个元素都有其对应的顺序索引。
List容器中的元素都对应一个整数型的序号记载其在容器中的位置，可以根据序号存取容器中的元素。
JDK API中List接口的实现类常用的有：ArrayList、LinkedList和Vector。

方法

List除了从Collection集合继承的方法外，List集合里添加了一些根据索引来操作集合元素的方法。

void add(int index, Object ele): 在index位置插入ele元素
boolean addAll(int index, Collection eles): 从index位置开始将eles中的所有元素添加进来
Object get(int index): 获取指定index位置的元素
int indexOf(Object obj): 返回obj在集合中首次出现的位置
int lastIndexOf(Object obj): 返回obj在当前集合中末次出现的位置
Object remove(int index): 移除指定index位置的元素，并返回此元素
Object set(int index, Object ele): 设置指定index位置的元素为ele
List subList(int fromIndex, int toIndex): 返回从fromIndex到toIndex位置的子集合

实现类

|—-List接口

|—-ArrayList实现类：作为List接口的主要实现类；线程不安全，效率高；底层使用Object[] elementData存储

|—-LinkedList实现类：底层使用双向链表存储；适用于频繁插入、删除操作，操作效率比ArrayList高

|—-Vector实现类：List接口的古老实现类；线程安全，效率低；底层使用Object[] elementData存储

ArrayList实现类

ArrayList是 List接口的典型实现类、主要实现类
本质上，ArrayList是对象引用的一个”变长”数组
ArrayList的JDK1.8 之前与之后的实现区别？
- JDK1.7：ArrayList像饿汉式，直接创建一个初始容量为10的数组
- JDK1.8：ArrayList像懒汉式，一开始创建一个长度为0的数组，当添加第一个元素时再创建一个始容量为10的数组
Arrays.asList(…) 方法返回的List集合，既不是ArrayList实例，也不是Vector实例。Arrays.asList(…) 返回值是一个固定长度的List集合.

LinkedList实现类

对于频繁的插入或删除元素的操作，建议使用LinkedList类，效率较高。

LinkedList内部使用双向链表，没有声明数组，而是定义了Node类型的first和last，用于记录首末元素。同时，定义内部类Node，作为LinkedList中保存数据的基本结构。Node除了保存数据，还定义了两个变量：

prev变量记录前一个元素的位置
next变量记录下一个元素的位置

新增方法：

void addFirst(Object obj)
void addLast(Object obj)
Object getFirst()
Object getLast()
Object removeFirst()
Object removeLast()

Vector实现类

Vector是一个古老的集合，JDK1.0就有了。大多数操作与ArrayList相同，区别之处在于Vector是线程安全的。
在各种list中，最好把ArrayList作为缺省选择。当插入、删除频繁时，使用LinkedList；Vector总是比ArrayList慢，所以尽量避免使用。

新增方法：

void addElement(Object obj)
void insertElementAt(Object obj,int index)
void setElementAt(Object obj,int index)
void removeElement(Object obj)
void removeAllElements()

Set接口

Set接口是Collection的子接口，set接口没有提供额外的方法
Set集合不允许包含相同的元素，如果试把两个相同的元素加入同一个Set集合中，则添加操作失败。
Set判断两个对象是否相同不是使用==运算符，而是根据equals()方法

实现类

|—-Set接口

|—-HashSet实现类：作为Set接口的主要实现类；线程不安全；可以存储null值

|—-LinkedHashSet实现类：作为HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历；对于频繁的遍历操作，LinkedHashSet效率高于HashSet

|—-SortedSet接口

|—-TreeSet实现类：可以按照添加对象的指定属性进行排序；

HashSet实现类

向HashSet中添加元素的过程：

当向HashSet集合中存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据hashCode值，通过某种散列函数决定该对象在HashSet底层数组中的存储位置。（这个散列函数会与底层数组的长度相计算得到在数组中的下标，并且这种散列函数计算还尽可能保证能均匀存储元素，越是散列分布，该散列函数设计的越好）
如果两个元素的hashCode()值相等，会再继续调用equals方法，如果equals方法结果为true，添加失败；如果为false，那么会保存该元素，但是该数组的位置已经有元素了，那么会通过链表的方式继续链接。

如果两个元素的equals()方法返回true，但它们的hashCode()返回值不相等，hashSet将会把它们存储在不同的位置，但依然可以添加成功。

底层也是数组，初始容量为16，当如果使用率超过0.75，（16*0.75=12）就会扩大容量为原来的2倍。（16扩容为32，依次为64,128….等）

重写hashCode()方法的基本原则

在程序运行时，同一个对象多次调用hashCode()方法应该返回相同的值。
当两个对象的equals()方法比较返回true时，这两个对象的hashCode()方法的返回值也应相等。
对象中用作equals()方法比较的Field，都应该用来计算hashCode值。

问题：为什么用Eclipse/IDEA复写hashCode方法，有31这个数字？

选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大，所谓的“冲突”就越少，查找起来效率也会提高。（减少冲突）

31只占用5bits，相乘造成数据溢出的概率较小。

31可以由i*31==(i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。（提高算法效率）

31是一个素数，素数作用就是，如果我用一个数字来乘以这个素数，那么最终出来的结果只能被素数本身和被乘数还有1来整除！(减少冲突)

重写equals()方法的基本原则

复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()。

LinkedHashSet实现类

LinkedHashSet是 HashSet的子类
LinkedHashSet根据元素的hashCode值来决定元素的存储位置，但它同时使用双向链表维护元素的次序，这使得元素看起来是以插入顺序保存的。
LinkedHashSet插入性能略低于HashSet，但在迭代访问Set里的全部元素时有很好的性能。
LinkedHashSet不允许集合元素重复。

LinkedHashSet中每个元素都是被链表的Node节点包装的，节点中包含指向上一个节点和下一个节点的指针。

TreeSet实现类

TreeSet是SortedSet接口的实现类，TreeSet可以确保集合元素处于排序状态。
TreeSet底层使用红黑结构存储数据。
向TreeSet中添加的数据，要求是相同类的对象

新增的方法：

Comparator comparator()
Object first()
Object last()
Object lower(Object e)
Object higher(Object e)
SortedSet subSet(fromElement, toElement)
SortedSet headSet(toElement)
SortedSet tailSet(fromElement)

TreeSet和后面要讲的TreeMap采用红黑树的存储结构。特点：有序，查询速度比List快。

两种排序方法：自然排序和定制排序。默认情况下，TreeSet采用自然排序。

自然排序

TreeSet会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系，然后将集合元素按升序(默认情况)排列
如果试图把一个对象添加到TreeSet时，则该对象的类必须实现Comparable接口。
- 实现Comparable的类必须实现compareTo(Object obj)方法，两个对象即通过compareTo(Object obj)方法的返回值来比较大小。
Comparable的典型实现
- BigDecimal、BigInteger以及所有的数值型对应的包装类：按它们对应的数值大小进行比较
- Character：按字符的unicode`值来进行比较
- Boolean：true对应的包装类实例大于false对应的包装类实例
- String：按字符串中字符的unicode值进行比较
- Date、Time：后边的时间、日期比前面的时间、日期大
向TreeSet中添加元素时，只有第一个元素无须比较compareTo()方法，后面添加的所有元素都会调用compareTo()方法进行比较。
因为只有相同类的两个实例才会比较大小，所以向TreeSet中添加的应该是同一个类的对象。
对于TreeSet集合而言，它判断两个对象是否相等的唯一标准是：两个对象通过compareTo(Object obj)方法比较返回值。
当需要把一个对象放入TreeSet中，重写该对象对应的equals()方法时，应保证该方法与compareTo(Object obj)方法有一致的结果：如果两个对象通过equals()方法比较返回true，则通过compareTo(Object obj)方法比较应返回0。否则，让人难以理解。

// User类，实现Comparable接口，用于TreeSet添加时进行比较
public class User implements Comparable {
	private String name;
	private int age;

	public User() {
	}

	public User(String name, int age) {
		this.name = name;
		this.age = age;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	@Override
	public int hashCode() {
		final int prime = 31;
		int result = 1;
		result = prime * result + age;
		result = prime * result + ((name == null) ? 0 : name.hashCode());
		return result;
	}

	@Override
	public boolean equals(Object obj) {
		if (this == obj)
			return true;
		if (obj == null)
			return false;
		if (getClass() != obj.getClass())
			return false;
		User other = (User) obj;
		if (age != other.age)
			return false;
		if (name == null) {
			if (other.name != null)
				return false;
		} else if (!name.equals(other.name))
			return false;
		return true;
	}

	@Override
	public String toString() {
		return "User [name=" + name + ", age=" + age + "]";
	}

  // 按姓名由小到大，年龄由小到大排列
	@Override
	public int compareTo(Object o) {
		if (o instanceof User) {
			User another = (User) o;
			int compareTo = this.name.compareTo(another.name);
			if (compareTo != 0) {
				return compareTo;
			} else {
				return Integer.compare(this.age, another.age);
			}
		} else {
			throw new RuntimeException("类型不匹配");
		}
	}
  
}


@Test
public void testTreeSet() {
  TreeSet treeSet = new TreeSet();

  treeSet.add(new User("Tom", 12));
  treeSet.add(new User("Jerry", 23));
  treeSet.add(new User("Kim", 16));
  treeSet.add(new User("Mary", 24));
  treeSet.add(new User("Rose", 12));
  treeSet.add(new User("Kim", 13));

  for (Object object : treeSet) {
  	System.out.println(object);
  }
}

输出：

User [name=Jerry, age=23]
User [name=Kim, age=13]
User [name=Kim, age=16]
User [name=Mary, age=24]
User [name=Rose, age=12]
User [name=Tom, age=12]

定制排序

TreeSet的自然排序要求元素所属的类实现Comparable接口，如果元素所属的类没有实现Comparable接口，或不希望按照升序(默认情况)的方式排列元素或希望按照其它属性大小进行排序，则考虑使用定制排序。定制排序，通过Comparator接口来实现。需要重写compare(T o1,T o2)方法。
利用int compare(T o1,T o2)方法，比较o1和o2的大小：如果方法返回正整数，则表示o1大于o2；如果返回0，表示相等；返回负整数，表示o1小于o2。
要实现定制排序，需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。
此时，仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常。
使用定制排序判断两个元素相等的标准是：通过Comparator比较两个元素返回了0。

@Test
public void testTreeSetComparator() {
  // 按年龄由大到小排列
  Comparator<User> comparator = new Comparator<User>() {
  @Override
  public int compare(User o1, User o2) {
  return -Integer.compare(o1.getAge(), o2.getAge());
  }
  };

  TreeSet treeSet = new TreeSet(comparator);

  treeSet.add(new User("Tom", 12));
  treeSet.add(new User("Jerry", 23));
  treeSet.add(new User("Kim", 16));
  treeSet.add(new User("Mary", 24));
  treeSet.add(new User("Rose", 12));
  treeSet.add(new User("Kim", 13));

  for (Object object : treeSet) {
  	System.out.println(object);
  }

}

输出：由于new User("Rose", 12)与new User("Tom", 12))的年龄相同，比较的返回值为0，且排在Tom的后面，就会认为Rose与Tom是相同的，所以没有添加到TreeSet中去。

User [name=Mary, age=24]
User [name=Jerry, age=23]
User [name=Kim, age=16]
User [name=Kim, age=13]
User [name=Tom, age=12]

❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗

自然排序中，比较两个对象是否相同的标准为：compareTo()返回0，不再是equals()。

定制排序中，比较两个对象是否相同的标准为：compare()返回0，不再是equals()。

❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗

Map接口

Map与Collection并列存在。用于保存具有映射关系的数据:key-value
Map中的key和value都可以是任何引用类型的数据
Map 中的 key 用Set来存放，不允许重复，即同一个 Map 对象所对应的类，须重写hashCode()和equals()方法
常用String类作为Map的“键”
key 和 value 之间存在单向一对一关系，即通过指定的 key 总能找到唯一的、确定的 value
Map接口的常用实现类：HashMap、TreeMap、LinkedHashMap和Properties。其中，HashMap是 Map 接口使用频率最高的实现类

继承结构

|—-Map接口：双列集合

|—-HashMap实现类：作为Map的主要实现类；线程不安全，效率高；可以存储null的key和value；key所在类要重写equals()和hashCode()；value所在类要重写equals()

|—-LinkedHashMap实现类：保证在遍历map元素时，可以按照添加的顺序实现遍历。原因：在原有的HashMap底层结构上，添加一对指针，指向前一个和后一个元素，对于频繁的遍历操作，此类执行效率高于HashMap。

|—-SortedMap接口

|—-TreeMap实现类：保证按照添加的key-value进行排序，实现排序遍历。考虑key的自然排序或定制排序。底层使用红黑树

|—-Hashtable实现类：古老的实现类；线程安全，效率低；不能存储null的key和value

|—-Properties实现类：常用来处理配置文件。key和value都是String类型。

HashMap和Hashtable的关系类似于ArrayList和Vector的关系，HashMap和ArrayList要比Hashtable和Vector新，所以后续使用时，主要使用HashMap和ArrayList。

Map结构的理解

Map中的key：无序的、不可重复的，使用Set存储所有的key –> key所在类要重写equals()和hashCode()（以HashMap为例）
Map中的value：无序的、可重复的，使用Collection存储所有的value –> value所在的类要重写equals()
一个键值对：key-value构成一个Entry对象
Map中的entry：无序的、不可重复的，使用Set存储所有的entry

常用方法

添加、删除、修改操作：
- Object put(Object key,Object value)：将指定key-value添加到(或修改)当前map对象中
- void putAll(Map m):将m中的所有key-value对存放到当前map中
- Object remove(Object key)：移除指定key的key-value对，并返回value
- void clear()：清空当前map中的所有数据
元素查询的操作：
- Object get(Object key)：获取指定key对应的value
- boolean containsKey(Object key)：是否包含指定的key
- boolean containsValue(Object value)：是否包含指定的value
- int size()：返回map中key-value对的个数
- boolean isEmpty()：判断当前map是否为空
- boolean equals(Object obj)：判断当前map和参数对象obj是否相等
元视图操作的方法：
- Set keySet()：返回所有key构成的Set集合
- Collection values()：返回所有value构成的Collection集合
- Set entrySet()：返回所有key-value对构成的Set集合

实现类

HashMap实现类

HashMap是Map接口使用频率最高的实现类。
允许使用null键和null值，与HashSet一样，不保证映射的顺序。
所有的key构成的集合是Set:无序的、不可重复的。所以，key所在的类要重写：equals()和hashCode()
所有的value构成的集合是Collection:无序的、可以重复的。所以，value所在的类要重写：equals()
一个key-value构成一个entry
所有的entry构成的集合是Set:无序的、不可重复的
HashMap判断两个key相等的标准是：两个key通过equals()方法返回true，hashCode值也相等。
HashMap判断两个value相等的标准是：两个value通过equals()方法返回true。

HashMap的存储结构

JDK 7及以前版本：HashMap是数组+链表结构(即为链地址法)。

HashMap的内部存储结构其实是数组和链表的结合。当实例化一个HashMap时，系统会创建一个长度为Capacity的Entry数组，这个长度在哈希表中被称为容量(Capacity)，在这个数组中可以存放元素的位置我们称之为“桶”(bucket)，每个bucket都有自己的索引，系统可以根据索引快速的查找bucket中的元素。

每个bucket中存储一个元素，即一个Entry对象，但每一个Entry对象可以带一个引用变量，用于指向下一个元素，因此，在一个桶中，就有可能生成一个Entry链。而且新添加的元素作为链表的head。

添加元素的过程

向HashMap中添加entry1(key，value)，需要首先计算entry1中key的哈希值(根据key所在类的hashCode()计算得到)，此哈希值经过处理以后，得到在底层Entry[]数组中要存储的位置i。如果位置i上没有元素，则entry1直接添加成功。如果位置i上已经存在entry2(或还有链表存在的entry3，entry4)，则需要通过循环的方法，依次比较entry1中key和其他的entry。如果彼此hash值不同，则直接添加成功。如果hash值不同，继续比较二者是否equals。如果返回值为true，则使用entry1的value去替换equals为true的entry的value。如果遍历一遍以后，发现所有的equals返回都为false,则entry1仍可添加成功。entry1指向原有的entry元素。

HashMap的扩容

当HashMap中的元素越来越多的时候，hash冲突的几率也就越来越高，因为数组的长度是固定的。所以为了提高查询的效率，就要对HashMap的数组进行扩容，而在HashMap数组扩容之后，最消耗性能的点就出现了：原数组中的数据必须重新计算其在新数组中的位置，并放进去，这就是resize。

HashMap的扩容时机

当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数size)*loadFactor时，就会进行数组扩容，loadFactor的默认值(DEFAULT_LOAD_FACTOR)为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小(DEFAULT_INITIAL_CAPACITY)为16，那么当HashMap中元素个数超过16*0.75=12（这个值就是代码中的threshold值，也叫做临界值）的时候，就把数组的大小扩展为2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

简述HashMap map = new HashMap();的过程：

实例化后，底层创建了长度是16的一维数组Entry[] table。

调用map.put(key1, value1)存放元素时：首先，调用key1所在类的hashCode()计算key1的哈希值，此哈希值经过某种算法计算以后，得到在Entry数组中的存放位置。

如果此位置上的数据为空，此时key1-value1添加成功
如果此位置上的数据不为空（意味着此位置上存在一个或多个数据（以链表形式存在）），比较key1和已经存在的一个或多个数据的哈希值：
- 如果key1的哈希值与已经存在的数据的哈希值都不相同，此时key1-value1添加成功。
- 如果key1的哈希值和已经存在的某一个数据（key2-value2）的哈希值相同，继续比较：调用key1所在类的equals()方法，进行比较：
  - 如果equals()返回false：此时key1-value1添加成功。
  - 如果equals()返回true：使用value1替换value2值。

扩容方式：扩容为原来容量的2倍，并将原有的数据复制过来。

JDK 8版本发布以后：HashMap是数组+链表+红黑树实现。

HashMap的内部存储结构其实是数组+链表+树的结合。当实例化一个HashMap时，会初始化initialCapacity和loadFactor，在put第一对映射关系时，系统会创建一个长度为initialCapacity的Node数组，这个长度在哈希表
中被称为容量(Capacity)，在这个数组中可以存放元素的位置我们称之为“桶”(bucket)，每个bucket都有自己的索引，系统可以根据索引快速的查找bucket中的元素。

每个bucket中存储一个元素，即一个Node对象，但每一个Node对象可以带一个引用变量next，用于指向下一个元素，因此，在一个桶中，就有可能生成一个Node链。也可能是一个一个TreeNode对象，每一个TreeNode对象可以有两个叶子结点left和right，因此，在一个桶中，就有可能生成一个TreeNode树。而新添加的元素作为链表的last，或树的叶子结点。

HashMap进行扩容和树形化的时机

当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数size)*loadFactor时，就会进行数组扩容，loadFactor的默认值(DEFAULT_LOAD_FACTOR)为0.75，这是一个折中的取值。也就是说，默认情况下，数组大小(DEFAULT_INITIAL_CAPACITY)为16，那么当HashMap中元素个数超过16*0.75=12（这个值就是代码中的threshold值，也叫做临界值）的时候，就把数组的大小扩展为2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知HashMap中元素的个数，那么预设元素的个数能够有效的提高HashMap的性能。

当HashMap中的其中一个链的对象个数如果达到了8个，此时如果capacity没有达到64，那么HashMap会先扩容解决，如果已经达到了64，那么这个链会变成树，结点类型由Node变成TreeNode类型。当然，如果当映射关系被移除后，下次resize方法时判断树的结点个数低于6个，也会把树再转为链表。

对比JDK 7和JDK 8

HashMap map = new HashMap();//默认情况下，先不创建长度为16的数组
当首次调用map.put()时，再创建长度为16的数组
数组为Node类型，在jdk7中称为Entry类型
形成链表结构时，新添加的key-value对在链表的尾部（七上八下）
当数组指定索引位置的链表长度>8时，且map中的数组的长度>64时，此索引位置上的所有key-value对使用红黑树进行存储

LinkedHashMap实现类

LinkedHashMap是HashMap的子类
在HashMap存储结构的基础上，使用了一对双向链表来记录添加元素的顺序
与LinkedHashSet类似，LinkedHashMap可以维护Map的迭代顺序：迭代顺序与Key-Value对的插入顺序一致

HashMap中的内部类：Node

static class Node<K,V> implements Map.Entry<K,V> {
  final int hash;
  final K key;
  V value;
  Node<K,V> next;
}

LinkedHashMap中的内部类：Entry

static class Entry<K,V> extends HashMap.Node<K,V> {
  Entry<K,V> before, after;
  Entry(int hash, K key, V value, Node<K,V> next) {
  	super(hash, key, value, next);
  }
}

TreeMap实现类

TreeMap存储Key-Value对时，需要根据key-value对进行排序。TreeMap可以保证所有的Key-Value对处于有序状态。
TreeSet底层使用红黑树结构存储数据
TreeMap的Key的排序：
- 自然排序：TreeMap的所有的Key必须实现Comparable接口，而且所有的Key应该是同一个类的对象，否则将会抛出ClasssCastException
- 定制排序：创建TreeMap时，传入一个Comparator对象，该对象负责对TreeMap中的所有key进行排序。此时不需要Map的Key实现Comparable接口
TreeMap判断两个key相等的标准：两个key通过compareTo()方法或者compare()方法返回0。

Hashtable实现类（古老）

Hashtable是个古老的Map实现类，JDK1.0就提供了。不同于HashMap，Hashtable是线程安全的。
Hashtable实现原理和HashMap相同，功能相同。底层都使用哈希表结构，查询速度快，很多情况下可以互用。
与HashMap不同，Hashtable不允许使用null作为key和value
与HashMap一样，Hashtable也不能保证其中Key-Value对的顺序
Hashtable判断两个key相等、两个value相等的标准，与HashMap一致。

Properties实现类

Properties类是Hashtable的子类，该对象用于处理属性文件
由于属性文件里的key、value都是字符串类型，所以Properties里的key和value都是字符串类型
存取数据时，建议使用setProperty(String key,String value)方法和getProperty(String key)方法

例：

Properties pros = new Properties();
pros.load(new FileInputStream("jdbc.properties"));
String user = pros.getProperty("user");
System.out.println(user);

Collections工具类

Collections是一个操作Set、List和Map等集合的工具类
Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作，还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
排序操作：为（均为static方法）
- reverse(List)：反转List中元素的顺序
- shuffle(List)：对List集合元素进行随机排序
- sort(List)：根据元素的自然顺序对指定List集合元素按升序排序
- sort(List，Comparator)：根据指定的Comparator产生的顺序对List集合元素进行排序
- swap(List，int，int)：将指定list集合中的i处元素和j处元素进行交换
查找、替换：
- Object max(Collection)：根据元素的自然顺序，返回给定集合中的最大元素
- Object max(Collection，Comparator)：根据Comparator指定的顺序，返回给定集合中的最大元素
- Object min(Collection)
- Object min(Collection，Comparator)
- int frequency(Collection，Object)：返回指定集合中指定元素的出现次数
- void copy(List dest,List src)：将src中的内容复制到dest中
- boolean replaceAll(List list，Object oldVal，Object newVal)：使用新值替换List对象的所有旧值
同步控制：Collections类中提供了多个synchronizedXxx()方法，该方法可使将指定集合包装成线程同步的集合，从而可以解决多线程并发访问集合时的线程安全问题