首页 > 编程语言 > java中的常用集合类整理
2021
09-19

java中的常用集合类整理

集合、数组都是对多个数据进行存储操作(主要是内存层面存储)的结构,简称Java容器。

数组的特点

1.数组初始化以后,长度确定不可变

2.数组定义好,其元素的类型确定不可变(可能有多态性)

3.数组中提供的方法有限,对于添加、删除、插入数据等操作不方便。

4.获取数组中实际元素的个数是没有办法的。

5.数组存储数据的特点是有序、可重复的。

Java集合可分为Collection和Map两种体系,集合存储的优点是解决数组存储数据方面的弊端。

  • Collection接口:单列数据,用来存储一个一个的对象
    • List接口:元素有序,可重复的集合 --> '动态'数组
    • Set接口 :元素无序、不可重复的集合
  • Map接口:双列数据,保存有映射关系(键值对)的集合

Collection接口

向collection接口的实现类的对象中添加数据obj时,要求obj所在类要重写equals方法。

Abstract Methods

add(Object e):将元素e添加到集合中

size():获取添加的元素个数

addAll(Collection coll):将形参coll集合的元素添加到当前集合中

clear():清空集合元素,集合仍然存在,只是集合里没有元素

isEmpty():判断当前集合是否为空

contains(Object obj):判断当前集合中是否包含obj,是否包含是通过调用obj的equals判断

containsAll(Collection coll):判断形参coll中的所有元素是否都存在当前集合中。

remove(Object obj):移除某个元素,同样通过equals寻找移除的元素

removeAll(Collection coll):从当前集合中移除coll集合中所有的元素,需要调用equals函数

retainAll(Collection coll):求两个集合的交集,结果为修改当前集合后的集合。

equals(Collection coll):比较两个集合是否一样。

hashCode():返回当前对象的哈希值

集合的遍历:iterator 接口

集合元素的遍历操作:Iterator迭代器接口。只能遍历集合Collection,map不行

Iterator <E> iterator = coll.iterator();
//方式一:通过iterator.next()获得集合元素
iterator.next();
//方式二:循环,不推荐
for(int i =0;i<coll.size;i++){
    iterator.next();
}
//方式三:推荐!
//hasNext():判断是否还有下一个元素
while(iterator.hasNext()){
    //next():①指针下移 ②将下移以后集合位置上的元素返回
    Object obj = iterator.next();
    if("Tom".equals(obj)){
    //iterator中的remove(),删除集合中的元素
    iterator.remove()
    }
}
//方法引用,Java8新特性
coll.forEach(System.out::println)

集合的遍历:增强for循环

增强for循环用于遍历数组和集合(colleciton)

格式:集合元素的类型 局部变量:集合

//第一个位置,是当前的元素
//第二个位置,是遍历的对象
//集合元素的类型 局部变量 :集合
for(Object obj : coll){}

面试题

知识点:增强for只能遍历不能赋值

集合元素的类型 局部变量:集合

相当于从集合中取出赋值给局部变量,集合本身是没有修改的。

String [] arr = new String[]{"ranan","ranan"}
//普通for循环
for(int i=0;i<arr.length;i++){
    arr[i] = "xx"
}
for(int i=0;i<arr.length;i++){
    System.out.println(arr[i]); //输出"xx"
}
//增强for循环
for(String s:arr){
    //这里的s是局部变量,相当与取出arr[i]的值赋值给了变量s,改变的是s的值
    s = "xx";
}
for(int i=0;i<arr.length;i++){
    System.out.println(arr[i]); //输出"ranan"
}

List接口

比较ArrayList、LinkedList、Vector的异同

同:三各类都实现了List接口,存储数据的特点相同:存储有序的、可重复异:

  • ArrayList:List接口的主要实现类,线程不安全、效率高,底层使用Object[]存储,默认扩容为原数组的1.5倍
  • LinkedList:底层使用双向链表存储,对于频繁的插入、删除操作效率更高
  • Vector:List接口的古老实现类,线程安全、效率低,底层使用Object[]存储,默认长度为10。默认扩容为原数组的2倍

ArrayList

JDK7

//底层创建了长度是10的object[]数组
ArrayList <Integer> list = new ArrayList<Integer>();//一般扩容原来的一半,将原数组元素复制到新数组
List add(123) //底层使用Object[]数组存储,elementData[0]= new Integer(123)
ArrayList list = new ArrayList(数字)

结论:建议开发中使用带参的构造器

JDK8

ArrayList list = new ArrayList() //底层的object[] elementData初始化为{},并没有创建长度为10的数组

懒汉式,底层的object[] elementData初始化为{},并没有创建长度为10的数组,第一次调用add方法时才new创建好数组。后续的添加和扩容操作与jdk7中一样。

区别:JDK7中的ArrayList对象的创建类似于单例的饿汉式,而JDK8中的类似于单例的懒汉式,延迟了数组的创建,节省内存

LinkedList

LinkedList = new LinkedList()//内部声明了Node类型的first与last,值为null

removeLast():移除最后一个元素

List的常用方法

List集合添加了一些根据索引来操作集合元素的方法,因为List是有序的

void add(int index,Object ele):在index位置插入ele元素

boolean addAll(int index,Collection eles):从index位置开始依次插入eles中的所有元素

Object get(int index):获取指定index位置的元素

int indexOf(Object obj):返回obj在集合中首次出现的位置

int LastIndexOf(Object obj):返回obj在集合中最后一次出现的位置

Object remove(int index):移除指定index位置的元素,并返回此元素

Object set(int index,Object ele):设置指定index位置的元素为ele

List subList(int fromIndex,int toIndex):返回从fromIndex到toIndex位置的子集合

常用方法

增:add(Object obj)

删:remove(int index)/remove(Obejct obj)

改:set(int index,Object ele)

查:get(int index)

插:add(int index,Object ele)

长度:size()

遍历:Iterator迭代器方法/增强for循环/普通的循环

集合与数组的转换

集合转换成数组 --> coll.toArray()

数组转换成List --> Arrays.asList(new String[]{'AA','BB','CC'})

使用场景:生成一个不可更改的list

Arrays.asList

1.该方法适用于对象型数据的数组(String、Integer...)

2.该方法不建议使用于基本数据类型的数组(byte,short,int,long,float,double,boolean

3.该方法将数组与List列表链接起来:当更新其一个时,另一个自动更新

4.不支持add()、remove()、clear()等方法。用此方法得到的List的长度是不可改变的

List arr = Arrays.asList(new int[]{123,456})会把new int[]{123,456}整体看成一个元素,基本数据类型数组会被看成一个整体。可以写成 List arr = Arrays.asList(123,456)

Set接口

Set接口中没有额外定义新的方法。

比较HashSet、LinkedHashSet、TreeSet

同:都是Set接口的实现类,存放数据无序、不可重复

HashSet:Set接口的主要实现类,线程不安全,可以存放null值,数组+链表存储数据

LinkedHashSet:HashSet的子类,遍历其内部数据时可以按照添加的顺序遍历,对于频繁的遍历操作,LinkedHashSet效率高于HashSet

TreeSet:数据是同一类的,可以按照添加对象的指定属性,进行排序。

无序性与不可重复性

无序性:不等于随机性,存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的hash值决定。(数组中的存储不是按照添加顺序添加的)

不可重复性:先比较添加元素的hash值是否相同,相同按照equals()判断是否重复

HashSet中元素的添加过程

向HashSet中添加元素a

1.先调用元素a所在类的hashCode()方法,计算a的哈希值。

2.此hash值通过散列函数计算出在HashSet底层数组中的存放位置 + 拉链法解决冲突

散列函数 + 拉链法解决冲突 拉链法时要先比较hash值再按照equals()判断是否重复,不重复时再链上

要求:向Set中添加的数据,其所在类的一定要重写HashCode方法和equals方法,此两个方法尽可能保持一致性。(相等的对象必须具有相同的hash值)

注意:

new HashSet()实际上是new了一个HashMap,向HashSet添加元素实际上是向HashMap添加元素,在HashSet中添加的元素相当于是HashMap的key,value都指向一个对象(这个对象没什么意义)

LinkedHashSet

LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用指针,遍历其内部数据时可以按照添加的顺序遍历

TreeSet

要求:向TreeSet中添加的数据,要求是相同类的对象作用:进行排序

遍历的时候会调用排序方法进行自动排序。

自然排序(Comparable接口):比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()

定制排序(Comparator接口):比较两个对象是否相同的标准为:compare()返回0,不再是equals()

Comparator com = new Comparator(){
    //定制排序内容
    @override
    public int compare(Object o1,Object o2){}
}
TreeSet set = new TreeSet(com)

练习题

1.在List内去除重复数字值,要求尽量简单

HashSet常常用于过滤重复元素 --> set.addAll(list) --> return new ArrayList(set)

//Person类中重写了hashCode()和equals()方法
HashSet set = new HashSet();
Person p1 = new Person(1001,"AA");
Person p2 = new Person(1002,"BB");
set.add(p1);
set.add(p2);
p1.name = "CC";
set.remove(p1);//remove时先计算hash值(此题由id和name共同计算所得),内容变了hash值也变了
System.out.println(set);//1001,"CC"   1002,"BB"
set.add(new Person(1001,"CC"));//原来的p1的hash值是按照1001,"AA"计算所得,此时算出来的应该是新的hash值
System.out.println(set);//1001,"CC"   1002,"BB"  1001,"CC"
set.add(new Person(1001,"AA")); //这里算出来是p1的hash值,hash值相同调用equals方法发现不同
System.out.println(set);//1001,"CC"   1002,"BB"  1001,"CC" 1001,"AA" 

Map接口

Map实现类的结构

HashMap:作为Map的主要实现类,线程不安全,效率高。可以存储key/value = null

LinkedHashMap:在遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层结构基础上添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,LinkedHashMap效率高于HashMap

TreeMap:保证按照添加的key-value对进行排序(key),实现排序遍历,底层使用红黑树

Hashtable:作为古老实现类,线程安全,效率低,不可以存储key/value = null

Properties:常用来处理配置文件,key-value都是String类型

Entry(key,value)无序,不可重复(Set)

key无序,不可重复,用set存储。 --> 不可重复,key所在的类要重写quals()hashCode() (HashMap为例)

value无序,可重复 --> value所在的类要重写equals,重写是为了实现通过value找到key的方法

Map中的常用方法

增删改

Object put(Object ket,Object value):将指定key-value添加到(或修改key的值)当前map对象

void putAll(Map m):将m中的所有key-value对存放在当前map中

Object remove(Object key):移除指定key的key-value对,并返回value

void clear():清空当前的map中的数据,map还在,只是里面没数据了。map.size()不会报错

Object get(Object key):获取指定key对用的value

boolean containsKey(Object key):是否包含指定的key

boolean containsValue(Object key):是否包含指定的key

int size():返回map中键值对的个数

boolean isEmpty():判断当前map是否为空

boolean equals(Object obj):判断当前map和参数对象obj是否相等

遍历

Set keySet():返回所有key构成的Set集合

Collection values():返回所有value构成的Collection集合

Set entrySet():返回所有key-value对构成的Set集合,Set<Map.Entry<Character,Integer>> entry = map.entetSet()

//返回的是Collection之后就可以使用iterator迭代器
Set set = map.keySet();
Iterator iterator = set.iterator();
//遍历所有的key-value
Set entrySet = map.entrySet()
Iterator iterator = entrySet.iterator();
while(iterator.hasNext()){
    Object obj = iterator.next();
    Map.Entry entry = (Map.Entry) obj;
    System.out.println(entry.getKey()+"--->"+entry.getValue());
}
//写法二
Set <Map.Entry<String,Integer>> entrySet = map.entrySet();
Iterator <Map.Entry<String,Integer>> iterator = entrySet.iterator();
while(iterator.hasNext()){
    Map.Entry <String,Integer> entry = iterator.next();
    String key = entry.getKey();
    Integer value = entry.getValue();
}

HashMap

问题1:HashMap的底层实现原理?

JDK7:

//在实例化以后,底层创建了长度16的一维数组Entry[] table
HashMap<E,E> map = new HashMap<E,E>();
//...可能已经执行过多次put...
map.put(key1,value);

往map中添加键值对的过程

  1. 调用key1所在类的hashCode()计算key1哈希值,得到在Entry中的存放位置
  2. 检查该位置是否有数据
    1. 没有数据,此时key1-value1添加成功
    2. 有数据,比较key1和已存在的数据的哈希值
    • 如果哈希值一样,调用equals()方法,不相等则添加成功,相等用新的value替换旧的value。put有更新作用
    • 如果哈希值不一样,则添加成功

在不断的添加过程中,默认的扩容方式:扩容为原有容量的2倍,并将原有的数据复制。

JDK8相较于JDK7的不同点(类似ArrayList)

1.new HashMap():底层没有创建一个长度为16的数组

2.首次调用put()方法时,底层创建长度为16的数组

3.jdk8 底层的数组是:Node[]

4.链表插入的方法(七上八下)

5.jdk7底层结构:数组+链表。jdk8中底层结构:数组+链表+红黑树。

当数组的某一个索引位置上的元素以链表形式存在的数据个数>8且当前数组的长度>64(若>8但是<64则扩容),此时该索引位置上的所有数据使用红黑树存储,

问题2:负载(加载)因子值的大小,对HashMap有什么影响?

HashMap的默认容量16

HashMao的默认加载因子0.75

threshold扩容的临界值=容量*填充因子=16 x 0.75=15

负载因子的大小决定了HashMap的数据密度

负载因子越大密度越大,发生碰撞的几率越高,性能会下降

负载因子越小,越容易触发扩容,会浪费空间

LinkedHashMap

LinkedHashMap是HashMap的子类,底层还是按照HashMap去存。

类似LinkedHashSet,在遍历map元素时,可以按照添加的顺序实现遍历。

LinkedHashMap中的内部类多了befor和after指针

TreeMap

要求:向TreeMap中添加key-value,要求key必须是由同一个类创建的对象

排序:按照key进行排序

自然排序(Comparable接口):

比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()

定制排序(Comparator接口):

比较两个对象是否相同的标准为:compare()返回0,不再是equals()

//自然
TreeMap map = new TreeMap();
//添加的key类里重写compareTo()
//定制
Comparator com = new Comparator(){
    //定制排序内容
    @override
    public int compare(Object o1,Object o2){}
}
TreeMap map = new TreeMap(com)

Properties

c类是Hashtable的子类,该对象用于处理属性文件。

由于属性文件里的key-value都是字符串类型,所以Properties里的key和value都是字符串类型。

存储数据时,建议使用setProperty(String key,String value)方法和getProperty(String key)方法

需要在当前项目中添加配置文件,File(手动添加后缀.properties)/Resource Bundle(自动添加后缀)

Properties pros = new Properties();
FileInputStream fis = new FileInputStream("配置文件的名字")
//参数为流,加载流对用的文件
pros.load(fis);
fis.close();

Collections工具类

Collections是一个操作Set、List和Map等集合的工具类。

Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变,对集合对象实现同步控制等方法

排序方法

reverse(List):反转List中元素的顺序

shuffle(List):对List集合元素进行随机排序

sort(List):根据元素的自然顺序对指定list集合元素按升序排序

sort(List,Comparator):根据指定的Comparator产生的顺序对List集合元素进行排序

swap(List,int,int):将指定list集合中的i处元素和j处元素进行交换

Object max/min(Collection):根据元素的自然排序,返回给定集合中的最大/最小元素

Object max/min(Collection,Comparator):根据Comparator指定的顺序,返回集合中的最大/最小元素

int frequency(Collection,Object):返回指定集合中指定元素出现的次数

void copy(List dest,List src):将src中的内容复制到dest中

boolean replaceAll(List list,Object oldVal,Objec newVal):把List中所有的旧值改成新值

copy的注意事项

//************错误写法1
//错误原因:需要满足src.size()<= dest.size(),否则会报错
List dest = new ArrayList();
//...一堆list.add()
List dest = new ArrayList();
Collections.copy(dest,list);
//************错误写法2
//错误原因:传参是指定造底层数组的长度,需要的dest.size是填了几个
List dest = new ArrayList();
//...一堆list.add()
List dest = new ArrayList(list.size());
Collections.copy(dest,list);
//************正确写法
List dest = new ArrayList();
//...一堆list.add()
//asList数组转化成List,这里的数组会默认填充null
List dest = Arrays.asList(new Object[list.size()])
Collections.copy(dest,list);

Collections常用方法:同步控制

Collections类中提供了多个synchronizedXxx(xxx)方法,将指定集合包装成线程同步的集合,从而解决多线程并发访问集合时的线程安全问题。

ArrayList和HashMap都是线程不安全的,如果要求线程安全可以使用synchronizedList(List list)和synchronizedMap(Map map)

//返回的List1为线程安全的List
List list1 = Collections.synchronizedLisd(list);

总结

本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注自学编程网的更多内容!

编程技巧