从零开始学习Java8 Stream，看这篇就够了

为何需要引入流

在我们平常的开发中几乎每天都会有到List、Map等集合API，若是问Java什么API使用最多，我想也应该是集合了。举例：假如我有个集合List，里面元素有1,7,3,8,2,4,9，需要找出里面大于5的元素，具体实现代码：

public List<Integer> getGt5Data() {
    List<Integer> data = Arrays.asList(1, 7, 3, 8, 2, 4, 9);
    List<Integer> result = new ArrayList<>();
    for (Integer num : data) {
        if (num > 5) {
            result.add(num);
        }
    }
    return result;
}

这个实现让我们感觉到了集合的操作不是太完美，如果是数据库的话，我们只需要简单的在where后面加一个条件大于5就可以得到我们想要的结果，为什么Java的集合就没有这种API呢？
其次，如果我们遇到有大集合需要处理，为了提高性能，我们可能需要使用到多线程来处理，但是写并行程序的复杂度有提高了不少。

基于以上的问题，所有Java8推出了Stream

Stream简介

Stream有哪些特点：

元素的序列：与集合一样可以访问里面的元素，集合讲的是数据，而流讲的是操作，比如：filter、map
源: 流也需要又一个提供数据的源，顺序和生成时的顺序一致
数据的操作：流支持类似于数据库的操作，支持顺序或者并行处理数据；上面的例子用流来实现会更加的简洁

public List<Integer> getGt5Data() {
    return Stream.of(1, 7, 3, 8, 2, 4, 9)
            .filter(num -> num > 5)
            .collect(toList());
}

流水线操作：很多流的方法本身也会返回一个流，这样可以把多个操作连接起来，形成流水线操作
内部迭代：与以往的迭代不同，流使用的内部迭代，用户只需要专注于数据处理
只能遍历一次：遍历完成之后我们的流就已经消费完了，再次遍历的话会抛出异常

使用Stream

Java8中的Stream定义了很多方法，基本可以把他们分为两类：中间操作、终端操作；要使用一个流一般都需要三个操作：

定义一个数据源
定义中间操作形成流水线
定义终端操作，执行流水线，生成计算结果

构建流

使用Stream.of方法构建一个流

Stream.of("silently","9527","silently9527.cn")
        .forEach(System.out::println);

使用数组构建一个流

int[] nums = {3, 5, 2, 7, 8, 9};
Arrays.stream(nums).sorted().forEach(System.out::println);

通过文件构建一个流

使用java.nio.file.Files.lines方法可以轻松构建一个流对象

Files.lines(Paths.get("/Users/huaan9527/Desktop/data.txt"))
                .forEach(System.out::println);

中间操作

中间操作会返回另外一个流，这样可以让多个操作连接起来形成一个流水线的操作，只要不触发终端操作，那么这个中间操作都不会实际执行。

filter

该操作接受一个返回boolean的函数，当返回false的元素将会被排除掉

举例：假如我们100个客户，需要筛选出年龄大于20岁的客户

List<Customer> matchCustomers = allCustomers.stream()
                .filter(customer -> customer.getAge()>20)
                .collect(toList());

distinct

该操作将会排除掉重复的元素

List<Integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9)
        .filter(num -> num > 5)
        .distinct()
        .collect(toList());

limit

该方法限制流只返回指定个数的元素

List<Integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9)
        .filter(num -> num > 5)
        .limit(2)
        .collect(toList());

skip

扔掉前指定个数的元素；配合limit使用可以达到翻页的效果

List<Integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9)
        .filter(num -> num > 5)
        .skip(1)
        .limit(2)
        .collect(toList());

map

该方法提供一个函数，流中的每个元素都会应用到这个函数上，返回的结果将形成新类型的流继续后续操作。
举例：假如我们100个客户，需要筛选出年龄大于20岁的客户，打印出他们的名字

allCustomers.stream()
            .filter(customer -> customer.getAge() > 20)
            .map(Customer::getName)
            .forEach(System.out::println);

在调用map之前流的类型是Stream<Customer>，执行完map之后的类型是Stream<String>

flatMap

假如我们需要把客户的名字中的每个字符打印出来，代码如下：

List<Customer> allCustomers = Arrays.asList(new Customer("silently9527", 30));
allCustomers.stream()
        .filter(customer -> customer.getAge() > 20)
        .map(customer -> customer.getName().split(""))
        .forEach(System.out::println);

执行本次结果，你会发现没有达到期望的结果，打印的结果

[Ljava.lang.String;@38cccef

这是因为调用map之后返回的流类型是Stream<String[]>，所有forEach的输入就是String[]；这时候我们需要使用flatMap把String[]中的每个元素都转换成一个流，然后在把所有的流连接成一个流，修改后的代码如下

List<Customer> allCustomers = Arrays.asList(new Customer("silently9527", 30));
allCustomers.stream()
        .filter(customer -> customer.getAge() > 20)
        .map(customer -> customer.getName().split(""))
        .flatMap(Arrays::stream)
        .forEach(System.out::println);

执行结果：

sorted

对所有的元素进行排序

List<Integer> numbers = Arrays.asList(1, 7, 3, 8, 2, 4, 9);
numbers.stream().sorted(Integer::compareTo).forEach(System.out::println);

终端操作

终端操作会执行所有的中间操作生成执行的结果，执行的结果不在是一个流。

anyMatch

如果流中有一个元素满足条件将返回true

if (allCustomers.stream().anyMatch(customer -> "silently9527".equals(customer.getName()))) {
    System.out.println("存在用户silently9527");
}

allMatch

确保流中所有的元素都能满足

if (allCustomers.stream().allMatch(customer -> customer.getAge() > 20)) {
    System.out.println("所有用户年龄都大于20");
}

noneMatch

与allMatch操作相反，确保流中所有的元素都不满足

if (allCustomers.stream().noneMatch(customer -> customer.getAge() < 20)) {
    System.out.println("所有用户年龄都大于20");
}

findAny

返回流中的任意一个元素，比如返回大于20岁的任意一个客户

Optional<Customer> optional = allCustomers.stream()
        .filter(customer -> customer.getAge() > 20)
        .findAny();

findFirst

返回流中的第一个元素

Optional<Customer> optional = allCustomers.stream()
        .filter(customer -> customer.getAge() > 20)
        .findFirst();

reduce

接受两个参数：一个初始值，一个BinaryOperator<T> accumulator将两个元素合并成一个新的值
比如我们对一个数字list累加

List<Integer> numbers = Arrays.asList(1, 7, 3, 8, 2, 4, 9);
Integer sum = numbers.stream().reduce(0, (a, b) -> a + b);

上面的代码，我们可以简写

Integer reduce = numbers.stream().reduce(0, Integer::sum);

找出流中的最大值、最小值 min、max

numbers.stream().reduce(Integer::max)
numbers.stream().reduce(Integer::min)

count

统计流中元素的个数

numbers.stream().count()

数据收集器collect

在Java8中已经预定义了很多收集器，我们可以直接使用，所有的收集器都定义在了Collectors中，基本上可以把这些方法分为三类：

将元素归约和汇总成一个值
分组
分区

归约和汇总

先看下我们之前求最大值和最小值采用收集器如何实现

找出年龄最大和最小的客户

Optional<Customer> minAgeCustomer = allCustomers.stream().collect(minBy(Comparator.comparing(Customer::getAge)));
Optional<Customer> maxAgeCustomer = allCustomers.stream().collect(maxBy(Comparator.comparing(Customer::getAge)));

求取年龄的平均值

Double avgAge = allCustomers.stream().collect(averagingInt(Customer::getAge));

进行字符串的连接

把客户所有人的名字连接成一个字符串用逗号分隔

allCustomers.stream().map(Customer::getName).collect(joining(","));

分组

在数据库的操作中，我们可以轻松的实现通过一个属性或者多个属性进行数据分组，接下来我们看看Java8如何来实现这个功能。

根据客户的年龄进行分组

Map<Integer, List<Customer>> groupByAge = allCustomers.stream().collect(groupingBy(Customer::getAge));

Map的key就是分组的值年龄，List<Customer>就是相同年龄的用户

我们需要先按照用户的地区分组，在按年龄分组

Map<String, Map<Integer, List<Customer>>> groups = allCustomers.stream()
                .collect(groupingBy(Customer::getArea, groupingBy(Customer::getAge)));

在相对于普通的分组，这里多传了第二个参数又是一个groupingBy；理论上我们可以通过这个方式扩展到n层分组

分组后再统计数量

Map<String, Long> groupByCounting = allCustomers.stream()
            .collect(groupingBy(Customer::getArea, counting()));

以用户所在地区分组后找出年龄最大的用户

Map<String, Optional<Customer>> optionalMap = allCustomers.stream()
                .collect(groupingBy(Customer::getArea, maxBy(Comparator.comparing(Customer::getAge))));

这时候返回的Map中的value被Optional包裹，如果我们需要去掉Optional，可以使用collectingAndThen

Map<String, Customer> customerMap = allCustomers.stream()
        .collect(groupingBy(Customer::getArea,
                collectingAndThen(maxBy(Comparator.comparing(Customer::getAge)), Optional::get)
        ));

写在最后（看完不点赞，你们想白嫖我吗）

首先感谢大家可以耐心地读到这里。点关注，不迷路
当然，文中或许会存在或多或少的不足、错误之处，有建议或者意见也非常欢迎大家在评论交流。
最后，白嫖不好，创作不易，希望朋友们可以点赞评论关注三连，因为这些就是我分享的全部动力来源🙏

原创不易转载请注明出处：https://silently9527.cn/archives/66

参数资料《Java8实战》