今天又翻了一下书的目录,第一章在这之后就结束了。也就是说,这本书所涉及到的新的知识已经全部点到了。
书的其余部分就是对这几个概念做一些基础知识的补充以及更深层次的实践。
最后两个小节的内容较少,所以合成一篇文章来总结。
上一篇:Lambda&Java多核编程-0-从集合到流

从串行到并行

串行指一个步骤一个步骤地处理,也就是通常情况下,代码一行一行地执行。
如果将我们常用的迭代器式的循环展开的话,就是串行执行了循环体内所定义的操作:

sum += arr.get(0);
sum += arr.get(1);
sum += arr.get(2);//...

在书的一开始,就提到Java需要支持集合的并行计算(而Lambda为这个需求提供了可能)。
这些功能将全部被实现于库代码中,对于我们使用者,实现并行的复杂性被大大降低(最低程度上只需要调用相关方法)。
另外,关于并发并行这两个概念,其实是不同的,如果不明白的话请自行了解,在此只引用一句非常流行的话:
一个是关于代码结构,一个是关于代码执行。
如果我们想将一个计算任务均匀地分配给CPU的四个内核,我们会给每个核分配一个用于计算的线程,每个线程上进行整个任务的子任务。
书上有一段非常形象的伪代码:

if the task list contains more than N/4 elements {
    leftTask = task.getLeftHalf()
    rightTask = task.getRightHalf()
    doInparallel {
        leftResult = leftTask.solve()
        rightResult = rightTask.solve()
    }
    result = combine(leftResult, rightResult)
} else {
    result = task.solveSequentially()
}

代码中,将每四个任务元素分为一组,用四个内核对其进行并行处理,然后每两组进行一次结果的合并,最终得到整个任务队列的最终结果。
从整体处理流程上看,先将任务队列递归地进行分组,并行处理每一组,然后将结果递归地进行合并(合并通过管道终止操作实现)。
Java8之前,开发者们使用一种针对集合的fork/join框架来实现该模式。
然而现在,想对代码进行性能优化,就是一件非常容易的事了。
还记得我们上一节中所得出的最终代码:

long validContactCounter