4

引言

本文就是我在学习函数式编程的过程当中自己体悟到的一些东西,这里将用go,JavaScript以及Haskell三种语言来分析函数式编程的一些奥秘。JavaScript由于具有的一些优势能够让我们可以实现函数式编程,而go作为一种强类型语言,虽然灵活性又稍有欠缺,但是也能够完成一些高阶函数的实现,Haskell语言作为正统的函数式编程语言,为了解释说明问题,作为对比参照。

正文

函数式编程也算是经常看到了,它的一些优势包括:

  1. 不包括赋值语句(assignment statement),一个变量一旦初始化,就无法被修改(immutable)
  2. 无副作用,函数除了计算结果,将不会产生任何副作用
  3. 因为无副作用,所以任何表达式在任何时候都能够evaluate

虽然上面的优势看看上去好像很厉害的样子,但是,到底厉害在哪里呢?我们可以通过下面的例子进行说明:

求和函数

Haskell

sum [1,2,3]
-- 6
-- sum 的实现其实是
foldr (+) 0 [1,2,3]

在Haskell中flodr的函数定义是:

foldr :: Foldable t => (a -> b -> b) -> b -> t a -> b

函数实现是:

-- if the list is empty, the result is the initial value z; else
-- apply f to the first element and the result of folding the rest
foldr f z []     = z 
foldr f z (x:xs) = f x (foldr f z xs) 

这是一个递归实现,在函数式编程中,递归定义是十分常见的。

foldr函数其实做了这样的事情:foldr接受三个参数,第一个参数是函数f,第二个参数是初始值z,第三个参数是一个列表。如果列表为空则返回初始化值z,否则递归调用 foldr,需要说明的是函数f的类型是接受两个参数,返回一个值,两个参数类型都应该和z相同(强类型语言中)。

在Haskell中我们能够看到一个列表能够这样被求和,那么在JavaScript中,我们是如何实现sum函数的呢?

JavaScript

首先我们实现js版本的foldr

function foldr(f,z,list){
  //为了简洁起见,把类型判断省略了
  // Object.prototype,toString.call(list) === '[object Array]' 
  if(list === null || list.length == 0){
    return z;
  }
  //这里的shift会改变参数的状态,会造成副作用
  //return f(list.shift(),foldr(f,z,list));
  //改用如下写法
  return f(list[0],foldr(f,z,list.slice(1)));
}

然后我们再实现js版本的(+):

function add(a,b){
  return a+b;
}

那么我们的sum就变成:

function sum(list){
  return foldr(add,0,list);
}

最后我们的js版的sum也可以这样用了:

let a = [1,2,3];
sum(a); // 6

像js这样的弱类型的语言较为灵活,函数f可以任意实现,对于foldr函数也能够在多种数据类型之间复用,那么对于像go这样的强类型语言,结果又是怎么样的呢?

go

同样地,我们实现以下go版本的foldr:

func foldr(f func(a,b int) int,z int,list []int)int{
    if len(list) == 0{
        return z
    }
    return f(list[0],foldr(f,z,list[1:]))
}

go因为有数组切片,所以使用起来较为简单,但是go又是强类型的语言,所以在声明函数的时候必须要把类型声明清楚。

再实现一下f函数:

func add(a,b int) int{
    return a+b;
}

依葫芦画瓢我们可以得到go版本的sum函数:

func sum(list []int) int{
    return foldr(add,0,list)
}

可以看出来好像套路都差不多,真正在调用的时候是这样的:

func main(){
    a := []int{1,2,3}
    sum(a) // 6
}

在Haskell中是没有循环的,因为循环可以通过递归实现,在上文我们实现的sum函数中,也没有用到任何循环语句,这和我们原来的编程思维有所不同,刚开始我学写求和函数的时候,都是从for,while开始的,但是函数式给我打开了新世界的大门。

有了上面的基础,我们发现在函数式编程中,代码的重用非常便利:

求积函数

javaScript

function muti(a,b){
  return a*b;
}

function product(list){
  return foldr(muti,1,list);
}

go

func muti(a,b int) int{
    return a*b;
}

func product(list []int) int{
    return foldr(muti,1,list)
}

Haskell

foldr (*) 1 [1,2,3,4] 
-- 24
-- or 
-- product 是Haskell预定义的函数
myproduct xs = foldr (*) 1 xs
-- myproduct [1,2,3,4]  

还有很多例如 anyTrueallTrue的例子,以下仅给出js实现:

anyTure

JavaScript

function or(a,b){
  return a || b;
}

function anyTrue(list){
  return foldr(or,false,list);
}

调用:

let b = [true,false,true];
console.log(anyTrue(b)); // true

allTure

JavaScript

function and(a,b){
  return a && b;
}

function allTrue(list){
  return foldr(and,true,list);
}

调用:

let b = [true,false,true];
console.log(allTrue(b)); // false

当然我们可以看出来这个flodr函数贼好用,但是好像还是有点疑惑,它是怎么工作的呢?看了一圈,flodr就是一个递归函数,但其实在编程世界,它还有一个更加出名的名字——reduce。我们看看在js中是如何使用reduce实现sum函数的:

求和函数reduce版

const _ = require("lodash");
_.reduce([1,2,3],function(sum,n){
  return sum+n;
});

lodash官方文档是这么定义的:

_.reduce alias _.foldl
_.reduceRight alias _.foldr

好吧,我欺骗了你们,其实foldr应该对应reduceRight

那么foldlfoldr到底有什么不同呢?

其实这两个函数的不同之处在于结合的方式不同,以求差为例:

Haskell

foldr (-) 0 [1,2,3]
-- 输出: 2
foldl (-) 0 [1,2,3]
-- 输出: -6

为什么两个输出是不同的呢?这个和结合方向有关:

foldr (-) 0 [1,2,3]

相当于:

1-(2-(3-0)) = 2

foldl (-) 0 [1,2,3]

相当于:

((0-1)-2)-3) = -6

结合方向对于求和结果而言是没有区别的,但是对于求差,就有影响了:

JavaScript

const _ = require("lodash");
//reduce 相当于 foldl
_.reduce([1,2,3],function(sum,n){
  return sum-n;
});
// 输出 -4

这个和说好的-6好像又不一样了,坑爹呢么不是?!这是因为,在lodash的实现中,reduce的初始值为数组的第一个元素,所以结果是1-2-3 = -4

那么我们看看reduceRight == foldr的结果:

JavaScript

const _ = require("lodash");
//reduceRight 相当于 foldr
_.reduceRight([1,2,3],function(sum,n){
  return sum-n;
});
// 输出 0

我们看到这个结果是0也算是预期结果,因为3-2-1=0

注:上文为了易于理解和行文连贯,加入了一些我自己的理解。需要说明的是,在Haskell中,foldl1函数应该是和JavaScript的reduce(lodash)函数是一致的,foldl1函数将会把列表的第一个元素作为初始值。

现在我们总结一下foldrfoldl的一些思路:

如果对列表[3,4,5,6]应用函数f初始值为z进行foldr的话,应该理解为:

f 3 (f 4 (f 5 ( f 6 z)))
-- 当 f 为 +, z = 0 上式就变为:
3 + (4 + (5 + (6 + 0)))
-- 前缀(+)形式则为:
(+)3 ((+)4 ((+)5 ((+)6 0)))

如果对列表[3,4,5,6]应用函数g初始值为z进行foldl的话,应该理解为:

g(g (g (g z 3) 4) 5) 6
-- 当然我们也可以类似地把 g 设为 +, z = 0, 上式就变为:
(((0 + 3) + 4) + 5) + 6
-- 改成前缀形式
(+)((+)((+)((+)0 3) 4) 5) 6

从上面的例子可以看出,左折叠(foldl)和右折叠(foldr)两者有一个很关键的区别,就是,左折叠无法处理无限列表,但是右折叠可以。

前面我们说的都是用预定义的函数+,-,*…,(在函数式编程里,这些运算符其实也都是函数)用这些函数是为了能够让我们更加便于理解,现在我们看看用我们自己定义的函数呢?试试逆转一个列表:

reverse

Haskell

flip' :: (a -> b -> c) -> b -> a -> c
flip' f x y= f y x

上面的flip'函数的作用就是传入第一个参数是一个函数,然后将两个参数的顺序调换一下(flip是预定义函数)。

Hasekll

foldr flip' [] [1,2,3]

那么JavaScript的实现呢?

JavaScript

function flip(f, a, b){
     return f(b,a);
}
//这个函数需要进行柯里化,否则无法在foldr中作为参数传入
var flip_ = _.curry(flip);

function cons(a,b){
     return a.concat(b);
 }

function reverse(list){
  return foldr(flip_(cons),[],list);
}

调用结果又是怎么样的呢?

console.log(reverse([1,2,3]))
// [ 3, 2, 1 ]

好了,现在我们好像又看到了一个新东西——curry,柯里化。简单地说,柯里化就是一个函数可以先接受一部分参数,然后返回一个接受剩下参数的函数。用上面的例子来说,flip函数在被柯里化之后得到的函数flip_,可以先接受第一个参数cons然后返回一个接受两个参数a,b的函数,也就是我们需要的连接函数。

在go语言里面,实现curry是一个很麻烦的事情,因此go的函数式编程支持还是比较有限的。

接着我们试试如何取得一个列表的长度,实现一个length函数:

length

Haskell

-- 先定义实现一个count 函数
count :: a -> b ->c
count a n = n + 1
-- 再实现一个length函数
length' = foldr (count) 0
-- 再调用
length' [1,2,3,4]
-- 4

JavaScript

//先定义一个count函数
function count(a,n){
  return n + 1;
}
//再实现length函数
function length(list){
  return foldr(count,0,list);
}
//调用
console.log(length([1,2,3,4]));
// 4

就是这么简单,好了,reduce我们讲完了,然后我们看看map,要知道map函数是怎么来的,我们要从一个比较简单的函数先入手,这个函数的功能是把整个列表的所有元素乘以2:

doubleall

haskell

-- 定义一个乘以2,并连接的函数
doubleandcons :: a -> [a] -> [a]
doubleandcons x y  = 2 * x : y

doubleall x = foldr doubleandcons []

-- 调用
doubleall [1,2,3]
-- 输出
-- [2,4,6]

JavaScript

function doubleandcons(a,list){
  return [a * 2].concat(list)
}

function doubleall(list){
  return foldr(doubleandcons,[],list)
}

//调用
console.log(doubleall([1,2,3]));
// [2,4,6]

再来看看go怎么写:

go

go 的尴尬之处在于,需要非常明确的函数定义,所以我们要重新写一个foldr函数,来接受第二个参数为列表的f

func foldr2(f func(a int,b []int) []int,z []int,list []int)[]int{
    if len(list) == 0{
        return z
    }
    return f(list[0],foldr2(f,z,list[1:]))
}

然后我们再实现同上面相同的逻辑:

func doubleandcons(n int,list []int) []int{
    return append([]int{n * 2},list...)
}

func doubleall(list []int) []int{
    return foldr2(doubleandcons,make([]int,0),list)
}
// doubleall([]int{1,2,3,4})
//[2 4 6 8]

go这门强类型编译语言虽然支持一定的函数式编程,但是使用起来还是有一定局限性的,起码代码复用上还是不如js的。

接下来我们关注一下其中的doubleandcons函数,这个函数其实可以转换为这样的一个函数:

fandcons f el [a]= (f el) : [a]
double el = el * 2
-- 只传入部分参数,柯里化
doubleandcons = fandcons double

现在我们关注一下这里的fandcons,其实这里可以通用表述为Cons·f,这里的·称为函数组合。而函数组合有这样的操作:

$$
(f. g) (h) = f (g(h))
$$

那么上面的我们的函数就可以表述为:

$$
fandcons(f(el)) = (Cons.f)(el)= Cons (f(el))
$$

所以:

$$
fandcons(f(el),list) = (Cons.f) ( el , list) = Cons ((f(el)) ,list)
$$

最终版本就是:

$$
doubleall = foldr((Cons . double),Nil)
$$

这里的foldr(Cons.double) 其实就是我们要的map double,那么我们的map的本来面目就是:

$$
map = foldr((Cons.f), Nil)
$$

这里的Nilfoldr函数的初始值。

好了map已经现身了,让我们再仔细看看一个map函数应该怎么实现:

map

Haskell

fandcons :: (a->b) ->a -> [b] -> [b]
fandcons f x y= (f x):y

map' :: (a->b) -> [a] -> [b]
map' f x = foldr (fandcons f) [] x

-- 调用 
map' (\x -> 2 * x)  [1,2,3]
-- 输出 [2,4,6]

这里用了Haskell的lambda表达式,其实就是fdouble实现。

我们也看看js版本的实现:

JavaScript

function fandcons(f, el, list){
  return [f(el)].concat(list);
}
//需要柯里化
var fandcons_ = _.curry(fandcons);

function map(f, list){
  return foldr(fandcons_(f),[],list);
}
//调用
console.log(map(function(x){return 2*x},[1,2,3,4]));
// 输出[ 2, 4, 6, 8 ]

这些需要柯里化的go我都不实现了,因为go实现柯里化比较复杂。

最后我们再看看map的一些神奇的操作:

矩阵求和

summatrix

Haskell

summatrix :: Num a => [[a]] -> a
summatrix x = sum (map sum x)

-- 调用
summatrix [[1,2,3],[4,5,6]]
-- 21

这里一定要显式声明 参数a的类型,因为sum函数要求Num类型的参数

JavaScript

function sum(list){
  return foldr(add,0,list);
}
function summatrix(matrix){
  return sum(map(sum,matrix));
}
//调用
 mat = [[1,2,3],[4,5,6]];
 console.log(summatrix(mat));
//输出 21

结语

在学习函数式编程的过程中,我感受到了一种新的思维模式的冲击,仿佛打开了一种全新的世界,没有循环,甚至没有分支,语法简洁优雅。我认为作为一名计算机从业人员都应该去接触一下函数式编程,能够让你的视野更加开阔,能够从另一个角度去思考。

原文发布于本人个人博客,保留文章所有权利,未经允许不得转载。


terasum
453 声望51 粉丝

Blockchain从业者,Go, JavaScript, Haskell爱好者,函数式编程,高性能并发。