11

Y 组合子是 lambda 演算中的一个概念,是任意函数的不动点,在函数式编程中主要作用是 提供一种匿名函数的递归方式

Y 组合子如下:

$$ λf.(λx.f(x x))(λx.f(x x)) $$

本文将尽量通俗易懂的以 实现匿名函数递归 为导向,推导出这一式子。

一、简介

1. lambda 表达式简介

这部分通过 js 函数介绍 lambda 表达式,如果已经了解 lambda 演算 可以跳过这一部分。

了解一个新领域的最好方法是用已有知识进行类比。
我们可以把每一个 lambda 表达式解释为一个 js 函数:

  • "λ" 字符可以看作 function 声明,"."字符前为参数列表,"."字符后为函数体。

  • lambda 表达式不能被命名(赋值给变量),这也是为什么lambda演算需要引入 Y组合子的原因。

  • lambda 表达式只允许定义一个参数。

使用 lamda 表达式 javascript 箭头函数 javascript 函数表达式
函数 λx.x+1 x=>x+1; (function(x){return x+1;});
函数调用 (λx.x+1)4 (x=>x+1)(4); (function(x){return x+1;})(4);

2. 组合子与不动点

组合子对照 js 可以理解为:函数体内,没有使用外部变量

不动点是函数的一个特征:对于函数 $f(x)$,如果有变量  $a$ 使得  $f(a)=a$ 成立,则称 $a$ 是函数 $f$ 上的一个不动点

二、递归

1. 普通的递归

递归就是函数不断调用自身

一个最基本的调用自身的函数是这样的:

var f = () => f();
f();
//> f()
//> f()
//> ...

但这个函数仅仅是不断的调用自身,什么也没做。

一个正常的递归函数应该有一个状态,每次调用不断的递进状态,最终可以通过判断状态结束递归:

var f = p => judge(p) ? f(step(p)) : value;

// 再加上“计算”的步骤,这样这个函数才有价值:

var f = p => judge(p) ? calc(f(step(p)),p) : value;

一个具体的例子,计算阶乘的函数:


var factorial = n => n ? factorial(n-1)*n : 1;

调用:

factorial(4);
//=> 24

2. 让匿名函数递归

由于不能给函数命名,我们需要把函数作为参数传入一个高阶函数。这样,在高阶函数中,就可以使用 参数名 来引用函数,相当于变相地给函数命了名。

构造一个高阶函数invokeWithSelf,它接受一个函数作为参数,并让这个函数将自身作为参数调用其自身:

var invokeWithSelf = f => f(f);

当这个函数传入自身作为参数时

invokeWithSelf(invokeWithSelf);
//> (f=>f(f))(f=>f(f));
//> (f=>f(f))(f=>f(f));
//> ...

我们得到了一个匿名的无限递归函数,仿照上一节,我们可以把这个函数改造成可以使用的递归函数

//首先需要有一个参数来保存递归状态
var func = f => p => f(f)(p);

//加上状态改变和判断
var func = f => p => judge(p) ? f(f)(step(p)) : value;

//增加计算
var func = f => p => judge(p) ? calc(f(f)(step(p)),p) : value;

具体例子,计算阶乘的函数:

var func = f => n => n ? f(f)(n-1)*n : 1;

调用:

func(func)(4);
//> 24

匿名调用:

(f => n => n ? f(f)(n-1)*n : 1)(f => n => n ? f(f)(n-1)*n : 1)(4);
//> 24

现在我们得到了一个匿名的递归函数,不过它只能用来计算阶乘。为了将其通用,我们希望将 函数的具体计算方式与其递归的形式剥离开来。

三、推导

1. 解耦递归逻辑与计算逻辑,得到 javascript 中的 Y 组合子

对于刚才的函数func,我们尝试一步步将它分解成 计算逻辑递归逻辑 两部分

var func = (f => n => n ? f(f)(n-1)*n : 1)(f => n => n ? f(f)(n-1)*n : 1);

//调用:
func(4);
//> 24

开始化简 func

var func = n => {
    return (f => n => n ? f(f)(n-1)*n : 1)(f => n => n ? f(f)(n-1)*n : 1);
}

提取重复形式 f => n => n ? f(f)(n-1)*n : 1

var func = n => {
    var fa = f => n => n ? f(f)(n-1)*n : 1;
    return fa(fa);
};

//改写形式
var func = n => {
    var fa = f => {
        return n => n ? f(f)(n-1)*n : 1;
    };
    return fa(fa);
};

可以看出,其主要递归逻辑来自 f(f), 我们将这一部分解耦:


var func = n => {
    var fa = f => {
        var fb = n => f(f)(n);
        return n => n ? fb(n-1)*n : 1;
    };
    return fa(fa);
};

可以看到 返回值 不再需要 fc 接收的参数 f, 将返回值表达式具名, 以便提取出 fc, 分离逻辑:


var func = n => {
    var fa = f => {
        var fb = n => f(f)(n);
        var fc = n => n ? fb(n-1)*n : 1;
        return fc;
    };
    return fa(fa);
};

fc 还在依赖 fb, 将 fb 作为参数传入 fc, 解除 fcfb 的依赖:

var func = n => {
    var fa = f => {
        var fb = n => f(f)(n);
        var fc = fb => n => n ? fb(n-1)*n : 1;
        return fc(fb);
    };
    return fa(fa);
};

可以发现 fc 是计算逻辑部分,将 fc 提取出 fa

var func = n => {
    var fa = fc => f => {
        var fb = n => f(f)(n);
        return fc(fb);
    };
    var fc = fb => n => n ? fb(n-1)*n : 1;
    return fa(fc)(fa(fc));
};

构造一个函数 fd, 化简返回值的形式:

var func = n => {
    var fa = fc => f => {
        var fb = n => f(f)(n);
        return fc(fb);
    };
    var fc = fb => n => n ? fb(n-1)*n : 1;
    var fd = fa => fc => {
        return fa(fc)(fa(fc));
    }
    return fd(fa)(fc);
};

fa 带入 fd, 得到递归逻辑部分:

var func = n => {
    var fc = fb => n => n ? fb(n-1)*n : 1;
    var fd = fc => {
        var fa = fc => f => {
            var fb = n => f(f)(n);
            return fc(fb);
        };
        return fa(fc)(fa(fc));
    }
    return fd(fc);
};

//化简fd
var func = n => {
    var fc = fb => n => n ? fb(n-1)*n : 1;
    var fd = fc => {
        var fa = f => {
            var fb = n => f(f)(n);
            return fc(fb);
        };
        return fa(fa);
    }
    return fd(fc);
};

//化简fd
var func = n => {
    var fc = fb => n => n ? fb(n-1)*n : 1;
    var fd = fc => (f => fc(n => f(f)(n)))(f => fc(n => f(f)(n)));
    return fd(fc);
};

可以看到,两部分逻辑已经分离,可以得到 javascript 中的 Y 组合子:

var fn = fc;
var Y = fd;

将参数名替换一下,得到 Y 组合子与计算逻辑 fn

var fn = f => n => n ? f(n-1)*n : 1;
var Y = y => (x => y(n => x(x)(n)))(x => y(n => x(x)(n)));

调用测试:

Y(fn)(4);
//> 24

2. Y组合子与惰性求值

你可能注意到,刚才推导出的 Y 组合子形式与 其 λ 表达式的等价形式不一致

/*λ 表达式的等价形式*/
Y = y => (x => y(x(x)))(x => y(x(x)));

/*推导出的形式*/
Y = y => (x => y(n => x(x)(n)))(x => y(n => x(x)(n)));

对比不难发现 n => x(x)(n) 应化为 x(x),并且尝试直接使用等价形式时会发生爆栈

我们知道,上面的两种形式几乎是等价的,例如:

var print = str => console.log(str);

// 在一个参数的情况下,等价于:
var print = console.log;

但当它们作为函数参数时,其实有着略微不同:

//接收一个函数,但不使用它
var y = xn => {
    console.log("run y");
    return false ? xn(1) : 0;
};

//接收任意一个参数,返回一个函数
var x = n => {
    console.log("run x");
    return n1 => n1;
};

//调用,将参数直接传入
y(x(1));
//> "run x"
//> "run y"

//调用,将参数包裹在匿名函数中传入
y((n1)=>x(1)(n1));
//> "run y"

可以看到,在 y(x(1)) 的过程中,根本没有用到参数 x(1) 的值,但程序不在乎这一点,首先求出了 x(1) 的值;
第二个表达式中参数 x(1) 被“包裹”在一个匿名函数中,并没有运行。

对于函数参数的求值策略,不同的语言不相同:

  • 在函数调用时,立即求值,称作“严格求值”(Eager evaluation), js / c++ / c# 均使用严格求值

  • 在函数运行时动态地求值,称作“惰性求值”(Lazy evaluation), 以 Haskell 为代表的函数式编程语言默认使用

javascript 中使用的是严格求值,而 lambda 表达式中使用的是惰性求值。

若将 n => x(x)(n) 替换为 x(x),将导致 Y 组合子中的 x(x) 作为 y 的参数被立即求值。
由于右边部分中 x(x) 是一个无限递归的的式子,对它求值会使它不断地调用自身,最终导致堆栈溢出。

只进行左边部分的替换并不会导致无限调用:

Y = y => (x => y(n => x(x)(n)))(x => y(n => x(x)(n)));

//可化为
Y = y => (x => y(x(x))(x => y(n => x(x)(n)));

在计算这个式子时,会首先计算 参数 y 的值
完成后在计算左边的 x(x) 之前、会计算左边部分中 x 参数的值
而左边式子中 x 的值取决于右边部分的结果,右边返回值使左边的 x(x) 不再是无限递归。

四、总结

函数式编程的方法感觉着实有点烧脑,还没怎么实操过。

不过 js 真是厉害,什么编程方法都能用...

一直希望能够找到一种符合人们思考方式(至少符合我自己)的编程方法,让程序变得自然、易读、易写。不断尝试中。


新しい世界
1.5k 声望71 粉丝