引言

在 Python 编程语言中,闭包通常指的是一个嵌套函数,即在一个函数内部定义的另一个函数。这个嵌套的函数能够访问并保留其外部函数作用域中的变量。这种结构就构成了一个闭包。

闭包在函数式编程语言中非常普遍。在 Python 中,闭包特别有用,因为它使得你可以创建基于函数的装饰器,这是一种非常强大的功能。

通过本教程,你将:

  • 了解闭包的概念以及它们在 Python 中的运作方式
  • 掌握闭包的典型应用场景
  • 探索闭包的替代方法 为了更好地理解本教程,你需要对 Python 的一些基本概念有所了解,比如函数、嵌套函数、装饰器、类和可调用对象。

用闭包编写装饰器

装饰器是 Python 中一个非常强大的功能,它允许你动态地修改函数的行为。在 Python 中,有两种类型的装饰器:

  • 基于函数的装饰器
  • 基于类的装饰器

基于函数的装饰器是一个函数,它接受一个函数对象作为参数,并返回另一个增加了额外功能的函数对象。这个返回的函数对象也是一个闭包。因此,在创建基于函数的装饰器时,你会用到闭包。

如你所知,装饰器可以在不修改函数内部代码的情况下改变函数的行为。实际上,基于函数的装饰器就是闭包。它们的特点是主要用来修改你传递给装饰器函数的函数行为。

这里有一个简单的装饰器示例,它在原有函数功能的基础上增加了额外的消息输出:

>>> def decorator(function):
...     def closure():
...         print("Doing something before calling the function.")
...         function()
...         print("Doing something after calling the function.")
...     return closure
...

在这个示例中,外层函数充当装饰器的角色。这个函数返回一个闭包对象,它通过增加额外的功能来改变被装饰的输入函数对象的原有行为。即便是在 decorator() 函数执行完毕后,闭包仍然能够对输入函数产生影响。

以下是你如何利用装饰器语法来动态地改变一个普通 Python 函数的行为:

>>> @decorator
... def greet():
...     print("Hi, Pythonista!")
...

>>> greet()
Doing something before calling the function.
Hi, Pythonista!
Doing something after calling the function.

在这个示例中,你通过 @decorator 来调整 greet() 函数的行为。请注意,现在调用 greet() 时,你不仅得到了它的基本功能,还额外获得了装饰器提供的功能。

利用闭包实现记忆化

缓存能够通过减少不必要的重复计算来提升算法的效率。记忆化是一种防止函数对相同输入多次执行的常用缓存技术。

记忆化的工作原理是将特定输入参数集的结果存储在内存中,之后在需要时直接引用这些结果。你可以利用闭包来实现记忆化。

在下面的示例中,你使用了一个装饰器——它本身也是一个闭包——来缓存一个假设的、计算成本高昂的函数的结果值:

>>> def memoize(function):
...     cache = {}
...     def closure(number):
...         if number not in cache:
...             cache[number] = function(number)
...         return cache[number]
...     return closure
...

在这个例子中,memoize() 函数接收一个函数对象作为参数,并返回一个新的闭包对象。这个内部函数仅对尚未处理的数字执行输入函数。已处理的数字及其输入函数的结果被存储在 cache 字典中,以供后续使用。

现在,假设你有一个如下的示例函数,它模拟了一个计算成本较高的操作:

>>> from time import sleep

>>> def slow_operation(number):
...     sleep(0.5)
...

该函数将代码的执行仅保留半秒,以模仿昂贵的操作。为此,您可以使用时间模块中的 sleep() 函数。
您可以使用以下代码测量函数的执行时间:

>>> from timeit import timeit

>>> timeit(
...     "[slow_operation(number) for number in [2, 3, 4, 2, 3, 4]]",
...     globals=globals(),
...     number=1,
... )
3.02610950000053

在这个代码片段中,你利用了 timeit 模块的 timeit() 函数来测量执行 slow_operation() 函数时,使用一系列值作为输入的耗时。处理六个输入值时,代码耗时略超过三秒。你可以通过跳过重复的输入值,并使用记忆化技术来提高这个计算过程的效率。

接下来,按照下面的例子使用 @memoize 装饰器来装饰 slow_operation() 函数。然后,执行计时代码:

>>> @memoize
... def slow_operation(number):
...     sleep(0.5)
...

>>> timeit(
...     "[slow_operation(number) for number in [2, 3, 4, 2, 3, 4]]",
...     globals=globals(),
...     number=1,
... )
1.5151869590008573

现在,由于采用了记忆化技术,相同代码的执行时间缩短了一半。这是因为 slow_operation() 函数不会对重复的输入值再次执行。

利用闭包实现封装

在面向对象编程(OOP)中,类提供了一种将数据和行为整合到单个实体中的机制。OOP 中的一个核心需求是数据封装,这一原则建议保护对象的数据不受外部干扰,并阻止直接访问。

在 Python 中,实现严格的数据封装可能比较困难,因为 Python 中并没有私有和公共属性的区分。相反,Python 通过命名约定来表明某个类成员是公开的还是非公开的。

你可以利用 Python 闭包来实现更严格的数据封装。闭包能够为数据创建一个私有的作用域,阻止用户直接访问这些数据,从而有助于保持数据的完整性并防止意外修改。

例如,假设你有一个如下的 Stack 类:

class Stack:
    def __init__(self):
        self._items = []

    def push(self, item):
        self._items.append(item)

    def pop(self):
        return self._items.pop()

该 Stack 类将其数据存储在名为 ._items 的列表对象中,并实现常见的堆栈操作,例如入栈和出栈。
以下是如何使用此类:

>>> from stack_v1 import Stack

>>> stack = Stack()
>>> stack.push(1)
>>> stack.push(2)
>>> stack.push(3)

>>> stack.pop()
3

>>> stack._items
[1, 2]

你的类的基本功能已经实现了。但是,尽管 _items 属性被设计为非公开的,你依然可以通过点表示法来访问它的值,就像访问普通属性一样。这种做法使得数据封装变得困难,无法有效保护数据免受直接访问。

再次强调,闭包提供了一种实现更严格数据封装的方法。请看以下代码示例:

def Stack():
    _items = []

    def push(item):
        _items.append(item)

    def pop():
        return _items.pop()

    def closure():
        pass

    closure.push = push
    closure.pop = pop
    return closure

在这个示例中,你通过编写一个函数来创建一个闭包对象,而不是定义一个类。在这个函数内部,你定义了一个局部变量 _items,它将是你闭包对象的一部分。你将使用这个变量来保存栈的数据。接着,你定义了两个内部函数来执行栈的操作。

closure() 内部函数作为闭包的载体。在这个函数的基础上,你添加了 push()pop() 函数。最终,你返回了最终的闭包对象。

你可以像使用 Stack 类一样使用 Stack() 函数。一个重要的不同点是,现在你无法访问 _items 属性:

>>> from stack_v2 import Stack

>>> stack = Stack()
>>> stack.push(1)
>>> stack.push(2)
>>> stack.push(3)

>>> stack.pop()
3

>>> stack._items
Traceback (most recent call last):
    ...
AttributeError: 'function' object has no attribute '_items'

Stack() 函数使你能够创建闭包,这些闭包的功能类似于 Stack 类的实例。但是,你无法直接访问 _items 属性,这增强了数据的封装性。

如果你非常讲究,可以使用一种高级技巧来访问 _items 属性的内容:

>>> stack.push.__closure__[0].cell_contents
[1, 2]

.__closure__ 属性会返回一个元组,其中包含了闭包中变量绑定的单元格。每个单元格对象都有一个名为 cell_contents 的属性,你可以通过它来获取单元格中的值。

即便有这种技巧可以访问闭包中的变量,但在 Python 代码中通常不会使用它。毕竟,如果你的目标是实现封装,为什么要去破坏它呢?

探索闭包的替代方案

到目前为止,你已经了解到 Python 闭包可以帮助解决一些问题。然而,理解闭包的内部工作原理可能比较困难,因此使用其他工具可能会让你的代码更容易理解。

你可以用一个实现了 .__call__() 特殊方法的类来替代闭包,这样的类可以创建出可调用的实例。所谓可调用实例,就是你可以像调用函数一样去调用的对象。

make_root_calculator() 工厂函数为例:

>>> def make_root_calculator(root_degree, precision=2):
...     def root_calculator(number):
...         return round(pow(number, 1 / root_degree), precision)
...     return root_calculator
...

>>> square_root = make_root_calculator(2, 4)
>>> square_root(42)
6.4807

>>> cubic_root = make_root_calculator(3)
>>> cubic_root(42)
3.48

该函数返回在其扩展范围内保留 root_ Degree 和 precision 参数的闭包。您可以用以下类替换该工厂函数:

class RootCalculator:
    def __init__(self, root_degree, precision=2):
        self.root_degree = root_degree
        self.precision = precision

    def __call__(self, number):
        return round(pow(number, 1 / self.root_degree), self.precision)

这个类接收与 make_root_calculator() 相同的两个参数,并将它们设置为实例属性。

通过实现 .__call__() 方法,你将你的类实例转变为可调用的对象,这意味着你可以像调用普通函数一样调用这些实例。以下展示了如何利用这个类来创建类似于根计算函数的对象:

>>> from roots import RootCalculator

>>> square_root = RootCalculator(2, 4)
>>> square_root(42)
6.4807

>>> cubic_root = RootCalculator(3)
>>> cubic_root(42)
3.48

>>> cubic_root.root_degree
3

如你所看到的,RootCalculator 类的功能与 make_root_calculator() 函数大致相同。此外,你现在还能够访问如 root_degree 这样的配置参数。

总结

现在你已经了解到,闭包通常是在 Python 中定义在另一个函数内部的函数对象。闭包会捕获它们封闭作用域内定义的对象,并将这些对象与内部函数对象结合起来,形成一个具有扩展作用域的可调用对象。

你可以在多种情况下使用闭包,尤其是当你需要在连续函数调用间保持状态或编写装饰器时。因此,掌握如何使用闭包对 Python 开发者来说是一项宝贵的技能。

在本教程中,你学习了:

  • 闭包是什么以及它们在 Python 中的工作原理
  • 实际中何时可以运用闭包
  • 可调用实例如何替代闭包 掌握了这些知识后,你可以开始在你的代码中创建和使用 Python 闭包,特别是如果你对函数式编程工具感兴趣的话。

本文由mdnice多平台发布


科学冷冻工厂
29 声望3 粉丝