• 返回函数

高阶函数除了可以接受函数作为参数外,还可以把函数作为结果值返回。如以下例子:

def lazy_sum(*args):
    def sum():
        ax = 0
        for n in args:
            ax = ax + n
        return ax
    return sum

当我们调用lazy_sum()时,返回的并不是求和结果,而是求和函数:

f=lazy_sum(1,3,5,7,9)
print(f)
#<function lazy_sum.<locals>.sum at ......>

调用函数f时,才真正计算求和的结果:

f=lazy_sum(1,3,5,7,9)
print(f())  #25

在这个例子中,我们在函数lazy_sum中又定义了函数sum,并且,内部函数sum可以引用外部函数lazy_sum的参数和局部变量,当lazy_sum返回函数sum时,相关参数和变量都保存在返回的函数中,这种称为“闭包(Closure)”的程序结构拥有极大的威力。

需要注意的一点是,即使每次调用同一个“返回函数”,每次的调用都会得到不同的函数,虽然它们完成的功能是一样的,但是它们在内存中是位于不同位置的。

返回的函数在其定义内部引用了局部变量args,当一个函数返回了一个函数后,其内部的局部变量还被新函数引用。因此返回函数不应引用任何循环变量,或后续会发生变化的变量,因为返回的函数并没有立刻被执行,而是直到调用了“f()”才被执行。如以下例子:

def count():
    fs = []
    for i in range(1, 4):
        def f():
             return i*i
        fs.append(f)
    return fs

f1, f2, f3 = count()
print(f1(),f2(),f3())  #9 9 9

如果一定要引用一个循环变量或者会发生变化的变量,正确的方法是再创建一个函数,用该函数的参数绑定循环变量当前的值,无论该循环变量后续如何更改,已绑定到函数参数的值不变:

def count():
    def f(j):
        def g():
            return j*j
        return g
    fs = []
    for i in range(1, 4):
        fs.append(f(i))  #f(i)立刻被执行,因此i的当前值被传入f()
    return fs
f1, f2, f3 = count()
print(f1(),f2(),f3())  #1 4 9
  • 匿名函数

当我们在传入函数时,有些时候,不需要显式地定义函数,直接传入匿名函数更方便。

在Python中关键字lambda表示匿名函数,冒号前面的x表示函数参数。如

lambda x: x * x
实际上是:

def f(x):
    return x * x

匿名函数有个限制,就是只能有一个表达式,不用写return,返回值就是该表达式的结果。

用匿名函数有个好处,因为函数没有名字,不必担心函数名冲突。此外,匿名函数也是一个函数对象,也可以把匿名函数赋值给一个变量,再利用变量来调用该函数,同样,也可以把匿名函数作为返回值返回。

  • 装饰器

假设我们要增强一个函数的功能,比如,在函数调用前后自动打印日志,但又不希望修改这个函数的定义,这种在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)。本质上,decorator就是一个返回函数的高阶函数。

以下例子定义并使用了一个打印日志的装饰器:

def log(func):
    def wrapper(*args, **kw):
        print('call %s():' % func.__name__)
        return func(*args, **kw)
    return wrapper
#使用@语法,把decorator置于函数的定义处
@log
def now():
    print('2018-3-26')
#调用结果
now()
'''call now():
2018-3-26'''

@log放到now()函数的定义处,相当于执行了语句:

now = log(now)

由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。wrapper()函数的参数定义是(*args, **kw),因此,wrapper()函数可以接受任意参数的调用。在wrapper()函数内,首先打印日志,再紧接着调用原始函数。如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:

def log(text):
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            print('%s %s():' % (text, func.__name__))
            return func(*args, **kw)
        return wrapper
    return decorator
#decorator用法
@log('execute')
def now():
    print('2018-3-26')
#调用结果
now()
'''execute now():
2018-3-26'''

和两层嵌套的decorator相比,3层嵌套的效果是这样的:

now = log('execute')(now)

经过decorator装饰之后的函数,它们的__name__已经从原来的'now'变成了'wrapper',因为返回的那个wrapper()函数名字就是'wrapper',所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。Python内置的functools.wraps就是干这个事的,使用方法是在装饰器中的wrapper函数前加上@functools.wraps(func),如上述代码中所示。

  • 偏函数

Python中的偏函数和数学中的偏函数意义不同,偏函数的主要作用是将一个函数中的某些参数固定(设定默认值),返回一个新函数,使得调用函数更加方便简单。

int()函数可以将字符串转换为数字,默认为按十进制转换,如果要按二进制或八进制转换,那么就要对int函数的base参数进行设置,如int('12345',base=2)int('12345',base=8),使用偏函数可以定义出一个int2()函数和int8()函数来完成同样的功能:

import functools
int2 = functools.partial(int,base=2)
int8 = functools.partial(int,base=8)
print(int2('10000000'))  #128
print(int8('10000000'))  #2097152

需要注意的是,偏函数只是把默认参数的默认值改变了,在调用函数时仍然可以给默认参数传入其他值,如int2('12345',base=10),函数将按十进制转换。

创建偏函数时,实际上可以接收函数对象*args**kw这3个参数,当传入:int2 = functools.partial(int,base=2))时,实际上是固定了int()函数的关键字参数base,也就是int2('1000')相当于:

kw = { 'base': 2 }
int('1000', **kw)

当传入:max10 = functools.partial(max,10))时,实际上是将10作为*args的一部分自动加到左边,也就是max10(5,6,7)相当于:

args = (10, 5, 6, 7)
max(*args)

返回结果为10

  • 模块

类似于c++中的头文件,Python也采用了将不同函数分组保存在不同文件的代码组织方式,在Python中一个.py文件就称之为一个模块(Module),在写代码时可以使用import进行模块引用。如一个abc.py文件就是一个叫abc的模块,可以使用import abc来引用。不同的模块中可以放入同名的函数和变量,因此在编写模块时不必考虑函数名和变量名与其他模块冲突,但是应避免与内置函数名重复。

Python采用了按目录来组织模块的方法,包含模块的目录称之为包(Package)。引入了包以后,只要顶层的包名不与别人冲突,那么所有模块都不会与别人冲突。每一个包目录下面都会有一个__init__.py(init前后两个下划线)的文件,这个文件是必须存在的,否则,Python就把这个目录当成普通目录,而不是一个包。__init__.py可以是空文件,也可以有Python代码,因为__init__.py本身就是一个模块,而它的模块名就是包名。另外,可以使用多级目录构成多层包结构。

在一个模块中,我们可能会定义很多函数和变量,但有的函数和变量我们希望给别人使用,有的函数和变量我们希望仅仅在模块内部使用。在Python中,是通过_前缀来实现的。

正常的函数和变量名是公开的(public),可以被直接引用;类似__xxx__(xxx前后下划线)这样的变量是特殊变量,可以被直接引用,但是有特殊用途,类似_xxx__xxx(只有xxx前有下划线)这样的函数或变量就是非公开的(private),不应该被直接引用。之所以我们说,private函数和变量“不应该”被直接引用,而不是“不能”被直接引用,是因为Python并没有一种方法可以完全限制访问private函数或变量,但是,从编程习惯上不应该引用private函数或变量。

  • 小结

以上为Python的基础和一些特性,从我个人的角度来看,Python的很多特性都是对编写代码的简化,使用一般的方法也能达到同样的功能,只是代码书写上有一点繁琐;Python的这些特性需要实际多写代码才能够很好地理解和灵活地运用,不然使用的时候容易出错;另外,有些简化在我看来没有太大的必要,当然具体如何写代码那就见仁见智了。