Python 对象的延迟初始化是指,当它第一次被创建时才进行初始化,或者保存第一次创建的结果,然后每次调用的时候直接返回该结果。

延迟初始化主要用于提高性能,避免浪费计算,并减少程序的内存需求。

property

在切入正题之前,我们了解下property的用法,property可以将属性的访问转变成方法的调用。

class Circle(object): 
  def __init__(self, radius): 
    self.radius = radius 
  
  @property
  def area(self): 
    return 3.14 * self.radius ** 2
  
c = Circle(4) 
print c.radius 
print c.area 

可以看到,area虽然是定义成一个方法的形式,但是加上@property后,可以直接执行c.area,当成属性访问。

现在问题来了,每次调用c.area,都会计算一次,太浪费cpu了,怎样才能只计算一次呢?这就是lazy property

lazy property

实现延迟初始化有两种方式,一种是使用python描述符,另一种是使用@property修饰符。

方式1:

class lazy(object): 
  def __init__(self, func): 
    self.func = func 
  
  def __get__(self, instance, cls): 
    val = self.func(instance) 
    setattr(instance, self.func.__name__, val) 
    return val 
  
class Circle(object): 
  def __init__(self, radius): 
    self.radius = radius 
  
  @lazy
  def area(self): 
    print \'evalute\'
    return 3.14 * self.radius ** 2
  
c = Circle(4) 
print c.radius 
print c.area 
print c.area 
print c.area 

结果\'evalute\'只输出了一次。在lazy类中,我们定义了__get__()方法,所以它是一个描述符。当我们第一次执行c.area时,python解释器会先从c.__dict__中进行查找,没有找到,就从Circle.__dict__中进行查找,这时因为area被定义为描述符,所以调用__get__方法。

__get__()方法中,调用实例的area()方法计算出结果,并动态给实例添加一个同名属性area,然后将计算出的值赋予给它,相当于设置c.__dict__[\'area\']=val

当我们再次调用c.area时,直接从c.__dict__中进行查找,这时就会直接返回之前计算好的值了。

不太懂python描述符的话,可以参考Descriptor HowTo Guide。

方式2

def lazy_property(func):
    attr_name = \"_lazy_\" + func.__name__

    @property
    def _lazy_property(self):
        if not hasattr(self, attr_name):
            setattr(self, attr_name, func(self))
        return getattr(self, attr_name)

    return _lazy_property

class Circle(object): 
  def __init__(self, radius): 
    self.radius = radius 
  
  @lazy_property
  def area(self): 
    print \'evalute\'
    return 3.14 * self.radius ** 2

这里与方法1异曲同工,在area()前添加@lazy_property相当于运行以下代码:

lazy_property(area)

lazy_property()方法返回_lazy_property_lazy_property又会调用_lazy_property()方法,剩下的操作与方法1类似。

我们可以检查下是否真的延迟初始化了:

c = Circle(4) 
print \"before first visit\"
print c.__dict__  
c.area
print \"after first visit\"
print c.__dict__

输出结果为:

before first visit
{\'radius\': 4}
evalute
after first visit
{\'_lazy_area\': 50.24, \'radius\': 4}

从中可以看书,只有当我们第一次访问c.area时,才调用area方法,说明确实延迟初始化了。

参考文献

  • Descriptor HowTo Guide

  • lazy evaluation

  • python中的property及实现lazy property(原博客已找不到)