Python 克隆对象,Python中的赋值语句不会创建对象的副本,而只是将名称绑定到对象上。对于不可变对象也是如此。
但为了处理可变对象或可变对象集合,需要一种方法来创建这些对象的“真实副本”或“克隆体”。
从本质上讲,你有时需要用到对象的副本,以便修改副本时不会改动本体。本节将介绍如何在Python中复制或“克隆”对象,以及相关的注意事项。
先来看如何复制Python的内置容器(collection)。Python的内置可变容器,如列表、字典和集合,调用对应的工厂函数就能完成复制:
new_list = list(original_list)
new_dict = dict(original_dict)
new_set = set(original_set)
但用这种方法无法复制自定义对象,且最重要的是这种方法只创建浅副本。对于像列表、字典和集合这样的复合对象,浅复制和深复制之间有下面这一个重要区别。
浅复制是指构建一个新的容器对象,然后填充原对象中子对象的引用。本质上浅复制只执行一层,复制过程不会递归,因此不会创建子对象的副本。
深复制是递归复制,首先构造一个新的容器对象,然后递归地填充原始对象中子对象的副本。这种方式会遍历整个对象树,以此来创建原对象及其所有子项的完全独立的副本。
这里的内容有点多,所以我们会通过一些例子来理解深复制和浅复制之间的区别。
Python 克隆对象 制作浅副本
下面的例子中将创建一个新的嵌套列表,然后用list()
工厂函数浅复制:
>>> xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> ys = list(xs) # 制作一个浅副本
这意味着ys
现在是一个新的独立对象,与xs
具有相同的内容。查看这两个对象来确认一下:
>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
为了确认ys
真的与原对象互相独立,我们来设计一个小实验。先尝试向原对象(xs
)添加一个新列表,然后查看这个改动是否影响了副本(ys
):
>>> xs.append(['new sublist'])
>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9], ['new sublist']]
>>> ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
从中可以看到,结果符合预期。修改浅复制的列表完全不会影响副本。
但由于前面只创建了原列表的浅副本,所以ys
仍然含有xs
子对象的引用。
这些子对象没有复制,只是在ys
中再次引用。
因此在修改xs
中的子对象时,这些改动也会反映在ys
中——因为两个列表共享相同的子对象。这个副本是仅含有一层的浅复制:
>>> xs[1][0] = 'X'
>>> xs
[[1, 2, 3], ['X', 5, 6], [7, 8, 9], ['new sublist']]
>>> ys
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]
在上面的例子中,看上去只是修改了xs
。但事实证明,xs
和ys
中的索引1处的子列表都被修改了。再次提醒,发生这种情况是因为前面只创建了原始列表的浅副本。
如果在第一步中创建的是xs
的深副本,那么这两个对象会互相完全独立。这就是对象的浅副本和深副本之间的实际区别。
现在你了解了如何创建一些内置容器类的浅副本,并且知道了浅复制和深复制之间的区别,剩下的问题如下。
- 如何创建内置容器的深副本?
-
如何创建任意对象(包括自定义类)的浅副本和深副本?
解决这些问题需要用到Python标准库中的copy
模块。该模块提供了一个简单接口来创建任意Python对象的浅副本和深副本。
Python 克隆对象 制作深副本
修改前面的列表复制示例,这次使用copy
模块中定义的deepcopy()
函数创建深副本:
>>> import copy
>>> xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> zs = copy.deepcopy(xs)
在查看xs
及使用copy.deepcopy()
创建的副本zs
时,会发现和前面的示例相同,它们看起来都一样:
>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> zs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
但如果修改原对象(xs
)中的某个子对象,则会发现这些修改不会影响深副本(zs
)。
现在原对象和副本是完全独立的。复制过程中递归复制了xs
,包括它的所有子对象:
>>> xs[1][0] = 'X'
>>> xs
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]
>>> zs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
你可能需要打开Python解释器,花一些时间熟悉这些例子。在亲身尝试这些例子后能更好地理解这些对象复制的概念。
顺便说一句,还可以使用copy
模块中的一个函数来创建浅副本。copy.copy()
函数会创建对象的浅副本。
在代码中,copy.copy()
可以清楚地表明这里创建的是浅副本。但对于内置容器,只需要使用list
、dict
和set
这样的工厂函数就能创建浅副本,这种方式更具Python特色。
Python 克隆对象 复制任意对象
还有一个问题是,如何创建任意对象(包括自定义类)的浅副本和深副本,下面就来看看。
还是要用到copy
模块,其中的copy.copy()
和copy.deepcopy()
函数可以复制任何对象。
同样,理解其工作方式的最好方法是进行简单的实验。基于之前的列表复制示例,首先定义一个简单的2D点类:
class Point:
def __init__(self, x, y):
self.x = x
self.y = y
def __repr__(self):
return f'Point({self.x!r}, {self.y!r})'
这个类很简单,其中实现了__repr__()
以便轻松地在Python解释器中查看从此类创建的对象。
接下来将创建一个Point
实例,然后使用copy
模块进行浅复制:
>>> a = Point(23, 42)
>>> b = copy.copy(a)
如果查看原Point
对象及其浅副本的内容,会发现正如期望中的一样:
>>> a
Point(23, 42)
>>> b
Point(23, 42)
>>> a is b
False
还有一点需要记住,由于的点对象使用不可变类型(int
)作为其坐标,因此在这种情况下,浅复制和深复制之间并没有区别。不过下面会扩展这个例子。
来看一个更复杂的例子。下面将定义另一个类来表示2D矩形。这次将创建更复杂的对象层次结构,矩形将使用Point
对象来表示坐标:
class Rectangle:
def __init__(self, topleft, bottomright):
self.topleft = topleft
self.bottomright = bottomright
def __repr__(self):
return (f'Rectangle({self.topleft!r}, '
f'{self.bottomright!r})')
同样,首先尝试创建一个矩形实例的浅副本:
rect = Rectangle(Point(0, 1), Point(5, 6))
srect = copy.copy(rect)
如果查看原矩形及其副本,会看到__repr__()
对Point
也能正常重载,并且浅复制过程正常工作:
>>> rect
Rectangle(Point(0, 1), Point(5, 6))
>>> srect
Rectangle(Point(0, 1), Point(5, 6))
>>> rect is srect
False
还记得前面关于列表的示例中是如何查看浅副本和深副本之间的区别吗?这里将使用相同的方法,在对象层次结构中修改位于内部的对象,然后在(浅)副本中查看相关改动:
>>> rect.topleft.x = 999
>>> rect
Rectangle(Point(999, 1), Point(5, 6))
>>> srect
Rectangle(Point(999, 1), Point(5, 6))
希望这和你的期望一致。接着将创建原矩形的深副本并再次修改,观察哪些对象受到影响:
>>> drect = copy.deepcopy(srect)
>>> drect.topleft.x = 222
>>> drect
Rectangle(Point(222, 1), Point(5, 6))
>>> rect
Rectangle(Point(999, 1), Point(5, 6))
>>> srect
Rectangle(Point(999, 1), Point(5, 6))
看吧!这次深副本(drect
)完全独立于原对象(rect
)和浅副本(srec
t)。
到这里已经介绍了很多内容,但关于对象的复制还有许多细节。
这个主题值得深入研究,因此你可能需要研究copy
模块的文档,甚至可能需要深入研究copy
模块的源码。例如,对象可以通过定义特殊方法__copy__()
和__deepcopy__()
来控制它们的复制方式。玩得开心!
关键要点
-
创建的浅副本不会克隆子对象,因此副本和原对象并不完全独立。
-
对象的深副本将递归克隆子对象。副本完全独立于原对象,但创建深副本的速度较慢。
-
使用
copy
模块可以复制任意对象(包括自定义类)。