Python max()和min()函数寻找极值,max()
函数和min()
函数具有双面性,它们可以像普通函数那样应用于集合,也可以用作高阶函数。
其默认行为模式如下:
这两个函数都可以接收无限多个输入参数,也可以将一个序列或者可迭代对象作为单一输入,找到其中的最大(或最小)值。
还可以用它们做一些更复杂的事,以前面的旅行数据为例,使用函数可以生成如下所示的一系列元组数据:
该集合中的每个元组包含3个值:起点、终点和距离,位置数据由经纬度数据组成。东经为正数,所以上面这些数据是美国东海岸的一条路径,大约为西经76°,距离单位为海里。
可以通过下面三种方法,从这些数据中得到最远距离和最近距离。
- 用生成器函数提取距离值。舍弃每段路径中的其他数据项,只保留距离。如果后续有其他处理流程,用这种方法会造成麻烦。
-
使用
unwrap(process(wrap()))
设计模式,返回包含最长距离和最短距离的路径段。虽然这里只用到了距离信息,但返回结果中包含了关于这段路径的完整信息。 -
将
max()
函数和min()
函数用作高阶函数,定义函数抽取重要距离值。
作为对照,先讲前两种方案。下面的脚本首先构建出旅行数据,然后用前两种方法获得最长距离和最短距离。
这段脚本中的source
是一个包含数据点的、打开的KML文件对象,trip
对象是包含各个路径段的元组。每个路径段是一个三元组,包含起点、终点和通过haversine()
函数计算出来的距离。legs()
函数将源KML文件中的路径转换为“起点-终点”对。
得到trip
对象后,就可以提取距离信息,计算最大值和最小值了,代码如下所示:
这里使用生成器函数从trip
元组中提取了需要的数据。由于每个生成器表达式只能用一次,所以生成器表达式需要写两遍。
在一个比前面更大的数据集上运行得到如下结果:
下面用unwrap(process(wrap()))
设计模式实现。清楚起见,把函数命名为wrap()
和unwrap()
,具体实现和运行结果如下:
不同于前一种实现方法,这种处理方式保留了路径段的完整信息:不仅提取了距离信息,而且把距离作为包装元组的第一项,然后利用max()
和min()
的默认行为模式处理包含距离和路径段的元组,最后舍弃第一个元素,保留路径段信息。
结果如下所示:
最后且最重要的实现方法是使用max()
和min()
的高阶函数模式。首先定义一个辅助函数,然后用它递归路径段集合,提取需要的信息,代码如下所示:
函数by_dist()
拆开路径段元组,只返回其中的距离数据,距离数据后续将用于max()
函数和min()
函数。
max()
和min()
都接收一个可迭代对象和和一个函数作为参数。在所有Python高阶函数中,都用关键字参数key
来提取所需的关键字信息。
max()
函数对key
函数的使用如下所示:
可以理解为max()
函数和min()
函数用key
函数把每一项包装成一个二元组。将二元组序列排序后,第一个值对应包含最小值的二元组,最后一个值对应包含最大值的二元组,拆包后就可得到原始数据。
其中的key()
函数是可选参数,默认值为lambda x: x
。