Python max()和min()函数寻找极值,max()
函数和min()
函数具有双面性,它们可以像普通函数那样应用于集合,也可以用作高阶函数。
其默认行为模式如下:
>>> max(1, 2, 3)
3
>>> max((1,2,3,4))
4
这两个函数都可以接收无限多个输入参数,也可以将一个序列或者可迭代对象作为单一输入,找到其中的最大(或最小)值。
还可以用它们做一些更复杂的事,以前面的旅行数据为例,使用函数可以生成如下所示的一系列元组数据:
(
((37.54901619777347, -76.33029518659048), (37.840832, -76.273834), 17.7246),
((37.840832, -76.273834), (38.331501, -76.459503), 30.7382),
((38.331501, -76.459503), (38.845501, -76.537331), 31.0756),
((36.843334, -76.298668), (37.549, -76.331169), 42.3962),
((37.549, -76.331169), (38.330166, -76.458504), 47.2866),
((38.330166, -76.458504), (38.976334, -76.473503), 38.8019)
)
该集合中的每个元组包含3个值:起点、终点和距离,位置数据由经纬度数据组成。东经为正数,所以上面这些数据是美国东海岸的一条路径,大约为西经76°,距离单位为海里。
可以通过下面三种方法,从这些数据中得到最远距离和最近距离。
- 用生成器函数提取距离值。舍弃每段路径中的其他数据项,只保留距离。如果后续有其他处理流程,用这种方法会造成麻烦。
-
使用
unwrap(process(wrap()))
设计模式,返回包含最长距离和最短距离的路径段。虽然这里只用到了距离信息,但返回结果中包含了关于这段路径的完整信息。 -
将
max()
函数和min()
函数用作高阶函数,定义函数抽取重要距离值。
作为对照,先讲前两种方案。下面的脚本首先构建出旅行数据,然后用前两种方法获得最长距离和最短距离。
from ch02_ex3 import (
float_from_pair, lat_lon_kml, limits, haversine, legs
)
path = float_from_pair(float_lat_lon(row_iter_kml(source)))
trip = tuple(
(start, end, round(haversine(start, end), 4))
for start, end in legs(iter(path)))
这段脚本中的source
是一个包含数据点的、打开的KML文件对象,trip
对象是包含各个路径段的元组。每个路径段是一个三元组,包含起点、终点和通过haversine()
函数计算出来的距离。legs()
函数将源KML文件中的路径转换为“起点-终点”对。
得到trip
对象后,就可以提取距离信息,计算最大值和最小值了,代码如下所示:
>>> long = max(dist for start, end, dist in trip)
>>> short = min(dist for start, end, dist in trip)
这里使用生成器函数从trip
元组中提取了需要的数据。由于每个生成器表达式只能用一次,所以生成器表达式需要写两遍。
在一个比前面更大的数据集上运行得到如下结果:
>>> long
129.7748
>>> short
0.1731
下面用unwrap(process(wrap()))
设计模式实现。清楚起见,把函数命名为wrap()
和unwrap()
,具体实现和运行结果如下:
from typing import Iterator, Iterable, Tuple, Any
Wrapped = Tuple[Any, Tuple]
def wrap(leg_iter: Iterable[Tuple]) -> Iterable[Wrapped]:
return ((leg[2], leg) for leg in leg_iter)
def unwrap(dist_leg: Tuple[Any, Any]) -> Any:
distance, leg = dist_leg
return leg
long = unwrap(max(wrap(trip)))
short = unwrap(min(wrap(trip)))
不同于前一种实现方法,这种处理方式保留了路径段的完整信息:不仅提取了距离信息,而且把距离作为包装元组的第一项,然后利用max()
和min()
的默认行为模式处理包含距离和路径段的元组,最后舍弃第一个元素,保留路径段信息。
结果如下所示:
((27.154167, -80.195663), (29.195168, -81.002998), 129.7748)
((35.505665, -76.653664), (35.508335, -76.654999), 0.1731)
最后且最重要的实现方法是使用max()
和min()
的高阶函数模式。首先定义一个辅助函数,然后用它递归路径段集合,提取需要的信息,代码如下所示:
def by_dist(leg: Tuple[Any, Any, Any]) -> Any:
lat, lon, dist = leg
return dist
long = max(trip, key=by_dist)
short = min(trip, key=by_dist)
函数by_dist()
拆开路径段元组,只返回其中的距离数据,距离数据后续将用于max()
函数和min()
函数。
max()
和min()
都接收一个可迭代对象和和一个函数作为参数。在所有Python高阶函数中,都用关键字参数key
来提取所需的关键字信息。
max()
函数对key
函数的使用如下所示:
from typing import Iterable, Any, Callable
def max_like(trip: Iterable[Any], key: Callable) -> Any:
wrap = ((key(leg), leg) for leg in trip)
return sorted(wrap)[-1][1]
可以理解为max()
函数和min()
函数用key
函数把每一项包装成一个二元组。将二元组序列排序后,第一个值对应包含最小值的二元组,最后一个值对应包含最大值的二元组,拆包后就可得到原始数据。
其中的key()
函数是可选参数,默认值为lambda x: x
。