Python max()和min()寻找极值|极客教程

Python max()和min()函数寻找极值，max()函数和min()函数具有双面性，它们可以像普通函数那样应用于集合，也可以用作高阶函数。
其默认行为模式如下：

>>> max(1, 2, 3)
3
>>> max((1,2,3,4))
4

这两个函数都可以接收无限多个输入参数，也可以将一个序列或者可迭代对象作为单一输入，找到其中的最大（或最小）值。

还可以用它们做一些更复杂的事，以前面的旅行数据为例，使用函数可以生成如下所示的一系列元组数据：

(
 ((37.54901619777347, -76.33029518659048), (37.840832, -76.273834), 17.7246),
 ((37.840832, -76.273834), (38.331501, -76.459503), 30.7382),
 ((38.331501, -76.459503), (38.845501, -76.537331), 31.0756),
 ((36.843334, -76.298668), (37.549, -76.331169), 42.3962),
 ((37.549, -76.331169), (38.330166, -76.458504), 47.2866),
 ((38.330166, -76.458504), (38.976334, -76.473503), 38.8019)
)

该集合中的每个元组包含3个值：起点、终点和距离，位置数据由经纬度数据组成。东经为正数，所以上面这些数据是美国东海岸的一条路径，大约为西经76°，距离单位为海里。
可以通过下面三种方法，从这些数据中得到最远距离和最近距离。

用生成器函数提取距离值。舍弃每段路径中的其他数据项，只保留距离。如果后续有其他处理流程，用这种方法会造成麻烦。
使用unwrap(process(wrap()))设计模式，返回包含最长距离和最短距离的路径段。虽然这里只用到了距离信息，但返回结果中包含了关于这段路径的完整信息。
将max()函数和min()函数用作高阶函数，定义函数抽取重要距离值。

作为对照，先讲前两种方案。下面的脚本首先构建出旅行数据，然后用前两种方法获得最长距离和最短距离。

from ch02_ex3 import (
    float_from_pair, lat_lon_kml, limits, haversine, legs
)
path = float_from_pair(float_lat_lon(row_iter_kml(source)))
trip = tuple(
    (start, end, round(haversine(start, end), 4))
        for start, end in legs(iter(path)))

这段脚本中的source是一个包含数据点的、打开的KML文件对象，trip对象是包含各个路径段的元组。每个路径段是一个三元组，包含起点、终点和通过haversine()函数计算出来的距离。legs()函数将源KML文件中的路径转换为“起点-终点”对。

得到trip对象后，就可以提取距离信息，计算最大值和最小值了，代码如下所示：

>>> long = max(dist for start, end, dist in trip)
>>> short = min(dist for start, end, dist in trip)

这里使用生成器函数从trip元组中提取了需要的数据。由于每个生成器表达式只能用一次，所以生成器表达式需要写两遍。

在一个比前面更大的数据集上运行得到如下结果：

>>> long
129.7748
>>> short
0.1731

下面用unwrap(process(wrap()))设计模式实现。清楚起见，把函数命名为wrap()和unwrap()，具体实现和运行结果如下：

from typing import Iterator, Iterable, Tuple, Any

Wrapped = Tuple[Any, Tuple]
def wrap(leg_iter: Iterable[Tuple]) -> Iterable[Wrapped]:
    return ((leg[2], leg) for leg in leg_iter)
def unwrap(dist_leg: Tuple[Any, Any]) -> Any:
    distance, leg = dist_leg
    return leg

long = unwrap(max(wrap(trip)))
short = unwrap(min(wrap(trip)))

不同于前一种实现方法，这种处理方式保留了路径段的完整信息：不仅提取了距离信息，而且把距离作为包装元组的第一项，然后利用max()和min()的默认行为模式处理包含距离和路径段的元组，最后舍弃第一个元素，保留路径段信息。

结果如下所示：

((27.154167, -80.195663), (29.195168, -81.002998), 129.7748)
((35.505665, -76.653664), (35.508335, -76.654999), 0.1731)

最后且最重要的实现方法是使用max()和min()的高阶函数模式。首先定义一个辅助函数，然后用它递归路径段集合，提取需要的信息，代码如下所示：

def by_dist(leg: Tuple[Any, Any, Any]) -> Any:
    lat, lon, dist = leg
    return dist

long = max(trip, key=by_dist)
short = min(trip, key=by_dist)

函数by_dist()拆开路径段元组，只返回其中的距离数据，距离数据后续将用于max()函数和min()函数。

max()和min()都接收一个可迭代对象和和一个函数作为参数。在所有Python高阶函数中，都用关键字参数key来提取所需的关键字信息。

max()函数对key函数的使用如下所示：

from typing import Iterable, Any, Callable

def max_like(trip: Iterable[Any], key: Callable) -> Any:
    wrap = ((key(leg), leg) for leg in trip)
    return sorted(wrap)[-1][1]

可以理解为max()函数和min()函数用key函数把每一项包装成一个二元组。将二元组序列排序后，第一个值对应包含最小值的二元组，最后一个值对应包含最大值的二元组，拆包后就可得到原始数据。

其中的key()函数是可选参数，默认值为lambda x: x。