Python max()和min()寻找极值

Python max()和min()函数寻找极值max()函数和min()函数具有双面性,它们可以像普通函数那样应用于集合,也可以用作高阶函数。
其默认行为模式如下:

>>> max(1, 2, 3)
3
>>> max((1,2,3,4))
4

这两个函数都可以接收无限多个输入参数,也可以将一个序列或者可迭代对象作为单一输入,找到其中的最大(或最小)值。

还可以用它们做一些更复杂的事,以前面的旅行数据为例,使用函数可以生成如下所示的一系列元组数据:

(
 ((37.54901619777347, -76.33029518659048), (37.840832, -76.273834), 17.7246),
 ((37.840832, -76.273834), (38.331501, -76.459503), 30.7382),
 ((38.331501, -76.459503), (38.845501, -76.537331), 31.0756),
 ((36.843334, -76.298668), (37.549, -76.331169), 42.3962),
 ((37.549, -76.331169), (38.330166, -76.458504), 47.2866),
 ((38.330166, -76.458504), (38.976334, -76.473503), 38.8019)
)

该集合中的每个元组包含3个值:起点、终点和距离,位置数据由经纬度数据组成。东经为正数,所以上面这些数据是美国东海岸的一条路径,大约为西经76°,距离单位为海里。
可以通过下面三种方法,从这些数据中得到最远距离和最近距离。

  • 用生成器函数提取距离值。舍弃每段路径中的其他数据项,只保留距离。如果后续有其他处理流程,用这种方法会造成麻烦。

  • 使用unwrap(process(wrap()))设计模式,返回包含最长距离和最短距离的路径段。虽然这里只用到了距离信息,但返回结果中包含了关于这段路径的完整信息。

  • max()函数和min()函数用作高阶函数,定义函数抽取重要距离值。

作为对照,先讲前两种方案。下面的脚本首先构建出旅行数据,然后用前两种方法获得最长距离和最短距离。

from ch02_ex3 import (
    float_from_pair, lat_lon_kml, limits, haversine, legs
)
path = float_from_pair(float_lat_lon(row_iter_kml(source)))
trip = tuple(
    (start, end, round(haversine(start, end), 4))
        for start, end in legs(iter(path)))

这段脚本中的source是一个包含数据点的、打开的KML文件对象,trip对象是包含各个路径段的元组。每个路径段是一个三元组,包含起点、终点和通过haversine()函数计算出来的距离。legs()函数将源KML文件中的路径转换为“起点-终点”对。

得到trip对象后,就可以提取距离信息,计算最大值和最小值了,代码如下所示:

>>> long = max(dist for start, end, dist in trip)
>>> short = min(dist for start, end, dist in trip)

这里使用生成器函数从trip元组中提取了需要的数据。由于每个生成器表达式只能用一次,所以生成器表达式需要写两遍。

在一个比前面更大的数据集上运行得到如下结果:

>>> long
129.7748
>>> short
0.1731

下面用unwrap(process(wrap()))设计模式实现。清楚起见,把函数命名为wrap()unwrap(),具体实现和运行结果如下:

from typing import Iterator, Iterable, Tuple, Any

Wrapped = Tuple[Any, Tuple]
def wrap(leg_iter: Iterable[Tuple]) -> Iterable[Wrapped]:
    return ((leg[2], leg) for leg in leg_iter)
def unwrap(dist_leg: Tuple[Any, Any]) -> Any:
    distance, leg = dist_leg
    return leg

long = unwrap(max(wrap(trip)))
short = unwrap(min(wrap(trip)))

不同于前一种实现方法,这种处理方式保留了路径段的完整信息:不仅提取了距离信息,而且把距离作为包装元组的第一项,然后利用max()min()的默认行为模式处理包含距离和路径段的元组,最后舍弃第一个元素,保留路径段信息。

结果如下所示:

((27.154167, -80.195663), (29.195168, -81.002998), 129.7748)
((35.505665, -76.653664), (35.508335, -76.654999), 0.1731)

最后且最重要的实现方法是使用max()min()的高阶函数模式。首先定义一个辅助函数,然后用它递归路径段集合,提取需要的信息,代码如下所示:

def by_dist(leg: Tuple[Any, Any, Any]) -> Any:
    lat, lon, dist = leg
    return dist

long = max(trip, key=by_dist)
short = min(trip, key=by_dist)

函数by_dist()拆开路径段元组,只返回其中的距离数据,距离数据后续将用于max()函数和min()函数。

max()min()都接收一个可迭代对象和和一个函数作为参数。在所有Python高阶函数中,都用关键字参数key来提取所需的关键字信息。

max()函数对key函数的使用如下所示:

from typing import Iterable, Any, Callable

def max_like(trip: Iterable[Any], key: Callable) -> Any:
    wrap = ((key(leg), leg) for leg in trip)
    return sorted(wrap)[-1][1]

可以理解为max()函数和min()函数用key函数把每一项包装成一个二元组。将二元组序列排序后,第一个值对应包含最小值的二元组,最后一个值对应包含最大值的二元组,拆包后就可得到原始数据。

其中的key()函数是可选参数,默认值为lambda x: x

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程