SQL Postgres的DISTINCT与DISTINCT ON有什么区别

在本文中，我们将介绍Postgres数据库中DISTINCT和DISTINCT ON的区别。DISTINCT和DISTINCT ON都是用于从查询结果中过滤重复的行，但它们的使用方式和效果有所不同。

阅读更多：SQL 教程

DISTINCT

DISTINCT关键字用于从查询结果中删除重复的行。当使用DISTINCT时，将对查询结果的所有列进行比较，并删除完全相同的行，只保留一行。例如，考虑以下的”orders”表：

OrderID	CustomerID	Product
1	100	Product A
2	100	Product B
3	200	Product A
4	300	Product C
5	300	Product B

如果我们执行以下查询：

SELECT DISTINCT CustomerID FROM orders;

查询结果将会是：

CustomerID
100
200
300

注意到结果中的重复行已被删除，只保留了唯一的CustomerID。

DISTINCT ON

DISTINCT ON关键字用于从查询结果中删除特定列的重复行。与DISTINCT不同，DISTINCT ON只比较指定的列，并删除该列完全相同的行，而其他列的值可以不同。DISTINCT ON需要在查询中使用ORDER BY子句来指定用于比较的列。例如，使用上面的”orders”表，我们执行以下查询：

SELECT DISTINCT ON (CustomerID) CustomerID, Product FROM orders ORDER BY CustomerID;

查询结果将会是：

CustomerID	Product
100	Product A
200	Product A
300	Product C

在这个例子中，我们只保留了每个CustomerID的第一行，即使其它列如Product的值不同。我们使用ORDER BY子句和DISTINCT ON(CustomerID)来指示查询按照CustomerID列的顺序进行排序，并仅保留第一个出现的CustomerID值。

区别与适用场景

主要区别在于DISTINCT对于所有列进行去重，而DISTINCT ON只对指定列进行去重，其他列的值可以不同。DISTINCT在查询结果中保留唯一的行，而DISTINCT ON只保留每个指定列的第一行。

适用场景方面，如果我们需要得到所有列都唯一的行，使用DISTINCT是最好的选择。对于只关心特定列的去重，DISTINCT ON可以提供更细粒度的控制。

下面通过另一个例子来展示它们的应用场景：

假设我们有一个”orders”表，包含以下数据：

OrderID	CustomerID	Product
1	100	Product A
2	100	Product B
3	200	Product A
4	200	Product B
5	300	Product C
6	300	Product C

如果我们要获取每个CustomerID的最新订单，我们可以使用DISTINCT ON来实现：

SELECT DISTINCT ON (CustomerID) * FROM orders ORDER BY CustomerID, OrderID DESC;

查询结果将会是：

OrderID	CustomerID	Product
2	100	Product B
4	200	Product B
6	300	Product C

在这个例子中，我们根据CustomerID和OrderID进行排序，并且使用DISTINCT ON (CustomerID)保留了每个CustomerID的最新订单。

总结

本文介绍了Postgres数据库中DISTINCT和DISTINCT ON的区别。DISTINCT用于从查询结果中删除所有列都相同的重复行，而DISTINCT ON仅删除指定列相同的重复行。DISTINCT保留每个唯一的行，而DISTINCT ON仅保留每个指定列的第一行。根据具体需求，我们可以选择适应的关键字来满足查询的要求。