SQL中选择每一组中某列最大值所在行的方法

技术背景

在数据库操作中，经常会遇到需要从表中选择每一组中某列最大值所在行的需求。例如，有一个文档表，包含id、rev和content列，需要为每个id选择rev最大的那一行。这种需求在处理版本管理、数据筛选等场景中非常常见。

实现步骤

方法一：与简单的分组 - 最大值子查询连接

首先在子查询中找出每个组（id）对应的最大值（MAX(rev)）。
然后将原表与子查询进行连接，连接条件为id和rev都相等。

方法二：自左连接，调整连接条件和过滤条件

将表与自身进行左连接，连接条件为id相等，并且左表的rev小于右表的rev。
过滤连接结果，只显示右表id为NULL的行，这些行就是每个组中rev最大的行。

方法三：使用`IN`子句

在WHERE子句中使用IN关键字，通过子查询找出每个组的id和对应的最大rev，主查询选择满足这些条件的行。

方法四：使用窗口函数

通过ROW_NUMBER()或MAX()等窗口函数为每行分配一个排名或计算最大值，然后筛选出排名为 1 或rev等于最大值的行。

方法五：使用相关子查询

在WHERE子句中使用相关子查询，对于原表的每一行，子查询找出该id对应的最大rev，主查询选择rev等于该最大值的行。

核心代码

方法一：与简单的分组 - 最大值子查询连接

SELECT a.id, a.rev, a.contents
FROM YourTable a
INNER JOIN (
    SELECT id, MAX(rev) rev
    FROM YourTable
    GROUP BY id
) b ON a.id = b.id AND a.rev = b.rev;

方法二：自左连接，调整连接条件和过滤条件

SELECT a.*
FROM YourTable a
LEFT OUTER JOIN YourTable b
    ON a.id = b.id AND a.rev < b.rev
WHERE b.id IS NULL;

方法三：使用`IN`子句

SELECT * 
FROM t1 WHERE (id,rev) IN 
( SELECT id, MAX(rev)
  FROM t1
  GROUP BY id
);

方法四：使用窗口函数

SELECT a.id, a.rev, a.contents
FROM (
    SELECT id, rev, contents,
           ROW_NUMBER() OVER (PARTITION BY id ORDER BY rev DESC) ranked_order
    FROM YourTable
) a
WHERE a.ranked_order = 1;

方法五：使用相关子查询

select yt.id, yt.rev, yt.contents
from YourTable yt
where rev = 
    (select max(rev) from YourTable st where yt.id=st.id);

最佳实践

索引优化：在id和rev列上创建索引可以显著提高查询性能，特别是对于大型数据集。
性能测试：不同的方法在不同的数据库系统、表结构和数据量下性能可能有所不同，建议进行性能测试，选择最适合的方法。
代码可读性：优先选择代码简洁、易于理解和维护的方法，特别是在团队协作开发中。

常见问题

重复最大值问题：如果某个组中有多个行的rev值相同且都是最大值，上述方法都会将这些行都返回。如果只需要返回其中一行，可以使用ROW_NUMBER()窗口函数并结合LIMIT子句。
性能问题：相关子查询在处理大型数据集时可能会导致性能下降，因为子查询会为原表的每一行执行一次。可以考虑使用其他方法替代。
兼容性问题：部分方法（如窗口函数）在较旧的数据库版本中可能不支持，需要根据实际使用的数据库版本选择合适的方法。

数据库开发 > SQL查询优化

#MySQL #SQL #数据库开发 #分组查询 #最大值选择

SQL中选择每一组中某列最大值所在行的方法

https://119291.xyz/posts/2025-04-22.sql-select-rows-with-max-value/

作者

发布于

2025年4月23日

许可协议

解决MySQL Workbench中UPDATE时的错误代码1175问题上一篇

Java中测试包含私有方法、字段或内部类的类下一篇

SQL中选择每一组中某列最大值所在行的方法

SQL中选择每一组中某列最大值所在行的方法

技术背景

实现步骤

方法一：与简单的分组 - 最大值子查询连接

方法二：自左连接，调整连接条件和过滤条件

方法三：使用IN子句

方法四：使用窗口函数

方法五：使用相关子查询

核心代码

方法一：与简单的分组 - 最大值子查询连接

方法二：自左连接，调整连接条件和过滤条件

方法三：使用IN子句

方法四：使用窗口函数

方法五：使用相关子查询

最佳实践

常见问题

方法三：使用`IN`子句

方法三：使用`IN`子句