使用 count(*) 统计后的字段作为 order by 的字段怎么优化

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

MySQL 5.5 Community Server

MySQL 5.6 Community Server

Percona Configuration Wizard

XtraBackup 搭建主从复制

Great Sites on MySQL

Percona

MySQL Performance Blog

Severalnines

推荐管理工具

Sequel Pro

phpMyAdmin

推荐书目

MySQL Cookbook

MySQL 相关项目

MariaDB

Drizzle

参考文档

http://mysql-python.sourceforge.net/MySQLdb.html

这是一个创建于 2244 天前的主题，其中的信息可能已经有所发展或是发生改变。

四百万行数据，GROUP BY 后统计，然后 DESC 排序后，还要分页

LOG( 统计该用户操作的日志表 )

id 主键 user_id 用户 ID date 创建日期

SQL( date, user_id 这两个字段建立复合索引 )

SELECT user_id, count(*) AS count FROM log GROUP BY date, user_id ORDER BY date DESC, user_id DESC LIMIT 0, 10

以上 SQL 语句可以走索引，但是这时候如果要 count 字段进行排序，explain 就走全表了，执行了 1 分半，有其他办法优化吗？

SELECT user_id, count(*) AS count FROM log GROUP BY date, user_id ORDER BY count DESC, date DESC, user_id DESC LIMIT 0, 10

10 条回复

setsunakute

2019-10-11 16:19:12 +08:00

select `user`, count from (
SELECT
`date`,
user_id,
count(*) AS count
FROM
log
GROUP BY
date, user_id
) as a
order by count DESC, `date` DESC, user_id DESC limit 0, 10;
这样试试?

ShutTheFu2kUP

2019-10-11 16:29:13 +08:00

@setsunakute 貌似还是一个结果，子查询不走索引，我启动强制索引，虽然 explain 的 key 有索引，但是还是 row 还是全表的行数

ShutTheFu2kUP

2019-10-11 16:50:08 +08:00

是我自己傻了...子查询还是走索引的，只是因为子查询里没有 LIMIT，所以行数还是全表的行数...

reus

2019-10-1116:55:23 +08:00

不走全表，是没可能算出结果的，你怎么优化都不能违背基本逻辑。
可以给 date 加范围条件，如果业务允许的话。

ShutTheFu2kUP

2019-10-11 16:58:10 +08:00

@reus 是的..在不重构表的情况下我也只能想到这个方法了..

saulshao

2019-10-11 17:48:00 +08:00

这种我之前的办法都是把 count 结果直接写到表里....然后查询这个表...

zhengwhizz

2019-10-11 20:37:55 +08:00 via Android

首先要确认你的业务场景，从语句来看只是要知道用户每天的操作次数，这其实属于数据统计了，你的日志表为原始数据表，每次请求都去拿原始表肯定很慢，所以要建立一个统计表(userid, count, date )，然后在每次用户有操作时 count 加 1 （实时性要求高的情况），或者定时脚本把前一天的统计了放进去。这种设计还可以满足时间段的统计，只需要 sum 下即可。

Caballarii

2019-10-11 20:40:53 +08:00

redis

Leigg

2019-10-11 20:46:51 +08:00 via Android

兄 die，你是要全表排序啊，怎么避免扫全表。需求，表设计，库选择，总有一个是有问题的。
非要在现有的基础上解决这个问题，楼上的建议是不错的。

ShutTheFu2kUP

2019-10-12 11:20:36 +08:00

@zhengwhizz 嗯，谢谢大佬，我的思路也是如果重构就用字段+1 的方式。定时统计也是一种解决办法，之前没有想到，感谢指导