数据库中的分组函数与胆组无关 (数据库不是胆组分组函数)

网络编程数据库中的分组函数与胆组无关 (数据库不是胆组分组函数) 09-24

在数据库管理系统（DBMS）中，分组函数（Group Functions）是一类常用的函数，它们可以对指定的数据进行汇总、计数、平均数计算等操作。分组函数通常与分组操作（Group By）结合使用，用于对某些列进行分组计算。然而，有时候我们会碰到一些情况，即使没有进行分组操作，分组函数的计算结果也与胆组相关。本文将详细介绍在数据库中分组函数的使用及其与胆组无关的情况。

一、分组函数的基本用法

在讲述分组函数与胆组无关之前，我们先来了解一下分组函数的基本用法。分组函数通常包括以下几种：

1. AVG：用于计算指定列的平均值；

2. SUM：用于计算指定列的总和；

3. COUNT：用于统计指定列中非空值的数量；

4. MAX：用于求取指定列中的更大值；

5. MIN：用于求取指定列中的最小值。

例如，我们有一张学生成绩表，其中包括学生姓名、所在班级、语文成绩、数学成绩、英语成绩等字段。如果我们要求出每个班的平均成绩、总成绩、及格人数等指标，可以使用以下语句：

SELECT class, AVG(chinese_score), AVG(math_score), AVG(english_score), SUM(chinese_score + math_score + english_score) AS total_score, COUNT(CASE WHEN chinese_score >= 60 AND math_score >= 60 AND english_score >= 60 THEN 1 END) AS pass_cnt

FROM std_score

GROUP BY class;

其中，这个语句中的 AVG、SUM、COUNT 就是分组函数，GROUP BY 关键字用于指定分组条件。

二、分组函数的计算并不总是和分组操作有关

通常情况下，分组函数的计算结果与分组条件有关。例如上述例子中，我们按照班级分组，求出了每个班级的平均成绩、总成绩及及格人数。但是，当我们把 GROUP BY 关键字去掉时，我们会发现计算结果依然正确：

SELECT AVG(chinese_score), AVG(math_score), AVG(english_score), SUM(chinese_score + math_score + english_score) AS total_score, COUNT(CASE WHEN chinese_score >= 60 AND math_score >= 60 AND english_score >= 60 THEN 1 END) AS pass_cnt

FROM std_score;

这是为什么呢？我们可以想象一下，以上语句的计算过程，实际上就是对整张表进行了聚合。也就是说，这些分组函数并没有通过 GROUP BY 关键字来限定计算范围，而是对表中所有行（或者符合条件的行）都进行了计算。因此，它们的计算结果并不总是和分组操作相关。

不过，需要注意的是，在某些情况下，去掉 GROUP BY 关键字会导致分组函数的计算结果变得毫无意义。例如，在以下语句中：

SELECT AVG(chinese_score), COUNT(chinese_score)

FROM std_score;

如果去掉 GROUP BY，计算结果就变成了所有成绩的平均分和总数。显然，这是毫无意义的。

三、分组函数在数据库查询中的应用

分组函数在实际的数据库查询中应用广泛，可以用来快速计算统计数据，也可以用来制作报表等。例如，以下是一个根据订单状态统计销售额的例子：

SELECT status, SUM(price * quantity) AS sales

FROM orders

GROUP BY status;

在这个例子中，我们使用 SUM 函数计算了订单中所有商品的销售额，并按照订单状态分组进行统计。

分组函数还可以用于查询某些列的最值等数据。例如，以下是一个查询产品库存最多的前十个产品的例子：

SELECT product_id, SUM(quantity) AS total_quantity

FROM product_storage

GROUP BY product_id

ORDER BY total_quantity DESC

LIMIT 10;

在这个例子中，我们使用 SUM 函数计算了每个产品的库存总量，并按照产品编号进行分组统计。然后，使用 ORDER BY 关键字对结果进行排序，使用 LIMIT 关键字取出前十个结果即可。

四、

数据库中的分组函数是常用的一类函数，可以用于聚合计算、统计数据、制作报表等多种场景。虽然分组函数通常和 GROUP BY 关键字结合使用，但是在某些情况下，分组函数的计算结果并不与分组操作相关。因此，在使用分组函数时需要根据实际情况进行判断。

相关问题拓展阅读：

order by 和 group by 的区别
mysql数据库 group by 报错原理是什么？

order by 和 group by 的区别

select a.name, max(a.sex) from a group by a.name order by a.sex asc

group by 用来分组如春,order by 用来渣睁耐早姿排序

order by

和 group by的区别为：指代不同、侧重点不同、引证用法不同

一、指代不同

1、order by：排序依据。

2、group by：进行分组。

二、侧重点不同

1、order by：用来对数据库的一组数据进行排序。

2、group by：指定的规则对数据进行分组，所谓的分组就是将一个“

数据集

”划分成若干个“小区域”，然后针对若干个“小区域”进行数据处理。

三、引证用法不同

1、order by：order作“次序，顺序”“治安，秩序”“整齐，有条理”解时，是

不可数名词

。作“订购，订货”“命令，嘱咐”“汇票，汇单”解时，是可数名词。

2、group by：group的基本意思是“群，团体，组类”，指由很多的人或物偶然键誉或有意组成的一个有秩序、有组织的整体，稿告段有时也可指较小的“人群”，还可以指一个大型的商业机构，即“集团”或某种“类别”友配。

order by 和 group by 的派返区别：

1，order by 从英文里理解就是行的排序方式，默认的为升序。 order by 后面必须列出排序的字段名，可以是多个字段名。

2，group by 从英文里理解就是分组。必须有“聚合函数”来配合才能使用，使用时至少需要一个分组标志字段。

注意：聚合函数是—sum()、count()、avg()等都是“聚合函数”

3,在sql命令格式使用的先后顺序上，group by 先于 order by。

在Sql中也可乱颂以说order by是按字段排序，group by 是按字段分类

通常order by 和group by 没有太多的关系，但是它们常常组合在一起用,完成分组加排序的功能。

如有下表：

执行这个语句是可以的：

如果执行下面语句就不行：

正确的应该是：

group by 尘陪饥的目的就是要将数据分类汇总。

如：

select 类别, sum(数量) as 数量之和 from A group by 类别

这就是简单Group By，返回结果会是分类汇总的结果。

order by 以…排序

group by 以…分组

order by 排序查询、asc升序、desc降序

示例：

select * from 学生表 order by 年龄查询学生表信息、按年龄的升序(默认、可缺省、从低到高早指)排列显示

也可以多条件排序、比如 order by 年陆弯配龄,成绩 desc 按年龄升序排列后、再按成绩降序排列

group by 分组查询、having 只能用于group by子句、作用于组内，having条件子句可以直接跟函数表达式。使用group by 子句的查闹衫询语句需要使用聚合函数。

示例：

select 学号,SUM(成绩) from 选课表 group by 学号按学号分组、查询每个学号的总成绩

select 学号,AVG(成绩) from 选课表

group by 学号

having AVG(成绩)>(select AVG(成绩) from 选课表 where 课程号=’001′)

order by AVG(成绩) desc

查询平均成绩大于001课程平均成绩的学号、并按平均成绩的降序排列

mysql数据库 group by 报错原理是什么？

在日常查询中，索引或其他数据查找的方法可能不是查询执行中更高昂的部分，例如：MySQL GROUP BY 可能负责查询执行时间 90% 还多。MySQL 执行 GROUP BY 时的主要复杂性是计算 GROUP BY 语句磨没中的聚合函数。UDF 聚合函数是一个接一个地获得构成单个组的所有值。这样，它可以在移动到另一个组之前计算单个组的聚合函数值。当然，问题在于，在大多数情况下，源数据值不会被分组。来自各种组的值在处理期间彼此跟随。因此，我们需要一个特殊的步骤。

处理 MySQL GROUP BY让瞎碧纳我们看看之前看过的同一张table： mysql> show create table tbl G *************************** 1. row ***************************Table: tbl Create Table: CREATE TABLE `tbl` ( `id` int(11) NOT NULL AUTO_INCREMENT, `k` int(11) NOT NULL DEFAULT ‘0’, `g` int(10) unsigned NOT NULL, PRIMARY KEY (`id`), KEY `k` (`k`) ) ENGINE=InnoDB AUTO_INCREMENT=DEFAULT CHARSET=latinrow in set (0.00 sec)

并且以不同方式执行相同的 GROUP BY 语句：

1、MySQL中的 Index Ordered GROUP BY

mysql> select k, count(*) c from tbl group by k order by k limit 5;

+—+—+

| k | c |

+—+—+

| 2 | 3 |

| 4 | 1 |

| 5 | 2 |

| 8 | 1 |

| 9 | 1 |

+—+—+

5 rows in set (0.00 sec)

mysql> explain select k, count(*) c from tbl group by k order by k limit 5 G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: index

possible_keys: k

key: k

key_len: 4

ref: NULL

rows: 5

filtered: 100.00

Extra: Using index

1 row in set, 1 warning (0.00 sec)

在这种情况下，我们在 GROUP BY 的列上有一个索引。这样，我们可以逐组扫描数据并动态执行 GROUP BY（低慧弊成本）。当我们使用 LIMIT 限制我们检索的组的数量或使用“覆盖索引”时，特别有效，因为顺序索引扫描是一种非常快速的操作。

如果您有少量组，并且没有覆盖索引，索引顺序扫描可能会导致大量 IO。所以这可能不是更优化的计划。

2、MySQL 中的外部排序 GROUP BY

mysql> explain select SQL_BIG_RESULT g, count(*) c from tbl group by g limit 5 G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows:

filtered: 100.00

Extra: Using filesort

1 row in set, 1 warning (0.00 sec)

mysql> select SQL_BIG_RESULT g, count(*) c from tbl group by g limit 5;

+—+—+

| g | c |

+—+—+

| 0 | 1 |

| 1 | 2 |

| 4 | 1 |

| 5 | 1 |

| 6 | 2 |

+—+—+

5 rows in set (0.88 sec)

如果我们没有允许我们按组顺序扫描数据的索引，我们可以通过外部排序（在 MySQL 中也称为“filesort”）来获取数据。你可能会注意到我在这里使用 SQL_BIG_RESULT 提示来获得这个计划。没有它，MySQL 在这种情况下不会选择这个计划。

一般来说，MySQL 只有在我们拥有大量组时才更喜欢使用这个计划，因为在这种情况下，排序比拥有临时表更有效（我们将在下面讨论）。

3、MySQL中的临时表 GROUP BY

mysql> explain select g, sum(g) s from tbl group by g limit 5 G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows:

filtered: 100.00

Extra: Using temporary

1 row in set, 1 warning (0.00 sec)

mysql> select g, sum(g) s from tbl group by g order by null limit 5;

+—+——+

| g | s |

+—+——+

| 0 | 0 |

| 1 | 2 |

| 4 | 4 |

| 5 | 5 |

| 6 | 12 |

+—+——+

5 rows in set (7.75 sec)

在这种情况下，MySQL 也会进行全表扫描。但它不是运行额外的排序传递，而是创建一个临时表。此临时表每组包含一行，并且对于每个传入行，将更新相应组的值。很多更新！虽然这在内存中可能是合理的，但如果结果表太大以至于更新将导致大量磁盘 IO，则会变得非常昂贵。在这种情况下，外部分拣计划通常更好。请注意，虽然 MySQL 默认选择此计划用于此用例，但如果我们不提供任何提示，它几乎比我们使用 SQL_BIG_RESULT 提示的计划慢 10 倍。您可能会注意到我在此查询中添加了“ ORDER BY NULL ”。这是为了向您展示“清理”临时表的唯一计划。没有它，我们得到这个计划： mysql> explain select g, sum(g) s from tbl group by g limit 5 G *************************** 1. row ***************************id:select_type: SIMPLEtable: tbl partitions: NULLtype: ALL possible_keys: NULLkey: NULLkey_len: NULLref: NULLrows: filtered: 100.Extra: Using temporary; Using filesort 1 row in set, 1 warning (0.00 sec)

在其中，我们获得了 temporary 和 filesort “两最糟糕的”提示。MySQL 5.7 总是返回按组顺序排序的 GROUP BY 结果，即使查询不需要它（这可能需要昂贵的额外排序传递）。ORDER BY NULL 表示应用程序不需要这个。您应该注意，在某些情况下 – 例如使用聚合函数访问不同表中的列的 JOIN 查询 – 使用 GROUP BY 的临时表可能是唯一的选择。

如果要强制 MySQL 使用为 GROUP BY 执行临时表的计划，可以使用 SQL_ALL_RESULT 提示。

4、MySQL 中的索引基于跳过扫描的 GROUP BY前三个 GROUP BY 执行方法适用于所有聚合函数。然而，其中一些人有第四种方法。

mysql> explain select k,max(id) from tbl group by k G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: range

possible_keys: k

key: k

key_len: 4

ref: NULL

rows: 2

filtered: 100.00

Extra: Using index for group-by

1 row in set, 1 warning (0.00 sec)

mysql> select k,max(id) from tbl group by k;

+—++

| k | max(id) |

+—++

| 0 ||

| 1 ||

| 2 ||

| 3 ||

| 4 ||

+—++

5 rows in set (0.00 sec)

此方法仅适用于非常特殊的聚合函数：MIN() 和 MAX()。这些并不需要遍历组中的所有行来计算值。他们可以直接跳转到组中的最小或更大组值（如果有这样的索引）。如果索引仅建立在 (K) 列上，如何找到每个组的 MAX(ID) 值？这是一个 InnoDB 表。记住 InnoDB 表有效地将 PRIMARY KEY 附加到所有索引。(K) 变为 (K,ID)，允许我们对此查询使用 Skip-Scan 优化。仅当每个组有大量行时才会启用此优化。否则，MySQL 更倾向于使用更传统的方法来执行此查询（如方法＃1中详述的索引有序 GROUP BY）。虽然我们使用 MIN() / MAX() 聚合函数，但其他优化也适用于它们。例如，如果您有一个没有 GROUP BY 的聚合函数（实际上所有表都有一个组），MySQL 在统计分析阶段从索引中获取这些值，并避免在执行阶段完全读取表： mysql> explain select max(k) from tbl G *************************** 1. row ***************************id:select_type: SIMPLEtable: NULL partitions: NULLtype: NULL possible_keys: NULLkey: NULLkey_len: NULLref: NULLrows: NULLfiltered: NULLExtra: Select tables optimized away 1 row in set, 1 warning (0.00 sec)

过滤和分组

我们已经研究了 MySQL 执行 GROUP BY 的四种方式。为简单起见，我在整个表上使用了 GROUP BY，没有应用过滤。当您有 WHERE 子句时，相同的概念适用： mysql> explain select g, sum(g) s from tbl where k>4 group by g order by NULL limit 5 G *************************** 1. row ***************************id:select_type: SIMPLEtable: tbl partitions: NULLtype: range possible_keys: kkey: kkey_len: ref: NULLrows:filtered: 100.Extra: Using index condition; Using temporary 1 row in set, 1 warning (0.00 sec)

对于这种情况，我们使用K列上的范围进行数据过滤/查找，并在有临时表时执行 GROUP BY。在某些情况下，方法不会发生冲突。但是，在其他情况下，我们必须选择使用 GROUP BY 的一个索引或其他索引进行过滤：

mysql> alter table tbl add key(g);

Query OK, 0 rows affected (4.17 sec)

Records: 0 Duplicates: 0 Warnings: 0

mysql> explain select g, sum(g) s from tbl where k>1 group by g limit 5 G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: index

possible_keys: k,g

key: g

key_len: 4

ref: NULL

rows: 16

filtered: 50.00

Extra: Using where

1 row in set, 1 warning (0.00 sec)

mysql> explain select g, sum(g) s from tbl where k>4 group by g limit 5 G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: tbl

partitions: NULL

type: range

possible_keys: k,g

key: k

key_len: 4

ref: NULL

rows: 1

filtered: 100.00

Extra: Using index condition; Using temporary; Using filesort

1 row in set, 1 warning (0.00 sec)

根据此查询中使用的特定常量，我们可以看到我们对 GROUP BY 使用索引顺序扫描（并从索引中“放弃”以解析 WHERE 子句），或者使用索引来解析 WHERE 子句（但使用临时表来解析 GROUP BY）。根据我的经验，这就是 MySQL GROUP BY 并不总是做出正确选择的地方。您可能需要使用 FORCE INDEX 以您希望的方式执行查询。

group by 与 count 一起的话不能直接写，

得用子查询

数据库不是胆组分组函数的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于数据库不是胆组分组函数,数据库中的分组函数与胆组无关,order by 和 group by 的区别,mysql数据库 group by 报错原理是什么？的信息别忘了在本站进行查找喔。

编辑：一起学习网

标签：函数,索引,成绩,学号,子句

一起学习网

数据库中的分组函数与胆组无关 (数据库不是胆组分组函数)

order by 和 group by 的区别

mysql数据库 group by 报错 原理是什么？

mysql数据库 group by 报错原理是什么？