扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
2007年7月16日
使用 IBM DB2® for Linux®,UNIX®,and Windows® (DB2)中的列组统计信息,当多个等式本地谓词或等式连接谓词互相关联时,优化器可以确定一个更好的查询访问计划,并且改善查询性能。本文将介绍如何使用列组统计信息。
简介
DB2 SQL 优化器(后文简称为优化器)可以估计每个备选访问计划的执行成本,并根据其估计结果选择一个最佳访问计划。一个访问计划可以指定用来解析一条 SQL 语句的操作次序。
为正确地确定每种访问计划的成本,DB2 优化器需要准确的基数估计值。基数估计是这样一种过程:在应用了谓词或执行了聚集之后,优化器使用统计信息确定部分查询结果的大小。对于访问计划的每个操作符,优化器将估计该操作符的基数输出。一个或更多谓词的应用可以减少输出流基数。
在计算谓词对于基数估计值的组合过滤效果时,通常会假设这些谓词彼此之间是独立的。然而,这些谓词可以在统计方面彼此关联。单独地处理它们通常会导致优化器低估基数值。而基数值的低估又会导致优化器选择一个次优的访问计划。
对于至少应用了至少两个本地等式谓词的 SQL 语句,优化器将考虑使用多列统计信息来检测统计关联,并更加准确地估计多个谓词组合的过滤效果。同样对于连接两个或更多表的 SQL 语句,以及在一对表间至少使用了两个等式连接谓词的连接,优化器也会使用多列统计信息。
一个本地等式谓词是一个应用于单个表的等式谓词,其描述如下所示:
|
其中 literal 可以是以下任一内容:
一个等式连接谓词的描述如下所示,它用于表 1 和表 2 间的连接:
|
DB2 V8.2 使用下面的多列统计信息:
这些统计信息描述了包含两个或更多列的列集中不同分组的数量。
在 DB2 V8.2 出现之前,只能使用索引 keycard 统计信息,并且要受下列条件约束:
在 DB2 V8.2 中,通过考虑到所有索引 keycard 统计信息而不要求索引完全限定,DB2 SQL 优化器进一步扩展了多列统计信息的使用。它还考虑到了用户收集的任何列组统计信息。本文讨论了优化器如何利用这些统计信息,以及用户如何识别要收集的列组统计信息。
多个本地等式谓词的统计相关性
DB2 SQL 优化器试图检测多个本地等式谓词间的统计相关性。
示例 1:假设有一个表 SHOW_LISTINGS,它包含如下列:
表 1. SHOW_LISTINGS 表的描述
列名 | 描述 |
SHOW_ID | 表外键,包含关于各演出清单的信息 |
CHANNEL_ID | 表外键,包含关于播放演出的每个频道的信息 |
STATION_ID | 表外键,包含和频道相关的每个电视台的信息 |
CITY_ID | 表外键,包含关于上演该演出的每个城市的信息 |
DAY | 演出播放的日期 |
TIME | 演出播放的当天的时间 |
<other columns> | 描述了演出清单的其他属性 |
由于演出只在某个电视台的某个频道播出,在一天的特定时间内,这些列(SHOW_ID,CHANNEL_ID,STATION_ID 和 TIME)彼此之间不是互相独立的。DAY 列独立于 TIME 列,但是它不独立于所有演出清单的 SHOW_ID。
设想一条应用了以下谓词的 SQL 语句:
P1: SHOW_ID = ? P2: CHANNEL_ID = ? P3: STATION_ID = ? P4: TIME = ? |
IX1 ON SHOW_LISTINGS(SHOW_ID, CHANNEL_ID, STATION_ID, TIME) IX2 ON SHOW_LISTINGS(SHOW_ID, CHANNEL_ID, STATION_ID, TIME, CITY_ID) IX3 ON SHOW_LISTINGS(SHOW_ID, CHANNEL_ID, STATION_ID, TIME, DAY, CITY_ID) |
不能使用如下所示的索引:
IX4 ON SHOW_LISTINGS(CITY_ID, SHOW_ID, CHANNEL_ID, STATION_ID, TIME) |
如果不存在具有所需键的索引,那么可以在 SHOW_ID、CHANNEL_ID、STATION_ID 和 TIME 上收集列组统计信息。优化器使用这些列组统计信息,运用与处理索引的 FIRST4KEYCARD 统计信息相同的方式检测这四个谓词间的统计相关性。
DB2 优化器同样也会考虑具有谓词子集的索引或者列组统计信息。例如,看下面所示的索引:
IX5 ON SHOW_LISTINGS(SHOW_ID, STATION_ID, CITY_ID, CHANNEL_ID) |
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者