至顶网›软件频道 ›理解 DB2 中的列组统计信息

理解 DB2 中的列组统计信息

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

DB2 SQL 优化器（后文简称为优化器）可以估计每个备选访问计划的执行成本，并根据其估计结果选择一个最佳访问计划。一个访问计划可以指定用来解析一条 SQL 语句的操作次序。

来源：IT专家网 2008年6月3日

注意：TABSCHEMA 列中的值将是不同的。同样，COLS 结果列并强制转换为 CHAR(128)，如果结果超过 128 个字符，它会将结果截断。在这个例子中，可能需要将 CAST 修改为一个更大的字符串。

TABSCHEMA  TABNAME    COLS                                   COLGROUPCARD        
---------- ---------- ------------------------------//------ -----------------
SKAPOOR    EMPLOYEE   EMPNO,WORKDEPT                                        32
SKAPOOR    EMPLOYEE   EMPNO,WORKDEPT,JOB                                    32
SKAPOOR    ORG        DEPTNUMB,DEPTNAME                                      8
SKAPOOR    ORG        MANAGER,DIVISION                                       8
SKAPOOR    ORG        DEPTNUMB,DEPTNAME,MANAGER,DIVISION,LOCATION            8

  5 record(s) selected with 1 warning messages suppressed.

这些记录描述了 EMPLOYEE 表的两列组统计信息和 ORG 表的三列组统计信息。

注意：在上面的查询中，注意 SYSCAT.SYSCOLGROUPCOLS 视图中的名为 “ORIDNAL” 的列。在 DB2 9 中，其拼写改为了 “ORDINAL”，所以，这个查询需要按照在 DB2 9 中使用的方法更新，如下所示：

WITH TMP(ID, NUM) AS
(
   SELECT COLGROUPID, MAX(ORDINAL)
     FROM SYSCAT.COLGROUPCOLS
   GROUP BY COLGROUPID
),
TMP2 (ID, NAME, NUM, TNAME, TSCHEMA) AS
(
   SELECT ID, CAST(RTRIM(COLNAME) AS CHAR(128)), NUM, TABNAME, TABSCHEMA
     FROM TMP Y, SYSCAT.COLGROUPCOLS X
    WHERE X.COLGROUPID = Y.ID
      AND Y.NUM = X.ORDINAL
  UNION ALL
   SELECT Y.ID, CAST(RTRIM(X.COLNAME) || ',' || Y.NAME AS CHAR(128)), Y.NUM-1,
   	 TNAME, TSCHEMA
     FROM TMP2 Y, SYSCAT.COLGROUPCOLS X
    WHERE Y.ID=X.COLGROUPID
      AND X.ORDINAL=Y.NUM-1
      AND Y.NUM > 1
      AND TNAME = TABNAME
      AND TSCHEMA = TABSCHEMA
)
SELECT SUBSTR(TSCHEMA,1,10) TABSCHEMA, SUBSTR(TNAME,1,10) TABNAME, NAME COLS,
	 COLGROUPCARD 
FROM TMP2, SYSSTAT.COLGROUPS
WHERE ID = COLGROUPID
AND NUM = 1
ORDER BY TABSCHEMA, TABNAME
;

查询目录表以检索索引统计信息。

注意：在 TABSCHEMA='SKAPOOR' 谓词中使用合适的模式名替换所提供的值。

SELECT SUBSTR(COLNAMES, 1, 30) AS COLS, FIRST2KEYCARD, FIRST3KEYCARD,
	 FIRST4KEYCARD, FULLKEYCARD
FROM SYSSTAT.INDEXES
WHERE TABSCHEMA='SKAPOOR' AND TABNAME='ORG';

上述查询返回如下记录：

COLS                       FIRST2KEYCARD FIRST3KEYCARD FIRST4KEYCARD FULLKEYCARD
-------------------------- ------------- ------------- ------------- -----------
+DEPTNUMB+DEPTNAME+MANAGER             8             8            -1           8

  1 record(s) selected.

FIRST2KEYCARD 统计信息描述了在列（DEPTNUMB 和 DEPTNAME）中不同组的数量，FIRST3KEYCARD 和 FULLKEYCARD 描述了完整列集（DEPTNUMB，DEPTNAME 和 MANAGER）中不同组的数量。FIRST4KEYCARD 值为 -1，这是因为索引在键中只包含三列。

练习

在示例 3 和 4 中，优化器使用了索引统计信息，而没有使用列组统计信息，通过说明统计信息相关性来修正基数估计值。

尝试以下步骤：

创建如下索引：
对这些索引收集统计信息，但不收集任何列组统计信息：
对示例 3 和 4 中的查询进行 EXPLAIN 处理。所得到的基数估计值符合上面的查询执行计划；然而，由于可用索引的不同，实际的计划会有所不同。注意收集的 DETAILED 统计信息并不影响基数估计值。
丢弃步骤 1 中创建的 IXEMP_1 和 IXSTAFF_1 索引，创建两个新的索引：
重复步骤 2 和步骤 3。其最后的基数估计值是相同的。

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

理解 DB2 中的列组统计信息

业界热点: