SQL Server 2008集成服务的事件探查器

ZDNet软件频道 时间:2009-11-30 作者: | 社区博客 我要评论()
本文关键词:SQL Server
在Solution Explorer中,单击 SSIS Packages,然后将 package.dtsx 文件重命名为 DataProfile.dtsx  12. 在对话框中单击Yes可将包对象重命名。每个客户端必须是唯一可识别的客户端,且不应该包括任何重复内容  34. 单击Candidate Key Profiles(候选键配置文件)。

  关键性能指示器和数据挖掘预测的可靠性完全取决于数据的有效性。尽管有效数据对于做出商业决策的重要性日益增强,但确保数据有效性的难度也在不断加大。数据正在源源不断地从各种系统和源流入您的企业和大量用户。

  很难定义数据质量的度量标准,因为它们针对于特定的域或应用程序。定义数据质量的一个常用方法是数据事件探查。

  数据配置文件是有关数据的汇总统计的集合,可能包含下列内容:

  · 用户表中的行数。

  · State 列中非重复值的数量。

  · Zip 列中空值或缺少值的数量。

  · City 列中的值的分布情况。

  · Zip 列中 State 列的函数依赖关系的强度,即对于给定的 zip 值,此状态应始终不变。

  在此演示中,我们假设贵公司对客户端信息有特定的数据质量要求。如下所示。

  a. 每个客户端必须是唯一可识别的客户端,且不能包括任何重复内容

  b. 人口统计信息不得为空

  c. 城市应包含相应的国家地区代码组合

  步骤

  启动服务器(使用 Hyper-V)

  注意:由于某些虚拟机配置和实验环境设置,很可能不需要您启动 Hyper-V Manager即可启动实验环境。在某些实验环境中,也不要求您登录到虚拟机,因为此配置可能已预设或保存。

  1. 从Start菜单启动 Hyper-V Manager。

  2. 右键选择 Bin07_SQL2008HOLS,然后单击Start。

  3. 再双击Bin07_SQL2008HOLS,打开虚拟机窗口。

  4. 您可以按Ctrl+Alt+Break将虚拟机切换到全屏显示。若要将虚拟机切换回窗口显示,则再次按下Ctrl+Alt+Break。

  5. 使用密码 pass@word1 以Student 身份登录

  在 Business Intelligence Development Studio 中启动 SSIS 解决方案。

  解决方案资源管理器是 Microsoft 中的一个组件,您可以用来查看和管理项目。 6. 单击Start | All Programs | Microsoft SQL Server 2008。右键单击 SQL Business Intelligence Development Studio,然后选择Run as Administrator。在出现提示时单击Continue。

  7. 单击File | New Project,然后从商业智能项目类型中在 Visual Studio 安装的模板下选择 Integration Services Project。

  8. 在New Project对话框的Solution Name文本框中键入 SSISAdvancedLAB 作为解决方案名称

  9. 将Location更改为:C:SSISHOLSSSIS。

  10. 单击OK

  11. 在Solution Explorer中,单击 SSIS Packages,然后将 package.dtsx 文件重命名为 DataProfile.dtsx

  12. 在对话框中单击Yes可将包对象重命名。

  数据配置文件任务

  13. Control Flow 设计器

14. Data Profiling task是从顶部开始第 10 个任务。

  使用数据配置文件任务

  15. 拖放Data Profiling Task或在工具框中双击Data Profiling Task

16. 在图面上双击Data Profiling Task

  17. DestinationType 属性指定将如何存储配置文件结果。默认情况下是 FileConnection,表示数据配置文件将存储在 XML 文件中。您也可以将配置文件存储在变量中,这样您便可以实施基于数据质量的控制流逻辑。例如,如果数据质量低于特定的质量,您可以发送电子邮件或启动清洗操作。对于此实验,只选择默认值 FileConnection 即可。将 OverwriteDestination 属性更改为 True。

  18. Destination 属性通过 SSIS 文件连接管理器指定用于存储结果的实际文件名。在下拉菜单中,选择“Choose New File Connection…”。

  19. 将Usage type: 更改为Create file

选择文件位置

  20. 浏览到 C:SSISHOLSSSISProfileResults ,然后在File name属性中选择 ClientProfile.xml。

  21. 单击OK

对表进行事件探查

  22. 单击Data Profiling Task Editor底部附近的Quick Profile(快速配置)按钮。单击New以配置连接到数据库。“快速配置文件”选项是一种很好的方法,可以为单个表快速设置一组简单但功能强大的数据配置文件,您还可以使用“配置文件请求”页以获得功能更强大的配置文件。

相关阅读:

  配置连接

  23. 在Server Name(服务器名)中键入 MIAMI。选择 Use Windows Authentication(使用 Windows 身份验证),在Connect to a database(连接到数据库)选项卡上,选择 SSISTRAINING 作为数据库。单击Test Connection(测试连接),如果连接正常则单击OK,然后单击OK以关闭此对话框。

  选择表

  24. 从Table or View下拉列表中选择 DimClientFull。选中Compute(计算)下的所有七个属性。单击OK。

  完成配置

  25. 单击OK。现在配置任务已完成,可以对表进行事件探查。“Control Flow ”面板上的Data Profiling Task 不显示红色十字符号

  保存解决方案

  26. 单击File | Save以保存解决方案

  执行包

  27. 右键单击 DataProfile.dtsx,然后单击Execute Package(执行包)

  包执行

  28. Data Profiling Task 在执行时变为黄色,当成功完成执行后变为绿色。

  停止包

  29. 单击Stop(停止)符号以退出包执行模式。SSIS 已对此数据库中的数据进行了事件探查,并将结果存储在以上指定的文件中。

  分析数据

  30. 根据公司对数据质量的要求,需要分析数据是否符合以下几个方面

  a. 每个客户端必须是唯一可识别的客户端,且不应该包括任何重复内容

  b. 人口统计信息不得为空

  c. 城市应包含相应的国家地区代码组合

  我们现在将查看 SSIS 生成的配置文件,以验证是否满足这些要求。

  使用数据配置文件查看器

  31. Data profile viewer(数据配置文件查看器)是用于分析配置文件结果的工具。Start | All Programs | Microsoft SQL Server 2008 | Integration Services | Data Profile Viewer。

  32. 单击Open并导航到 C:SSISHOLSSSISProfileResults ,然后打开 ClientProfile.xml

  33. 这将加载统计数据以准备好进行分析,如下所示:

  企业需要

  每个客户端必须是唯一可识别的客户端,且不应该包括任何重复内容

  34. 单击Candidate Key Profiles(候选键配置文件)。您将看到,“Data Profiling Task ”已计算 ClientBusinessKey 列和 ClientId 列的键强度。ClientId 列的键强度为 100% 表明此列可用作键。注意,ClientBusinessKey 列似乎存在一些问题,因为键强度不是 100%。我们来仔细看一下!

  35. 单击顶窗格中的 ClientBusinessKey 行。注意,在中间窗格中,您可以实际查看阻止 ClientBusinessKey 列成为键的值,以及每个值违反唯一性的次数。在这种情况下,有 9 条记录包括同一个键。(您也可以查看违规总百分比。)

  36. 为什么您认为这里有 9 个键违规?也许如果您可以查看此行中的其他列,就可以推测出查出此行的原因。事实上,您可以不必退出“数据配置文件查看器”!双击值为 AW00011000 的那一行。底部窗格中显示包含违规的记录。您可以查看哪些行需要更正,以免有人将错误数据引入到存放地点!更好的方法是,您可以进入包含这些行的数据源,以找出数据质量问题并修复生成数据的过程!


百度大联盟认证黄金会员Copyright© 1997- CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号 京ICP备09041801号-159
京公网安备:1101082134