科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道如何在分析应用中使用数据挖掘(4)

如何在分析应用中使用数据挖掘(4)

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

数据挖掘是SQL Server 2000中最令人激动的新功能之一。我将数据挖掘看作是一个能够自动分析数据以获取相关信息的过程,数据挖掘可以和任一关系数据库或者OLAP数据源集成使用,但它和OLAP的集成所带来的好处却是极为显著的。

作者:tech.ddvip.com 来源:tech.ddvip.com 2007年9月5日

关键字: 数据库 数据挖掘 SQL Server SQL Server 各版本

  • 评论
  • 分享微博
  • 分享邮件
 

在客户端创建挖掘模型

尝试不同的挖掘模型,从其中找到效果最好的。尽管目前的客户端应用程序还不支持这一功能,但用户希望在客户机端,而不是在服务器端创建挖掘模型。客户分析程序需要支持这项功能,可以利用MDX扩展通过OLE DB for OLAP或ADO MD来创建挖掘模型。在客户机端创建挖掘模型需要运行SQL Server企业版,因为该功能依赖于企业版的自定义累积功能。

用数据挖掘维创建虚拟数据集需要三个步骤。第一,创建挖掘模型。下面的命令生成一个挖掘决策树来根据用户的性别、婚姻和教育状况预测年收入。

  
    CREATE OLAP MINING MODEL [Local Find Salary]
      FROM [Sales]
       (
        CASE
         DIMENSION [Customers]
         LEVEL [Name]
         PROPERTY [Gender] ,
         PROPERTY [Marital Status] ,
         PROPERTY [Education] ,
         PROPERTY [Yearly Income] PREDICT
       )
      USING Microsoft_Decision_Trees

注意调用数据集名字的FROM语句和引出Customers维Name层的成员属性的每个PROPERTY关健字。运行上面的命令后,就会得到一个空的挖掘模型,它对你的分析服务(Analysis Services)连接是唯一的,也会与其它工作站共享。(要创建共享的挖掘模型,需要用分析管理器或DSO编程接口)。下面的命令是将Sales多维数据集中的数据送入挖掘模型。这是一个简单的指定了挖掘模型名字的INSERT INTO语句:

  INSERT INTO [Local Find Salary]

最后,将根据挖掘模型、其它维以及从源多维数据集中引用的度创建一个虚拟多维数据集。下面是创建多维数据集的代码:

  
    CREATE SESSION VIRTUAL CUBE [PredictIncomeCube]
      FROM [Sales]
       (
        MEASURE [Sales].[Unit Sales] ,
        DIMENSION [Sales].[Customers],
        DIMENSION [Sales].[Time],
        DIMENSION [PredictIncome] NOT_RELATED_TO_FACTS
        FROM [Local Find Salary]
       COLUMN [Customers.Name.Yearly Income]
      )

在这一语句中,我仅仅使用了Unit Sales度、Customers和Time维。最后一个维━━PredictIncome是作为CREATE VIRTUAL CUBE语句的一部分而创建的。NOT_RELATED_TO_FACTS关键字让分析服务(Analysis Services)知道该维不是由同多维数据集相关的表得来的,FROM和COLUMN子句进一步说明了在创建虚拟多维数据集时使用了挖掘模型和挖掘模型的预测实体。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章