王朝网络
分享
 
 
 

数据挖掘基础教程

王朝导购·作者佚名
 
  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  参考价格: 点此进入淘宝搜索页搜索
  分类: 图书,计算机/网络,数据库,数据仓库与数据挖掘,

作者: (印度)西蒙(Soman.K.P)等著;范明,牛常勇译

出 版 社: 机械工业出版社

出版时间: 2009-1-1字数:版次: 1页数: 305印刷时间: 2009/01/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787111255437包装: 平装编辑推荐

数据挖掘是一个新兴的多学科交叉领域,它基于人工智能、机器学习、模式识别、统计学、数据库、可视化等技术,能够从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,目前已广泛应用于科学、工程、商业、医学等领域。

本书旨在向读者介绍数据挖掘方法和算法,使读者能够应用这些方法解决现实世界中的问题。本书精心选择了在数据挖掘领域中广泛使用的大部分方法,并辅以简单的例子,因而是学习数据挖掘的理想教材。

本书特色

•涵盖数据挖掘中数据的预处理、分类、预测、聚类、关联、支持向量机、多维数据可视化等内容,以及用于这些数据挖掘问题的典型算法。

•许多算法都通过例子解释,并辅以大量图示,有利于初学者理解。

•介绍如何使用开源软件包Weka和ExcelMiner、GCLUTO工具进行数据挖掘。在学习理论的同时,配合使用这些数据挖掘软件进行实验有利于读者加深对数据挖掘理论和算法的理解。

•介绍了一些源自UCI机器学习库的数据集,它们已经成为研究算法性能的基准数据集。

附带光盘包括

大量数据集。

使用Weka和ExcelMiner进行数据挖掘的演示。

内容简介

本书全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。

本书讲解深入浅出,并辅以大量实例,随书光盘提供了大量数据集以及两种广泛使用的数据挖掘软件——weka和ExcelMiner,便于读者理解数据挖掘知识。

本书适合作为高等院校计算机及相关专业数据挖掘课程的教材,也可供广大技术人员参考。

目录

出版者的话

译者序

前言

第1章 数据挖掘

1.1 引言

1.1.1数据挖掘与知识发现

1.1.2数据挖掘与数据分析

1.1.3数据挖掘与统计学

1.1.4数据挖掘与机器学习

1.2数据挖掘——成功的例子

1.3数据挖掘研究发展的主要原因

1.4当前研究成果

1.5图形模型和层次概率表示

1.6新的应用

1.7影响数据挖掘的趋势

1.8研究挑战

1.9实验平台和基础设施

参考文献

第2章 从商务角度看数据挖掘

2.1 引言

2.2从数据挖掘工具到解决方案

2.3数据挖掘系统的演变

2.4知识发现过程

2.5数据挖掘支撑技术概述

2.5.1数据挖掘:验证与发现

2.5.2决策支持系统

2.5.3OLAP

2.5.4桌面DSS

2.5.5数据仓库

2.5.6数据挖掘过程

2.6数据挖掘技术

参考文献

第3章 数据挖掘算法的数据类型、输入和输出

3.1 引言

3.2实例和特征

3.3特征(数据)的不同类型

3.4概念学习与概念描述

3.5数据挖掘的输出——知识表示

3.5.1分类学习算法的知识输出

3.5.2聚类学习算法的输出

3.5.3关联规则的输出

3.5.4用于数值预测的树的输出

3.5.5基于实例的学习和知识表示

参考文献

第4章 决策树——分类和回归树

4.1 引言

4.2构造分类树

4.2.1用于标称属性的ID3算法

4.2.2信息论和信息熵

4.2.3构造树

4.2.4高分支属性

4.2.5从ID3到C4.5

4.2.6形象化地理解ID3和C4.5算法

4.3 CHAID

4.3.1 CHAID的数学工具

4.3.2 CHAID变量的类型

4.3.3 CHAID算法

4.3.4 CHAID算法描述

4.3.5将CHAID用于气象数据

4.3.6单调变量的预测子级别合并

4.4CART(分类和回归树)

……

第5章数据挖掘的预处理和后处理

第6章数据集

第7章关联规则挖掘

第8章用开源和商业软件进行机器学习

第9章分类和回归算法

第10章支持向量机

第11章聚类分析

第12章多维数据可视化

参考文献

附录ASVM公式:安全可分的线性分类器

附录B图划分的矩阵形式

书摘插图

第1章 数据挖掘

1.1 引言

计算机科学家经常提到摩尔定律:计算机的处理速度大约每18个月翻一番。但是很少有人知道计算机的存储容量大约每9个月翻一番。(Goebel和Gruenwald 1999)。像理想气体一样,计算机的数据库迅速膨胀,占满了可用的存储空间,导致数据库中的大量数据成为未开发利用的资源。这些数据就像一个金矿,可以从中提取信息。然后,利用数据挖掘技术,可以将这些信息转换成有价值的知识。

很难说清楚有多少存储在全世界公司、学校、政府部门和其他机构的大型数据库中未使用的海量数据以及其当前增长率。据估计,美国国会图书馆存储的信息量高达3PB(Lesk1997)。Lesk估计,全世界每年大约产生160TB信息。而且,他估计已售出的磁盘空间将超过十万TB。很快,计算机的数据存储容量将超过人们使用该数据存储和使用其中数据的能力。将海量数据转换为知识的过程将变得价值无限。为此,在过去的10~15年中,一种称作数据库中知识发现(KDD)的过程逐步发展完善。数据挖掘算法就包含在KDD过程中。

典型的数据库用户使用一种界面通过诸如SQL这样的标准技术从数据库中检索数据。数据挖掘系统将这一过程向前推进一步,支持用户从数据中发现新的知识(Adriaans和Zantinge 1996)。按照计算机科学家的观点,数据挖掘是一个多学科交叉领域。诸如神经网络、遗传算法、回归、统计分析、机器学习和聚类分析等数据处理技术经常出现在数据挖掘文献中。许多研究者认为数据挖掘还不是一个完善的学科,数据可扩展性、与数据库系统的兼容性,以及可用性和准确性都有待改进。

……

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
>>返回首页<<
推荐阅读
 
 
频道精选
 
更多商品
机械CAE分析原理及工程实践
电动自行车维修经验集锦
AutoCAD2008中文版从入门到精通
WINDOWS VISTA从入门到精通
风力发电系统低电压运行技术
数控技术及其应用
AutoCAD2009中文版实用教程
UnigraphicsNX6.0中文版标准实例教程
工科物理 上册
功能材料及其应用
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有