内容简介
本书以培养高级数据应用人才为目标,主要介绍数据仓库与数据挖掘技术的基本原理和应用方法。
全书共13章,主要内容包括数据仓库的概念与体系结构、数据、数据存储、OLAP与数据立方体、数据挖掘基础、关联规则算法、分类、统计分析、神经网络、聚类分析、非结构化数据挖掘、知识图谱、大数据挖掘算法。
本书内容循序渐进、深入浅出、概念清晰、条理性强。本书既重视理论知识的讲解,又强调应用技能的培养,除了介绍算法的主要思想和理论基础,还给出具体实例,利用算法解决实例中的任务。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。
本书既可作为高等学校软件工程和计算机专业的教材,也可供从事相关领域工作的技术人员学习和参考。
目录
第1章 数据仓库的概念与体系结构
1.1 数据仓库的兴起
1.1.1 数据管理技术的发展
1.1.2 数据仓库的萌芽
1.2 数据仓库的基本概念
1.2.1 元数据
1.2.2 数据粒度
1.2.3 数据模型
1.2.4 ETL
1.2.5 数据集市
1.3 数据仓库的特点与组成
1.3.1 数据仓库的特点
1.3.2 数据仓库的组成
1.4 数据仓库的体系结构
1.4.1 传统数据仓库的体系结构
1.4.2 传统数据仓库系统在大数据时代所面临的挑战
1.4.3 大数据时代的数据仓库
小结
习题
第2章 数据
2.1 数据的概念与内容
2.2 数据属性与数据集
2.3 数据预处理
2.3.1 数据预处理的意义
2.3.2 数据清洗
2.3.3 数据集成
2.3.4 数据变换
2.3.5 数据归约
小结
习题
第3章 数据存储
3.1 数据仓库的数据模型
3.1.1 数据仓库的概念模型
3.1.2 数据仓库的逻辑模型
3.1.3 数据仓库的物理模型
3.2 元数据存储
3.2.1 元数据的概念
3.2.2 元数据的分类方法
3.2.3 元数据的管理
3.2.4 元数据的作用
3.3 数据集市
3.3.1 数据集市的概念
3.3.2 数据集市的类型
3.4 大数据存储技术
3.4.1 传统数据库管理系统
3.4.2 NoSQL数据库
小结
习题
第4章 OLAP与数据立方体
4.1 OLAP的概念
4.1.1 OLAP的含义与基本概念
4.1.2 OLAP出现的原因——发展背景
4.1.3 OLAP参考标准——12条准则
4.2 多维分析操作
4.2.1 多维分析操作的定义
4.2.2 多维分析操作的必要性
4.2.3 多维分析操作的内容
4.2.4 多维分析操作实例展现
4.3 基本数据模型
4.3.1 基本数据模型的形式
4.3.2 MOLAP的定义、架构及优劣势分析
4.3.3 ROLAP的定义、架构及优劣势分析
4.3.4 MOLAP与ROLAP的比较
4.3.5 HOLAP的形成
……
第5章 数据挖掘基础
第6章 关联规则算法
第7章 分类
第8章 统计分析
第9章 神经网络
第10章 聚类分析
第11章 非结构化数据挖掘
第12章 知识图谱
第13章 大数据挖掘算法
参考文献