内容简介
本书主要分三部分内容:上篇 Python基础,分5个章节介绍Python基础知识,主要包括Python概述、程序结构、函数、组合数据类型和面向对象编程基础;中篇Python数据挖掘实战,分2个章节介绍Python实现数据挖掘的过程和实战案例,主要围绕Python实现一个网站的简单搜索引擎、静态网站爬虫、动态网站爬虫和网络爬虫框架Scrapy几部分内容展开;下篇Python数据处理和分析案例,分3个章节介绍使用NumPy进行数据计算、使用Pandas进行数据分析及Matplotlib、seaborn和Bokeh数据可视化和实战案例。
目录
上篇 Python基础
第1章 Python概述
1.1认识Python
1.2 安装Python开发环境
1.3 Python基本数据类型
1.4 Python语法基础
第2章 程序结构
2.1 选择结构
2.2 循环结构
2.3 跳转语句
第3章 函数
3.1 函数的定义和调用
3.2 函数参数的传递
3.3 内置函数
第4章 组合数据类型
4.1 列表
4.2 元组
4.3 字典
4.4 集合
第5章 面向对象编程基础
5.1 面向对象
5.2 类与对象
5.3 构造方法与析构方法
5.4 类方法和静态方法
5.5 继承和多态
中篇 Python数据挖掘实战
第6章Python实现一个网站的简单搜索引擎
6.1 项目准备
6.2 编写视图函数
6.3 设计模板文件
6.4 配置访问路由
6.5 功能演示
第7章Python网络爬虫
7.1 静态网站爬虫——采集豆瓣读书网图书信息
7.2 动态网站爬虫——采集当当网上图书信息
7.3 网络爬虫框架Scrapy
下篇 Python数据分析案例
第8章 使用NumPy进行数据计算
8.1 Numpy数组对象
8.2 创建NumPy数组
8.3 ndarray对象的数据类型
8.4 数组运算
8.5 ndarray的索引和切片
8.6 数组的转置和轴对称
8.7 NumPy通用函数
8.8 利用NumPy数组进行数据处理
8.9 随机数模块
8.10 案例——骰子游戏
第9章 使用Pandas进行数据分析
9.1 Pandas的数据结构介绍
9.2 Pandas索引操作及高级索引
9.3 数据排序
9.4 统计计算与描述
9.5 层次化索引
9.6 读写数据操作
9.7 案例——北京和上海近10年房屋销售情况统计分析
第10章 数据可视化
10.1 数据可视化工具
10.2 Matplotlib库绘制图表
10.3 使用seaborn绘制统计图形
10.4 Bokeh——交互式可视化库
10.5 案例——画图分析链家网站上北京租房信息
参考文献
前言/序言
在当今信息爆炸的时代,数据已经成为了一种无形的财富。掌握数据挖掘、数据处理和分析的技能,对于各行各业的专业人士来说,都显得尤为重要。Python作为一种简洁、易学且功能强大的编程语言,在数据挖掘、数据处理和分析领域具有广泛的应用。
本书旨在为读者提供一套完整的Python学习路径,从基础语法、程序结构、函数使用,到复杂的数据类型处理,再到面向对象的编程思想,最后深入到数据挖掘、数据处理和分析的实战应用。本书内容分为三篇:Python基础、Python数据挖掘实战以及Python数据分析案例。
在上篇“Python基础”中,从Python的概述开始,介绍Python的历史、特点以及安装配置方法。随后,逐步深入Python的语法和程序结构,帮助读者掌握编写Python程序的基本技巧。接着,学习函数的使用,了解如何封装代码块以实现代码的复用。在数据类型方面,详细介绍列表、元组、字典和集合等组合数据类型的使用方法,并通过实例让读者掌握它们的添加、删除和修改操作。最后,引入面向对象编程的概念,为读者打开编程思维的新世界。
在中篇“Python数据挖掘实战”中,把理论知识应用到实际的数据挖掘项目中。首先,使用Python实现一个简单的网站搜索引擎,让读者了解搜索引擎的基本工作原理。接着,学习网络爬虫技术,包括静态网站爬虫和动态网站爬虫的构建方法。通过采集豆瓣读书网和当当网上的图书信息,读者将掌握如何编写网络爬虫程序,并从互联网上抓取所需的数据。最后,介绍网络爬虫框架Scrapy,帮助读者提高爬虫程序的编写效率。
下篇“Python数据分析案例”着重介绍了Python数据分析的具体案例。首先从NumPy这一基础的数据计算库入手,详细讲解了NumPy数组对象的创建、数据类型、数组运算、索引和切片等基础知识。这些内容是进行数据分析的基础,在NumPy的基础上,进一步介绍了强大的数据分析工具Pandas在数据分析中的应用。最后,介绍了数据可视化的实现。
本书旨在为读者提供一份系统、全面的Python基础入门指南,帮助读者从零开始学习Python,逐步掌握Python的核心知识和基本技能。希望本书能成为读者学习Python编程和数据挖掘、分析和处理的良师益友,引领你走进Python编程的广阔天地。