全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

大数据分析挖掘与可视化

  • 定价: ¥59
  • ISBN:9787561596326
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:厦门大学
  • 页数:391页
我要买:
点击放图片

导语

  

内容提要

  

    本书基于Python语言和第三方库Scrapy、NumPy、pandas、Sklearn、seaborn、Matplotlib编写,结合大量的数据分析挖掘案例,详细介绍大数据分析、挖掘与可视化的原理和方法,帮助读者逐步掌握Python程序设计、大数据采集与Python爬虫、数据清洗与转换、数据建模与挖掘、数据分析和数据可视化等相关知识,提高解决实际问题的能力。

目录

第1章  大数据概述
  1.1  大数据的时代背景与应用场景
  1.2  大数据及其特点
  1.3  大数据处理的相关技术
  1.4  数据分析
    1.4.1  数据分析术语
    1.4.2  数据分析过程
    1.4.3  Python数据分析和科学计算扩展库介绍
  1.5  数据挖掘
  1.6  数据可视化
  1.7  课后习题
第2章  Python大数据开发环境的搭建
  2.1  Python开发环境的搭建
    2.1.1  Python语言简介
    2.1.2  Python的下载、安装和环境配置
  2.2  PyCharm概述
    2.2.1  认识PyCharm
    2.2.2  PyCharm的安装
    2.2.3  PyCharm基本设置
  2.3  Anaconda概述
    2.3.1  Anaconda简介
    2.3.2  Anaconda的下载与安装
  2.4  PyCharm中导入Anaconda
  2.5  Jupyter Notebook的安装和使用
  2.6  实验
第3章  Python编程基础
  3.1  Python概述
  3.2  Python基础知识
    3.2.1  Python代码编写规范
    3.2.2  标识符、常量和变量
    3.2.3  基本数据类型
    3.2.4  运算符与表达式
  3.3  Python程序的基本结构
    3.3.1  选择结构
    3.3.2  循环结构
  3.4  组合数据类型
    3.4.1  列表
    3.4.2  元组
    3.4.3  字典
    3.4.4  集合
  3.5  函数与模块
    3.5.1  函数定义
    3.5.2  函数调用
    3.5.3  函数的参数
    3.5.4  变量的作用域
    3.5.5  匿名函数和递归函数
    3.5.6  模块
  3.6  文件
    3.6.1  文件的打开与关闭
    3.6.2  文件的读写
    3.6.3  文件的定位
  3.7  课后习题
  3.8  实验
第4章  Python爬虫
  4.1  爬虫概述
  4.2  爬虫技术原理
  4.3  robots协议
  4.4  Python爬虫
    4.4.1  re模块
    4.4.2  socket模块
    4.4.3  urllib模块
    4.4.4  Requests模块
    4.4.5  lxml模块
  4.5  Python多线程爬虫
  4.6  Scrapy爬虫框架
    4.6.1  Scrapy下载安装
    4.6.2  使用Scrapy爬取数据
  4.7  Python爬虫案例
  4.8  课后习题
  4.9  实验
第5章  NumPy
  5.1  认识NumPy
  5.2  ndarray
    5.2.1  创建NumPy数组
    5.2.2  NumPy数组的属性
    5.2.3  NumPy数组的变换
    5.2.4  索引与切片
    5.2.5  NumPy数组的迭代器对象
  5.3  NumPy数组的运算
    5.3.1  四则运算和关系运算
    5.3.2  逻辑运算
    5.3.3  集合运算
  5.4  NumPy函数的使用
    5.4.1  NumPy数学函数
    5.4.2  NumPy字符串函数
    5.4.3  NumPy统计函数
    5.4.4  NumPy排序函数
    5.4.5  NumPy条件筛选函数
    5.4.6  NumPy其他函数
  5.5  NumPy数据文件的读写
    5.5.1  二进制文件的读写
    5.5.2  文本文件的读写
  5.6  NumPy数据分析案例
  5.7  课后习题
  5.8  实验
第6章  pandas
  6.1  认识pandas
  6.2  pandas数据结构
    6.2.1  Series
    6.2.2  DataFrame
    6.2.3  Panel
  6.3  pandas索引操作
    6.3.1  索引和选取
    6.3.2  重新索引和更换索引
  6.4  pandas算术运算与数据对齐
    6.4.1  Series的算术运算
    6.4.2  DataFrame的算术运算
    6.4.3  DataFrame与Series的混合算术运算
  6.5  pandas数据读写
    6.5.1  I/O API函数
    6.5.2  pandas读写CSV文件中的数据
    6.5.3  pandas读写Excel文件中的数据
    6.5.4  pandas读写HTML文件中的数据
    6.5.5  pandas读写JSON数据
    6.5.6  pandas读写数据库文件的数据
  6.6  pandas数据分析处理
    6.6.1  缺失值处理
    6.6.2  数据合并和级联
    6.6.3  字符串和文本数据处理
    6.6.4  数据排序与分组
    6.6.5  pandas函数应用
    6.6.6  数据统计与汇总
  6.7  pandas数据分析案例
  6.8  课后习题
  6.9  实验
第7章  数据建模与数据挖掘
  7.1  数据建模
  7.2  相关性与关联规则
  7.3  回归分析
    7.3.1  线性回归
    7.3.2  逻辑回归
  7.4  聚类
    7.4.1  K-Means聚类算法
    7.4.2  层次聚类算法
    7.4.3  基于密度的聚类算法
  7.5  分类
    7.5.1  决策树分类算法
    7.5.2  朴素贝叶斯分类算法
    7.5.3  支持向量机(SVM)的分类算法
    7.5.4  K-最近邻算法
  7.6  课后习题
  7.7  实验
第8章  数据可视化
  8.1  Matplotlib
    8.1.1  认识Matplotlib
    8.1.2  图形的属性
    8.1.3  Matplotlib绘图流程
    8.1.4  基本图表绘制
    8.1.5  高级图表绘制
    8.1.6  子图绘制
  8.2  PyEcharts
    8.2.1  认识PyEcharts
    8.2.2  图表绘制
  8.3  seaborn
    8.3.1  认识seaborn
    8.3.2  图表绘制
  8.4  课后习题
  8.5  实验
第9章  综合案例
  9.1  二手房数据分析
    9.1.1  数据获取
    9.1.2  数据清洗与数据转换
    9.1.3  数据分析
    9.1.4  数据可视化
    9.1.5  数据分析结果
  9.2  旅游景点数据分析
    9.2.1  爬取数据
    9.2.2  数据清洗
    9.2.3  数据建模
    9.2.4  数据分析与可视化
附录 课程思政教学案例
挖掘数据“宝藏”,树立正确“三观”
参考文献