28
2.2.1Python运算符 28
2.2.2运算符的优先级 33
2.3Python语法基础 35
2.3.1条件语句:if及if嵌套 35
2.3.2循环语句:while与for 36
2.3.3格式化:format与% 38
2.4Python的函数 39
2.4.1函数的概念及使用 40
2.4.2数据分析中的常用函数 41
2.5本章小结 44
第3章Pandas数据整理与清洗 45
3.1Pandas的概念与数据结构 45
3.1.1初识Pandas 45
3.1.2Pandas的数据结构 46
3.2数据的读取 48
3.2.1读取本地离线数据 49
3.2.2读取Web在线数据 50
3.2.3读取常用数据库的数据 51
3.2.4读取Hadoop集群数据 53
3.3数据的索引 54
3.3.1set_index()函数:创建索引 54
3.3.2unstack()函数:层次化索引 56
3.3.3swaplevel()函数:调整索引 57
3.4数据的切片 57
3.4.1提取一列或多列数据 57
3.4.2提取一行或多行数据 58
3.4.3提取指定区域的数据 59
3.5数据的删除 60
3.5.1删除一行或多行数据 60
3.5.2删除一列或多列数据 61
3.5.3删除指定的列表对象 62
3.6数据的排序 62
3.6.1按行索引排序数据 62
3.6.2按列索引排序数据 63
3.6.3按一列或多列排序数据 64
3.6.4按一行或多行排序数据 65
3.7数据的聚合 65
3.7.1level参数:指定列聚合数据 65
3.7.2groupby()函数:分组聚合 66
3.7.3agg()函数:更多聚合指标 67
3.8数据透视 68
3.8.1pivot_table()函数:数据透视 68
3.8.2crosstab()函数:数据交叉 71
3.9数据合并 71
3.9.1merge()函数:横向合并 72
3.9.2concat()函数:纵向合并 74
3.10本章小结 75
第4章Python数据可视化库 76
4.1Matplotlib 76
4.1.1Matplotlib库简介 76
4.1.2Matplotlib可视化案例 76
4.2Pyecharts 78
4.2.1Pyecharts库简介 78
4.2.2Pyecharts可视化案例 78
4.3Seaborn 79
4.3.1Seaborn库简介 79
4.3.2Seaborn可视化案例 79
4.4Bokeh 81
4.4.1Bokeh库简介 81
4.4.2Bokeh可视化案例 81
4.5HoloViews 83
4.5.1HoloViews简介 83
4.5.2HoloViews可视化案例 83
4.6Plotly 84
4.6.1Plotly库简介 84
4.6.2Plotly可视化案例 85
4.7NetworkX 86
4.7.1NetworkX简介 86
4.7.2NetworkX可视化案例 87
4.8其他可视化库 88
4.8.1Altair 88
4.8.2Pygal 89
4.9动手练习 90
第2篇Matplotlib数据可视化
第5章Matplotlib图形参数设置 95
5.1Matplotlib主要参数配置 95
5.1.1线条设置 95
5.1.2坐标轴设置 98
5.1.3图例的设置 99
5.2绘图参数文件及主要函数 101
5.2.1修改绘图参数文件 101
5.2.2绘图主要函数简介 103
5.3Matplotlib参数配置案例 104
5.4动手练习 105
第6章Matplotlib基础绘图 106
6.1绘制直方图 106
6.1.1直方图的参数 106
6.1.2案例:每日利润额的数值分布 107
6.2绘制折线图 109
6.2.1折线图的参数 109
6.2.2案例:每周商品销售业绩分析 109
6.3绘制条形图 111
6.3.1条形图的参数 111
6.3.2案例:不同省份利润额的比较 112
6.4绘制饼图 113
6.4.1饼图的参数 114
6.4.2案例:不同类型商品销售额比较 115
6.5绘制散点图 116
6.5.1散点图的参数 116
6.5.2案例:销售额与利润额的关系 117
6.6绘制箱形图 118
6.6.1箱形图的参数 118
6.6.2案例:区域销售业绩比较分析 120
6.7动手练习 122
第7章Matplotlib高级绘图 123
7.1树形图及应用案例 123
7.1.1树形图的适用场景 123
7.1.2案例:不同省份销售额的比较分析 124
7.2误差条形图及应用案例 125
7.2.1误差条形图的适用场景 125
7.2.2案例:门店业绩考核达标情况分析 125
7.3火柴杆图及应用案例 127
7.3.1火柴杆图的函数及其应用场景 127
7.3.2案例:不同省份送货准时性分析 127
7.4甘特图及应用案例 128
7.4.1甘特图及其应用场景 129
7.4.2案例:企业信息化项目进度管理 129
7.5自相关图及应用案例 132
7.5.1自相关图及其应用场景 132
7.5.2案例:股票价格的自相关分析 133
7.6图形整合及应用案例 135
7.6.1图形整合函数 135
7.6.2案例:区域销售额与利润额分析 137
7.7动手练习 139
第3篇Pyecharts数据可视化
第8章Pyecharts图形参数配置 143
8.1全局配置项 143
8.1.1基本元素配置项 143
8.1.2坐标轴配置项 151
8.1.3原生图形配置项 154
8.2系列配置项 159
8.2.1样式类配置项 159
8.2.2标记类配置项 161
8.2.3其他类配置项 165
8.3多样化的视图呈现 166
8.3.1生成HTML文件 166
8.3.2生成图片 167
8.3.3在JupyterNotebook环境下运行 168
8.3.4在JupyterLab环境中运行 168
8.4动手练习 169
第9章Pyecharts基础绘图 170
9.1绘制折线图 170
9.1.1折线图及其参数配置 170
9.1.2案例:各门店销售业绩比较分析 171
9.2绘制条形图 173
9.2.1条形图及其参数配置 173
9.2.2案例:各省市商品订单数量分析 175
9.3绘制箱形图 177
9.3.1箱形图及其参数配置 177
9.3.2案例:不同类型商品的收益分析 178
9.4涟漪散点图 179
9.4.1涟漪散点图的参数配置 179
9.4.2案例:不同收入等级客户价值分析 180
9.5K线图 182
9.5.1K线图的参数配置 182
9.5.2案例:企业股票价格趋势分析 183
9.6双坐标轴图 185
9.6.1双坐标轴图的介绍 185
9.6.2案例:区域销售业绩及数量分析 185
9.7动手练习 187
第10章Pyecharts高级绘图 189
10.1日历图 189
10.1.1日历图的参数 189
10.1.2案例:企业股票每日交易量分析 190
10.2漏斗图 192
10.2.1漏斗图的参数 192
10.2.2案例:华东地区各省市利润额分析 192
10.3仪表盘 194
10.3.1仪表盘的参数 194
10.3.2案例:企业2022年销售业绩完成率 195
10.4环形图 196
10.4.1环形图的参数 196
10.4.2案例:不同教育群体的购买力分析 197
10.5雷达图 198
10.5.1雷达图的参数 198
10.5.2案例:不同区域销售业绩的比较 199
10.6旭日图 202
10.6.1旭日图的属性 202
10.6.2案例:绘制我的家庭树旭日图 203
10.7主题河流图 205
10.7.1主题河流图的属性 205
10.7.2案例:不同类型商品销售情况分析 205
10.8词云 207
10.8.1词云的属性 207
10.8.2案例:商品类型关键词词云 207
10.9玫瑰图 209
10.9.1玫瑰图的属性设置 209
10.9.2案例:不同职业群体的购买力分析 209
10.10平行坐标系 211
10.10.1平行坐标系的属性设置 211
10.10.2案例:地区利润增长率比较分析 211
10.11动手练习 213
第4篇数据可视化案例
第11章案例1:空气质量状况分析 217
11.1案例背景及数据爬取 217
11.1.1案例背景介绍 217
11.1.2案例数据爬取 218
11.2历年数据总体分析 220
11.2.1历年AQI总体比较分析 220
11.2.2历年季度AQI趋势分析 223
11.2.3历年空气污染物分析 224
11.32022年空气质量分析 226
11.3.1空气质量等级分析 226
11.3.2每月AQI数据分析 228
11.3.3每周AQI数据分析 230
11.3.4每日AQI数据分析 231
11.4污染物数据高级分析 233
11.4.16种污染物相关分析 233
11.4.2PM2.5与PM10回归分析 234
11.4.3PM2.5与PM10残差分析 235
11.5案例小结 236
第12章案例2:人口现状及趋势分析 237
12.1人口总数及结构分析 237
12.1.1人口总数趋势分析 237
12.1.2人口男女性别分析 239
12.1.3人口年龄结构分析 241
12.2人口增长率数据分析 244
12.2.1人口增长率趋势分析 244
12.2.2人口增长率相关分析 246
12.2.3人口增长率回归分析 247
12.3人口抚养比数据分析 249
12.3.1人口抚养比趋势分析 249
12.3.2人口抚养比相关分析 252
12.3.3人口抚养比回归分析 253
12.4案例小结 255
第13章案例3:网络平台商品评论可视化分析 256
13.1项目案例背景 256
13.2商品评论总体分析 257
13.2.1月度商品评论数及得分分析 257
13.2.2不同尺寸的商品评论数及得分分析 259
13.2.3不同颜色的商品评论数及得分分析 261
13.3商品评论文本分析 263
13.3.1中文Jieba分词概述 263
13.3.2商品评论关键词分析 263
13.3.3商品评论关键词词云 266
13.4案例小结 268
附录A搭建大数据开发环境 269
A.1集群的安装及网络配置 269
A.1.1集群软件及其版本 269
A.1.2集群网络环境配置 271
A.2集群案例数据集简介 273
A.2.1数据字段说明 273
A.2.2数据导入说明 274
A.2.3运行环境说明 275
A.3集群节点参数配置 276
A.3.1Hadoop的参数配置 276
A.3.2Hive的参数配置 278
A.3.3Spark的参数配置 280
A.3.4集群的启动与关闭 281