资源详情

Python统计可视化之Altair探索分析实践指南(全彩)(博文视点出品)

Python统计可视化之Altair探索分析实践指南(全彩)(博文视点出品)-电子书下载


作者: 刘大成
出版社: 电子工业出版社
出版年: 2022-2
页数: 392
定价: 139
ISBN: 9787121425974

下载次数:1


本站推荐

书籍资料

  • 内容简介
  • 作者介绍
  • 书籍目录

《Python统计可视化之Altair探索分析实践指南(全彩)》以Altair为核心工具,通过认识数据、理解数据和探索数据三个维度全方位地探索分析数据集的统计可视化形式,以应用数据和案例研究为实践场景,使用Altair数据加工器进行数据预处理。在此基础上,深入介绍不同应用领域和实践场景的数据集的统计可视化模型。
《Python统计可视化之Altair探索分析实践指南(全彩)》以动手实践和练习的方式让读者学习和巩固核心知识,学习形式简单、高效,适合大数据相关行业的人士参考,也适合大数据相关专业的高校师生教学和自学使用。

刘大成
高级机器学习工程师、资深数据分析师、数据产品工程师。
具有金融、教育、测评、咨询等行业的丰富实践经验;完成多个机器学习项目、数据分析项目;开发多个数据产品。
出版专著《Python数据可视化之matplotlib实践》和《Python数据可视化之matplotlib精进》。
研究兴趣主要有数据可视化、数据挖掘和数据产品。

第1篇入门
第1章Altair的环境配置.4
1.1Altair的安装.4
1.2前端渲染工具的安装和启动方法.5
1.2.1JupyterNotebook的安装和启动方法5
1.2.2JupyterLab的安装和启动方法5
1.3vega_datasets的使用6
1.4JSON简介.9
1.4.1JSON语法规则.9
1.4.2在Altair中使用JSON.10
1.5Pandas的数据框(DataFrame)对象的使用方法.12
1.5.1使用字典创建DataFrame的方法12
1.5.2DataFrame的操作方法13
1.5.3缺失值的操作方法.15
1.5.4条件查询的操作方法.22
1.6数据加工器.27
第2章Altair的图形语法.30
2.1图形语法简介.30
2.1.1图形语法的原理.31
2.1.2图形的视觉对象的组合原则.33
2.1.3Altair图形系统的

成模块.40
2.2声明式统计可视化的意义和优势.43
2.3Altair的语法规则.46
2.3.1Altair的数据结构.46
2.3.2Altair的基本对象.48
2.3.3Altair的展示方法.56
2.3.4Altair的存储方法.59
第2篇进阶
第3章认识数据65
3.1名义型变量和数量型变量组合的经典图形66
3.1.1柱形图.66
3.1.2条形图.67
3.1.3条形码图.67
3.2时间型变量和数量型变量组合的经典图形68
3.2.1折线图.68
3.2.2动手实践:调整折线图的刻度标签.70
3.2.3次序型变量(时间变量离散化)和数量型变量组合:柱形图72
3.2.4动手实践:面积图.74
3.2.5动手实践:阶梯图.76
3.2.6练习:比较不同年份7月的日降雨量.78
3.2.7动手实践:分类汇总天气类型的频数分布.78
3.2.8练习:总结分类汇总天气类型频数分布的实现方法81
3.2.9斜率图.81
3.2.10数据集类型的数据结构形式.82
3.3时间型变量和名义型变量的组合:甘特图85
3.4数量型变量和数量型变量组合的经典图形87
3.4.1散点图.87
3.4.2动手实践:气泡图.89
3.4.3动手实践:缺失值的可视化识别方法.90
3.4.4直方图.91
3.4.5热力图.94
3.4.6变量类型对颜色标尺的作用.96
3.4.7动手实践:展示不同时间的最高气温的分布情况96
3.4.8动手实践:展示文本注释与颜色的映射关系.99
第4章理解数据105
4.1使用子区通道分区理解数据105
4.1.1比较不同地区的汽车马力分布情况.106
4.1.2动手实践:分区展示不同年份的每月平均降雨量108
4.1.3练习:绘制不同月份的年平均降雨量时间序列图109
4.2使用分层图形综合理解数据110
4.2.1使用描述统计量刻画变量取值的分布偏斜方向和程度111
4.2.2练习:绘制风速的均值、最大值和最小值的趋势变化曲线.115
4.3通过连接图形全面理解数据115
4.3.1散点图连接直方图了解更多的变量信息116
4.3.2练习:散点图连接水平直方图和垂直直方图,分别刻画降雨量和风速的频数分布118
4.4使用变量矩阵分区理解数据119
第5章探索数据123
5.1让鼠标光标停留在标记上出现变量取值提示123
5.1.1实现方法.123
5.1.2练习:时间序列图的时间型变量和数量型变量的提示文本125
5.2点击鼠标和拖曳鼠标实现图形区域选择127
5.2.1实现方法.127
5.2.2动手实践:动态选定时间区间的时间序列面积图132
5.3点击鼠标实现标记选择.137
5.3.1实现方法.137
5.3.2动手实践:滑动鼠标实现标记选择.139
5.4点击鼠标实现图形区域选择140
5.4.1实现方法.140
5.4.2动手实践:滑动鼠标实现图形区域的选择.142
5.4.3练习:鼠标光标悬停在注释文本上交互显示标记143
5.4.4动手实践:缺失值的可视化识别方法2144
5.5元素交互实现图形区域选择147
5.5.1点选下拉列表实现图形区域的选择.148
5.5.2练习:使用条件查询过滤数据记录,实现图形区域的选择150
5.5.3使用单选按钮实现图形区域的选择.151
5.5.4动手实践:使用连接图形以图形联动方式实现图形区域的选择.152
5.5.5练习:点选图例的标记符号实现图形区域的选择155
5.5.6拖动滑块实现图形区域的选择.155
第3篇实践
第6章应用数据161
6.1滑珠图.161
6.1.1比较不同国家人群的预期寿命的变化情况.161
6.1.2动手实践:使用网格线表示滑竿的滑珠图.163
6.1.3练习:描绘数量波动的总体趋势——棒棒糖图166
6.2连线散点图.168
6.2.1探索不同年份的数量变化.168
6.2.2动手实践:使用文本注释使连线散点图成为时间故事线.172
6.3箱线图.173
6.3.1探索不同天气类型的风速分布特征和分布形态174
6.3.2动手实践:垂直连接分区直方图补充箱线图的分布特征176
6.3.3水平连接分区直方图补充箱线图的分布特征.178
6.3.4核密度估计加工器.179
6.3.5动手实践:通过比较均值和众数的大小分析概率密度曲线的偏斜方向和程度.181
6.3.6数据离散加工器.181
6.3.7数据汇总连接加工器.185
6.3.8动手实践:计算小雨天气的出现天数.188
6.3.9练习:按照月份统计不同降雨量类型出现的天数190
6.4探索数据的累积汇总和秩的排序及滞后变换——窗口变换加工器.191
6.4.1窗口变换加工器的应用.191
6.4.2动手实践:累积求和的柱形图.193
6.4.3指数图.195
6.4.4动手实践:秩的排序.198
6.4.5凹凸图.201
6.4.6动手实践:滞后等值和领先等值.206
6.4.7瀑布图.209
6.4.8练习:销售量的相对变化量.214
6.5分散型堆积条形图系列.215
6.5.1分散型堆积条形图.215
6.5.2漏斗图.217
6.5.3动手实践:离散化的颜色标尺.221
6.5.4旋风图.224
6.5.4动手实践:堆积条形图的分层图形——子弹头图227
6.5.5练习:将堆积条形图变成分层条形图——温度计图230
6.6堆积柱形图系列231
6.6.1堆积柱形图.231
6.6.2堆积百分比柱形图.235
6.7面积图系列.236
6.7.1堆积百分比面积图.236
6.7.2量化波形图.237
6.8置信区间的应用239
6.8.1置信区间.239
6.8.2误差棒图.241
6.8.3动手实践:样本容量对样本标准差和样本均值的标准误的影响.245
第7章案例研究248
7.1不同数量级和单位变量关系的探索分析248
7.1.1使用平行坐标图分析数量型变量的相关关系.249
7.1.2使用矩阵散点图分析连续型变量的相关关系.251
7.1.3建立马力和重量的一元线性回归模型.252
7.1.4练习:建立生产年份和重量的置信带与回归直线265
7.1.5动手实践:建立关于生产年份的重量分布脊线图266
7.1.6动手实践:建立马力和单位里程数的非线性回归模型.268
7.2金融时间序列数据的探索分析.270
7.2.15只股票的价格波动探索分析271
7.2.25只股票的频数分布探索分析274
7.2.3比较不同股票的价格走势图.275
7.2.4股票收益率的迷你折线图.277
7.2.5股票波动率的迷你柱形图.278
7.2.6绘制股票收盘价的移动平均线.281
7.2.7绘制股票的K线图(蜡烛图)283
7.2.8动手实践:绘制移动平均线和K线图的分层图形.285
7.2.9练习:使用柱线图(棒形图)代替K线图.289
7.3自然语言处理的可视化模型的构建和应用.289
7.3.1读取文本数据.290
7.3.2存储单词和字母的频数分布.292
7.3.3使用条形图分析字母的频数.293
7.3.4使用条形图分析高频词.295
7.3.5使用词云图分析段落词语的运用特点.296
7.4反映统计数字的象形图.299
7.5可视化模型框架的数据流转过程与模型存储和渲染方法303
7.5.1使用Pandas的实例方法to_json()和Altair的函数to_values()完成数据流转.304
7.5.2使用Altair的函数to_json()和函数to_values()完成数据流转305
7.5.3可视化模型的存储和渲染方法.305
7.6调整坐标轴的量尺类型的实现方法和应用场景.306
7.6.1选择合适的坐标轴量尺类型.306
7.6.2使用气泡图描绘3个数量型变量的数量关系.307
7.6.3动手实践:按照年份查看人均收入、寿命和人口数量的动态变化关系.309
7.6.4使用连续型量尺离散化的方法转换变量类型.312
7.7使用波形图和频谱图分析音频文件.314
7.7.1使用波形图分析音频文件的声音变化.314
7.7.2使用频谱图分析音频文件的频率变化.315
7.7.3练习:使用仪表盘分析音频文件的元数据.317
7.8视觉图像的大块数据文件处理和统计可视化318
第4篇拓展
第8章探索分析辅助工具.327
8.1包sviewgui的使用方法.327
8.1.1sviewgui加载数据和读取数据的方法328
8.1.2CSV文件的GUI具体功能和使用方法.329
8.1.3数据框对象的GUI具体功能和使用方法331
8.2数据框对象统计可视化的实现方法.334
8.2.1折线图.334
8.2.2核密度估计图.336
8.2.3直方图.338
8.2.4散点图.340
8.2.5六边形网格图.341
8.2.6箱线图.341
第9章颜色的使用方法和属性配置的作用域.343
9.1颜色方案的设置方法343
9.2动手实践:使用颜色方案accent设置标记属性通道color的配色模式346
9.3变量与颜色的映射关系的设置方法.347
9.4原始颜色编码数据的设置方法.348
9.5属性配置的作用域.349
附录A本书练习详解.352
3.2.6练习:比较不同年份7月的日降雨量.352
3.2.8练习:总结分类汇总天气类型频数分布的实现方法354
4.1.3练习:绘制不同月份的年平均降雨量时间序列图355
4.2.2练习:绘制风速的均值、最大值和最小值的趋势变化曲线356
4.3.2练习:散点图连接水平直方图和垂直直方图,分别刻画降雨量和
风速的频数分布.358
5.1.2练习:时间序列图的时间型变量和数量型变量的提示文本359
5.4.3练习:鼠标光标悬停在注释文本上交互显示标记360
5.5.2练习:使用条件查询过滤数据记录,实现图形区域的选择362
5.5.5练习:点选图例的标记符号实现图形区域的选择364
6.1.3练习:描绘数量波动的总体趋势——棒棒糖图365
6.3.9练习:按照月份统计不同降雨量类型出现的天数367
6.4.8练习:销售量的相对变化量.369
6.5.5练习:将堆积条形图变成分层条形图——温度计图370
7.1.4练习:建立生产年份和重量的置信带与回归直线373
7.2.9练习:使用柱线图(棒形图)代替K线图.374
参考文献376