资源详情

Python贝叶斯建模与计算(数据科学与大数据技术)

Python贝叶斯建模与计算(数据科学与大数据技术)-电子书下载


作者: [阿根廷] 奥斯瓦尔多·A. 马丁(Osvaldo A. Martin)/[美]拉万·库马尔(Ravin Kumar)/[美]劳俊鹏(Junpeng Lao)
出版社: 清华大学出版社
译者: 郭涛
出版年: 2024-3
页数: 348
定价: 98
装帧: 平装
ISBN: 9787302654858

下载次数:22


本站推荐

书籍资料

  • 内容简介
  • 作者介绍
  • 书籍目录
《Python贝叶斯建模与计算》旨在帮助贝叶斯初学者成为中级从业者。本书使用了PyMC3、TensorFlow Probability和Arviz等多个软件库的实践方法,重点是应用统计学的实践方法,并参考了基础数学理论。
本书首先回顾了贝叶斯推断的概念。第2章介绍了贝叶斯模型探索性分析的现代方法。基于这两个基本原理,接下来的章节介绍了各种模型,包括线性回归、样条、时间序列和贝叶斯加性回归树。其后几章讨论的主题包括:逼近贝叶斯计算,通过端到端案例研究展示如何在不同环境中应用贝叶斯建模,以及概率编程语言内部构件。最后一章深入讲述数学理论或扩展对某些主题的讨论,作为本书其余部分的参考。
《Python贝叶斯建模与计算》由PyMC3、ArviZ、Bambi和TensorFlowProbability等软件库的贡献者撰写
Osvaldo A. Martin是阿根廷IMASL-CONICET和芬兰阿尔托大学计算机科学系的研究员。他拥有生物物理学和结构生物信息学博士学位。多年来,他日益精进对贝叶斯方面的数据分析问题的研究。他对开发和实现贝叶斯统计和概率建模软件工具尤其感兴趣。
Ravin Kumar是谷歌的数据科学家,此前曾在SpaceX和Sweetgreen等公司工作。他拥有制造工程硕士学位和机械工程学士学位。他发现贝叶斯统计可以有效地为组织建模以及制定策略。
Junpeng Lao是谷歌的数据科学家。在此之前,他获得了博士学位,随后作为博士后在认知神经科学领域开展研究。他主要研究Bootstrapping和Permutation,由此对贝叶斯统计和生成建模产生了浓厚的兴趣。
目录
第1章 贝叶斯推断 1
1.1贝叶斯建模 1
1.1.1贝叶斯模型 2
1.1.2贝叶斯推断介绍 2
1.2一个自制采样器,不要随意尝试 5
1.3支持自动推断,反对自动建模 9
1.4量化先验信息的方法 12
1.4.1共轭先验 13
1.4.2客观先验 15
1.4.3最大熵先验 17
1.4.4弱信息先验与正则化先验 20
1.4.5先验预测分布用于评估先验选择 21
1.5练习 21
第2章 贝叶斯模型的探索性分析 25
2.1贝叶斯推断前后的工作 25
2.2理解你的假设 26
2.3理解你的预测 28
2.4诊断数值推断 32
2.4.1有效样本量 33
2.4.2潜在尺度缩减因子() 35
2.4.3蒙特卡罗标准差 35
2.4.4轨迹图 37
2.4.5自相关图 38
2.4.6秩图 38
2.4.7散度 40
2.

.8采样器的参数和其他诊断方法 42
2.5模型比较 43
2.5.1交叉验证和留一法 44
2.5.2对数预测密度的期望 47
2.5.3帕累托形状参数 47
2.5.4解读帕累托参数较大时的p_loo 48
2.5.5LOO-PIT 49
2.5.6模型平均 50
2.6练习 51
第3章 线性模型与概率编程语言 55
3.1比较两个或多个组 55
3.2线性回归 63
3.2.1一个简单的线性模型 65
3.2.2预测 67
3.2.3中心化处理 68
3.3多元线性回归 70
3.4广义线性模型 74
3.4.1逻辑回归 75
3.4.2分类模型 76
3.4.3解释对数赔率 81
3.5回归模型的先验选择 82
3.6练习 85
第4章 扩展线性模型 87
4.1转换预测变量 87
4.2可变的不确定性 90
4.3引入交互效应 91
4.4鲁棒的回归 93
4.5池化、多级模型和混合效应 97
4.5.1非池化参数 98
4.5.2池化参数 100
4.5.3组混合与公共参数 102
4.6分层模型 104
4.6.1后验几何形态很重要 107
4.6.2分层模型的优势 112
4.6.3分层模型的先验选择 114
4.7练习 114
第5章 样条 117
5.1多项式回归 117
5.2扩展特征空间 118
5.3样条的基本原理 120
5.4使用Patsy软件库构建设计矩阵 123
5.5用PyMC3拟合样条 125
5.6选择样条的结点和先验 127
5.7用样条对二氧化碳吸收量建模 129
5.8练习 134
第6章 时间序列 137
6.1时间序列问题概览 137
6.2将时间序列分析视为回归问题 138
6.2.1时间序列的设计矩阵 143
6.2.2基函数和广义加性模型 144
6.3自回归模型 147
6.3.1隐AR过程和平滑 152
6.3.2(S)AR(I)MA(X) 154
6.4状态空间模型 157
6.4.1线性高斯状态空间模型与卡尔曼滤波 158
6.4.2ARIMA模型的状态空间表示 161
6.4.3贝叶斯结构化的时间序列 164
6.5其他时间序列模型 168
6.6模型的评判和先验选择 168
6.7练习 170
第7章 贝叶斯加性回归树 173
7.1决策树 173
7.2BART模型 176
7.3BART模型先验 177
7.3.1先验的独立性 177
7.3.2树结构的先验 177
7.3.3叶结点值μij和树数量m的先验 178
7.4拟合贝叶斯加性回归树 178
7.5自行车数据的BART模型 178
7.6广义BART模型 180
7.7BART的可解释性 181
7.7.1部分依赖图 182
7.7.2个体条件期望图 183
7.8预测变量的选择 185
7.9PyMC3中BART的先验选择 187
7.10练习 188
第8章 逼近贝叶斯计算 191
8.1超越似然 191
8.2逼近的后验 192
8.3用ABC逼近拟合一个高斯 194
8.4选择距离函数、ϵ和统计量 195
8.4.1选择距离函数 196
8.4.2选择ϵ 197
8.4.3选择统计量 199
8.5g-and-k分布 199
8.6逼近移动平均 203
8.7在ABC场景中做模型比较 205
8.7.1边际似然与LOO 205
8.7.2模型选择与随机森林 209
8.7.3MA模型的模型选择 209
8.8为ABC选择先验 211
8.9练习 211
第9章 端到端贝叶斯工作流 213
9.1工作流、上下文和问题 213
9.2获取数据 216
9.2.1抽样调查 216
9.2.2试验设计 216
9.2.3观察性研究 216
9.2.4缺失数据 217
9.2.5应用示例:收集航班延误数据 217
9.3构建不止一个模型 218
9.3.1在构建贝叶斯模型前需要问的问题 218
9.3.2应用示例:选择航班延误的似然 218
9.4选择先验和预测先验 220
9.5推断和推断诊断 222
9.6后验图 223
9.7评估后验预测分布 224
9.8模型比较 225
9.9奖励函数和决策 228
9.10与特定受众分享结果 230
9.10.1分析流程的可重复性 231
9.10.2理解受众 232
9.10.3静态视觉辅助 233
9.10.4可重复的计算环境 234
9.10.5应用示例:展示航班延误模型和结论 234
9.11试验性示例:比较两个组 235
9.12练习 239
第10章概率编程语言 241
10.1PPL的系统工程视角 241
10.2后验计算 242
10.2.1计算梯度 243
10.2.2示例:近实时推断 244
10.3应用编程接口 245
10.3.1示例:Stan和Slicstan 246
10.3.2示例:PyMC3和PyMC4 247
10.4PPL驱动的转换 248
10.4.1对数概率 248
10.4.2随机变量和分布转换 250
10.4.3示例:有界和无界随机变量之间的采样比较 251
10.5操作图和自动重参数化 252
10.6异常处理 255
10.7基础语言、代码生态系统、模块化 257
10.8设计PPL 258
10.9应用贝叶斯从业者的注意事项 265
10.10练习 265
第11章附加主题 267
11.1概率背景 267
11.1.1概率 268
11.1.2条件概率 269
11.1.3概率分布 270
11.1.4离散随机变量及其分布 271
11.1.5连续随机变量和分布 275
11.1.6联合、条件和边际分布 279
11.1.7概率积分转换 282
11.1.8期望 284
11.1.9转换 285
11.1.10极限 286
11.1.11马尔可夫链 288
11.2熵 290
11.3Kullback-Leibler散度 292
11.4信息标准 294
11.5深入介绍LOO 296
11.6Jeffrey先验求导 297
11.6.1关于θ的二项似然的Jeffrey先验 298
11.6.2关于的二项似然的Jeffrey先验 299
11.6.3二项似然的Jeffrey后验 299
11.7边际似然 300
11.7.1调和平均估计器 300
11.7.2边际似然和模型比较 301
11.7.3贝叶斯因子与WAIC和LOO 303
11.8移出平面 304
11.9推断方法 307
11.9.1网格方法 307
11.9.2Metropolis-Hastings 308
11.9.3哈密顿蒙特卡罗 310
11.9.4序贯蒙特卡罗 314
11.9.5变分推断 315
11.10编程参考 317
11.10.1选择哪种编程语言 317
11.10.2版本控制 317
11.10.3依赖项管理和包仓库 317
11.10.4环境管理 318
11.10.5文本编辑器、集成开发环境、笔记 318
11.10.6本书使用的专用工具 319
词汇表 321
参考文献(在线提供) 325