

叶斯定理:条件概率、边缘概率、联合概率关系70
3.7全概率定理:穷举法73
3.8独立、互斥、条件独立76
第4章离散随机变量79
4.1随机:天地不仁,以万物为刍狗80
4.2期望值:随机变量的可能取值加权平均89
4.3方差:随机变量离期望距离平方的平均值91
4.4累积分布函数(CDF):累加94
4.5二元离散随机变量95
4.6协方差、相关性系数97
4.7边缘概率:偏求和,相当于降维100
4.8条件概率:引入贝叶斯定理101
4.9独立性:条件概率等于边缘概率104
4.10以鸢尾花数据为例:不考虑分类标签107
4.11以鸢尾花数据为例:考虑分类标签116
4.12再谈概率1:展开、折叠120
第5章离散分布123
5.1概率分布:高度理想化的数学模型124
5.2离散均匀分布:不分厚薄125
5.3伯努利分布:非黑即白128
5.4二项分布:杨辉三角129
5.5多项分布:二项分布推广132
5.6泊松分布:建模随机事件的发生次数135
5.7几何分布:滴水穿石136
5.8超几何分布:不放回138
第6章连续随机变量141
6.1一元连续随机变量142
6.2期望、方差和标准差145
6.3二元连续随机变量147
6.4边缘概率:二元PDF偏积分149
6.5条件概率:引入贝叶斯定理151
6.6独立性:比较条件概率和边缘概率153
6.7以鸢尾花数据为例:不考虑分类标签154
6.8以鸢尾花数据为例:考虑分类标签162
第7章连续分布171
7.1连续均匀分布:离散均匀分布的连续版172
7.2高斯分布:最重要的概率分布,没有之一173
7.3逻辑分布:类似高斯分布177
7.4学生t-分布:厚尾分布179
7.5对数正态分布:源自正态分布181
7.6指数分布:泊松分布的连续随机变量版183
7.7卡方分布:若干IID标准正态分布平方和184
7.8F-分布:和两个服从卡方分布的独立随机变量有关185
7.9Beta分布:概率的概率187
7.10Dirichlet分布:多元Beta分布190
第8章条件概率197
8.1离散随机变量:条件期望198
8.2离散随机变量:条件方差204
8.3离散随机变量的条件期望和条件方差:以鸢尾花为例206
8.4连续随机变量:条件期望215
8.5连续随机变量:条件方差216
8.6连续随机变量:以鸢尾花为例217
8.7再谈如何分割“1”221
第9章一元高斯分布231
9.1一元高斯分布:期望值决定位置,标准差决定形状232
9.2累积概率密度:对应概率值234
9.3标准高斯分布:期望为0,标准差为1236
9.468-95-99.7法则239
9.5用一元高斯分布估计概率密度243
9.6经验累积分布函数244
9.7QQ图:分位-分位图245
9.8从距离到一元高斯分布249
第10章二元高斯分布253
10.1二元高斯分布:看见椭圆254
10.2边缘分布:一元高斯分布258
10.3累积分布函数:概率值262
10.4用椭圆解剖二元高斯分布264
10.5聊聊线性相关性系数268
10.6以鸢尾花数据为例:不考虑分类标签272
10.7以鸢尾花数据为例:考虑分类标签281
第11章多元高斯分布287
11.1矩阵角度:一元、二元、三元到多元288
11.2高斯分布:椭圆、椭球、超椭球293
11.3解剖多元高斯分布PDF298
11.4平移→旋转302
11.5平移→旋转→缩放308
第12章条件高斯分布311
12.1联合概率和条件概率关系312
12.2给定X条件下,Y的条件概率:以二元高斯分布为例316
12.3给定Y条件下,X的条件概率:以二元高斯分布为例321
12.4多元正态条件分布:引入矩阵运算325
第13章协方差矩阵331
13.1计算协方差矩阵:描述数据分布332
13.2相关性系数矩阵:描述Z分数分布338
13.3特征值分解:找到旋转、缩放340
13.4SVD分解:分解数据矩阵345
13.5Cholesky分解:列向量坐标349
13.6距离:欧氏距离VS马氏距离350
13.7几何视角:超椭球、椭球、椭圆353
13.8合并协方差矩阵362
第14章随机变量的函数367
14.1随机变量的函数:以鸢尾花为例368
14.2线性变换:投影视角369
14.3单方向投影:以鸢尾花两特征为例372
14.4正交系投影:以鸢尾花两特征为例376
14.5以椭圆投影为视角看线性变换380
14.6主成分分析:换个视角看数据383
第15章蒙特卡洛模拟387
15.1蒙特卡洛模拟:基于伪随机数发生器388
15.2估算平方根389
15.3估算积分390
15.4估算体积391
15.5估算圆周率391
15.6布丰投针估算圆周率393
15.7接受-拒绝抽样法395
15.8二项分布随机漫步397
15.9两个服从高斯分布的随机变量相加399
15.10产生满足特定相关性的随机数400
第16章频率派统计推断411
16.1统计推断:两大学派412
16.2频率学派的工具414
16.3中心极限定理:渐近于正态分布416
16.4最大似然:鸡兔比例419
16.5最大似然:以估算均值、方差为例421
16.6区间估计:总体方差已知,均值估计424
16.7区间估计:总体方差未知,均值估计427
16.8区间估计:总体均值未知,方差估计429
第17章概率密度估计431
17.1概率密度估计:从直方图说起432
17.2核密度估计:若干核函数加权叠合435
17.3带宽:决定核函数的高矮胖瘦439
17.4核函数:八种常见核函数441
17.5二元KDE:概率密度曲面443
第18章贝叶斯分类447
18.1贝叶斯定理:分类鸢尾花448
18.2似然概率:给定分类条件下的概率密度450
18.3先验概率:鸢尾花分类占比451
18.4联合概率:可以作为分类标准451
18.5证据因子:和分类无关452
18.6后验概率:也是分类的依据453
18.7单一特征分类:基于KDE457
18.8单一特征分类:基于高斯461
第19章贝叶斯分类进阶467
19.1似然概率:给定分类条件下的概率密度468
19.2联合概率:可以作为分类标准470
19.3证据因子:和分类无关472
19.4后验概率:也是分类的依据474
19.5独立:不代表条件独立477
19.6条件独立:不代表独立478
第20章贝叶斯推断入门483
20.1贝叶斯推断:更贴合人脑思维484
20.2从一元贝叶斯公式说起486
20.3走地鸡兔:比例完全不确定488
20.4走地鸡兔:很可能一半一半495
20.5走地鸡兔:更一般的情况504
第21章贝叶斯推断进阶511
21.1除了鸡兔,农场发现了猪512
21.2走地鸡兔猪:比例完全不确定517
21.3走地鸡兔猪:很可能各1/3520
21.4走地鸡兔猪:更一般的情况525
第22章马尔可夫链蒙特卡洛529
22.1归一化因子没有闭式解?530
22.2鸡兔比例:使用PyMC3534
22.3鸡兔猪比例:使用PyMC3537
第23章马氏距离543
23.1马氏距离:考虑数据分布的距离度量544
23.2欧氏距离:最基本的距离546
23.3标准化欧氏距离:两个视角547
23.4马氏距离:两个视角549
23.5马氏距离和卡方分布553
第24章线性回归557
24.1再聊线性回归558
24.2最小二乘法561
24.3优化问题562
24.4投影视角563
24.5线性方程组:代数视角563
24.6条件概率564
24.7最大似然估计(MLE)568
第25章主成分分析571
25.1再聊主成分分析572
25.2原始数据574
25.3特征值分解协方差矩阵575
25.4投影577
25.5几何视角看PCA583
25.6奇异值分解586
25.7优化问题591
25.8数据还原和误差592
编程不难(全彩图解 + 微课 + Python编程)(鸢尾花数学大系:从加减乘除到机器学习)
2026-05-02