


6
1.8.4商业分析37
1.8.5计量经济学37
1.8.6机器学习37
1.8.7统计信号处理37
1.8.8选举37
第2章回归39
2.1案例研究:消除混凝土抗压
强度的不一致性39
2.2回归的概念42
2.2.1内插和外推42
2.2.2线性回归42
2.2.3y在x上的最小二乘
回归线43
2.2.4多重回归44
2.2.5逐步回归45
2.2.6多项式回归46
2.3回归的假设47
2.3.1案例数量47
2.3.2缺失数据47
2.3.3多重共线性与奇异性48
2.4特征探索49
2.5过拟合和欠拟合55
2.6回归度量的评估58
2.6.1解释方差得分58
2.6.2平均绝对误差58
2.6.3均方误差59
2.6.4R259
2.6.5残差60
2.6.6残差图60
2.6.7残差平方和60
2.7回归的类型61
2.7.1线性回归61
2.7.2网格搜索65
2.7.3岭回归65
2.7.4套索回归68
2.7.5ElasticNet70
2.7.6梯度boosting回归71
2.7.7支持向量机74
2.8回归的应用78
2.8.1预测销售额78
2.8.2预测债券价值78
2.8.3通货膨胀率78
2.8.4保险公司79
2.8.5呼叫中心79
2.8.6农业79
2.8.7预测薪水79
2.8.8房地产行业80
第3章时间序列83
3.1案例研究:预测雅虎的每日
调整的收盘价83
3.2特征探索85
3.3评估时间序列对象的
平稳性86
3.3.1具有平稳本质的时间序列
的性质87
3.3.2测试以确定时间序列
是否平稳87
3.3.3制作时间序列对象的
方法90
3.4测试以确定时间序列是否
具有自相关性100
3.4.1自相关函数100
3.4.2偏自相关函数100
3.4.3度量自相关101
3.4.4DurbinWatson统计101
3.5建模时间序列102
3.5.1验证预测序列的实验102
3.5.2确定建模参数103
3.6自回归综合移动平均105
3.6.1自回归移动平均105
3.6.2自回归106
3.6.3移动平均线107
3.6.4组合模型108
3.7缩减预测规模109
3.8时间序列分析应用113
3.8.1销售预测113
3.8.2天气预测113
3.8.3失业率估计113
3.8.4疾病爆发113
3.8.5股市预测114
第4章聚类115
4.1案例研究:确定营销短尾
关键词115
4.2特征的探索117
4.3有监督学习与无监督学习118
4.3.1有监督学习119
4.3.2无监督学习119
4.4聚类分析120
4.5为建模作数据转换120
4.6聚类模型124
4.6.1k-means聚类124
4.6.2将k-means聚类应用于簇
的最优数量129
4.6.3主成分分析130
4.6.4高斯混合模型137
4.6.5贝叶斯高斯混合模型142
4.7聚类的应用144
4.7.1疾病识别144
4.7.2搜索引擎中的文档
聚类144
4.7.3基于人口统计的客户
划分145
第5章分类147
5.1案例研究:俄亥俄州诊所——
满足供求147
5.2特征探究149
5.3实施数据整理154
5.4实施探索性数据分析157
5.5特征的生成162
5.6分类164
5.6.1模型评估技术164
5.6.2二元分类器:受试者工作
特征165
5.6.3决策树分类168
5.7核近似169
5.7.1SGD分类器169
5.7.2集成方法172
5.8随机森林分类173
5.9分类应用178
5.9.1图像分类178
5.9.2音乐分类178
5.9.3E-mail的垃圾邮件
过滤178
5.9.4保险179
附录A图表类型以及何时使用
它们181
编程不难(全彩图解 + 微课 + Python编程)(鸢尾花数学大系:从加减乘除到机器学习)
2025-12-14