在人工智能的浪潮中,机器学习已经成为了推动技术进步的核心力量。🌊 清华大学出版社以其深厚的学术底蕴,推出了《清华社人工智能系列》丛书,其中《机器学习项目成功交付》一书,以其全面而深入的内容,成为了机器学习领域的一盏明灯。🌟
本书不仅仅是一本教科书,它是机器学习项目成功交付的指南针。🧭 从项目的前期准备到最终的发布,每一个环节都被精心设计和详细阐述。🔍 读者将跟随作者的笔触,深入了解如何开始工作,如何深入研究问题,以及如何进行探索性数据分析。📊
在道德和基线评估方面,本书提供了宝贵的视角,帮助读者在构建模型的同时,也能够考虑到伦理和社会责任。🌐 这是机器学习领域中不可忽视的一部分,也是本书的一大亮点。
书中不仅讲解了如何使用机器学习技术制作实用模型,还涵盖了测试和选择模型的策略,这对于任何希望在机器学习领域取得成功的专业人士来说都是至关重要的。🛠️ 通过实际的示例和代码,读者可以更好地理解理论,并将其应用于实践。
系统构建和生产是机器学习项目成功交付的关键阶段,本书对此进行了深入的探讨。🏭 从理论到实践,从模型到产品,每一步都是精心策划和执行的。
发布项目是机器学习项目的最终目标,本书提供了详尽的指导,帮助读者确保项目能够顺利地从实验室走向市场。🚀 这是一本不仅适合高等院校计算机及相关专业的教材和教学参考书,也适合相关开发人员的自学用书和参考手册。
《机器学习项目成功交付》以其全面的内容和实用的指导,成为了机器学习领域的一本必读之作。📖 它不仅提供了理论知识,更重要的是,它教会了读者如何在实际项目中应用这些知识,从而实现机器学习项目的成功交付。
在这个数据驱动的时代,掌握机器学习项目的成功交付,就是掌握了开启未来之门的钥匙。🔑 让我们一起探索这本书的深度和广度,开启我们的机器学习之旅,为未来的技术革新做好准备。🌠
43
3.2 创建项目估计 47
3.2.1 时间和精力估计 47
3.2.2 机器学习项目的团队设计 49
3.2.3 项目风险 55
3.3 售前/项目前期管理 56
3.4 项目前期/售前清单 56
3.5 The Bike Shop预售 58
3.6 有关项目前期的后记 65
3.7 小结 66
第4章 开始工作 67
4.1 Sprint 0待办事项 67
4.2 最终确定团队设计和资源配置 68
4.3 工作方式 69
4.3.1 流程与结构 69
4.3.2 心跳和沟通方案 71
4.3.3 工具 72
4.3.4 标准和实践 76
4.3.5 文档 78
4.4 基础设施计划 80
4.4.1 系统访问 80
4.4.2 技术基础设施评估 81
4.5 数据故事 81
4.5.1 数据收集动机 84
4.5.2 数据收集机制 84
4.5.3 数据沿袭 85
4.5.4 事件 87
4.6 隐私、安全和道德计划 87
4.7 项目路线图 88
4.8 Sprint 0清单 89
4.9 The Bike Shop:项目设置 90
4.10 小结 96
第5章 深入研究问题 97
5.1 Sprint 1待办事项 97
5.2 理解数据 98
5.2.1 数据调查 99
5.2.2 调查数值数据 101
5.2.3 调查分类数据 103
5.2.4 调查非结构化数据 104
5.2.5 报告和使用调查结果 106
5.3 业务问题细化、用户体验和应用程序设计 107
5.4 构建数据管道 110
5.4.1 数据融合问题 113
5.4.2 管道丛林 114
5.4.3 数据测试 116
5.5 模型存储库和模型版本控制 117
5.5.1 特征、基础模型和训练机制 118
5.5.2 版本控制概述 119
5.6 小结 120
第6章 探索性数据分析、道德和基线评估 121
6.1 探索性数据分析 121
6.1.1 探索性数据分析的目标 122
6.1.2 汇总和描述数据 123
6.1.3 绘图和可视化 125
6.1.4 非结构化数据 129
6.2 道德检查点 133
6.3 基线模型和性能 134
6.4 出现问题时的解决方案 135
6.5 预建模检查表 137
6.6 The Bike Shop:预建模 137
6.6.1 数据调查结束后 138
6.6.2 探索性数据分析实现 141
6.7 小结 144
第7章 使用机器学习技术制作实用模型 145
7.1 Sprint 2待办事项 146
7.2 特征工程和数据增强 147
7.2.1 特征工程的基础概念 148
7.2.2 创建新特征 150
7.2.3 数据增强 152
7.3 模型设计 154
7.3.1 设计的外力 154
7.3.2 总体设计 155
7.3.3 选择组件模型 156
7.3.4 归纳偏差 157
7.3.5 多个不相交模型 161
7.3.6 模型组合 161
7.4 使用机器学习技术制作模型 162
7.4.1 建模过程 163
7.4.2 实验跟踪和模型存储库 164
7.4.3 AutoML和模型搜索 166
7.5 警惕“臭”模型 168
7.6 小结 169
第8章 测试和选择模型 171
8.1 测试和选择模型的原因 171
8.2 测试流程 172
8.2.1 离线测试 173
8.2.2 离线测试环境 175
8.2.3 在线测试 177
8.2.4 现场试验 177
8.2.5 A/B测试 178
8.2.6 多臂老虎机 179
8.2.7 非功能测试 181
8.3 选择模型 182
8.3.1 定量选择 184
8.3.2 通过可比测试进行选择 184
8.3.3 通过多次测试进行选择 185
8.3.4 定性选择指标 187
8.4 建模后检查表 188
8.5 The Bike Shop:Sprint 2 189
8.6 小结 196
第9章 Sprint 3:系统构建和生产 199
9.1 Sprint 3待办事项 199
9.2 机器学习实现的类型 201
9.2.1 辅助系统 202
9.2.2 委托系统 205
9.2.3 自治系统 208
9.3 非功能审查 210
9.4 实现生产系统 211
9.4.1 生产数据基础设施 211
9.4.2 模型服务器和推理服务 214
9.4.3 用户接口设计 216
9.5 记录、监控、管理、反馈和文档 219
9.5.1 模型治理 221
9.5.2 文档 222
9.6 发布前测试 223
9.7 道德审查 224
9.8 投入生产 225
9.9 曲终人不散 226
9.10 The Bike Shop Sprint 3 227
9.11 小结 230
第10章 发布项目 231
10.1 Sprint Ω待办事项 231
10.2 投入生产并不意味着万事大吉 232
10.2.1 直面问题和厘清责任 232
10.2.2 机器学习的技术债务 234
10.2.3 模型漂移 235
10.2.4 再训练 236
10.2.5 紧急情况 237
10.2.6 问题调查 238
10.3 团队项目后评审 238
10.4 改进实践 240
10.5 新技术的采用 241
10.6 案例研究 242
10.7 再见,祝你好运 242
10.8 小结 243