在两位顶尖数据科学家的引导下,你将系统了解LLM前沿技术的更新进展,学习理论知识,以最负责任的方式将LLM技术融入商业场景;将构建一个LLM驱动的应用,直观感受框架的实际运作,掌握数据版本控制、实验跟踪、模型监控和伦理等知识点。
本书旨在为不同层级的数据领域从业者提供助力,使用前沿技术与方法论,全方位呈现LLM应用,介绍上佳技术实践。通过“数据优先”视角,识别整合LLM并驱动业务成功的机会。
Kristen Kehrer从2010年以来,一直为电子商务公司、医疗保健公司和公共事业部门构建和维护具有创新意义的、用于统计数据的ML模型方案。Kristen是Data Moves Me公司的创始人,2018年荣膺领英数据科学与分析领域顶尖影响力人物,拥有9.5万名数据科学领域的粉丝。Kristen获得了伍斯特理工学院的应用统计学专业硕士学位和数学专业学士学位。
Caleb Kaiser目前担任Comet的全栈工程师,也是Cortex Labs的创始成员。Caleb还曾在Scribe Media的作者平台团队工作,并获得了芝加哥艺术学院的艺术写作专业学士学位。
第1章 现代机器学习简介1
1.1数据科学与商业智能渐行渐远2
1.2从CRISP-DM过渡到最新的多组件ML系统3
1.3LLM提升了ML的能力和复杂度5
1.4你能从本书中学到哪些知识6
第2章 一种端到端的方法9
2.1YouTube搜索智能体的组件11
2.2生产中使用的ML系统的核心原则13
2.2.1可观察性14
2.2.2可再现性15
2.2.3互操作性15
2.2.4可扩展性16
2.2.5可改进性17
2.2.6关于工具的注意事项18
第3章 以数据为中心19
3.1基础模型的出现19
3.2现成组件的角色20
3.3数据驱动的方法21
3.4有关数据伦理的注意事项22
3.5构建数据集23
3.5.1使用向量数据库25
3.5.2数据版本控制和管理38
3.5.3开始使用数据版本控制工具41
3.6适度了解数据工程知识45
第4章 LLM47
4.1选择LLM47
4
1.1我需要执行哪种类型的推理49
4.1.2这项任务是通用的还是专用的50
4.1.3数据的隐私级别有多高50
4.1.4该模型需要多高的成本51
4.2LLM实验管理52
4.3LLM推理56
4.3.1提示工程的基本原理56
4.3.2上下文学习58
4.3.3中间计算64
4.3.4RAG67
4.3.5智能体技术71
4.4用CometML优化LLM推理77
4.5微调LLM84
4.5.1微调LLM的时机84
4.5.2量化、QLoRA和参数高效微调85
4.6本章小结90
第5章 合成一个完整的应用91
5.1用Gradio得到应用的雏形93
5.2使用Plotnine创建图形94
5.2.1添加选择框102
5.2.2添加徽标103
5.2.3添加选项卡103
5.2.4添加标题和副标题104
5.2.5更改按钮的颜色104
5.2.6添加下载按钮105
5.2.7将组件合在一起105
5.3将模型部署为API107
5.3.1用FastAPI实现API109
5.3.2实现Uvicorn111
5.4监控LLM111
5.4.1用Docker部署服务113
5.4.2部署LLM115
5.5小结119
第6章 完成ML生命周期121
6.1部署一个简单的随机森林模型121
6.2模型监控简介125
6.3用EvidentlyAI监控模型131
6.4构建模型监控系统134
6.5有关监控的总结141
第7章 最佳实践143
7.1第一步:理解问题143
7.2第二步:选择和训练模型144
7.3第三步:部署和维护145
7.4第四步:协作与沟通148
7.5LLM的发展趋势149
7.6进一步的研究150