lotlib库基础
2.3.1 基本图表绘制
2.3.2 数据可视化常用技巧
2.4 案例实战:股票数据读取与K线图绘制
2.4.1 初步尝试:股票数据读取与可视化
2.4.2 进阶实战:股票K线图绘制
第3章 线性回归模型
3.1 一元线性回归
3.1.1 一元线性回归的数学原理
3.1.2 一元线性回归的代码实现
3.1.3 案例实战:不同行业工龄与薪水的线性回归模型
3.2 线性回归模型评估
3.2.1 模型评估的编程实现
3.2.2 模型评估的数学原理
3.3 多元线性回归
3.3.1 多元线性回归的数学原理和代码实现
3.3.2 案例实战:客户价值预测模型
第4章 逻辑回归模型
4.1 逻辑回归模型的算法原理
4.1.1 逻辑回归模型的数学原理
4.1.2 逻辑回归模型的代码实现
4.1.3 逻辑回归模型的深入理解
4.2 案例实战:客户流失预警模型
4.2.1 案例背景
4.2.2 数据读取与变量划分
4.2.3 模型的搭建与使用
4.3 模型评估方法:ROC曲线与KS曲线
4.3.1 ROC曲线的基本原理
4.3.2 案例实战:用ROC曲线评估客户流失预警模型
4.3.3 KS曲线的基本原理
4.3.4 案例实战:用KS曲线评估客户流失预警模型
第5章 决策树模型
5.1 决策树模型的基本原理
5.1.1 决策树模型简介
5.1.2 决策树模型的建树依据
5.1.3 决策树模型的代码实现
5.2 案例实战:员工离职预测模型
5.2.1 模型搭建
5.2.2 模型预测及评估
5.2.3 决策树模型可视化呈现及决策树要点理解
5.3 参数调优:K折交叉验证与GridSearch网格搜索
5.3.1 K折交叉验证
5.3.2 GridSearch网格搜索
第6章 朴素贝叶斯模型
6.1 朴素贝叶斯模型的算法原理
6.1.1 一维特征变量下的贝叶斯模型
6.1.2 二维特征变量下的贝叶斯模型
6.1.3 n维特征变量下的贝叶斯模型
6.1.4 朴素贝叶斯模型的简单代码实现
6.2 案例实战:肿瘤预测模型
6.2.1 案例背景
6.2.2 数据读取与划分
6.2.3 模型的搭建与使用
第7章 K近邻算法
7.1 K近邻算法的原理和代码实现
7.1.1 K近邻算法的基本原理
7.1.2 K近邻算法的计算步骤
7.1.3 K近邻算法的代码实现
7.2 案例实战:手写数字识别模型
7.2.1 案例背景
7.2.2 手写数字识别的原理
7.2.3 手写数字识别的代码实现
7.3 图像识别原理详解
第8章 随机森林模型
8.1 随机森林模型的原理和代码实现
8.1.1 集成模型简介
8.1.2 随机森林模型的基本原理
8.1.3 随机森林模型的代码实现
8.2 案例实战:股票涨跌预测模型
8.2.1 股票基本数据获取
8.2.2 股票衍生变量生成
8.2.3 多因子模型搭建
8.2.4 模型使用与评估
8.2.5 参数调优
8.2.6 收益回测曲线绘制
第9章 AdaBoost与GBDT模型
9.1 AdaBoost算法原理
9.1.1 AdaBoost算法的核心思想
9.1.2 AdaBoost算法的数学原理概述
9.1.3 AdaBoost算法的数学原理举例
9.1.4 AdaBoost算法的简单代码实现
9.2 AdaBoost算法案例实战:信用卡精准营销模型
9.2.1 案例背景
9.2.2 模型搭建
9.2.3 模型预测及评估
9.2.4 模型参数介绍
9.3 GBDT算法原理
9.3.1 GBDT算法的核心思想
9.3.2 GBDT算法的数学原理概述
9.3.3 GBDT算法的数学原理举例
9.3.4 GBDT算法的简单代码实现
9.4 GBDT算法案例实战:产品定价模型
9.4.1 案例背景
9.4.2 模型搭建
9.4.3 模型预测及评估
9.4.4 模型参数介绍
第10章 机器学习神器:XGBoost与LightGBM算法
10.1 XGBoost算法原理
10.1.1 XGBoost算法的核心思想
10.1.2 XGBoost算法的数学原理概述
10.1.3 XGBoost算法的简单代码实现
10.2 XGBoost算法案例实战1:金融反欺诈模型
10.2.1 案例背景
10.2.2 模型搭建
10.2.3 模型预测及评估
10.2.4 模型参数调优
10.3 XGBoost算法案例实战2:信用评分卡模型
10.3.1 案例背景
10.3.2 多元线性回归模型
10.3.3 GBDT回归模型
10.3.4 XGBoost回归模型
10.4 LightGBM算法原理
10.4.1 LightGBM算法的核心思想
10.4.2 LightGBM算法的数学原理概述
10.4.3 LightGBM算法的简单代码实现
10.5 LightGBM算法案例实战1:客户违约预测模型
10.5.1 案例背景
10.5.2 模型搭建
10.5.3 模型预测及评估
10.5.4 模型参数调优
10.6 LightGBM算法案例实战2:广告收益回归预测模型
10.6.1 案例背景
10.6.2 模型搭建
10.6.3 模型预测及评估
10.6.4 模型参数调优
第11章 特征工程之数据预处理
11.1 非数值类型数据处理
11.1.1 Get_dummies哑变量处理
11.1.2 LabelEncoding编号处理
11.2 重复值、缺失值及异常值处理
11.2.1 重复值处理
11.2.2 缺失值处理
11.2.3 异常值处理
11.3 数据标准化
11.3.1 min-max标准化
11.3.2 Z-score标准化
11.4 数据分箱
11.5 特征筛选:WOE值与IV值
11.5.1 WOE值的定义与计算
11.5.2 IV值的定义与计算
11.5.3 WOE值与IV值的代码实现
11.5.4 案例实战:客户流失预警模型的IV值计算
11.6 多重共线性的分析与处理
11.6.1 多重共线性的定义
11.6.2 多重共线性的分析与检验
11.7 过采样和欠采样
11.7.1 过采样
11.7.2 欠采样
第12章 数据降维之PCA
12.1 数据降维
12.1.1 PCA的基本原理
12.1.2 PCA的代码实现
12.2 案例实战:人脸识别模型
12.2.1 案例背景
12.2.2 人脸数据读取、处理与变量提取
12.2.3 数据划分与降维
12.2.4 模型的搭建与使用
12.3 人脸识别外部接口调用
12.3.1 baidu-aip库安装
12.3.2 调用接口进行人脸识别和打分
第13章 数据聚类与分群分析
13.1 KMeans算法
13.1.1 KMeans算法的基本原理
13.1.2 KMeans算法的代码实现
13.1.3 案例实战:银行客户分群模型
13.2 DBSCAN算法
13.2.1 DBSCAN算法的基本原理
13.2.2 DBSCAN算法的代码实现
13.2.3 KMeans算法与DBSCAN算法的对比
13.3 案例实战:新闻聚类分群模型
13.3.1 案例背景
13.3.2 文本数据的读取与处理
13.3.3 模型的搭建与使用
13.3.4 模型优化
第14章 智能推荐系统
14.1 智能推荐系统的基本原理
14.1.1 智能推荐系统的应用场景
14.1.2 智能推荐系统的基础:协同过滤算法
14.2 计算相似度的常用方法
14.2.1 欧氏距离
14.2.2 余弦相似度
14.2.3 皮尔逊相关系数
14.3 案例实战:电影智能推荐系统
14.3.1 案例背景
14.3.2 数据读取与处理
14.3.3 系统搭建
第15章 关联分析:Apriori算法
15.1 关联分析的基本概念和Apriori算法
15.1.1 关联分析的基本概念
15.1.2 Apriori算法的数学演示
15.1.3 Apriori算法的代码实现
15.2 案例实战:病症关联规则分析
15.2.1 案例背景
15.2.2 数据读取与处理
15.2.3 关联规则分析
第16章 深度学习初窥之神经网络模型
16.1 深度学习基础:神经网络模型
16.1.1 神经网络模型的基本原理
16.1.2 神经网络模型的简单代码实现
16.2 案例实战:用户评论情感分析模型
16.2.1 案例背景
16.2.2 数据读取、中文分词、文本向量化
16.2.3 神经网络模型的搭建与使用