注释47
2.6 控制语句49
2.6.1 if语句50
2.6.2 for语句51
2.6.3 while语句52
2.6.4 控制语句的嵌套53
2.7 函数55
2.7.1 内置函数55
2.7.2 自定义函数58
2.8 模块的导入61
2.8.1 import语句导入法61
2.8.2 from语句导入法62
第3章自动化整理计算机文件
3.1文件的自动分类65
3.2文件和文件夹的快速查找71
3.3自动清理重复文件80
3.4批量转换图片的格式83
3.5按照日期自动分类图片85
第4章自动化处理PDF文件
4.1批量下载PDF文件93
4.1.1 使用Selenium模块爬取多页内容93
4.1.2 使用Selenium模块批量下载PDF文件99
4.2批量合并PDF文件104
4.3批量拆分PDF文件107
4.4批量加密PDF文件111
4.5批量为PDF文件添加水印112
4.5.1 自定义函数创建水印文件113
4.5.2 自定义函数添加水印114
4.5.3 使用循环为每个PDF文件添加水印115
第5章自动化处理Word文档
5.1批量生成Word合同119
5.1.1 读取文件并进行查找和替换120
5.1.2 使用循环套用模板生成合同122
5.2将Word文档批量转换为PDF文件125
5.3在Word文档中批量标记关键词128
5.4在Word文档中批量替换关键词134
第6章自动化处理Excel工作簿
6.1批量生成产品出货清单139
6.1.1 提取出货统计表中的数据140
6.1.2 使用for语句创建产品出货清单141
6.2批量替换工作簿的单元格数据144
6.3将多个工作表合并为一个工作表148
6.3.1 使用xlwings模块读取多个工作表中的数据149
6.3.2 新建工作簿存放合并后的数据151
6.4将一个工作表拆分为多个工作簿153
6.5批量拆分列数据157
6.6批量分类汇总数据161
第7章自动化处理PowerPoint演示文稿
7.1批量提取演示文稿中的文本内容167
7.2将演示文稿批量导出为图片和PDF文件170
7.3自动读取图文素材制作演示文稿174
7.4批量提取演示文稿中的图片素材181
第8章爬虫技术基础
8.1认识网页结构187
8.1.1 查看网页的源代码187
8.1.2 初步了解网页结构189
8.1.3 网页结构的组成189
8.1.4 百度新闻页面结构剖析195
8.2Requests模块197
8.3正则表达式202
8.3.1 正则表达式基础知识203
8.3.2 使用正则表达式提取数据209
8.4Selenium模块215
8.4.1 网页数据爬取的难点215
8.4.2 浏览器驱动程序的下载与安装217
8.4.3 使用Selenium模块获取网页真正的源代码220
8.4.4 使用Selenium模块模拟鼠标和键盘操作223
第9章爬虫实战演练
9.1爬取图书数据—当当网228
9.1.1 使用Requests模块获取网页源代码228
9.1.2 编写正则表达式提取图书数据229
9.1.3 批量爬取多页数据234
9.2爬取新闻数据—新浪新闻237
9.2.1 使用Selenium模块获取网页源代码238
9.2.2 编写正则表达式提取新闻数据239
9.2.3 自定义函数完成多个关键词的批量爬取242
9.3爬取价格数据—农业农村部网站244
9.3.1 使用Selenium模块获取网页源代码244
9.3.2 使用pandas模块获取网页中的表格数据246
9.3.3 批量爬取多页数据248
9.4爬取职位数据—前程无忧网250
9.4.1 使用Selenium模块搜索职位250
9.4.2 编写正则表达式提取数据并保存252
9.4.3 批量爬取多页数据255
9.5爬取财务报表—东方财富网259
9.5.1 使用Selenium模块爬取单页财务报表259
9.5.2 使用Selenium模块爬取多页财务报表264
9.5.3 爬取指定时期和指定种类的财务数据269
第10章自动化处理电子邮件
10.1自动发送电子邮件281
10.1.1 获取SMTP授权码281
10.1.2 自动发送文本格式的电子邮件282
10.1.3 自动发送HTML格式的电子邮件284
10.1.4 自动发送带附件的电子邮件287
10.2批量发送电子邮件291
10.3定时发送电子邮件293
10.3.1 自动爬取数据并通过电子邮件发送293