线获取推文 35
2.3.2 推文的结构 38
2.3.3 使用流API 42
2.4 分析推文——实体分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——时间序列分析 54
2.7 小结 57
第3章 Twitter用户、粉丝和社区 58
3.1 用户、好友和粉丝 58
3.1.1 回到TwitterAPI 58
3.1.2 用户资料的结构 59
3.1.3 下载好友和粉丝的资料 62
3.1.4 分析你的社会网络 64
3.1.5 度量影响力和参与度 68
3.2 挖掘粉丝 72
3.3 挖掘对话 77
3.4 在地图上绘制推文 80
3.4.1 将推文转换为GeoJSON 80
3.4.2 用Folium轻松绘制地图 83
3.5 小结 89
第4章 Facebook帖子、页面和用户互动 90
4.1 FacebookGraphAPI 90
4.1.1 注册你的应用 90
4.1.2 鉴权和安全 92
4.1.3 用Python连接FacebookGraphAPI 93
4.2 挖掘你的帖子 96
4.2.1 帖子的结构 99
4.2.2 时间频率分析 99
4.3 挖掘Facebook页面 101
4.3.1 从页面获取帖子 103
4.3.2 度量参与度 107
4.3.3 用词云可视化帖子 112
4.4 小结 114
第5章 Google+话题分析 115
5.1 Google+API入门 115
5.2 在WebGUI中嵌入搜索结果 120
5.2.1 Python的装饰器 121
5.2.2 Flask路由和模板 122
5.3 Google+页面的笔记和活动 125
5.4 笔记的文本分析和TF-IDF计算 127
5.5 小结 134
第6章 StackExchange提问和回答 135
6.1 提问和回答 135
6.2 StackExchangeAPI入门 137
6.2.1 搜索带标签的问题 139
6.2.2 搜索用户 142
6.3 处理StackExchange的存档数据 144
6.4 问题标签的文本分类 149
6.4.1 监督学习和文本分类 149
6.4.2 分类算法 153
6.4.3 评估 155
6.4.4 StackExchange数据的文本分类 157
6.4.5 在实时应用中嵌入分类器 161
6.5 小结 165
第7章 博客、RSS、维基百科和自然语言处理 166
7.1 博客和自然语言处理 166
7.2 从博客和网站获取数据 166
7.2.1 使用WordPress.comAPI 167
7.2.2 使用BloggerAPI 170
7.2.3 解析RSS和Atom订阅 173
7.2.4 从维基百科获取数据 174
7.2.5 关于网络爬取的一点建议 176
7.3 自然语言处理基础 177
7.3.1 文本处理 177
7.3.2 信息抽取 185
7.4 小结 190
第8章 挖掘所有数据 191
8.1 很多社交API 191
8.2 挖掘YouTube上的视频 191
8.3 挖掘GitHub上的开源软件 196
8.4 挖掘Yelp上的本地商家 203
8.5 创建自定义的Python客户端 208
8.6 小结 210
第9章 关联数据和语义网 211
9.1 数据网 211
9.1.1 语义网词汇 212
9.1.2 微格式 215
9.1.3 关联数据和开放数据 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 从DBpedia挖掘关系 220
9.3 挖掘地理坐标 222
9.3.1 从维基百科抽取地理数据 222
9.3.2 在GoogleMaps上绘制地理数据 225
9.4 小结 229