
.3.3降噪与文本计数
3.4语料文本的语言学处理代码
3.4.1字母大小写转换
3.4.2词形还原
3.4.3文本分句或分词
3.4.4词性标注
3.5语料库词频排序
3.5.1简单词频排序
3.5.2降噪处理后词频排序
3.5.3清除停用词后排序
3.6语料库检索与统计
3.6.1上下文关键词检索
3.6.2类符形符比
3.6.3N连词提取
3.6.4指定词检索与统计
3.7中文语料文本的处理方法
3.7.1上下文关键词检索
3.7.2中文停用词
第4章数据可视化
4.1概述
4.2表格绘制
4.3图形绘制
4.3.1词频图形绘制
4.3.2柱状图和点状图绘制
4.4词云图绘制
4.4.1英文文本词云图
4.4.2中文文本词云图
第5章代码运行错误分析
5.1概述
5.2错误分析案例
5.2.1输入输出错误(IOError)
5.2.2对象属性错误(AttributeError)
5.2.3数据类型错误(TypeError)
5.2.4变量名称错误(NameError)
5.2.5索引错误(IndexError)
5.2.6缩进错误(Indentati)
5.2.7参数类型错误(ValueError)
5.2.8语法错误(SyntaxError)
5.2.9Unicode解码错误(UnicodeDecodeError)
5.2.10关键字错误(KeyError)
中篇基础性代码的组合使用
第6章算法、代码与编程
6.1篇章结构
6.2算法和代码
6.2.1算法
6.2.2代码
6.3选择不同代码的影响
6.3.1分词处理方式对后续文本分析的影响
6.3.2不同的降噪效果
6.3.3链表、字符串、元组和字典对比
6.3.4停用词的功用
6.4Python与既有语料库工具的关系
第7章基础性代码的语料库组合应用
7.1以Excel文件格式输出术语(类符)
7.1.1简单输出术语
7.1.2按词频输出术语
7.2以Excel文件格式输出表格
7.3语篇词汇密度的计算
7.4语篇词汇复杂性的计算
7.5语篇词长分布的计算
7.6NLTK固有语料库
7.6.1总统就职演说语料库
7.6.2华尔街杂志语料库
7.6.3其他相关语料库介绍
下篇Python探索路径
第8章Python的语料库拓展应用
8.1概述
8.2单语语料导入Excel工作簿
8.3KWIC检索功能的拓展
8.4语篇词形还原
8.5术语提取效果的改进
8.6语篇段落对齐
8.7应用语言学文献计量研究的数据提取
8.8专业通用词的提取路径探索
附录1与本书相关的加载模块与函数命令对应表
附录2Python2和Python3部分代码对比
附录3部分NLTK固有语料库
附录4汉英对照术语表
索引
编程语言与程序设计
Python编程 从入门到实践 第3版(图灵出品)
编程语言与程序设计
Hello算法(图灵出品)
编程语言与程序设计
C++ Primer Plus 第6版 中文版(异步图书出品)
编程语言与程序设计
C++ Primer(中文版 第5版)(博文视点出品)
编程语言与程序设计
高效C/C++调试