本书由 Python pandas 项目的创立者 Wes McKinney 撰写,是一本实用、现代的Python数据科学工具读物,适合新入门的 Python 分析师和刚接触数据科学及科学计算的 Python 程序员。数据文件和相关材料在 Github 上可以获得。
第二版版更新了能提升其独特价值的多个领域,从 Python 3.6 到新的 pandas 特性。通过阐释 Python 数据工具的原理和方法,本书帮助读者以新颖而富有创造性的途径学习如何有效利用它们。
Wes McKinney 是流行开源 Python 数据分析库 pandas 的创立者。他是一位公共演讲者和开源 Python 及 C++ 开发者,活跃于 Python 数据科学社区和 Apache 软件基金会。他在纽约从事软件架构师工作。
Preface
1.Preliminaries
2.PythonLanguageBasics,IPython,andJupyterNotebooks
3.Built-inDataStructures,Functions,andFiles
4.NumPyBasics:ArraysandVectorizedComputation
5.GettingStartedwithpandas.
6.DataLoading,Storage,andFileFormats
7.DataCleaninclandPreparation.
8.DataWrangling:Join,Combine,andReshape.
9.PlottingandVisualization.
10.DataAggregationandGroupOperations.
11.TimeSeries
12.Advancedpandas
3.IntroductiontoModelingLibrariesinPython
14.DataAnalysisExamples
A.AdvancedNumPy.
B.MoreontheIPythonSystem