Skip to content

大纲

  • 中文名:《交互的Python:数据分析入门》
  • 英文名:《Interactive Python: An Introduction to Data Science》

面向读者

本书主要面向的是没有编程基础和数据处理分析经验的读者,也可以作为数据分析相关方向职业技术人员/学生作为参考和学习使用。

本书目的与特点

已有的编程书籍常常堆积着枯燥乏味的术语,而且大都不针对数据分析领域。另外,当前各类编程语言的模式基本都是“编辑-编译-运行”,这非常适用于编写功能明确的代码,像各类游戏、网站等;而数据分析重“探索”,旨在在理解数据的基础上加以利用,具有极强的交互性,需要不断地尝试各种代码进行分析,根据对分析结果的理解寻找数据背后隐藏的模式,因此更需要一种“运行-探索”的新工作模式。在内容的讲解上,数据分析书籍应强调探索,注重思考,而非简单概念的梳理和代码实现。遗憾的是,市面上大多数书籍都属于后者,对于数据分析人员仅能做参考而非学习使用。正是根据这一理解,本书的内容从头到尾都在阐述对概念与问题的思考、探索与解决,一些概念的讲述只是为这一核心提供理论基础。如果说理论知识是硬件,那么理论知识实现的探索分析就是软件,本书正是为需要它的读者提供软硬件支持。

本书内容大纲

本书内容主要涉及3个方面,一是Python的基础知识,这部分是任何使用Python工作的人都必须学习和掌握的;二是数据分析核心模块的学习和使用,这部分是任何使用Python进行数据处理工作都应当学习的;三是扩展内容,这里包括Markdown,一种流行的文本书写语言,但我把它放在前面章节讲解,因为个人认为书写文档对于数据分析从业者来说与代码探索、实现同等重要,有必要掌握Markdown这一门简单高效的工具。另外是一些Python中比较高级的用法(不常用),在数据分析时也极少用到,包括面向对象编程、异常处理等,对于想要入门分析的读者来说只是增加障碍,在读者学会基础后再学习和利用这一些比较高级的理论方法更为妥当。

在内容的撰写上,例子和代码中英文参杂。考虑读者本身的工作语境是中文,所以本书不少实例都使用了中文,以便于读者更好地理解和与工作对接。但英文的学习是有必要的,当前Python并没有官方中文文档,另外,在实际工作时遇到的大多数问题都要学习和利用英文搜索和提问等。

本书的学习平台是Anaconda,该平台几乎集成了常用的Python计算包,读者将更多地可以将精力放在学习、及时将所学应用于工作环境而非在与学习无关的软件安装、脚本运行等各种问题中浪费时间。

  • 0-前言-本书介绍
  • 1-介绍与准备工作
  • 2-python基础
  • 3-基本数据结构
  • 4-控制流与文件操作
  • 5-函数和模块
  • 6-Numpy
  • 7-Matplotlib
  • 8-Pandas入门
  • 9-Markdown基础
  • 10-数据导入
  • 11-数据分析工具箱
  • 12-Pandas进阶
  • 13-数据可视化进阶
  • 14-统计分析
  • 15-拓展-未言及的内容
  • 16-结语-接下来学什么