页数:451页 开本:16开 重量:721 g
《利用Python进行数据分析》内容简介:学习NumPy(NumericalPython)的基础和高级知识;从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境。
目录
前言1 第1章准备工作5 本书主要内容5 为什么要使用Python进行数据分析6 重要的Python库7 安装和设置10 社区和研讨会16 使用本书16 致谢18 第2章引言20 来自bit.ly的1.usa.gov数据21 MovieLens1M数据集29 1880—2010年间全美婴儿姓名35 小结及展望47 第3章IPython:一种交互式计算和开发环境48 IPython基础49 内省51 使用命令历史60 与操作系统交互63 软件开发工具66 IPythonHTMLNotebook75 利用IPython提高代码开发效率的几点提示77 高级IPython功能79 致谢81 第4章NumPy基础:数组和矢量计算82 NumPy的ndarray:一种多维数组对象83 通用函数:快速的元素级数组函数98 利用数组进行数据处理100 用于数组的文件输入输出107 线性代数109 随机数生成111 范例:随机漫步112 第5章pandas入门115 pandas的数据结构介绍116 基本功能126 汇总和计算描述统计142 处理缺失数据148 层次化索引153 其他有关pandas的话题158 第6章数据加载、存储与文件格式162 读写文本格式的数据162 二进制数据格式179 使用HTML和WebAPI181 使用数据库182 第7章数据规整化:清理、转换、合并、重塑186 合并数据集186 重塑和轴向旋转200 数据转换204 字符串操作217 示例:USDA食品数据库224 第8章绘图和可视化231 matplotlibAPI入门231 pandas中的绘图函数244 绘制地图:图形化显示海地地震危机数据254 Python图形化工具生态系统260 第9章数据聚合与分组运算263 GroupBy技术264 数据聚合271 分组级运算和转换276 透视表和交叉表288 示例:2012联邦选举委员会数据库291 第10章时间序列302 日期和时间数据类型及工具303 时间序列基础307 日期的范围、频率以及移动311 时区处理317 时期及其算术运算322 重采样及频率转换327 时间序列绘图334 移动窗口函数337 性能和内存使用方面的注意事项342 第11章金融和经济数据应用344 数据规整化方面的话题344 分组变换和分析355 更多示例应用361 第12章NumPy高级应用368 ndarray对象的内部机理368 高级数组操作370 广播378 ufunc高级应用383 结构化和记录式数组386 更多有关排序的话题388 NumPy的matrix类393 高级数组输入输出395 性能建议397 附录APython语言精要401 |