发布于 2017-05-09 00:22:55 | 168 次阅读 | 评论: 0 | 来源: 网友投递
Pandas Python数据分析工具包
Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV) 文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV 和高效的 HDF5 格式。
Pandas 0.20.1 是自 0.19.2 以来的又一个主要版本,包括许多 API 更改、弃用,新特性,功能改进、性能改进以及大量错误修复。建议所有用户升级到此版本。
亮点包括:
Series/DataFrame 新的 .agg()API ,类似于 groupby-rolling-resample API
与 feather-format 集成,包括一个新的顶级 pd.read_feather()和 DataFrame.to_feather()方法
.ix indexer已被弃用
Panel 已被弃用
添加 IntervalIndex 和 Interval scalar 类型
改进当根据 .groupby()中的索引级别进行分组时的用户 API
改进对 UInt64 dtypes 的支持
Google BigQuery 支持现在使用 pandas-gbq 库
更多请查看完整更新内容
下载地址:
https://pypi.python.org/pypi/pandas/#downloads