为什么用pandas?(why do you like pandas)

pandas库的优点/特点

pandas库
  • 集成索引的DataFrame(数据帧)对象, 数据操作快速且高效。
  • 用于在内存数据结构和不同格式之间读写数据的工具:CSV和文本文件、Microsoft Excel、SQL数据库和快速HDF5格式;
  • 智能数据对齐和缺失数据的集成处理:实现计算中基于标签的自动对齐,轻松将杂乱的数据处理成有序的形式;
  • 数据集的灵活变形和旋转;
  • 基于智能标签的大数据集切片、“ 花式 ”索引和子集;
  • 可以从数据结构中插入和删除列;
  • 依靠分组依据引擎(允许对数据集进行分裂-应用-合并操作)对数据进行聚合或转换
  • 数据集的高性能合并与连接;
  • 分层轴索引提供了一种直观的方式,在低维数据结构中使用高维数据;
  • 时间序列函数:日期范围产生和频率转换,移动窗口统计,日期移动和延迟。甚至可以在不丢失数据的情况下创建特定领域的时间偏移和加入时间序列;
  • 高度优化的性能,使用Cython或C编写关键代码路径。
  • Python的pandas库被广泛应用于学术和商业领域,包括金融、神经科学、经济学、统计学、广告、网络分析等等。

其他人还浏览了:



公众号

关注公众号,获取一手资讯

“ 为什么用pandas?(why do you like pandas) ” comments 0

评论/回复

电子邮件地址不会被公开。 必填项已用*标注