Release Notes

MindSpore Pandas 0.2.0 Release Notes

主要特性和增强

  • [STABLE] 提供了基于共享内存的数据管道,数据无需落盘即可从MindSpore Pandas数据处理进程传输至MindSpore训练进程,解决了数据分析框架与AI训练框架割裂的问题。

  • [STABLE] 简化单机多进程模式使用方式,无需手动部署分布式计算引擎。

  • [STABLE] 支持Python3.9。

  • [STABLE] 增加了落盘功能,当datamem使用率超过预设的阈值时使用磁盘空间。

  • [STABLE] 优化分布式计算引擎冷启动时间。

  • [STABLE] 优化多进程模式内存占用。

  • [STABLE] 重构统计类和比较类API,并提升部分性能。

API 变更

  • [STABLE] 新增API mindpandas.DataFrame.memory_usage

  • [STABLE] 新增API mindpandas.DataFrame.count

  • [STABLE] 新增API mindpandas.DataFrame.product

  • [STABLE] 新增API mindpandas.DataFrame.var

  • [STABLE] 新增API mindpandas.DataFrame.prod

  • [STABLE] 新增API mindpandas.Series.prod

  • [STABLE] 新增API mindpandas.Series.isin

  • [STABLE] 新增API mindpandas.Series.item

  • [STABLE] 新增API mindpandas.Series.cummin

  • [STABLE] 新增API mindpandas.Series.count

  • [STABLE] 新增API mindpandas.Series.cummax

Bug Fixes

  • [BUGFIX] 修复了 read_csv 无法处理URL的问题。

  • [BUGFIX] 修复了 drop API在某些情况下计算结果错误的问题。

  • [BUGFIX] 修复了当使用 yrctl start 启动分布式计算引擎过程时出错,需要手动退出的问题。

  • [BUGFIX] 修复了设置代理后分布式计算引擎无法启动的问题。

贡献者

感谢以下人员做出的贡献:

caiyimeng, chenyue li, dessyang, liyuxia, lichen_101010, Martin Yang, panfengfeng, RobinGrosman, shenghong96, Tom Chen, wangyue, weisun092, xiaohanzhang, xutianyu, yanghaitao, youtianming

欢迎以任何形式对项目提供贡献!