是什么使我们成为Pandas 1.0


1月9日,Pandas 1.0.0rc发布了。 该库的先前版本是0.25。


第一个主要版本包含许多重大创新,包括改进的数据框自动汇总,更多的输出格式,新的数据类型,甚至新的文档站点。


所有更改都可以在此处看到,在本文中,我们将局限于对最重要的内容进行较小的,较少技术性的审查。


您可以像往常一样使用pip安装该库,但是由于在编写Pandas 1.0时仍是候选版本 ,因此您需要明确指定版本:


pip install --upgrade pandas==1.0.0rc0 

请注意:由于版本是主要版本,因此更新可能会破坏旧代码!


顺便说一下,此版本已完全停止对Python 2的支持( 这可能是升级的好理由-大约翻译 )。 Pandas 1.0至少需要Python 3.6+,因此,如果不确定,请检查已安装的版本:


 $ pip --version pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7) $ python --version Python 3.7.5 

检查Pandas版本的最简单方法是:


 >>> import pandas as pd >>> pd.__version__ 1.0.0rc0 

使用DataFrame.info改进了自动汇总


我最喜欢的创新是DataFrame.info方法的更新。 该功能变得更具可读性,这使得研究数据的过程变得更加容易:


 >>> df = pd.DataFrame({ ...: 'A': [1,2,3], ...: 'B': ["goodbye", "cruel", "world"], ...: 'C': [False, True, False] ...:}) >>> df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A 3 non-null int64 1 B 3 non-null object 2 C 3 non-null object dtypes: int64(1), object(2) memory usage: 200.0+ bytes 

表格输出为降价格式


同样令人愉快的创新是使用DataFrame.to_markdown将数据帧导出到Markdown表的功能


 >>> df.to_markdown() | | A | B | C | |---:|----:|:--------|:------| | 0 | 1 | goodbye | False | | 1 | 2 | cruel | True | | 2 | 3 | world | False | 

这极大地简化了使用github gists在Medium等网站上发布表格的过程。



字符串和布尔值的新类型


熊猫1.0还添加了新的实验类型。 他们的API可能会更改,因此请谨慎使用。 但总的来说,熊猫建议在有意义的地方使用新类型。


到目前为止,需要明确进行转换:


 >>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string") >>> C = pd.Series([False, True, False], dtype="bool") >>> df.B = B, df.C = C >>> df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A 3 non-null int64 1 B 3 non-null string 2 C 3 non-null bool dtypes: int64(1), object(1), string(1) memory usage: 200.0+ bytes 

注意Dtype列如何显示新类型-stringbool


新字符串类型最有用的功能是可以从数据帧中选择行的列 。 这可以大大简化文本数据的分析:


 df.select_dtypes("string") 

以前,如果不显式指定名称,则无法选择行列。


有关新类型的更多信息,请参见此处




感谢您的阅读! 如前所述,完整的更改列表可以在此处查看。

Source: https://habr.com/ru/post/zh-CN483720/


All Articles