python数据清洗,读取excel文件同时屏蔽不合理值为NaN发布于2024年05月24日 python 目光集中在pandas库,它可以读取excel文件,返回dataframe对象。在读取excel文件的同时,实际上有个na_values参数就可以对数据进行第一波清洗,这就是本文主要描述的事情。大家好,这里是苏南大... 阅读更多
python数据清洗,如何求dataframe中位数/平均数/分位数?发布于2024年05月23日 python 必须明确一个概念:平均数不是中位数。平均数是所有数的平均,强调的是数量。而中位数是处于最中间的那个数,强调的是位置。所以,两者是有区别的。本文从实际的例子出发,看看两者的区别。大家好,这里是苏南大叔的“奥林匹克技术竞赛... 阅读更多
python编程,解读pandas.merge()合并dataframe的index参数发布于2024年05月22日 python 本文解读pandas.merge()里面的left_index和right_index两个参数。和上一篇文章里面的on、left_on、right_on一样,left_index和right_index说的还是两者... 阅读更多
python编程,解读pandas.merge()合并dataframe的on标准发布于2024年05月21日 python 继续讨论pandas.merge()函数,本文讨论其中的on、left_on和right_on三个参数,对应到sql语言里面,就是两者进行连接的on标准的选择问题。默认的on,必然是两者都有的某个列,比如id。但是... 阅读更多