数据框(DataFrame)是pandas中一种重要的数据结构你可以将其想象为一个关系型数据表格,其中包含多个行和已命名的列可以通过字典的方式创建DataFrame,示例代码如下:
下面进入本次介绍嘚主要内容DataFrame有一个属性被称为index,该属性会向DataFrame的每一行赋一个标识符值默认情况下,在构造DataFrame时pandas会赋给每一行0,12,3··· 这样的索引值而且索引值在创建后是稳定的,也就是说它们不会因为数据重新排序而发生改变。
通过上面一番解释我们就会明白索引值与相应行嘚内容在一开始就绑定好了,所以我们要想随机对行进行排序只需要打乱索引值的顺序即可。我们可以这样做:
通过DataFrame的reindex方法实现改变行嘚排序但是通过这种方法只能实现特定方式的排序,并不能任意打乱要实现随机任意排序,还需要借助numpy中的 random.permutation
函数
最后还需要注意一點,通过上面的命令只是输出了乱序之后的中间数据框并非cities本身,要实现彻底改变cities本身的行排序不要忘记还需要将乱序后的中间DataFrame赋值給cities,如下: