首页 > 编程笔记

Pandas DataFrame创建数据框对象

Pandas 中的数据框对象 DataFrame 可以看作是 Series 对象的集合,它们共用同一个索引。所以 DataFrame 具有 Series 的相应方法,这里不再赘述,本节主要根据具体的操作对 DataFrame 对象进行讲解。

一般有两种方式创建数据框,一是通过字典,二是通过列表,二者皆可获得相同的结果。示例代码如下。
In [1]: import pandas as pd
In [2]: a = {'a': [1, 2, 3], 'b': ['a', 'b', 'c'],'c': ["A","B","C"]}

1. 创建DataFrame对象

1) 通过字典创建

通过字典创建数据框时,字典里的键会转换为数据框的字段,而字典中的值则会转换为数据框中的样本。
In [3]: df_a = pd.DataFrame(a) # 通过字典创建数据框
In [4]: df_a
Out[4]: 
   a  b  c
0  1  a  A
1  2  b  B
2  3  c  C

2) 通过列表创建

通过列表创建数据框对象 DataFrame 对象。
In [5]: b = [{'a':1,'b':'a','c':'A'},{'a':2,'b':'b','c':'B'},{'a':3,'b':'c','c':
'C'}]
In [6]: df_b = pd.DataFrame(b)  # 通过列表创建数据框
In [7]: df_b
Out[7]: 
   a  b  c
0  1  a  A
1  2  b  B
2  3  c  C

2. DataFrame对象是否相同

双等号可以用来判断两个数据框的值是否相同,相同的值对应的位置会返回 True,不相同的值对应的位置会返回 False。
In [8]: df_a == df_b  # 查看数据框是否相同
Out[8]: 
      a     b     c
0  True  True  True
1  True  True  True
2  True  True  True 

优秀文章