您的当前位置:首页正文

Python 数据分析小技巧 (1) —— 创建 Pandas

来源:花图问答

从今天起,开启一个有关用 Python 做数据分析的 tricks 系列,致力于分享一些高效实用的小技巧,进一步了解那些你所熟知的库(Pandas、NumPy 等),也会分享一些冷门但好用的 Python 库,来帮你节省数据分析过程中写代码的时间~

这个系列的文章可能涵盖一些你已经很了解的方法,但在我们日常写代码的过程中,最常出现的情况就是,这个方法我知道,而且用过很多次,但就是想不起来具体怎么写了,比如记不清要不要加方括号,括号括在哪里等小问题。不如关注一下这个系列,趁机把哪些在编程过程中遇到的小问题一网打尽!

本篇小 trick 要分享的是如何新建一个 Pandas DataFrame,这是数据分析中最常见的操作之一了,下面介绍几种不同的方法。

1. 通过 list of list 创建 DataFrame


import pandas as pd

data = [['Apple', 6], ['Grape', 30], ['Banana', 5]]

df = pd.DataFrame(data, columns = ['Fruit', 'Price'])

df

2. 通过 dict of list 创建 DataFrame


import pandas as pd

data = {'Fruit':['Apple', 'Grape', 'Banana'], 'Price':[6, 30, 5]}

df = pd.DataFrame(data)

df

3. 通过 list of dicts 创建 DataFrame

import pandas as pd

data = [{'Fruit': 'Apple', 'Price': 6}, {'Fruit': 'Grape', 'Price': 30}, {'Fruit': 'Banana', 'Price': 5}]

df = pd.DataFrame(data)

df

4. 通过 zip() 函数创建 DataFrame


import pandas as pd 

Fruit = ['Apple', 'Grape', 'Banana'] 

Price = [6, 30, 5] 

list_of_tuples = list(zip(Fruit, Price)) 

df = pd.DataFrame(list_of_tuples, columns = ['Name', 'Age']) 

df

5. 新建空的 DataFrame,逐行添加数据


import pandas as pd 

df = pd.DataFrame(columns = ['Fruit', 'Price'])

df = df.append({'Fruit': 'Apple', 'Price': 6}, ignore_index=True)

df = df.append({'Fruit': 'Grape', 'Price': 30}, ignore_index=True)

df = df.append({'Fruit': 'Banana', 'Price': 5}, ignore_index=True)

df

以上几种方法都可以得到一样的 DataFrame,如下:

image

可以根据具体情况决定使用哪种方法~


扫描下方二维码关注公众号【数据池塘】,第一时间获取更多有关数据挖掘、机器学习的干货,回复【算法】获取机器学习的最全算法网络图:

扫它~