从今天起,开启一个有关用 Python 做数据分析的 tricks 系列,致力于分享一些高效实用的小技巧,进一步了解那些你所熟知的库(Pandas、NumPy 等),也会分享一些冷门但好用的 Python 库,来帮你节省数据分析过程中写代码的时间~
这个系列的文章可能涵盖一些你已经很了解的方法,但在我们日常写代码的过程中,最常出现的情况就是,这个方法我知道,而且用过很多次,但就是想不起来具体怎么写了,比如记不清要不要加方括号,括号括在哪里等小问题。不如关注一下这个系列,趁机把哪些在编程过程中遇到的小问题一网打尽!
本篇小 trick 要分享的是如何新建一个 Pandas DataFrame,这是数据分析中最常见的操作之一了,下面介绍几种不同的方法。
1. 通过 list of list 创建 DataFrame
import pandas as pd
data = [['Apple', 6], ['Grape', 30], ['Banana', 5]]
df = pd.DataFrame(data, columns = ['Fruit', 'Price'])
df
2. 通过 dict of list 创建 DataFrame
import pandas as pd
data = {'Fruit':['Apple', 'Grape', 'Banana'], 'Price':[6, 30, 5]}
df = pd.DataFrame(data)
df
3. 通过 list of dicts 创建 DataFrame
import pandas as pd
data = [{'Fruit': 'Apple', 'Price': 6}, {'Fruit': 'Grape', 'Price': 30}, {'Fruit': 'Banana', 'Price': 5}]
df = pd.DataFrame(data)
df
4. 通过 zip() 函数创建 DataFrame
import pandas as pd
Fruit = ['Apple', 'Grape', 'Banana']
Price = [6, 30, 5]
list_of_tuples = list(zip(Fruit, Price))
df = pd.DataFrame(list_of_tuples, columns = ['Name', 'Age'])
df
5. 新建空的 DataFrame,逐行添加数据
import pandas as pd
df = pd.DataFrame(columns = ['Fruit', 'Price'])
df = df.append({'Fruit': 'Apple', 'Price': 6}, ignore_index=True)
df = df.append({'Fruit': 'Grape', 'Price': 30}, ignore_index=True)
df = df.append({'Fruit': 'Banana', 'Price': 5}, ignore_index=True)
df
以上几种方法都可以得到一样的 DataFrame,如下:
image可以根据具体情况决定使用哪种方法~
扫描下方二维码关注公众号【数据池塘】,第一时间获取更多有关数据挖掘、机器学习的干货,回复【算法】获取机器学习的最全算法网络图:
扫它~