Pandas

Pandas是一个用Python语言编写的开源、BSD许可的库。Pandas提供高性能、快速、易于使用的数据结构和数据分析工具,用于处理数字数据和时间序列。Pandas建立在numpy库上,用Python、Cython和C语言编写。在Pandas中,我们可以从各种文件格式导入数据,如JSON、SQL、Microsoft Excel等。

例子:

# Importing pandas library
import pandas as pd

# Creating and initializing a nested list
age = [['Andy', 95.5, "男"], ['杰伦', 65.7, "女"],['周杨', 85.1, "男"], ['张三', 75.4, "男"]]

# Creating a pandas dataframe
df = pd.DataFrame(age, columns=['姓名', '分数', '性别'])

# Printing dataframe
df

Numpy

Numpy是python的基本库,用于进行科学计算。它提供了高性能的多维数组和处理这些数组的工具。numpy数组是一个由正整数的元组索引的数值(同一类型)的网格,numpy数组速度快,容易理解,并给予用户在数组间进行计算的权利。

例子:

# Importing Numpy package
import numpy as np

# Creating a 3-D numpy array using np.array()
org_array = np.array([[123, 426, 385],
                    [243, 256, 939],
                    [131, 334, 552]])

# Printing the Numpy array
print(org_array)

Pandas与NumPy之间的差异表如下。

Pandas Numpy
当需要处理表格数据时,更喜欢pandas模块。 当需要处理数字数据时,更喜欢numpy模块。
pandas的强大工具是数据框架和系列。 而numpy的强大工具是数组。
Pandas会消耗更多的内存。 Numpy的内存是高效的。
当行数为500K或更多时,Pandas有更好的性能。 当行数为50K或更少时,Numpy有更好的性能。
与numpy数组相比,pandas数组的索引非常慢。 Numpy数组的索引是非常快的。
Pandas提供了一个名为DataFrame的have2d表对象。 Numpy能够提供多维数组。
Pandas是由Wes McKinney开发的,于2008年发布。 Numpy是由Travis Oliphant开发的,于2005年发布。
Pandas被用于很多组织,如Kaidee、Trivago、Abeja公司。,以及更多。 Numpy正在被用于像沃尔玛Tokopedia、Instacart等组织中。
Pandas有一个较高的行业应用。 Numpy有一个较低的行业应用。