Pandas es la biblioteca de Python más popular que se utiliza para el análisis de datos. Proporciona un rendimiento altamente optimizado con código fuente back-end escrito puramente en C o Python .
We can analyze data in pandas with:
- Series
- DataFrames
Serie:
La serie es una array unidimensional (1-D) definida en pandas que se puede usar para almacenar cualquier tipo de datos.
Código #1: Creación de series
# Program to create series # Import Panda Library import pandas as pd # Create series with Data, and Index a = pd.Series(Data, index = Index)
Aquí, los datos pueden ser:
- Un valor escalar que puede ser integerValue, string
- Un diccionario de Python que puede ser clave, par de valores
- Un Ndarray
Nota : el índice por defecto es de 0, 1, 2, …(n-1) donde n es la longitud de los datos.
Código #2: cuando los datos contienen valores escalares
# Program to Create series with scalar values # Numeric data Data =[1, 3, 4, 5, 6, 2, 9] # Creating series with default index values s = pd.Series(Data) # predefined index values Index =['a', 'b', 'c', 'd', 'e', 'f', 'g'] # Creating series with predefined index values si = pd.Series(Data, Index)
Salida :
Código #3: cuando los datos contienen diccionario
# Program to Create Dictionary series dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5} # Creating series of Dictionary type sd = pd.Series(dictionary)
Salida :
Código #4: cuando los datos contienen Ndarray
# Program to Create ndarray series # Defining 2darray Data =[[2, 3, 4], [5, 6, 7]] # Creating series of 2darray snd = pd.Series(Data)
Salida :
marcos de datos:
DataFrames es una estructura de datos bidimensional (2-D) definida en pandas que consta de filas y columnas.
Código #1: Creación de DataFrame
# Program to Create DataFrame # Import Library import pandas as pd # Create DataFrame with Data a = pd.DataFrame(Data)
Aquí, los datos pueden ser:
- Uno o más diccionarios
- Una o más series
- 2D-numpy Ndarray
Código #2: Cuando los datos son diccionarios
# Program to Create Data Frame with two dictionaries # Define Dictionary 1 dict1 ={'a':1, 'b':2, 'c':3, 'd':4} # Define Dictionary 2 dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9} # Define Data with dict1 and dict2 Data = {'first':dict1, 'second':dict2} # Create DataFrame df = pd.DataFrame(Data)
Salida :
Código #3: Cuando los datos son series
# Program to create Dataframe of three series import pandas as pd # Define series 1 s1 = pd.Series([1, 3, 4, 5, 6, 2, 9]) # Define series 2 s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3]) # Define series 3 s3 = pd.Series(['a', 'b', 'c', 'd', 'e']) # Define Data Data ={'first':s1, 'second':s2, 'third':s3} # Create DataFrame dfseries = pd.DataFrame(Data)
Salida :
Código n.º 4: cuando los datos son 2D-numpy ndarray
Nota : se debe mantener una restricción al crear DataFrame de arrays 2D: las dimensiones de la array 2D deben ser las mismas.
# Program to create DataFrame from 2D array # Import Library import pandas as pd # Define 2d array 1 d1 =[[2, 3, 4], [5, 6, 7]] # Define 2d array 2 d2 =[[2, 4, 8], [1, 3, 9]] # Define Data Data ={'first': d1, 'second': d2} # Create DataFrame df2d = pd.DataFrame(Data)
Salida :
Publicación traducida automáticamente
Artículo escrito por Abhishek rajput y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA