Análisis de datos usando Pandas

Pandas es la biblioteca de Python más popular que se utiliza para el análisis de datos. Proporciona un rendimiento altamente optimizado con código fuente back-end escrito puramente en C o Python .

We can analyze data in pandas with:

  1. Series
  2. DataFrames

Serie:

La serie es una array unidimensional (1-D) definida en pandas que se puede usar para almacenar cualquier tipo de datos.

Código #1: Creación de series

# Program to create series
  
# Import Panda Library
import pandas as pd  
  
# Create series with Data, and Index
a = pd.Series(Data, index = Index)  

Aquí, los datos pueden ser:

  1. Un valor escalar que puede ser integerValue, string
  2. Un diccionario de Python que puede ser clave, par de valores
  3. Un Ndarray

Nota : el índice por defecto es de 0, 1, 2, …(n-1) donde n es la longitud de los datos.
 
Código #2: cuando los datos contienen valores escalares

# Program to Create series with scalar values 
  
# Numeric data
Data =[1, 3, 4, 5, 6, 2, 9]  
  
# Creating series with default index values
s = pd.Series(Data)    
  
# predefined index values
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g'] 
  
# Creating series with predefined index values
si = pd.Series(Data, Index) 

Salida :

Scalar Data with default Index

Scalar Data with Index

 
Código #3: cuando los datos contienen diccionario

# Program to Create Dictionary series
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5} 
  
# Creating series of Dictionary type
sd = pd.Series(dictionary) 

Salida :

Dictionary type data

Código #4: cuando los datos contienen Ndarray

# Program to Create ndarray series
  
# Defining 2darray
Data =[[2, 3, 4], [5, 6, 7]]  
  
# Creating series of 2darray
snd = pd.Series(Data)    

Salida :

Data as Ndarray

marcos de datos:

DataFrames es una estructura de datos bidimensional (2-D) definida en pandas que consta de filas y columnas.

Código #1: Creación de DataFrame

# Program to Create DataFrame
  
# Import Library
import pandas as pd   
  
# Create DataFrame with Data
a = pd.DataFrame(Data)  

Aquí, los datos pueden ser:

  1. Uno o más diccionarios
  2. Una o más series
  3. 2D-numpy Ndarray

 
Código #2: Cuando los datos son diccionarios

# Program to Create Data Frame with two dictionaries
  
# Define Dictionary 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}   
  
# Define Dictionary 2     
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9} 
  
# Define Data with dict1 and dict2
Data = {'first':dict1, 'second':dict2} 
  
# Create DataFrame 
df = pd.DataFrame(Data)  

Salida :

DataFrame with two dictionaries

 
Código #3: Cuando los datos son series

# Program to create Dataframe of three series 
import pandas as pd
  
# Define series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])   
  
# Define series 2       
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3]) 
  
# Define series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])     
  
# Define Data
Data ={'first':s1, 'second':s2, 'third':s3} 
  
# Create DataFrame
dfseries = pd.DataFrame(Data)              

Salida :

DataFrame with three series

 
Código n.º 4: cuando los datos son 2D-numpy ndarray
Nota : se debe mantener una restricción al crear DataFrame de arrays 2D: las dimensiones de la array 2D deben ser las mismas.

# Program to create DataFrame from 2D array
  
# Import Library
import pandas as pd 
  
# Define 2d array 1
d1 =[[2, 3, 4], [5, 6, 7]] 
  
# Define 2d array 2
d2 =[[2, 4, 8], [1, 3, 9]] 
  
# Define Data
Data ={'first': d1, 'second': d2}  
  
# Create DataFrame
df2d = pd.DataFrame(Data)    

Salida :

DataFrame with 2d ndarray

Publicación traducida automáticamente

Artículo escrito por Abhishek rajput y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *