Python | Método Pandas Dataframe.describe()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas describe()se utiliza para ver algunos detalles estadísticos básicos como percentil, media, estándar, etc. de un marco de datos o una serie de valores numéricos. Cuando este método se aplica a una serie de strings, devuelve una salida diferente que se muestra en los ejemplos a continuación.

Sintaxis: DataFrame.describe(percentiles=Ninguno, incluir=Ninguno, excluir=Ninguno)

Parámetros:
percentil: lista como tipo de datos de números entre 0-1 para devolver el percentil respectivo
incluye: Lista de tipos de datos que se incluirán al describir el marco de datos. El valor predeterminado es Ninguno
excluir: lista de tipos de datos que se excluirán al describir el marco de datos. El valor predeterminado es Ninguno

Tipo de retorno: resumen estadístico del marco de datos.

Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.

Ejemplo n.º 1: descripción del marco de datos con el tipo de datos de objeto y numérico

En este ejemplo, se describe el marco de datos y se pasa [‘objeto’] para incluir el parámetro para ver la descripción de la serie de objetos. [.20, .40, .60, .80] se pasa al parámetro percentil para ver el percentil respectivo de la serie numérica.

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# percentile list
perc =[.20, .40, .60, .80]
  
# list of dtypes to include
include =['object', 'float', 'int']
  
# calling describe method
desc = data.describe(percentiles = perc, include = include)
  
# display
desc

Salida:
como se muestra en la imagen de salida, se devolvió la descripción estadística del marco de datos con los respectivos percentiles pasados. Para las columnas con strings, se devolvió NaN para operaciones numéricas.

 
Ejemplo #2: Describiendo una serie de strings

En este ejemplo, la columna Nombre llama al método de descripción para ver el comportamiento con el tipo de datos del objeto.

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# calling describe method
desc = data["Name"].describe()
  
# display
desc

Salida:
como se muestra en la imagen de salida, el comportamiento de describe() es diferente con series de strings.
Se devolvieron diferentes estadísticas como recuento de valores, valores únicos, top y frecuencia de ocurrencia en este caso.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *