Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
La función pandas dataframe.info() se utiliza para obtener un resumen conciso del marco de datos. Es muy útil cuando se hace un análisis exploratorio de los datos. Para obtener una descripción general rápida del conjunto de datos, usamos la función dataframe.info().
Sintaxis: DataFrame.info(verbose=Ninguno, buf=Ninguno, max_cols=Ninguno, memory_usage=Ninguno, null_counts=Ninguno)
Parámetros:
detallado: si imprimir el resumen completo. Ninguno sigue la configuración de display.max_info_columns. True o False anula la configuración de display.max_info_columns.
buf : búfer grabable, por defecto es sys.stdout
max_cols : determina si se imprime un resumen completo o breve. Ninguno sigue la configuración de display.max_info_columns.
uso de memoria :Especifica si se debe mostrar el uso total de memoria de los elementos de DataFrame (incluido el índice). Ninguno sigue la configuración de display.memory_usage. True o False anula la configuración de display.memory_usage. Un valor de ‘profundo’ es equivalente a Verdadero, con una profunda introspección. El uso de la memoria se muestra en unidades legibles por humanos (representación en base 2).
null_counts : si mostrar los recuentos no nulos. Si es Ninguno, solo muestra si el marco es más pequeño que max_info_rows y max_info_columns. Si es verdadero, siempre muestra los recuentos. Si es falso, nunca muestre los recuentos.
Para obtener un enlace al archivo CSV utilizado en el código, haga clic aquí
. Ejemplo n.º 1: utilice la función info() para imprimir un resumen completo del marco de datos.
Python3
# importing pandas as pd import pandas as pd # Creating the dataframe df = pd.read_csv("nba.csv") # Print the dataframe df
Imprimamos el resumen completo del marco de datos.
Python3
# to print the full summary df.info()
Producción :
Como podemos ver en el resultado, el resumen incluye una lista de todas las columnas con sus tipos de datos y la cantidad de valores no nulos en cada columna. también tenemos el valor de rangeindex proporcionado para el eje de índice.
Ejemplo #2: Usar la función info() para imprimir un breve resumen del marco de datos
Nota: Para imprimir el breve resumen, podemos usar el parámetro detallado y establecerlo en False.
Python3
# importing pandas as pd import pandas as pd # Creating the dataframe df = pd.read_csv("nba.csv") # Print the short summary of the # dataframe by setting verbose = False df.info(verbose = False)
Producción :
Como podemos ver en el resultado, el resumen es muy nítido y breve. Es útil cuando tenemos miles de atributos en el marco de datos.
Ejemplo n.º 3: utilice la función info() para imprimir un resumen completo del marco de datos y excluir los recuentos nulos.
Nota: para imprimir el resumen completo, excluyendo los recuentos nulos, podemos usar el parámetro de recuentos nulos y configurarlo como falso.
Python3
# importing pandas as pd import pandas as pd # Creating the dataframe df = pd.read_csv("nba.csv") # Print the full summary of the dataframe # with null count excluded df.info(verbose = True, null_counts = False)
Producción :
Como podemos ver en la salida, el resumen está completo pero se excluyen los recuentos nulos.
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA