Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas .size
, .shape
y .ndim
se utilizan para devolver el tamaño, la forma y las dimensiones de los marcos de datos y las series.
Sintaxis: dataframe.size
Retorno: Devuelve el tamaño del marco de datos/serie que es equivalente al número total de elementos. Eso es filas x columnas.Sintaxis: dataframe.shape
Retorno: Devuelve la tupla de forma (Filas, columnas) del marco de datos/serieSintaxis: dataframe.ndim
Retorno: Devuelve la dimensión del marco de datos/serie. 1 para una dimensión (serie), 2 para dos dimensiones (marco de datos)
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo:
En este ejemplo, la salida de tamaño y forma se almacena primero. Dado que .size
devuelve el número total de elementos, se compara multiplicando filas y columnas devueltas por el método de forma. Después de que la dimensión de Dataframe y series también se verifique usando.ndim
# importing pandas module import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dataframe.size size = data.size # dataframe.shape shape = data.shape # dataframe.ndim df_ndim = data.ndim # series.ndim series_ndim = data["Salary"].ndim # printing size and shape print("Size = {}\nShape ={}\nShape[0] x Shape[1] = {}". format(size, shape, shape[0]*shape[1])) # printing ndim print("ndim of dataframe = {}\nndim of series ={}". format(df_ndim, series_ndim))
Producción:
Size = 4122 Shape=(458, 9) Shape[0] x Shape[1] = 4122 ndim of dataframe = 2 ndim of series=1
Como se puede ver, filas x columnas de .shape es igual al valor devuelto por .size
Además, ndim para dataframe fue 2 y series es 1, lo cual es cierto para todo tipo de dataframes y series.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA