En este artículo, discutiremos cómo obtener una lista de columnas específicas de un marco de datos de Pandas. Primero, leeremos un archivo csv en un marco de datos de pandas.
Nota: Para obtener el archivo CSV utilizado, haga clic aquí .
Ejemplo:
Python3
# importing pandas module import pandas as pd # making data frame from csv data = pd.read_csv("nba.csv") # calling head() method df = data.head(5) # displaying data df
Producción:
Veamos cómo obtener una lista de una columna específica de un Pandas DataFrame:
convertiremos la columna «Nombre» en una lista de tres formas diferentes.
1. Usando Series.tolist()
Desde el marco de datos, seleccionamos la columna «Nombre» usando un operador [] que devuelve un objeto Serie. A continuación, usaremos la función Series.to_list() proporcionada por la clase Series para convertir el objeto de la serie y devolver una lista.
Python3
# importing pandas module import pandas as pd # making data frame from csv data = pd.read_csv("nba.csv") df = data.head(5) # Converting a specific Dataframe # column to list using Series.tolist() Name_list = df["Name"].tolist() print("Converting name to list:") # displaying list Name_list
Producción:
Desglosémoslo y veamos los tipos.
Python3
# column 'Name' as series object print(type(df["Name"])) # Convert series object to a list print(type(df["Name"].values.tolist()
Producción:
2. Usando numpy.ndarray.tolist()
Desde el marco de datos, seleccionamos la columna «Nombre» usando un operador [] que devuelve un objeto Serie y usa Series.Values para obtener una array NumPy del objeto serie. A continuación, usaremos la función tolist() proporcionada por la array NumPy para convertirla en una lista.
Python3
# importing pandas module import pandas as pd # making data frame from csv data = pd.read_csv("nba.csv") df = data.head(5) # Converting a specific Dataframe column # to list using numpy.ndarray.tolist() Name_list = df["Name"].values.tolist() print("Converting name to list:") # displaying list Name_list
Producción:
Del mismo modo, descomponiéndolo
Python3
# Select a column from dataframe # as series and get a numpy array print(type(df["Name"].values)) # Convert numpy array to a list print(type(df["Name"].values.tolist()
Producción:
3. Uso de la función list() de Python
También puede usar la función list() de Python con un parámetro iterable opcional para convertir una columna en una lista.
Python3
# importing pandas module import pandas as pd # making data frame from csv data = pd.read_csv("nba.csv") df = data.head(5) # Converting a specific Dataframe # column to list using list() # function in Python Name_List = list(df["Name"]) print("Converting name to list:") # displaying list Name_List
Producción:
Conversión de columna de índice en lista La
columna de índice se puede convertir en lista llamando a pandas.DataFrame.index, que devuelve la columna de índice como una array, y luego llamando a index_column.tolist() , que convierte index_column en una lista.
Python3
# Converting index column to list index_list = df.index.tolist() print("Converting index to list:") # display index as list index_list
Producción: