Analizar datos del mundo real es algo difícil porque debemos tener en cuenta varias cosas. Además de obtener los datos útiles de grandes conjuntos de datos, también es muy importante mantener los datos en el formato requerido.
Uno podría encontrarse con una situación en la que necesitamos mayúsculas en cada letra en cualquier columna específica en un marco de datos dado. Veamos cómo podemos aplicar mayúsculas a una columna en el marco de datos de Pandas.
Vamos a crear un dataframe usando nba.csv
.
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # calling head() method # storing in new variable data_top = data.head(10) # display data_top
Producción:
Hay ciertos métodos que podemos cambiar/modificar el caso de la columna en el marco de datos de Pandas. Veamos cómo podemos aplicar mayúsculas a una columna en el marco de datos de Pandas usando el upper()
método.
Método 1:
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # display data['Name'] = data['Name'].str.upper() data.head()
Producción:
Método #2: Usar lambda con el upper()
método
# Import pandas package import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # removing null values to avoid errors data.dropna(inplace = True) # Applying upper() method on 'College' column data['College'].apply(lambda x: x.upper()).head(10)
Producción: