Python | Marco de datos de Pandas.assign()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Dataframe.assign()El método asigna nuevas columnas a un DataFrame, devolviendo un nuevo objeto (una copia) con las nuevas columnas agregadas a las originales. Las columnas existentes que se reasignan se sobrescribirán.

La longitud de la columna recién asignada debe coincidir con el número de filas en el marco de datos.

Sintaxis: DataFrame.assign(**kwargs)

Parámetros:
kwargs: las palabras clave son los nombres de las columnas. Si se puede llamar a los valores, se calculan en el DataFrame y se asignan a las nuevas columnas. El invocable no debe cambiar el DataFrame de entrada (aunque los pandas no lo verifican). Si los valores no son invocables (por ejemplo, una serie, un escalar o una array), simplemente se asignan.

Devuelve: un nuevo DataFrame con las nuevas columnas además de todas las columnas existentes.

Para obtener un enlace al archivo CSV utilizado en el código, haga clic aquí

Ejemplo #1: Asigne una nueva columna llamada Revised_Salary con un incremento del 10% del Salario original.

# importing pandas as pd
import pandas as pd
  
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
  
# Printing the first 10 rows of
# the data frame for visualization
df[:10]

# increase the salary by 10 % 
df.assign(Revised_Salary = lambda x: df['Salary']
                               + df['Salary']/10)

Producción:

 
Ejemplo #2: Asignar más de una columna a la vez

# importing pandas as pd
import pandas as pd
  
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
  
# First column ='New_Team', this column
# will append '_GO' at the end of each team name.
# Second column ='Revised_Salary' will increase 
# the salary of all employees by 10 % 
df.assign(New_team = lambda x: df['Team']+'_GO', 
          Revised_Salary = lambda x: df['Salary'] 
                             + df['Salary'] / 10)

Producción:

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *