Concatenar marcos de datos de Pandas sin duplicados

En este artículo, vamos a concatenar dos marcos de datos usando el módulo pandas .

Para realizar la concatenación de dos marcos de datos, vamos a utilizar el método pandas.concat().drop_duplicates() en el módulo pandas .

Enfoque paso a paso: 

  • Módulo de importación.
  • Cargue dos marcos de datos de muestra como variables.
  • Concatene los marcos de datos usando el método pandas.concat().drop_duplicates() .
  • Muestra el nuevo marco de datos generado.

A continuación se muestran algunos ejemplos que muestran cómo realizar la concatenación entre dos marcos de datos utilizando el módulo pandas sin duplicados:

Ejemplo 1:

Python3

# Importing pandas library
import pandas as pd
 
# loading dataframes
dataframe1 = pd.DataFrame({'columnA': [20, 30, 40],
                           'columnB': [200, 300, 400]})
 
dataframe2 = pd.DataFrame({'columnA': [50, 20, 60],
                           'columnB': [500, 200, 600]})
 
# Concatenating dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
 
# Display concatenated dataframe
new_dataframe

Producción:

Aquí, hemos concatenado dos marcos de datos usando el método pandas.concat() .

Ejemplo 2:

Python3

# Importing pandas library
import pandas as pd
 
# loading dataframes
dataframe1 = pd.DataFrame({'name': ['rahul', 'anjali', 'kajal'],
                           'age': [23, 28, 30]})
 
dataframe2 = pd.DataFrame({'name': ['devesh', 'rashi', 'anjali'],
                           'age': [20, 15, 28]})
 
# Concatenating two dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
 
# Resetting index
new_dataframe = new_dataframe.reset_index(drop=True)
 
# Display dataframe generated
new_dataframe

Producción:

Como se muestra en la imagen de salida, obtenemos la concatenación de marcos de datos sin eliminar los duplicados.

Ejemplo 3:

Python3

# Importing pandas library
import pandas as pd
 
# Loading dataframes
dataframe1 = pd.DataFrame({'empname': ['rohan', 'hina', 'alisa', ],
                           'department': ['IT', 'admin', 'finance', ],
                           'designation': ['Sr.developer', 'administrator', 'executive', ]})
 
dataframe2 = pd.DataFrame({'empname': ['rishi', 'huma', 'alisa', ],
                           'department': ['cyber security', 'HR', 'finance', ],
                           'designation': ['penetration tester', 'HR executive', 'executive', ]})
 
# Concatenating two dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
 
# Resetting index
new_dataframe = new_dataframe.reset_index(drop=True)
 
# Display dataframe generated
new_dataframe

Producción:

Aquí hay otro ejemplo, que muestra cómo concatenar dos tramas de datos.

Conjunto de datos de salida para el Ejemplo 3

Publicación traducida automáticamente

Artículo escrito por arelemegha y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *