¿Cómo unir conjuntos de datos con las mismas columnas y seleccionar uno usando Pandas?

Es habitual que en las operaciones de manipulación de datos, dado que los datos provienen de diferentes fuentes, puede ser necesario unir dos conjuntos de datos en uno. En este artículo, analicemos cómo unir conjuntos de datos con las mismas columnas en python.

Usando Pandas concat()

Python tiene un paquete llamado pandas que proporciona una función llamada concat que nos ayuda a unir dos conjuntos de datos como uno solo.

Sintaxis:

pandas.concat(objs, axis=0, join=’outer’, ignore_index=False, keys=Ninguna)

Parámetros:

  • objs -secuencia de objetos Series o DataFrame
  • eje – 0 – índice’, 1 – columnas
  • unir – interno, predeterminado – externo
  • ignore_index – booleano, predeterminado Falso. Si es verdadero, el marco de datos no debe contener un índice

Los conjuntos de datos utilizados para la demostración se pueden descargar aquí data_1 y data_2 .

Ejemplo:

Aquí, hemos hecho que ignore_index sea False, lo que significa que la función concat ignorará el índice original de los conjuntos de datos individuales y creará un nuevo índice.

Python3

import pandas as pd
  
# read the datasets
df1 = pd.read_csv(r"your_path/data_1.csv")
df2 = pd.read_csv(r"your_path/data_2.csv")
  
# print the datasets
print(df1.head())
print(df2.head())
concat_data = pd.concat([df1, df2], ignore_index=True)
print(concat_data)

Producción:

Uso de Pandas Merge()

Pandas proporciona una sola función, merge(), como punto de entrada para todas las operaciones estándar de combinación de bases de datos entre objetos DataFrame. Hay cuatro formas básicas de manejar la combinación (interior, izquierda, derecha y exterior), según las filas que deban conservar sus datos.

Sintaxis: pandas.merge(izquierda, derecha, cómo)

Parámetros:

  • izquierda – marco de datos (referencia izquierda)
  • derecha – marco de datos (referencia derecha)
  • cómo – {‘izquierda’, ‘derecha’, ‘exterior’, ‘interior’, ‘cruz’}, por defecto ‘interior’

Ejemplo:

Similar a la función concat() es la función merge() donde podemos unir conjuntos de datos con las mismas columnas. En la función de combinación, podemos pasar los conjuntos de datos y usar el modo Unión externa para unir los conjuntos de datos con las mismas columnas que se muestran,

Python3

merge_data = pd.merge(df1, df2, how='outer')
print(merge_data)

Producción:

Publicación traducida automáticamente

Artículo escrito por jssuriyakumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *