Es habitual que en las operaciones de manipulación de datos, dado que los datos provienen de diferentes fuentes, puede ser necesario unir dos conjuntos de datos en uno. En este artículo, analicemos cómo unir conjuntos de datos con las mismas columnas en python.
Usando Pandas concat()
Python tiene un paquete llamado pandas que proporciona una función llamada concat que nos ayuda a unir dos conjuntos de datos como uno solo.
Sintaxis:
pandas.concat(objs, axis=0, join=’outer’, ignore_index=False, keys=Ninguna)
Parámetros:
- objs -secuencia de objetos Series o DataFrame
- eje – 0 – índice’, 1 – columnas
- unir – interno, predeterminado – externo
- ignore_index – booleano, predeterminado Falso. Si es verdadero, el marco de datos no debe contener un índice
Los conjuntos de datos utilizados para la demostración se pueden descargar aquí data_1 y data_2 .
Ejemplo:
Aquí, hemos hecho que ignore_index sea False, lo que significa que la función concat ignorará el índice original de los conjuntos de datos individuales y creará un nuevo índice.
Python3
import pandas as pd # read the datasets df1 = pd.read_csv(r"your_path/data_1.csv") df2 = pd.read_csv(r"your_path/data_2.csv") # print the datasets print(df1.head()) print(df2.head()) concat_data = pd.concat([df1, df2], ignore_index=True) print(concat_data)
Producción:
Uso de Pandas Merge()
Pandas proporciona una sola función, merge(), como punto de entrada para todas las operaciones estándar de combinación de bases de datos entre objetos DataFrame. Hay cuatro formas básicas de manejar la combinación (interior, izquierda, derecha y exterior), según las filas que deban conservar sus datos.
Sintaxis: pandas.merge(izquierda, derecha, cómo)
Parámetros:
- izquierda – marco de datos (referencia izquierda)
- derecha – marco de datos (referencia derecha)
- cómo – {‘izquierda’, ‘derecha’, ‘exterior’, ‘interior’, ‘cruz’}, por defecto ‘interior’
Ejemplo:
Similar a la función concat() es la función merge() donde podemos unir conjuntos de datos con las mismas columnas. En la función de combinación, podemos pasar los conjuntos de datos y usar el modo Unión externa para unir los conjuntos de datos con las mismas columnas que se muestran,
Python3
merge_data = pd.merge(df1, df2, how='outer') print(merge_data)
Producción:
Publicación traducida automáticamente
Artículo escrito por jssuriyakumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA