Pandas: fusiona dos marcos de datos con diferentes columnas

Pandas admite tres tipos de estructuras de datos. Son Serie, Marco de datos y Panel. Un marco de datos es una estructura de datos bidimensional, aquí los datos se almacenan en un formato tabular que está en filas y columnas. Podemos crear un marco de datos de muchas maneras. 

Aquí estamos creando un marco de datos utilizando una estructura de datos de lista en python.

Python3

# import required module
import pandas
  
# assign data
l=["vignan","it","sravan","subbarao"]
  
# create data frame
df = pandas.DataFrame(l)
  
# display dataframe
df

Producción:

Aquí, en el ejemplo anterior, creamos un marco de datos. Combinemos los dos marcos de datos con diferentes columnas. Es posible unir las diferentes columnas usando el método concat() .

Sintaxis: pandas.concat(objs: Union[Iterable[‘DataFrame’], Mapping[Label, ‘DataFrame’]], axis=’0′, join: str = “’outer’”)

  • DataFrame: Es el nombre del marco de datos.
  • Mapeo: se refiere a mapear las columnas de índice y marco de datos
  • eje: 0 se refiere al eje de la fila y 1 se refiere al eje de la columna.
  • unión: Tipo de unión.

Nota: Si la columna del marco de datos coincide. Luego, los valores vacíos se reemplazan por valores NaN.

Enfoque paso a paso:

  • Abra el cuaderno jupyter
  • Importar módulos necesarios
  • Crear un marco de datos
  • Realizar operaciones
  • Analiza los resultados.

A continuación se muestran algunos ejemplos basados ​​en el enfoque anterior:

Ejemplo 1

En este ejemplo, vamos a concatenar las calificaciones de los estudiantes según las universidades.

Python3

# importing pandas module
import pandas as pd
  
  
# dictionary with list object in 
# values ie college details
details = {
    'Name': ['Sravan', 'Sai', 'Mohan', 'Ishitha'],
    'College': ['Vignan', 'Vignan', 'Vignan', 'Vignan'],
    'Physics': [99, 76, 71, 93],
    'Chemistry': [97, 67, 65, 89],
    'Data Science': [93, 65, 65, 85]
}
  
  
# converting to dataframe using DataFrame()
df = pd.DataFrame(details)
  
  
# print data frame
df

Producción:

Python3

# creating another data
details1 = {
    'Name': ['Harsha', 'Saiteja', 'abhilash', 'harini'],
    'College': ['vvit', 'vvit', 'vvit', 'vvit'],
    'Physics': [69, 76, 51, 43],
    'Chemistry': [67, 67, 55, 89],
    'Maths': [73, 65, 61, 85]
}
  
# create dataframe
df1 = pd.DataFrame(details1)
  
  
# display dataframe
df1

Producción:

Python3

# concat dataframes
pd.concat([df, df1], axis=0, ignore_index=True)

Python3

# concat when axis = 1
pd.concat([df, df1], axis=1, ignore_index=True)

Ejemplo 2:

Almacenamiento de marcas y detalles del asunto

Python3

# Import pandas library
import pandas as pd
  
# initialize list of lists
data = [['sravan', 98.00], ['jyothika', 90.00], ['vijay', 79.34]]
  
# Create the pandas DataFrame
df = pd.DataFrame(data, columns=['Name', 'Marks'])
  
# print dataframe.
df

Producción:

Python3

# initialize list of lists
data1 = [['Haseen', 88.00, 5], ['ramya', 54.00, 5], ['haritha', 56.34, 4]]
  
# Create the pandas DataFrame
df1 = pd.DataFrame(
    data1, columns=['Name', 'Marks', 'Total subjects registered'])
  
# print dataframe.
df1

Producción:

Python3

# concatenating data frame
pd.concat([df, df1], axis=0, ignore_index=True)

Producción:

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *