Tratar con filas y columnas en Pandas DataFrame

Un marco de datos es una estructura de datos bidimensional, es decir, los datos se alinean de forma tabular en filas y columnas. Podemos realizar operaciones básicas en filas/columnas como seleccionar, eliminar, agregar y cambiar el nombre. En este artículo, estamos usando nba.csvfile.

Tratando con columnas

Para manejar las columnas, realizamos operaciones básicas en las columnas como seleccionar, eliminar, agregar y renombrar.

Selección de columnas :
para seleccionar una columna en Pandas DataFrame, podemos acceder a las columnas llamándolas por su nombre de columna.

# Import pandas package
import pandas as pd
  
# Define a dictionary containing employee data
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Age':[27, 24, 22, 32],
        'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
        'Qualification':['Msc', 'MA', 'MCA', 'Phd']}
  
# Convert the dictionary into DataFrame 
df = pd.DataFrame(data)
  
# select two columns
print(df[['Name', 'Qualification']])

Salida:

para obtener más ejemplos, consulte Cómo seleccionar varias columnas en un marco de datos de pandas. Adición de
 
columnas :
para agregar una columna en el marco de datos de Pandas, podemos declarar una nueva lista como una columna y agregarla a un marco de datos existente.

# Import pandas package 
import pandas as pd
  
# Define a dictionary containing Students data
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Height': [5.1, 6.2, 5.1, 5.2],
        'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}
  
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
  
# Declare a list that is to be converted into a column
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']
  
# Using 'Address' as the column name
# and equating it to the list
df['Address'] = address
  
# Observe the result
print(df)

Salida:

para obtener más ejemplos, consulte Agregar una nueva columna a un marco de datos existente en Pandas .
 
Eliminación de columnas :
para eliminar una columna en Pandas DataFrame, podemos usar el drop()método. Las columnas se eliminan soltando columnas con nombres de columna.

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
  
# display
print(data)

Salida:
como se muestra en las imágenes de salida, la nueva salida no tiene las columnas pasadas. Esos valores se eliminaron ya que el eje se estableció igual a 1 y los cambios se realizaron en el marco de datos original ya que en el lugar era Verdadero.

Marco de datos antes de eliminar columnas –

Marco de datos después

de eliminar columnas – Para obtener más ejemplos, consulte Eliminar columnas de DataFrame usando Pandas.drop()

Tratar con filas:

Para manejar las filas, podemos realizar operaciones básicas en las filas, como seleccionar, eliminar, agregar y cambiar el nombre.

Selección de filas :
Pandas proporciona un método único para recuperar filas de un marco de datos. DataFrame.loc[]El método se utiliza para recuperar filas de Pandas DataFrame. Las filas también se pueden seleccionar pasando la ubicación del entero a una función iloc[] .

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
  
  
print(first, "\n\n\n", second)

Salida:
como se muestra en la imagen de salida, se devolvieron dos series ya que solo había un parámetro en ambas ocasiones.

Para obtener más ejemplos, consulte Pandas Extrayendo filas usando .loc []
 
Adición de fila :
para agregar una fila en Pandas DataFrame, podemos combinar el marco de datos anterior con uno nuevo.

# importing pandas module 
import pandas as pd 
    
# making data frame 
df = pd.read_csv("nba.csv", index_col ="Name") 
  
df.head(10)
  
new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
                        'Position':'PG', 'Age':33, 'Height':'6-2',
                        'Weight':189, 'College':'MIT', 'Salary':99999},
                                                            index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

Salida:

Marco de datos antes de agregar una fila –

Marco de datos después de agregar

una fila – Para obtener más ejemplos, consulte Agregar una fila en la parte superior en Pandas DataFrame
 
Eliminación de filas :
para eliminar una fila en Pandas DataFrame, podemos usar el método drop(). Las filas se eliminan soltando Filas por etiqueta de índice.

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
                            "R.J. Hunter"], inplace = True)
  
# display
data

Salida:
como se muestra en las imágenes de salida, la nueva salida no tiene los valores pasados. Esos valores se eliminaron y los cambios se realizaron en el marco de datos original, ya que en el lugar era Verdadero.

Marco de datos antes de eliminar valores –

Marco de datos después

de eliminar valores – Para obtener más ejemplos, consulte Eliminar filas de DataFrame usando Pandas.drop()
 
Problema relacionado con las columnas:

Problema relacionado con Filas:

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *