Diferencia entre loc() e iloc() en Pandas DataFrame

La biblioteca de Python de Pandas es muy útil para la manipulación de datos matemáticos y se usa ampliamente en el campo del aprendizaje automático. Se compone de muchos métodos para su correcto funcionamiento. loc()y iloc()son uno de esos métodos. Estos se utilizan en el corte de datos de Pandas DataFrame. Ayudan en la selección conveniente de datos del DataFrame. Se utilizan para filtrar los datos de acuerdo con algunas condiciones. El funcionamiento de ambos métodos se explica en el conjunto de datos de muestra de automóviles.

# importing the module
import pandas as pd
   
# creating a sample dataframe
data = pd.DataFrame({'Brand' : ['Maruti', 'Hyundai', 'Tata',
                                'Mahindra', 'Maruti', 'Hyundai',
                                'Renault', 'Tata', 'Maruti'],
                     'Year' : [2012, 2014, 2011, 2015, 2012, 
                               2016, 2014, 2018, 2019],
                     'Kms Driven' : [50000, 30000, 60000, 
                                     25000, 10000, 46000, 
                                     31000, 15000, 12000],
                     'City' : ['Gurgaon', 'Delhi', 'Mumbai', 
                               'Delhi', 'Mumbai', 'Delhi', 
                               'Mumbai','Chennai',  'Ghaziabad'],
                     'Mileage' :  [28, 27, 25, 26, 28, 
                                   29, 24, 21, 24]})
   
# displaying the DataFrame
display(data)

Producción :

loc() : loc()es un método de selección de datos basado en etiquetas, lo que significa que tenemos que pasar el nombre de la fila o columna que queremos seleccionar. Este método incluye el último elemento del rango pasado, a diferencia de iloc(). loc()puede aceptar los datos booleanos a diferencia de iloc(). Muchas operaciones se pueden realizar usando el loc()método como-

1. Selección de datos según algunas condiciones:

# selecting cars with brand 'Maruti' and Mileage > 25
display(data.loc[(data.Brand == 'Maruti') & (data.Mileage > 25)])

Producción :

2. Seleccionar un rango de filas del DataFrame:

# selecting range of rows from 2 to 5
display(data.loc[2 : 5])

Producción :

3. Actualizar el valor de cualquier columna:

# updating values of Mileage if Year < 2015
data.loc[(data.Year < 2015), ['Mileage']] = 22
display(data)

Producción :

iloc() :iloc() es un método de selección basado en índices, lo que significa que tenemos que pasar un índice entero en el método para seleccionar una fila/columna específica. Este método no incluye el último elemento del rango pasado a diferencia de loc(). iloc()no acepta los datos booleanos a diferencia de loc(). Las operaciones que se realizan usando iloc()son:

1. Seleccionando filas usando índices enteros:

# selecting 0th, 2th, 4th, and 7th index rows
display(data.iloc[[0, 2, 4, 7]])

Producción :

2. Seleccionando un rango de columnas y filas simultáneamente:

# selecting rows from 1 to 4 and columns from 2 to 4
display(data.iloc[1 : 5, 2 : 5])

Producción :

Publicación traducida automáticamente

Artículo escrito por vipul1501 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *