¿Cómo filtrar las filas del marco de datos según la fecha en Pandas? – Part 1

Al filtrar las filas de un DataFrame por fecha, se seleccionan todas las filas que cumplen las restricciones de fecha especificadas, en función de una columna que contiene datos de fecha. Por ejemplo, seleccionar todas las filas entre el 13 de marzo de 2020 y el 31 de diciembre de 2020 devolvería todas las filas con valores de fecha en ese rango.

Use DataFrame.loc() con la sintaxis de indexación [condición] para seleccionar solo las filas de DataFrame que cumplen la condición. Defina la condición para verificar si la columna de fecha en DataFrame está dentro de las restricciones. Creará una array booleana para todas las filas. Solo se imprimirán las filas que tengan un valor verdadero.

Consulte los siguientes ejemplos. Descarga el marco de datos desde aquí .

 Acercarse:

  • Convierta la columna de datos en formato de fecha compatible con python
  • Filtrar las filas en función de la fecha
  • Acceda a las filas usando la función .loc() y guárdelas en el marco de datos.

Ejemplo 1:

Python3

# import pandas library
import pandas as pd
  
# load csv file
df = pd.read_csv(
    "C:\\Users\\Rohan\\OneDrive\\Desktop\\GFG\\netflix_titles.csv")
  
# convert date column into date format
df['date_added'] = pd.to_datetime(df['date_added'])
  
# filter rows on the basis of date
newdf = (df['date_added'] > '01-03-2020') & (df['date_added'] <= '31-12-2020')
  
# locate rows and access them using .loc() function
newdf = df.loc[newdf]
  
# print dataframe
print(newdf)

Producción:

Se imprimirán todas las películas entre la fecha 13 de marzo de 2020 y el 31 de diciembre de 2020.

Ejemplo 2:

Python3

# import pandas library
import pandas as pd
  
# load csv file
df = pd.read_csv(
    "C:\\Users\\Rohan\\OneDrive\\Desktop\\GFG\\netflix_titles.csv")
  
# convert date column into date format
df['date_added'] = pd.to_datetime(df['date_added'])
  
# filter rows on the basis of date
newdf = (df['date_added'] > '01-01-2019') & (df['date_added'] <= '31-12-2019')
  
# locate rows and access them using .loc() function
newdf = df.loc[newdf]
  
# print dataframe
print(newdf)

Producción:

La salida anterior imprime todas las películas agregadas en Netflix en el año 2019.

Publicación traducida automáticamente

Artículo escrito por rohanchopra96 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *