Seleccione las filas del marco de datos de Pandas entre dos fechas

Prerrequisitos: pandas

pandas

Este artículo se enfoca en obtener filas de marcos de datos de pandas seleccionados entre dos fechas. Podemos hacer esto usando un filtro.

Las fechas se pueden representar inicialmente de varias maneras:

  • cuerda
  • np.datetime64
  • fechahora.fechahora

Para manipular fechas en pandas, usamos la función pd.to_datetime() en pandas para convertir diferentes representaciones de fecha al formato datetime64[ns].

Sintaxis: pandas.to_datetime(arg, errores=’raise’, dayfirst=False, yearfirst=False, utc=Ninguno, box=True, format=Ninguno, exact=True, unit=Ninguno, infer_datetime_format=False, origin=’unix ‘, caché=Falso)

Parámetros:

  • arg: un objeto entero, de string, flotante, de lista o dictado para convertirlo en un objeto de fecha y hora.
  • dayfirst: valor booleano, coloca el día primero si es verdadero.
  • yearfirst: valor booleano, coloca el año primero si es verdadero.
  • utc: valor booleano, devuelve el tiempo en UTC si es verdadero.
  • formato: Entrada de string para indicar la posición del día, mes y año.

Acercarse

  • Módulo de importación
  • Crear o cargar datos
  • Crear marco de datos
  • Convierta la columna de fechas al tipo de datos datetime64[ns]
  • Defina una fecha de inicio y una fecha de finalización.
  • Utilice un filtro para mostrar el marco de datos actualizado y almacenarlo.
  • Mostrar marco de datos

Ejemplo: marco de datos original

Python3

import pandas as pd
data = {'Name': ['Tani', 'Saumya',
                 'Ganesh', 'Kirti'],
  
        'Articles': [5, 3, 4, 3],
  
        'Location': ['Kanpur', 'Kolkata',
                     'Kolkata', 'Bombay'],
        'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']}
  
# Create DataFrame
df = pd.DataFrame(data)
display(df)

Producción:

Ejemplo: Selección de filas de marcos de datos entre dos filas

Python3

import pandas as pd
data = {'Name': ['Tani', 'Saumya',
                 'Ganesh', 'Kirti'],
  
        'Articles': [5, 3, 4, 3],
  
        'Location': ['Kanpur', 'Kolkata',
                     'Kolkata', 'Bombay'],
        'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']}
  
# Create DataFrame
df = pd.DataFrame(data)
start_date = '2020-08-05'
end_date = '2020-08-08'
mask = (df['Dates'] > start_date) & (df['Dates'] <= end_date)
  
df = df.loc[mask]
display(df)

Producción:

Publicación traducida automáticamente

Artículo escrito por soumibardhan10 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *