Prerrequisitos: pandas
pandas
Este artículo se enfoca en obtener filas de marcos de datos de pandas seleccionados entre dos fechas. Podemos hacer esto usando un filtro.
Las fechas se pueden representar inicialmente de varias maneras:
- cuerda
- np.datetime64
- fechahora.fechahora
Para manipular fechas en pandas, usamos la función pd.to_datetime() en pandas para convertir diferentes representaciones de fecha al formato datetime64[ns].
Sintaxis: pandas.to_datetime(arg, errores=’raise’, dayfirst=False, yearfirst=False, utc=Ninguno, box=True, format=Ninguno, exact=True, unit=Ninguno, infer_datetime_format=False, origin=’unix ‘, caché=Falso)
Parámetros:
- arg: un objeto entero, de string, flotante, de lista o dictado para convertirlo en un objeto de fecha y hora.
- dayfirst: valor booleano, coloca el día primero si es verdadero.
- yearfirst: valor booleano, coloca el año primero si es verdadero.
- utc: valor booleano, devuelve el tiempo en UTC si es verdadero.
- formato: Entrada de string para indicar la posición del día, mes y año.
Acercarse
- Módulo de importación
- Crear o cargar datos
- Crear marco de datos
- Convierta la columna de fechas al tipo de datos datetime64[ns]
- Defina una fecha de inicio y una fecha de finalización.
- Utilice un filtro para mostrar el marco de datos actualizado y almacenarlo.
- Mostrar marco de datos
Ejemplo: marco de datos original
Python3
import pandas as pd data = {'Name': ['Tani', 'Saumya', 'Ganesh', 'Kirti'], 'Articles': [5, 3, 4, 3], 'Location': ['Kanpur', 'Kolkata', 'Kolkata', 'Bombay'], 'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']} # Create DataFrame df = pd.DataFrame(data) display(df)
Producción:
Ejemplo: Selección de filas de marcos de datos entre dos filas
Python3
import pandas as pd data = {'Name': ['Tani', 'Saumya', 'Ganesh', 'Kirti'], 'Articles': [5, 3, 4, 3], 'Location': ['Kanpur', 'Kolkata', 'Kolkata', 'Bombay'], 'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']} # Create DataFrame df = pd.DataFrame(data) start_date = '2020-08-05' end_date = '2020-08-08' mask = (df['Dates'] > start_date) & (df['Dates'] <= end_date) df = df.loc[mask] display(df)
Producción:
Publicación traducida automáticamente
Artículo escrito por soumibardhan10 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA