La biblioteca pandas en python proporciona un conjunto estándar de herramientas de series temporales y algoritmos de datos. De esta manera, podemos trabajar eficientemente con series de tiempo muy grandes y cortar y dividir, agregar y volver a muestrear fácilmente series de tiempo irregulares y de frecuencia fija.
Los datos de series temporales son una forma importante de datos estructurados que se utilizan en finanzas, economía, ecología, etc. Todo lo que se observa o mide en muchos puntos en el tiempo forma una serie temporal.
- Marcas de tiempo: Estos son los instantes específicos en el tiempo
- Período fijo: Esto representará como el mes de mayo 25 o el año completo 1999.
Módulos en DateTime
- fecha: Este módulo se utiliza para almacenar el calendario en el formato de año, mes, fecha.
- time: este módulo se utiliza para obtener y mostrar la hora en formato de horas, minutos, segundos y microsegundos.
- datetime: este módulo se utiliza para almacenar tanto la fecha como la hora.
- timedelta: este módulo se utiliza para obtener la diferencia entre dos valores de fecha y hora.
A continuación se muestran varios ejemplos que muestran cómo utilizar series temporales en la biblioteca de pandas:
Ejemplo 1: Muestra la fecha y hora actuales. En este programa, vamos a mostrar la fecha y la hora actuales.
Python3
# import datetime module # for getting date and time from datetime import datetime # command to display # current date and time datetime.now()
Producción:
Ejemplo 2: Programa para mostrar hora, minutos, segundos, mes, año, día individualmente desde el módulo.
Python3
# import module from datetime import datetime # display all attributes a=datetime.now() print(a.year) print(a.day) print(a.month) print(a.hour) print(a.minute) print(a.second) print(a.microsecond) print(a.date)
Producción:
Ejemplo 3: Diferencia entre dos fechas. Podemos obtener horas, días y minutos de diferencia usando el módulo timedelta.
Python3
# importing time delta module from datetime import timedelta # subtracting date from year 2027 to 2021 deltaresult = datetime(2027, 5, 7) - datetime(2021, 6, 24) # display the result print(deltaresult) # to get days print(deltaresult.days) # to get seconds difference print(deltaresult.seconds)
Producción:
Si queremos generar datos de series temporales, Python admitirá el módulo date_range . Esto generará fechas dentro de la frecuencia dada. Está disponible en el módulo pandas.
Sintaxis: pandas.date_range(inicio=Ninguno, final=Ninguno, períodos=Ninguno, frecuencia=Ninguno)
Parámetros:
- inicio: fecha de inicio hora desde la fecha de inicio.
- fin: especifique la hora de la fecha de finalización.
- freq: representa una frecuencia como horas, minutos o segundos.
Ejemplo 4: en este programa, podemos comenzar con el 1 de enero de 2021 y mostrar las fechas hasta marzo usando el método date_range.
Python3
# importing pandas module import pandas as pd # using date_range function to generate # dates from january 1 2021 to # march 16 2021 as periods = 75 dates = pd.date_range('1/1/2021', periods=75) print(dates)
Producción:
Generación de valores para las fechas correspondientes mediante el uso de series temporales como índices.
Ejemplo 5: En este programa, damos valores a las fechas estableciendo fechas como índices para cada valor.
Python3
# importing pandas module import pandas as pd # importing numpy module for generating values import numpy as np # using date_range function to generate dates # from january 1 2021 to march 16 2021 as periods = 75 dates = pd.date_range('1/1/2021', periods=75) # giving values to dates results = pd.Series(np.arange(75), index=dates) # print results print(results) # converting to data frame print(pd.DataFrame(results))
Producción:
Podemos convertir columnas de string de datos al tipo de fecha y hora utilizando el siguiente método.
Sintaxis:
pandas.to_datetime(nombre_columna)
Ejemplo 6: en este programa, convertiremos datos de string en tipo de fecha y hora.
Python3
# importing pandas module for data frame import pandas as pd # creating data frame for different customers # in a shop with respect to dates data = pd.DataFrame({'dates': ['1/2/2021', '2/4/2020', '1/3/2021', '4/12/2017'], 'customers': [100, 30, 56, 56]}) # display original data data # converting dates column to date # using pandas.to_datetime function data['dates'] = pd.to_datetime(data['dates']) # data after conversion data
Producción:
Ejemplo 7: En este programa, vamos a tomar algunos datos de series temporales como índice, convertirlos y verificar si son iguales o no.
Python3
# importing pandas module for data frame import pandas as pd # creating data frame for different customers # in a shop with respect to dates data = pd.DataFrame({'dates': ['1/2/2021', '2/4/2020', '1/3/2021', '4/12/2017', '1/2/2021', '2/4/2020', '1/3/2021'], 'customers': [100, 30, 56, 56, 23, 45, 67]}) # display original data data # converting dates column to date # using pandas.to_datetime function data['dates'] = pd.to_datetime(data['dates']) # after conversion data # finding unique time series data print(data['dates'].nunique()) # counting each series data data['dates'].value_counts()
Producción:
Ejemplo 8: Programa para mostrar un histograma de un marco de datos que tiene objetos DateTime.
Python3
# importing pandas module for data frame import pandas as pd # creating data frame for different customers # in a shop with respect to dates data = pd.DataFrame({'dates': ['1/2/2021', '2/4/2020', '1/3/2021', '4/12/2017', '1/2/2021', '2/4/2020', '1/3/2021'], 'customers': [100, 30, 56, 56, 23, 45, 67]}) # display original data data # converting dates column to date # using pandas.to_datetime function data['dates'] = pd.to_datetime(data['dates']) # depict visualization data['dates'].hist(figsize=(10, 5), color="green")
Producción:
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA