¿Reemplazar NaN con una string en blanco o vacía en Pandas?

En este artículo, discutiremos cómo reemplazar NaN con una string en blanco o vacía en Pandas. Creación de marco de datos con valor NaN para demostración Para esto, crearemos un dataframe usando el objeto pandas dataframe(). Python3 # import pandas module import pandas as pd    # import numpy module import numpy as np    … Continue reading «¿Reemplazar NaN con una string en blanco o vacía en Pandas?»

Muestreo Estratificado en Pandas

El Muestreo Estratificado es una técnica de muestreo utilizada para obtener muestras que mejor representen a la población. Reduce el sesgo en la selección de muestras al dividir la población en subgrupos homogéneos llamados estratos y muestrear aleatoriamente los datos de cada estrato (forma singular de estratos).  En estadística, el muestreo estratificado se utiliza cuando … Continue reading «Muestreo Estratificado en Pandas»

Gestión de datos en Python

Data Wrangling es el proceso de recopilación, recopilación y transformación de datos sin procesar en otro formato para una mejor comprensión, toma de decisiones, acceso y análisis en menos tiempo. Data Wrangling también se conoce como Data Munging. Importancia de la disputa de datos La disputa de datos es un paso muy importante. El siguiente … Continue reading «Gestión de datos en Python»

Obtenga una lista de los valores de una columna en particular de un Pandas DataFrame

En este artículo, veremos cómo obtener todos los valores de una columna en un marco de datos de pandas en forma de lista. Esto puede ser muy útil en muchas situaciones, supongamos que tenemos que sacar notas de todos los alumnos de una materia en particular, sacar números de teléfono de todos los empleados, etc. … Continue reading «Obtenga una lista de los valores de una columna en particular de un Pandas DataFrame»

¿Cómo extraer datos de tiempo de una columna de archivo de Excel usando Pandas?

Requisito previo: expresiones regulares en Python En estos artículos, discutiremos cómo extraer datos de tiempo de una columna de archivo de Excel usando Pandas. Supongamos que nuestro archivo de Excel se parece a la imagen dada a continuación, entonces tenemos que extraer el Tiempo de la columna de la hoja de Excel y almacenarlo en … Continue reading «¿Cómo extraer datos de tiempo de una columna de archivo de Excel usando Pandas?»

Python | Pandas Timestamp.to_julian_date

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos. La función Pandas Timestamp.to_julian_date()convierte la marca de tiempo dada en una fecha juliana. El valor para la … Continue reading «Python | Pandas Timestamp.to_julian_date»

Cómo obtener filas/nombres de índice en el marco de datos de Pandas

Al analizar los conjuntos de datos reales, que a menudo tienen un tamaño muy grande, es posible que necesitemos obtener las filas o los nombres de los índices para realizar ciertas operaciones. Analicemos cómo obtener nombres de fila en el marco de datos de Pandas . Primero, vamos a crear un marco de datos simple … Continue reading «Cómo obtener filas/nombres de índice en el marco de datos de Pandas»

función pandas.isna() en Python

Este método se utiliza para detectar valores faltantes para un objeto similar a una array. Esta función toma un objeto escalar o similar a una array e indica si faltan valores («NaN» en arrays numéricas, «Ninguno» o «NaN» en arrays de objetos, «NaT» en tipo de fecha y hora). Sintaxis: pandas.isna(obj) Argumento : obj: escalar … Continue reading «función pandas.isna() en Python»

Obtenga minutos de la marca de tiempo en Pandas-Python

Pandas es una biblioteca de código abierto creada para el lenguaje Python. Ofrece varias estructuras de datos y operaciones para manipular datos numéricos y series temporales. Aquí, usemos algunos métodos proporcionados por pandas para extraer el valor de los minutos de una marca de tiempo. Método 1: uso del atributo pandas.Timestamp.minute . Este atributo de … Continue reading «Obtenga minutos de la marca de tiempo en Pandas-Python»

¿Cómo encontrar y soltar columnas duplicadas en un marco de datos de Pandas?

Analicemos cómo encontrar y soltar columnas duplicadas en un marco de datos de Pandas. Primero, creemos un marco de datos simple con los nombres de columna ‘Nombre’, ‘Edad’, ‘Domicilio’ y ‘Marcas’. # Import pandas library  import pandas as pd    # List of Tuples students = [             (‘Ankit’, 34, ‘Uttar pradesh’, 34),             (‘Riti’, 30, ‘Delhi’, … Continue reading «¿Cómo encontrar y soltar columnas duplicadas en un marco de datos de Pandas?»