Creando un marco de datos de la serie Pandas

La serie es un tipo de lista en pandas que puede tomar valores enteros, valores de string, valores dobles y más. Pero en Pandas Series devolvemos un objeto en forma de lista, con un índice que comienza de 0 a n , donde n es la longitud de los valores en serie. Más adelante en … Continue reading «Creando un marco de datos de la serie Pandas»

Resalte las columnas específicas de Pandas DataFrame usando applymap()

Veamos cómo resaltar elementos y columnas específicas de un Pandas DataFrame. Podemos hacer esto usando la applymap()función de la clase Styler. Styler.applymap()  Sintaxis: Styler.applymap(self, func, subset = None, **kwargs) Parámetros: func : toma un escalar y devuelve un escalar. subconjunto: indexador válido para limitar los datos antes de aplicar la función. **kwargs: pasar dictamen a … Continue reading «Resalte las columnas específicas de Pandas DataFrame usando applymap()»

Agrupación de variables categóricas en Pandas Dataframe

En primer lugar, tenemos que entender qué son las variables categóricas en pandas. Los categóricos son los tipos de datos disponibles en la biblioteca pandas de python. Una variable categórica toma solo una categoría fija (generalmente un número fijo) de valores. Algunos ejemplos de variables categóricas son el género, el grupo sanguíneo, el idioma, etc. … Continue reading «Agrupación de variables categóricas en Pandas Dataframe»

Indexación y selección de datos con Pandas

Indexación en Pandas: La indexación en pandas significa simplemente seleccionar filas y columnas particulares de datos de un DataFrame. Indexar podría significar seleccionar todas las filas y algunas de las columnas, algunas de las filas y todas las columnas, o algunas de cada una de las filas y columnas. La indexación también se conoce como … Continue reading «Indexación y selección de datos con Pandas»

Formas de aplicar LEFT, RIGHT, MID en Pandas

Muchas veces necesitamos extraer caracteres específicos presentes dentro de una string en el marco de datos de Pandas. Para resolver este problema, tenemos el concepto de Izquierda, Derecha y Medio en pandas. Ejemplo 1: extraer caracteres de la izquierda Python3 # importing pandas library import pandas as pd    # creating and initializing a list  … Continue reading «Formas de aplicar LEFT, RIGHT, MID en Pandas»

Combinando múltiples columnas en Pandas groupby con diccionario

Veamos cómo combinar múltiples columnas en Pandas usando groupby un diccionario con la ayuda de diferentes ejemplos. Ejemplo 1: # importing pandas as pd  import pandas as pd     # Creating a dictionary  d = {‘id’:[‘1’, ‘2’, ‘3’],      ‘Column 1.1’:[14, 15, 16],      ‘Column 1.2’:[10, 10, 10],      ‘Column 1.3’:[1, 4, 5],      ‘Column 2.1’:[1, 2, 3],      ‘Column … Continue reading «Combinando múltiples columnas en Pandas groupby con diccionario»

Seleccione la primera o la última N filas en un marco de datos usando el método head() y tail() en Python-Pandas

Analicemos cómo seleccionar el número N superior o inferior de filas de un marco de datos usando los métodos head() y tail(). 1) Seleccione las primeras N filas de un marco de datos utilizando el head()método de Pandas DataFrame: El método Pandas head()se usa para devolver las n primeras (5 por defecto) filas de un … Continue reading «Seleccione la primera o la última N filas en un marco de datos usando el método head() y tail() en Python-Pandas»

Cargue la string JSON en Pandas DataFrame

Veamos cómo podemos usar un conjunto de datos en formato JSON en nuestro Pandas DataFrame. Esto se puede hacer usando la read_json()función incorporada. Nos permite leer el JSON en un Pandas DataFrame. Ejemplo: considere el archivo JSON path_to_json.json: ruta_a_json.json # importing the module import pandas    # reading the file data = df.read_json(«path_to_json.json»)    # … Continue reading «Cargue la string JSON en Pandas DataFrame»

¿Cómo soltar filas con valores NaN en Pandas DataFrame?

NaN significa Not A Number y es una de las formas comunes de representar el valor que falta en los datos. Es un valor de punto flotante especial y no se puede convertir a ningún otro tipo que no sea flotante. El valor de NaN es uno de los principales problemas en el análisis de … Continue reading «¿Cómo soltar filas con valores NaN en Pandas DataFrame?»

Contraer varias columnas en Pandas

Mientras operamos marcos de datos en Pandas, podemos encontrar una situación para colapsar las columnas. Deje que se acumulen datos de varias columnas o se colapsen en función de algún otro requisito. Veamos cómo colapsar varias columnas en Pandas. Se deben seguir los siguientes pasos para colapsar varias columnas en Pandas: Paso #1: Cargue numpy … Continue reading «Contraer varias columnas en Pandas»