Diferencia entre la cabeza, la cola y la muestra de los pandas

Prerrequisitos: Comprensión básica de los pandas

En este artículo, vamos a ver la diferencia entre Pandas Head, Tail y Sample usando Python

Pandas es una biblioteca de código abierto que está hecha principalmente para trabajar con datos relacionales o etiquetados de manera fácil e intuitiva. Proporciona varias estructuras de datos y operaciones para manipular datos numéricos y series de tiempo. La primera línea de código después de leer el archivo CSV es mostrar los datos de nuestro conjunto de datos dado. Pandas proporciona tres características a través de las cuales puede mostrar conjuntos de datos de muestra. Y tres de estos métodos son Head, Tail y Sample. 

Diferente entre cabeza, cola y muestra

Uno debe analizar cómo deben mostrar los datos dados. Por lo general, muchos programadores prefieren elegir head() y verificar las filas iniciales para analizar los datos. Pero a veces puede no ser suficiente. Yo digo usar los tres para analizar los datos. 

Muestra

Con el método Muestra, puede mostrar los datos aleatorios de su conjunto de datos. Y hay diferentes formas a través de las cuales puede mostrar los datos de muestra del conjunto de datos. 

Ejemplo:

Python

import pandas as pd
  
data = {
    "Anime": ["One Piece", "Naruto", "Bleach",
              "Hunter X Hunter", "Attack On Titan",
              "Gintama", "Code Geass", "Death Note",
              "Black Lagoon", "Classroom Of Elite",
              "Cowboy Bepop", "Jujutsu Kaisen",
              "Blue Period"],
    "Episodes": [1009, 720, 366, 148, 74, 366,
                 50, 37, 24, 12, 26, 24, 12],
    "Year": [1999, 2002, 2004, 2011, 2013, 2006,
             2007, 2008, 2006, 2016, 1995,
             2020, 2021]
}
df = pd.DataFrame(data)

Ahora que tenemos nuestros datos, intente ver los datos usando el método de muestra .

Syntax: 
df.sample() #returns only one row 
df.sample(n) #returns n number of row 

Python3

print(df.sample())  # just one row
print(df.sample(6))  # randomly selected 6 row

Producción:

Observe que la muestra devuelve datos aleatorios que no están ordenados. 

Cabeza

Como el significado simple en inglés, Head se usa para denotar la parte superior del cuerpo. En Pandas, la cabeza se usa para mostrar los datos ordenados desde la parte superior. Al pasar el argumento vacío, de forma predeterminada, muestra las 5 filas superiores. Al proporcionar el valor ‘n’, incluso puede mostrar n número de datos. 

Syntax: 
df.head() #default=5 Rows 
df.head(n) #n number of rows  

Python3

print(df.head())  # default:5 rows
print(df.head(8))  # first 8 ordered rows

Producción:

Cola

La cola es opuesta a la cabeza. Muestra los datos ordenados desde abajo. 

Syntax: 
df.tail() #default 5 number of rows 
df.tail(n) #n number of rows

Python3

print(df.tail())  # default:5 rows
print(df.tail(8))  # last 8 ordered rows

Producción:

Conclusión

La principal diferencia entre la muestra, la cabeza y la cola es: al pasar los argumentos vacíos, la muestra devuelve solo una fila, mientras que la cabeza y la cola devuelven 5 filas. Una muestra devuelve datos desordenados, mientras que cabeza y cola devuelven datos ordenados. 

Publicación traducida automáticamente

Artículo escrito por jaintarun y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *