Prerrequisitos: Comprensión básica de los pandas
En este artículo, vamos a ver la diferencia entre Pandas Head, Tail y Sample usando Python
Pandas es una biblioteca de código abierto que está hecha principalmente para trabajar con datos relacionales o etiquetados de manera fácil e intuitiva. Proporciona varias estructuras de datos y operaciones para manipular datos numéricos y series de tiempo. La primera línea de código después de leer el archivo CSV es mostrar los datos de nuestro conjunto de datos dado. Pandas proporciona tres características a través de las cuales puede mostrar conjuntos de datos de muestra. Y tres de estos métodos son Head, Tail y Sample.
Diferente entre cabeza, cola y muestra
Uno debe analizar cómo deben mostrar los datos dados. Por lo general, muchos programadores prefieren elegir head() y verificar las filas iniciales para analizar los datos. Pero a veces puede no ser suficiente. Yo digo usar los tres para analizar los datos.
Muestra
Con el método Muestra, puede mostrar los datos aleatorios de su conjunto de datos. Y hay diferentes formas a través de las cuales puede mostrar los datos de muestra del conjunto de datos.
Ejemplo:
Python
import pandas as pd data = { "Anime": ["One Piece", "Naruto", "Bleach", "Hunter X Hunter", "Attack On Titan", "Gintama", "Code Geass", "Death Note", "Black Lagoon", "Classroom Of Elite", "Cowboy Bepop", "Jujutsu Kaisen", "Blue Period"], "Episodes": [1009, 720, 366, 148, 74, 366, 50, 37, 24, 12, 26, 24, 12], "Year": [1999, 2002, 2004, 2011, 2013, 2006, 2007, 2008, 2006, 2016, 1995, 2020, 2021] } df = pd.DataFrame(data)
Ahora que tenemos nuestros datos, intente ver los datos usando el método de muestra .
Syntax: df.sample() #returns only one row df.sample(n) #returns n number of row
Python3
print(df.sample()) # just one row print(df.sample(6)) # randomly selected 6 row
Producción:
Observe que la muestra devuelve datos aleatorios que no están ordenados.
Cabeza
Como el significado simple en inglés, Head se usa para denotar la parte superior del cuerpo. En Pandas, la cabeza se usa para mostrar los datos ordenados desde la parte superior. Al pasar el argumento vacío, de forma predeterminada, muestra las 5 filas superiores. Al proporcionar el valor ‘n’, incluso puede mostrar n número de datos.
Syntax: df.head() #default=5 Rows df.head(n) #n number of rows
Python3
print(df.head()) # default:5 rows print(df.head(8)) # first 8 ordered rows
Producción:
Cola
La cola es opuesta a la cabeza. Muestra los datos ordenados desde abajo.
Syntax: df.tail() #default 5 number of rows df.tail(n) #n number of rows
Python3
print(df.tail()) # default:5 rows print(df.tail(8)) # last 8 ordered rows
Producción:
Conclusión
La principal diferencia entre la muestra, la cabeza y la cola es: al pasar los argumentos vacíos, la muestra devuelve solo una fila, mientras que la cabeza y la cola devuelven 5 filas. Una muestra devuelve datos desordenados, mientras que cabeza y cola devuelven datos ordenados.