Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas proporciona a los analistas de datos una forma de eliminar y filtrar marcos de datos utilizando el .drop()
método. Las filas o columnas se pueden eliminar usando la etiqueta de índice o el nombre de la columna usando este método.
Sintaxis:
DataFrame.drop(etiquetas=Ninguno, eje=0, índice=Ninguno, columnas=Ninguno, nivel=Ninguno, en el lugar=Falso, errores=’subir’)Parámetros:
etiquetas: string o lista de strings que hacen referencia al nombre de fila o columna.
eje: int o valor de string, 0 ‘índice’ para Filas y 1 ‘columnas’ para Columnas.
índice o columnas: etiqueta única o lista. el índice o las columnas son una alternativa al eje y no se pueden usar juntos.
nivel: se utiliza para especificar el nivel en caso de que el marco de datos tenga un índice de nivel múltiple.
inplace: realiza cambios en el marco de datos original si es verdadero.
errores: ignora el error si algún valor de la lista no existe y elimina el resto de los valores cuando los errores = ‘ignorar’Tipo de devolución: marco de datos con valores descartados
Para descargar el CSV utilizado en el código, haga clic aquí.
Ejemplo #1: Descartar filas por etiqueta de índice
En su código, se pasa una lista de etiquetas de índice y las filas correspondientes a esas etiquetas se descartan usando el método .drop().
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv", index_col ="Name" ) # dropping passed values data.drop(["Avery Bradley", "John Holland", "R.J. Hunter", "R.J. Hunter"], inplace = True) # display data
Salida:
como se muestra en las imágenes de salida, la nueva salida no tiene los valores pasados. Esos valores se eliminaron y los cambios se realizaron en el marco de datos original, ya que en el lugar era Verdadero.
Marco de datos antes de descartar valores-
Marco de datos después de descartar valores-
Ejemplo #2: Descartar columnas con nombre de columna
En su código, las columnas Aprobadas se descartan usando nombres de columna. axis
el parámetro se mantiene en 1 ya que 1 se refiere a las columnas.
# importing pandas module import pandas as pd # making data frame from csv file data = pd.read_csv("nba.csv", index_col ="Name" ) # dropping passed columns data.drop(["Team", "Weight"], axis = 1, inplace = True) # display data
Salida:
como se muestra en las imágenes de salida, la nueva salida no tiene las columnas pasadas. Esos valores se eliminaron ya que el eje se estableció igual a 1 y los cambios se realizaron en el marco de datos original ya que en el lugar era Verdadero.
Marco de datos antes de eliminar columnas-
Marco de datos después de eliminar columnas-
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA