En este artículo, discutiremos cómo barajar un marco de datos por filas en el lenguaje de programación R.
Barajar significa reordenar o reorganizar los datos. Podemos barajar las filas en el marco de datos usando la función sample() . Al proporcionar indexación al marco de datos, la tarea requerida se puede lograr fácilmente.
Sintaxis:
marco de datos [muestra (1: nrow (marco de datos)),]
Dónde.
- dataframe es el dataframe de entrada
- La función sample() se usa para barajar las filas que toma un parámetro con una función llamada nrow() con un operador de división para barajar todas las filas.
- Se demanda nrow() para obtener todas las filas tomando el parámetro de entrada como un marco de datos
Ejemplo: programa R para crear un marco de datos con 3 columnas y 6 filas y barajar el marco de datos por filas
R
# create a dataframe of students with id,name and marks data=data.frame(id=c(1,2,3,4,5,6), name=c("sravan","bobby","ojaswi","gnanesh", "rohith","satwik"), marks=c(89,90,98,78,98,78)) # display dataframe print(data) print("_______________________________________________________") # shuffle the dataframe by rows shuffled_data= data[sample(1:nrow(data)), ] # display print(shuffled_data)
Producción:
Ejemplo: programa R para crear un marco de datos de estudiante con 2 columnas y 3 filas
R
# create a dataframe of students with id,name data = data.frame(id=c(1, 2, 3), name=c( "sravan", "bobby", "ojaswi")) # display dataframe print(data) print("_______________________________________________________") # shuffle the dataframe by rows shuffled_data = data[sample(1:nrow(data)), ] # display print(shuffled_data)
Producción:
Publicación traducida automáticamente
Artículo escrito por gottumukkalabobby y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA