Obtenga el resumen estadístico y la naturaleza del DataFrame en R

En este artículo, veremos cómo encontrar las estadísticas del marco de datos dado. Usaremos la función summary() para obtener las estadísticas de cada columna:

Sintaxis: resumen (nombre del marco de datos)

El resultado producido contendrá los siguientes detalles:

  • Valor mínimo: devuelve el valor mínimo de cada columna
  • Valor máximo: devuelve el valor máximo de cada columna
  • Media: devuelve el valor medio de cada columna
  • Mediana: devuelve la mediana de cada columna
  • 1er cuartil: devuelve el 1er cuartil de cada columna
  • 3er cuartil: devuelve el 3er cuartil de cada columna.

Ejemplo 1: en los datos de este ejemplo, habíamos tomado las calificaciones, la altura, el peso y las calificaciones de los estudiantes, por lo que estamos calculando el resumen de esas dos columnas.

R

# create vector with names
name = c("sravan", "mohan", "sudheer", 
         "radha", "vani", "mohan")
  
# create vector with subjects
subjects = c(".net", "Python", "java",
             "dbms", "os", "dbms")
  
# create a vector with marks
marks = c(98, 97, 89, 90, 87, 90)
  
# create vector with height
height = c(5.97, 6.11, 5.89, 5.45, 5.78, 6.0)
  
# create vector with weight
weight = c(67, 65, 78, 65, 81, 76)
  
# pass these vectors to the data frame
data = data.frame(name, subjects,
                  marks, height, weight)
  
# display
print(data)
print("STATISTICAL SUMMARY")
  
# use summary function 
print(summary(data))

Producción:

Ejemplo 2: en este ejemplo, obtenemos un resumen estadístico de columnas individuales

R

# create vector with names
name = c("sravan","mohan","sudheer",
         "radha","vani","mohan")
  
# create vector with subjects
subjects = c(".net","Python","java",
             "dbms","os","dbms")
  
# create a vector with marks
marks=c(98,97,89,90,87,90)
  
# create vector with height
height=c(5.97,6.11,5.89,
         5.45,5.78,6.0)
  
# create vector with weight
weight=c(67,65,78,65,81,76)
  
# pass these vectors to the data frame
data=data.frame(name,subjects,marks,
                height,weight)
  
# display
print(data)
print("STATISTICAL SUMMARY of marks")
  
# use summary function  on marks column
print(summary(data$marks))
print("STATISTICAL SUMMARY of height")
  
  
# use summary function on height column
print(summary(data$height))
print("STATISTICAL SUMMARY of weight")
  
# use summary function on weight column
print(summary(data$weight))

Producción:

Encontrar la naturaleza del marco de datos:

Podemos usar la función class() para obtener la naturaleza del marco de datos.

Volverá:

  • O los datos son NULL o no
  • El tipo de datos de una columna en particular en un marco de datos

Sintaxis: clase (marco de datos $nombre_columna)

Ejemplo:

R

# create vector with names
name = c("sravan","mohan","sudheer",
         "radha","vani","mohan")
  
# create vector with subjects
subjects = c(".net","Python","java",
             "dbms","os","dbms")
  
# create a vector with marks
marks=c(98,97,89,90,87,90)
  
# create vector with height
height=c(5.97,6.11,5.89,
         5.45,5.78,6.0)
  
# create vector with weight
weight=c(67,65,78,65,81,76)
  
# pass these vectors to the data frame
data=data.frame(name,subjects,marks,
                height,weight)
  
# nature of dataframe
print(paste("names column",class(data$names)))
print(paste("subjects column",class(data$subjects)))
print(paste("marks column",class(data$marks)))
print(paste("height column",class(data$height)))
print(paste("weight column",class(data$weight)))

Producción:

Publicación traducida automáticamente

Artículo escrito por pulamolusaimohan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *