Estructuras de datos en programación R

Una estructura de datos es una forma particular de organizar los datos en una computadora para que pueda usarse de manera efectiva. La idea es reducir las complejidades de espacio y tiempo de las diferentes tareas. Las estructuras de datos en la programación R son herramientas para contener múltiples valores. 

Las estructuras de datos base de R a menudo se organizan por su dimensionalidad (1D, 2D o nD) y si son homogéneas (todos los elementos deben ser del mismo tipo) o heterogéneas (los elementos suelen ser de varios tipos). Esto da lugar a los seis tipos de datos que se utilizan con mayor frecuencia en el análisis de datos.

Las estructuras de datos más esenciales utilizadas en R incluyen: 

  • Vectores
  • Liza
  • marcos de datos
  • Arrays
  • arreglos
  • factores

Vectores

Un vector es una colección ordenada de tipos de datos básicos de una longitud determinada. La única clave aquí es que todos los elementos de un vector deben ser del mismo tipo de datos, por ejemplo, estructuras de datos homogéneas. Los vectores son estructuras de datos unidimensionales.

Ejemplo:  

Python3

# R program to illustrate Vector
 
# Vectors(ordered collection of same data type)
X = c(1, 3, 5, 7, 8)
 
# Printing those elements in console
print(X)

Producción: 

[1] 1 3 5 7 8

Liza

Una lista es un objeto genérico que consta de una colección ordenada de objetos. Las listas son estructuras de datos heterogéneas. Estas también son estructuras de datos unidimensionales. Una lista puede ser una lista de vectores, una lista de arrays, una lista de caracteres y una lista de funciones, etc.

Ejemplo:  

Python3

# R program to illustrate a List
 
# The first attributes is a numeric vector
# containing the employee IDs which is
# created using the 'c' command here
empId = c(1, 2, 3, 4)
 
# The second attribute is the employee name
# which is created using this line of code here
# which is the character vector
empName = c("Debi", "Sandeep", "Subham", "Shiba")
 
# The third attribute is the number of employees
# which is a single numeric variable.
numberOfEmp = 4
 
# We can combine all these three different
# data types into a list
# containing the details of employees
# which can be done using a list command
empList = list(empId, empName, numberOfEmp)
 
print(empList)

Producción: 

[[1]]
[1] 1 2 3 4

[[2]]
[1] "Debi"    "Sandeep" "Subham"  "Shiba"  

[[3]]
[1] 4

marcos de datos

Los marcos de datos son objetos de datos genéricos de R que se utilizan para almacenar los datos tabulares. Los marcos de datos son los objetos de datos más populares en la programación R porque nos sentimos cómodos al ver los datos dentro de la forma tabular. Son estructuras de datos bidimensionales y heterogéneas. Estas son listas de vectores de igual longitud. 

Los marcos de datos tienen las siguientes restricciones impuestas sobre ellos: 

  • Un marco de datos debe tener nombres de columna y cada fila debe tener un nombre único.
  • Cada columna debe tener el mismo número de elementos.
  • Cada elemento de una sola columna debe ser del mismo tipo de datos.
  • Diferentes columnas pueden tener diferentes tipos de datos.

Para crear un marco de datos usamos la función data.frame().

Ejemplo:  

Python3

# R program to illustrate dataframe
 
# A vector which is a character vector
Name = c("Amiya", "Raj", "Asish")
 
# A vector which is a character vector
Language = c("R", "Python", "Java")
 
# A vector which is a numeric vector
Age = c(22, 25, 45)
 
# To create dataframe use data.frame command
# and then pass each of the vectors
# we have created as arguments
# to the function data.frame()
df = data.frame(Name, Language, Age)
 
print(df)

Producción: 

   Name Language Age
1 Amiya        R  22
2   Raj   Python  25
3 Asish     Java  45

Arrays

Una array es un arreglo rectangular de números en filas y columnas. En una array, como sabemos, las filas son las que se ejecutan horizontalmente y las columnas son las que se ejecutan verticalmente. Las arrays son estructuras de datos bidimensionales y homogéneas.
Ahora, veamos cómo crear una array en R. Para crear una array en R necesitas usar la función llamada array. Los argumentos de esta array() son el conjunto de elementos del vector. Debe pasar cuántos números de filas y cuántos números de columnas desea tener en su array y este es el punto importante que debe recordar que, de forma predeterminada, las arrays están ordenadas por columnas. 

Ejemplo:  

Python3

# R program to illustrate a matrix
 
A = matrix(
    # Taking sequence of elements
    c(1, 2, 3, 4, 5, 6, 7, 8, 9),
     
    # No of rows and columns
    nrow = 3, ncol = 3, 
 
    # By default matrices are
    # in column-wise order
    # So this parameter decides
    # how to arrange the matrix         
    byrow = TRUE                            
)
 
print(A)

Producción: 

     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9

arreglos

Las arrays son los objetos de datos R que almacenan los datos en más de dos dimensiones. Los arreglos son estructuras de datos n-dimensionales. Por ejemplo, si creamos una array de dimensiones (2, 3, 3), crea 3 arrays rectangulares, cada una con 2 filas y 3 columnas. Son estructuras de datos homogéneas.

Ahora, veamos cómo crear arreglos en R. Para crear un arreglo en R necesitas usar la función llamada array(). Los argumentos de este array() son el conjunto de elementos en vectores y tienes que pasar un vector que contenga las dimensiones del array. 

Ejemplo:  

Python3

# R program to illustrate an array
 
A = array(
    # Taking sequence of elements
    c(1, 2, 3, 4, 5, 6, 7, 8),
 
    # Creating two rectangular matrices
    # each with two rows and two columns
    dim = c(2, 2, 2)                       
)
 
print(A)

Producción: 

, , 1

     [,1] [,2]
[1,]    1    3
[2,]    2    4

, , 2

     [,1] [,2]
[1,]    5    7
[2,]    6    8

factores

Los factores son los objetos de datos que se utilizan para categorizar los datos y almacenarlos como niveles. Son útiles para almacenar datos categóricos. Pueden almacenar tanto strings como enteros. Son útiles para categorizar valores únicos en columnas como «VERDADERO» o «FALSO», o «MASCULINO» o «MUJER», etc. Son útiles en el análisis de datos para el modelado estadístico.

Ahora, veamos cómo crear factores en R. Para crear un factor en R necesitas usar la función llamada factor(). El argumento de este factor() es el vector. 

Ejemplo:  

Python3

# R program to illustrate factors
 
# Creating factor using factor()
fac = factor(c("Male", "Female", "Male",
               "Male", "Female", "Male", "Female"))
 
print(fac)

Producción: 

[1] Male   Female Male   Male   Female Male   Female
Levels: Female Male

Publicación traducida automáticamente

Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *