Array vs marco de datos en R

Una estructura de datos es una forma particular de organizar los datos en una computadora para que pueda usarse de manera efectiva. La idea es reducir las complejidades de espacio y tiempo de las diferentes tareas.
Las dos estructuras de datos más importantes en R son Matrix y Dataframe, se ven iguales pero de naturaleza diferente. 
 

Array en R –

Es una colección homogénea de conjuntos de datos que se organizan en una organización rectangular de dos dimensiones. Es una array am * n con un tipo de datos similar. Se crea utilizando una entrada vectorial. Tiene un número fijo de filas y columnas. Puede realizar muchas operaciones aritméticas en la array R como: suma, resta, multiplicación y división.
Ejemplo: 

Python

# Matrix of two rows
# and three columns
# boolean value by row is true.
# passed as 4th parameter
A = matrix (c(11, 22, 33, 44, 55, 66),
            nrow = 2, ncol = 3, byrow = 1)
 
# Printing Matrix
print(A)

Producción:  

     [, 1] [, 2] [, 3]
[1, ]   11   22   33
[2, ]   44   55   66

Aplicación y uso  

  • Tiene un gran uso en Economía para calcular algunos datos como el PIB (Producción interna bruta) o PI (Precio ingreso per cápita). 
     
  • También es útil en el estudio de circuitos eléctricos y electrónicos. 
     
  • Las arrays se utilizan en el estudio de encuestas, es decir, trazado de gráficos, etc. 
     
  • Útil en probabilidad y estadística.

Marcos de datos en R –

Se utiliza para almacenar tablas de datos. Puede contener varios tipos de datos en varias columnas llamadas campos. Es una lista de vectores de igual longitud. Es una forma generalizada de una array. Es como una tabla en hojas de Excel. Tiene nombres de columna y fila. El nombre de las filas es único sin columnas vacías. Los datos almacenados deben ser de tipo numérico, carácter o factor. Los marcos de datos son heterogéneos. 
Ejemplo: 

Python

# creating company data frame
comp.data <- data.frame(
 
# company ids
# data members
comp_id = c (1:3),
 
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
 
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)

Producción : 

R-Dataframe-01

Aplicación y uso 

  • Los marcos de datos pueden hacer muchos trabajos, como fórmulas de estadísticas de ajuste. 
     
  • Procesamiento de datos (No es posible con Matrix, la primera conversión a Data Frame es obligatoria). 
     
  • La transposición es posible, es decir, cambiar filas a columnas y viceversa, lo cual es útil en Data Science. 
     
Marcos de datos Matrix v/s en R
Array Marco de datos
Colección de conjuntos de datos dispuestos en una organización rectangular bidimensional. Almacena tablas de datos que contienen varios tipos de datos en varias columnas llamadas campos.
Es una array m * n con un tipo de datos similar. Es una lista de vectores de igual longitud. Es una forma generalizada de array.
Tiene un número fijo de filas y columnas. Tiene un número variable de filas y columnas.
Los datos almacenados en columnas solo pueden ser del mismo tipo de datos. Los datos almacenados deben ser de tipo numérico, carácter o factor.
La array es homogénea. DataFrames es heterogéneo.

Publicación traducida automáticamente

Artículo escrito por shivamraj74 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *