data.table vs data.frame en Programación R

data.table en R es una versión mejorada de data.frame. Debido a su velocidad de ejecución y la menor cantidad de código para escribir, se hizo popular en R. El propósito de data.table es crear datos tabulares como un marco de datos, pero la sintaxis varía. En el siguiente ejemplo, podemos ver la sintaxis de la tabla de datos:

R

DataTable = data.table(name = c("a", "b", "c", "d"),
                       id = (7, 0, 3, 4))
DataTable

En el ejemplo anterior, usamos la función data.table() y luego usamos la función llamada c() que significa concatenación que se usa para imprimir datos como una serie y los nombres serán de tipo string, así que usamos ” ” e id como un tipo entero, por lo que no es necesario especificarlo entre comillas.

data.frame en R es similar a la tabla de datos que se usa para crear datos tabulares, pero la tabla de datos proporciona muchas más funciones que el marco de datos, por lo que, en general, todos prefieren data.table en lugar de data.frame . Pero el marco de datos también es mejor para usar y ahora veamos la sintaxis a continuación para el marco de datos. Similar a la sintaxis de data.table, data.frame también es obviamente la misma aquí, en lugar de data.table() usamos la función data.frame().

R

# student id
stuid = c(2, 5, 3, 4, 6, 7, 4, 2, 0)  
  
# student age
age = c(23, 45, 67, 23, 41, 43, 54, 67, 89) 
  
# sex of the student
sex = c(1, 1, 0, 0, 0, 1, 0, 1, 1)  
  
# student info
stuinfo = data.frame(empidno, age, sex, status) 
  
stuinfo

El ejemplo anterior nos da los datos de los estudiantes en forma tabular. Si observamos aquí, el código para la tabla de datos es menor que el código para el marco de datos y, por lo tanto, la tabla de datos tarda menos en compilarse y proporciona una salida más rápida, por lo que hace que la tabla de datos se use ampliamente.

Tabla de diferencias

tabla de datos

marco de datos

Sintaxis: data.table() Sintaxis: data.frame()

data.table es una forma reescrita de data.frame en c (o) optimizado

data.table hereda de data.frame.

data.frame es la clase base en R y es la predeterminada en R.

data.table se utiliza para estructuras de datos más complejas y para 

grandes datos

data.frame se usa para construir pequeñas tablas y arrays, etc.
data.table es mucho más rápido que una chispa en muchos casos. data.frame es 20 veces más lento que data.table

Las funciones integradas, como las uniones rodantes, el rango superpuesto 

hace que los usuarios resuelvan la amplia gama de problemas.

data.frame carece de estas características, pero es bueno para principiantes.

Código eficiente (podemos escribir menos número de líneas de 

código en data.table)

Necesitamos escribir algunas líneas más de código en comparación 

a data.table

Para convertir data.table a data.frame usamos: setDF(dt) donde
DF = marco de datos y dt = tabla de datos.
Para convertir data.frame a data.table usamos: setDT(df) donde
DT = tabla de datos y df = marco de datos.
data.table es ampliamente utilizado debido a sus características avanzadas,
velocidad y memoria.
data.frame también se usa pero no mucho de data.table y
es muy bueno para principiantes.

Publicación traducida automáticamente

Artículo escrito por subhashkarthik1505 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *