En este artículo, discutiremos cómo trazar una función de distribución acumulativa (CDF) en el lenguaje de programación R.
La función de distribución acumulativa (CDF) de una variable aleatoria evaluada en x, es la probabilidad de que x tome un valor menor o igual que x. Para calcular la función de distribución acumulativa en el lenguaje R, usamos la función ecdf(). La función ecdf() en lenguaje R se utiliza para calcular y trazar el valor de la función de distribución acumulativa empírica de un vector numérico. La función ecdf() toma el vector de datos como argumento y devuelve los datos CDF.
Sintaxis: ecdf( vector_datos )
Parámetro:
- data_vector: determina el vector que contiene datos para el cálculo de CDF.
Trazar la función de distribución acumulada en base R
Para trazar una función CDF en base R, primero calculamos la CDF usando la función ecdf(). Luego usamos la función plot() para trazar el gráfico CDF en el lenguaje R. La función plot toma el resultado de la función ecdf() como argumento para trazar el gráfico CDF.
Sintaxis: trama (CDF)
Parámetro:
- CDF: determina la función de distribución acumulativa calculada mediante la función ecdf().
Ejemplo 1: Función de distribución acumulativa en base R
Este es un ejemplo de un gráfico de función de distribución acumulativa básico en el lenguaje R.
R
# create sample data sample_Data = rnorm(500) # calculate CDF CDF <- ecdf(sample_Data ) # draw the cdf plot plot( CDF )
Producción:
Ejemplo 2: función de distribución acumulativa en base R usando un conjunto de datos de iris
R
head(iris) plot(ecdf(iris$Petal.Length))
Producción:
Trazar CDF de distribución conocida
Para trazar la función de distribución acumulativa de una distribución estándar en un rango conocido específico, usamos la función curve() en el lenguaje R. La función curve() dibuja una curva correspondiente a una función sobre el intervalo. Toma una expresión como argumento que en este caso será pnorm junto con los límites desde y hasta y devuelve un gráfico CDF normal.
Sintaxis: curve( expresión, desde, hasta )
Parámetros:
- expresión: determina la función de expresión para el cálculo de CDF.
- from: determina el límite inferior de datos.
- a: determina el límite superior de datos.
Ejemplo:
Este es un ejemplo de un gráfico CDF normal.
R
# plot normal CDF plot curve(pnorm, from = -10, to = 10)
Producción:
Trazar CDF de distribución conocida usando el paquete ggplot2
Para dibujar el mismo gráfico en la biblioteca del paquete ggplot2, usamos la función stat_function(). La función stat_function toma la función de expresión como un argumento divertido y convierte la curva de acuerdo con esa expresión en un gráfico ggplot2 básico.
Sintaxis: plot + stat_function(fun)
Parámetros:
- diversión: determina la función para la forma de la trama.
Ejemplo:
Aquí hay un ejemplo de un diagrama CDF normal usando ggplot2.
R
# load library ggplot2 library(ggplot2) # create sample dataframe for upper and lower limit sample_limit<- data.frame(x = c(-10, 10)) # draw CDF Plot ggplot(sample_limit, aes(x = x)) + stat_function(fun = pnorm)
Producción:
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA