En el mundo de la estadística, lo primero que se debe hacer antes de cualquier estimación es crear un conjunto de muestras a partir de todo el conjunto de población. El conjunto de población se puede ver como el árbol completo desde donde se recopilan los datos, mientras que el conjunto de muestra se puede ver como la rama en la que se realiza el estudio real de las observaciones y la estimación. El árbol de población es un conjunto muy grande y hacer el estudio de las observaciones en él puede ser muy agotador, tanto en términos de tiempo como de dinero. Por lo tanto, para reducir la cantidad de tiempo y recursos, se crea un conjunto de muestra a partir del conjunto de población. Proceso de muestreo :
- Identificación del conjunto Población.
- Determinación del tamaño de nuestro conjunto muestral.
- Proporcionar un medio para la base de la selección de muestras del medio Población.
- Selección de muestras del medio utilizando una de las muchas técnicas de muestreo como el muestreo aleatorio simple, sistemático o estratificado.
- Verificar si el conjunto de muestra formado contiene elementos que realmente coinciden con los diferentes atributos del conjunto de población, sin grandes variaciones entre ellos.
- Comprobación de errores o estimaciones inexactas en el conjunto de muestras formadas, que pueden haber ocurrido o no
- El conjunto que obtenemos después de realizar los pasos anteriores en realidad contribuye al conjunto de muestra.
Población
Población es el conjunto de variables, elementos, entidades que se consideran para un estudio estadístico. También se conoce como el conjunto universal del que se extraen las inferencias reales. El conjunto de población consta de todos los atributos de los individuos o elementos bajo consideración, pero hacer estimaciones sobre una población es muy agotador tanto en recursos como en tiempo. Ejemplo: Considere el peso medio de todos los hombres en la Tierra. Esto aquí, se considera una población hipotética porque incluye a todos los hombres que alguna vez han vivido en la tierra, lo que incluye a las personas que existirán en el futuro y también a las personas que vivieron antes que nosotros. Pero surge una anomalía, al hacer tal medición, que no todos los hombres en la bandeja de población son observables (considere hombres, que existirán en el futuro y también hombres, que han vivido antes y no existen en este momento). Además, realizar estadísticas sobre la muestra de la población (si es hipotéticamente posible) requeriría una gran cantidad de tiempo y recursos, lo que también sería exhaustivo e ineficiente. Por lo tanto, lo que se realiza en cambio es tomar un subconjunto de la población disponible y realizar estadísticas sobre ellos e interpolar inferencias sobre toda la población. Sacando un subconjunto, facilita la tarea ya que el tiempo requerido para escudriñar el subconjunto es menor que el tiempo requerido para escudriñar todo el conjunto de Población. Las estadísticas se realizan en el conjunto de muestras para sacar conclusiones sobre toda la bandeja de población. Los cálculos se consideran una conclusión del conjunto de población porque no se mide con los datos reales del conjunto de población y no está libre de errores. Esto es obvio ya que el conjunto de muestra se usa como un marco medio, tiene menos miembros y, por lo tanto, se pierde algo de información. (lo que resulta en errores). Los cálculos se consideran una conclusión del conjunto de población porque no se mide con los datos reales del conjunto de población y no está libre de errores. Esto es obvio ya que el conjunto de muestra se usa como un marco medio, tiene menos miembros y, por lo tanto, se pierde algo de información. (lo que resulta en errores). Los cálculos se consideran una conclusión del conjunto de población porque no se mide con los datos reales del conjunto de población y no está libre de errores. Esto es obvio ya que el conjunto de muestra se usa como un marco medio, tiene menos miembros y, por lo tanto, se pierde algo de información. (lo que resulta en errores).
Marco de muestreo
El marco de muestreo es la base del medio de muestreo. Es una colección de todos los elementos de la muestra tomados en observación. A veces, incluso puede ocurrir que todos los elementos del marco muestral ni siquiera participen en las estadísticas reales. En ese caso, los elementos que formaron parte del estudio se denominan Muestras y los elementos potenciales que pudieron haber estado en el estudio pero no formaron parte del Marco Muestreo.Así, el Marco Muestreo es la lista potencial de elementos sobre los que realizaremos nuestras estadísticas. Crear un buen marco de muestreo es muy esencial porque ayudará a predecir la reacción del resultado de las estadísticas con el conjunto de población. Un marco de muestreo no es solo un conjunto aleatorio de elementos cuidadosamente seleccionados, sino que incluso consta de identificadores que ayudan a identificar todos y cada uno de los elementos del conjunto. Ejemplo:GeeksForGeeks organizó una reunión de todos los Geek Interns de toda la India en Delhi para realizar un estudio estadístico sobre sus actuaciones. GfG envió un correo electrónico de invitación a los 500 pasantes, pero dado que todos los pasantes están dispersos por toda la India, de 500 personas de 200 aparecen en realidad. Y, por lo tanto, GfG tuvo que realizar su estudio solo en 200 estudiantes (Conjunto de muestra). Pero las 300 personas restantes que podrían haber sido los candidatos potenciales en el estudio, pero decidieron no presentarse, forman el marco de muestreo. Métodos y tipos de muestreo :
- Muestreo aleatorio simple
- Muestreo Sistemático
- Muestreo estratificado
Estos son los procesos de muestreo más utilizados y cada uno tiene sus ventajas y desventajas. Veamos cada uno de estos métodos de muestreo en detalle:
- Muestreo aleatorio simple: El muestreo aleatorio simple es la forma más elemental de muestreo. En este método, todos los elementos de las poblaciones se dividen primero en conjuntos aleatorios de igual tamaño. Los conjuntos aleatorios no tienen propiedades definitorias entre ellos, es decir, un conjunto no puede identificarse a partir de otro conjunto en función de algunos identificadores específicos. Por lo tanto, cada elemento tiene la misma propiedad de ser seleccionado. P (de ser seleccionado) = Los métodos básicos para emplear SRS son:
- Elija el conjunto de población
- Identificar la base del Muestreo
- Uso de generadores de sesiones/números aleatorios para seleccionar un elemento de cada conjunto.
- Menos exhaustivo con respecto al tiempo ya que es la forma más elemental de muestreo.
- Muy útil para conjuntos de población con muy pocos elementos.
- SRS se puede emplear en cualquier lugar, en cualquier momento, incluso sin el uso de generadores aleatorios especiales
- No es eficiente para grandes conjuntos de población.
- Causa la mayor cantidad de errores de los tres métodos de muestreo mencionados
- Hay posibilidades de sesgo y luego SRS no podrá proporcionar un resultado correcto
- No proporciona un identificador específico para separar muestras estadísticamente similares
- Muestreo sistemático : el muestreo sistemático también se conoce como un tipo de muestreo probabilístico. Es mucho más preciso que SRS y también el porcentaje de formación de errores estándar es muy bajo pero no libre de errores. En este método, en primer lugar, los elementos de la bandeja de población se organizan en base a un orden o esquema específico conocido propiamente como clasificación. Puede ser de cualquier orden, lo que depende totalmente de la persona que realiza las estadísticas. Primero, los elementos se organizan de forma ascendente, descendente, lexicográfica o cualquier otro método conocido que el evaluador considere adecuado. Aunque el punto de inicio debe ser aleatorio cada vez. Después de organizarse, los elementos de muestra se seleccionan en función de un conjunto o función de intervalo predefinido. Ejemplo: En un conjunto aleatorio de números con elementos que van del 1 al 100. Los elementos se ordenan primero en orden ascendente o descendente. Entonces, digamos que cada cuarto elemento se selecciona para formar parte del marco de muestreo. Este tipo de muestreo se conoce como muestreo sistemático. P (de ser seleccionado) = [depende de la bandeja de población ordenada después de que se haya clasificado] Los métodos básicos para emplear el muestreo aleatorio sistemático son: –
- Elegir sabiamente el conjunto de población
- Verificar si el Muestreo Sistemático será el método eficiente o no.
- En caso afirmativo, entonces Aplicación de un método de clasificación para obtener un par ordenado de elementos de población.
- Elegir una periodicidad para rastrear elementos.
- La precisión es mayor que SRS.
- La probabilidad estándar de error es menor.
- No hay problema para que el sesgo se introduzca durante la creación del marco de muestra.
- No es muy eficiente cuando se trata del tiempo
- La periodicidad en los elementos de la bandeja de población puede llevar a resultados absurdos.
- El muestreo sistemático puede proporcionar el resultado más preciso o uno imposible.
- Muestreo estratificado : el muestreo estratificado es el tipo de método de muestreo más complejo de los tres métodos mencionados anteriormente. Es un método híbrido que se refiere tanto al muestreo aleatorio simple como al muestreo sistemático. Es uno de los tipos de métodos de muestreo más avanzados disponibles, y proporciona resultados casi precisos al probador. En este método, la bandeja de población se divide en subsegmentos también conocidos como estrato (singular). Cada estrato puede tener su propia propiedad única. Después de dividirse en diferentes sustratos, SRS o muestreo sistemático se puede utilizar para crear y seleccionar muestras para realizar estadísticas. Los métodos elementales para el Muestreo Estratificado son:
- Elegir sabiamente la bandeja de población.
- Comprobación de la periodicidad o cualquier otra característica, para que puedan dividirse en diferentes estratos
- Dividir la bandeja de población en subconjuntos y subgrupos sobre la base de la propiedad selectiva.
- Usando SRS o muestreo sistemático de cada estrato individual para formar el marco de la muestra.
- Incluso podemos aplicar diferentes métodos de muestreo a diferentes subconjuntos.
- Proporcione resultados con mediciones de alta precisión.
- Se pueden desear diferentes resultados simplemente cambiando el método de muestreo.
- Este método también compara diferentes estratos cuando se extraen muestras.
- Ineficiente y caro cuando se trata de recursos y dinero.
- Este método fallará solo en casos raros donde haya homogeneidad en los elementos.
Estos tres son los métodos de muestreo ampliamente utilizados que se están realizando en la actualidad. Cada uno de ellos tiene sus propias ventajas y desventajas. Por lo tanto, el método de muestreo debe elegirse sabiamente, porque una elección incorrecta puede conducir a respuestas erróneas.