Prerrequisitos: Minería de datos
Cuando hablamos de minería de datos, generalmente hablamos de descubrimiento de conocimiento a partir de datos. Para conocer los datos, es necesario analizar los objetos de datos, los atributos de datos y los tipos de atributos de datos. La minería de datos incluye saber acerca de los datos, encontrar relaciones entre los datos. Y para esto, necesitamos discutir los atributos y objetos de datos.
Los objetos de datos son la parte esencial de una base de datos. Un objeto de datos representa la entidad. Los objetos de datos son como un grupo de atributos de una entidad. Por ejemplo, un objeto de datos de ventas puede representar clientes, ventas o compras. Cuando un objeto de datos se enumera en una base de datos, se denominan tuplas de datos.
Atributo:
puede verse como un campo de datos que representa las características o funciones de un objeto de datos. Para un cliente, los atributos del objeto pueden ser la identificación del cliente, la dirección, etc. Podemos decir que un conjunto de atributos utilizados para describir un objeto determinado se conocen como vector de atributos o vector de características.
Tipo de atributos:
Este es el primer paso del preprocesamiento de datos . Diferenciamos entre diferentes tipos de atributos y luego preprocesamos los datos. Así que aquí está la descripción de los tipos de atributos.
- Cualitativo (Nominal (N), Ordinal (O), Binario (B)).
- Cuantitativo (Numérico, Discreto, Continuo)
Atributos cualitativos:
1. Atributos Nominales – relacionados con los nombres: Los valores de un atributo Nominal son nombres de cosas, algún tipo de símbolos. Los valores de los atributos nominales representan alguna categoría o estado y es por eso que el atributo nominal también se conoce como atributos categóricos y no hay orden (rango, posición) entre los valores del atributo nominal.
Ejemplo :
2. Atributos binarios: los datos binarios tienen solo 2 valores/estados. Por ejemplo, sí o no, afectado o no afectado, verdadero o falso.
- Simétrico: Ambos valores son igualmente importantes (Género).
- Asimétrico: Ambos valores no son igualmente importantes (Resultado).
3. Atributos ordinales: los atributos ordinales contienen valores que tienen una secuencia significativa o una clasificación (orden) entre ellos, pero la magnitud entre los valores en realidad no se conoce, el orden de los valores muestra lo que es importante pero no indica qué importancia tiene. es.
Atributos cuantitativos:
1. Numérico: Un atributo numérico es cuantitativo porque es una cantidad medible, representada en valores enteros o reales. Los atributos numéricos son de 2 tipos, intervalo y proporción .
- Un atributo escalado por intervalos tiene valores, cuyas diferencias son interpretables, pero los atributos numéricos no tienen el punto de referencia correcto, o podemos llamar puntos cero. Los datos se pueden sumar y restar en una escala de intervalo, pero no se pueden multiplicar ni dividir. Considere un ejemplo de temperatura en grados centígrados. Si la temperatura de un día de un día es el doble de la del otro día, no podemos decir que un día es el doble de caliente que otro día.
- Un atributo de escala proporcional es un atributo numérico con un punto cero fijo. Si una medida tiene una escala de razón, podemos decir que un valor es un múltiplo (o razón) de otro valor. Los valores están ordenados, y también podemos calcular la diferencia entre los valores, y se puede dar el resumen de la media, la mediana, la moda, el rango de cuantiles y cinco números.
2. Discreto: los datos discretos tienen valores finitos, pueden ser numéricos y también pueden estar en forma categórica. Estos atributos tienen un conjunto finito o contablemente infinito de valores.
Ejemplo:
3. Continuo : Los datos continuos tienen un número infinito de estados. Los datos continuos son de tipo flotante. Puede haber muchos valores entre 2 y 3.
Ejemplo :
Publicación traducida automáticamente
Artículo escrito por Mohityadav y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA