La ciencia de datos es el estudio del análisis de datos mediante tecnología avanzada ( aprendizaje automático , inteligencia artificial , big data). Procesa una gran cantidad de datos estructurados, semiestructurados y no estructurados para extraer el significado de la información, a partir del cual se puede diseñar un patrón que será útil para tomar una decisión para aprovechar la nueva oportunidad comercial, mejorar el producto/servicio y en definitiva, el crecimiento del negocio. Proceso de ciencia de datos para dar sentido a Big data/gran cantidad de datos que se utilizan en los negocios. El flujo de trabajo de la ciencia de datos es el siguiente:
- Determinación del objetivo y el problema del negocio: cuál es el objetivo de la organización, qué nivel quiere alcanzar la organización y qué problema enfrenta la empresa: estos son los factores que se están considerando. Con base en tales factores, se considera qué tipo de datos son relevantes.
- Recopilación de datos relevantes: los datos relevantes se recopilan de varias fuentes.
- Limpieza y filtrado de datos recopilados: se eliminan los datos no relevantes.
- Explore los datos filtrados y limpios: busque cualquier patrón oculto, sincronice los datos, visualícelos en forma de gráfico, tabla, etc. que sea comprensible para una persona sin conocimientos técnicos.
- Crear un modelo mediante el análisis de datos: crear un modelo, validarlo.
- Visualización de hallazgos interpretando datos o creando un modelo para una persona de negocios.
- Ayudar a los empresarios a tomar la decisión y dar el paso al saco del crecimiento empresarial.
Minería de datos: es un proceso de extracción de significado, patrones ocultos de los datos recopilados que son útiles para tomar una decisión comercial con el fin de disminuir los gastos y aumentar los ingresos. Big Data: este es un término relacionado con la extracción de datos significativos mediante el análisis de la gran cantidad de datos complejos y de diversos formatos generados a alta velocidad, que no pueden ser manejados o procesados por el sistema tradicional. Expansión de datos día a día: día a día, la cantidad de datos aumenta exponencialmente debido a las diversas fuentes de producción de datos actuales, como dispositivos electrónicos inteligentes. Según el informe de IDC (International Data Corporation), los nuevos datos creados por cada persona en el mundo por segundo para 2020 serán de 1,7 MB. La cantidad de datos totales en el mundo para 2020 alcanzará alrededor de 44 ZettaBytes (44 billones de GigaBytes) y 175 ZettaBytes para 2025. Se está viendo que el volumen total de datos se duplica cada dos años. El crecimiento del tamaño total de los datos en todo el mundo, año tras año, según el informe de IDC, se muestra a continuación:
Fuente de Big Data:
- Redes sociales: en el mundo de hoy, un buen porcentaje de la población mundial total está comprometida con las redes sociales como Facebook, WhatsApp, Twitter, YouTube, Instagram, etc. Cada actividad en dichos medios, como cargar una foto o video, enviar un mensaje, hacer comentarios , poner like, etc crear datos.
- Un sensor colocado en varios lugares: Sensor colocado en varios lugares de la ciudad que recopila datos sobre temperatura, humedad, etc. Una cámara colocada al lado de la carretera recopila información sobre las condiciones del tráfico y crea datos. Las cámaras de seguridad ubicadas en áreas sensibles como aeropuertos, estaciones de tren y centros comerciales generan una gran cantidad de datos.
- Comentarios de satisfacción del cliente: los comentarios de los clientes sobre el producto o servicio de las distintas empresas en su sitio web crean datos. Por ejemplo, los sitios comerciales minoristas como Amazon, Walmart, Flipkart y Myntra recopilan comentarios de los clientes sobre la calidad de su producto y el tiempo de entrega. Las empresas de telecomunicaciones y otras organizaciones proveedoras de servicios buscan la experiencia del cliente con su servicio. Estos crean una gran cantidad de datos.
- Dispositivo IoT: los dispositivos electrónicos que están conectados a Internet crean datos para su funcionalidad inteligente, por ejemplo, un televisor inteligente, una lavadora inteligente, una cafetera inteligente, un aire acondicionado inteligente, etc. Son datos generados por máquinas que son creados por sensores guardados en varios dispositivos Por ejemplo, una máquina de impresión inteligente está conectada a Internet. Varias máquinas de impresión de este tipo conectadas a una red pueden transferir datos entre sí. Por lo tanto, si alguien carga una copia de un archivo en una máquina de impresión, el sistema almacena el contenido de ese archivo y otra máquina de impresión ubicada en otro edificio o en otro piso puede imprimir esa copia impresa del archivo. Tal transferencia de datos entre varias máquinas de impresión genera datos.
- Comercio electrónico: en las transacciones de comercio electrónico, las transacciones comerciales, la banca y el mercado de valores, muchos registros almacenados se consideran una de las fuentes de big data. Los pagos a través de tarjetas de crédito, tarjetas de débito u otras formas electrónicas, se mantienen registrados como datos.
- Sistema de Posicionamiento Global (GPS): El GPS en el vehículo ayuda a monitorear el movimiento del vehículo para acortar el camino a un destino para reducir el consumo de combustible y tiempo. Este sistema crea una gran cantidad de datos sobre la posición y el movimiento del vehículo.
Publicación traducida automáticamente
Artículo escrito por krishnenduGhorui y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA