El alcance del proyecto de ciencia de datos es un tema que a menudo se socava cuando comienza un nuevo proyecto de ciencia de datos. Puede ser un gran error y puede poner en peligro más de lo que cree. Si un gran proyecto falla, puede significar el final de la carrera de un científico de datos calificado. Pero antes de que analicemos el alcance real del proyecto de datos, hay ciertos consejos a continuación que están compuestos para allanar el camino hacia el tema real.
1. Hacer las preguntas correctas
Hacer las preguntas correctas antes de aplicar las técnicas apropiadas es fundamental para hacer el trabajo en ciencia de datos. El enfoque para resolver problemas en ciencia de datos es fundamental. Es un hecho que si eres una persona curiosa, la ciencia de datos es para ti, pero necesitas protegerte de algunas trampas importantes.
La mayoría de las personas comienzan a trabajar en los datos desde el lado equivocado. Toman un conjunto de datos y aplican sus herramientas favoritas. Como resultado, terminas con preguntas limitadas como «Sí» o «No» y argumentos superficiales que carecen de la profundidad del conocimiento y el intelecto, afirmando lo que es visible.
Cuando adquiere datos, debe pensar ampliamente con una estructura de datos para evitar un camino inútil hacia preguntas simples y resultados no sorprendentes. Necesitamos evitar resultados sorprendentes y centrarnos en cuánto conocimiento podemos obtener de un conjunto de datos dado.
2. Priorice el «conocimiento del dominio» sobre las «técnicas correctas»
Incluso como profesional de los datos, uno siempre debe priorizar el conocimiento del dominio sobre las técnicas, sin importar cuán técnicamente viable sea en su profesión como científico de datos. Sin el conocimiento del dominio, los esfuerzos para realizar operaciones de manipulación que realiza en datos que se ajustan a modelos para obtener resultados por las buenas o por las malas son inútiles. La selección de las técnicas correctas debe venir después de la inquisición de las preguntas correctas. Es una mentalidad que es crucial para el éxito de cualquier proyecto de ciencia de datos. Sin embargo, la competencia tanto en el «conocimiento del dominio» como en la «selección de las técnicas correctas» son muy deseables en el mundo de la ciencia de datos, pero ahora sabe qué priorizar.
Como científico de datos, si desea crear información de valor duradero, debemos comprender lo siguiente:
- Necesidades de nuestros compañeros de trabajo.
- La forma que toma el trabajo.
- Estructura de los argumentos que creamos.
- El proceso de eventos después de que “terminamos”.
Para alcanzar los objetivos anteriores, debemos darnos el espacio para contemplar. Debemos tener cuidado con el «por qué» y el «qué» antes de enredarnos en preguntas que comienzan con «cómo». De lo contrario, nuestro precioso tiempo se desperdiciará al tomar las medidas equivocadas.
Una parte desafiante de manejar datos es pensar en la «estructura» en lugar de pensar en el vacío. Los beneficios de tener una estructura sólida nos impiden hacer cosas que se nos pasan por la cabeza. Al mismo tiempo, la estructura nos permite desglosar el problema y estudiar a fondo todas las partes del problema (también conocido como análisis del problema). Hace de este enfoque una fantástica herramienta de análisis de problemas.
El ser humano ha estado utilizando la estructuración desde tiempos inmemoriales para facilitar el pensamiento sobre los problemas. No tenemos que reinventar la rueda. Podemos modificar ideas de otras disciplinas como las ciencias sociales, la composición en inglés, la filosofía y el diseño para que se ajusten a nuestras necesidades y hacer que nuestros datos profesionales funcionen enormemente valiosos.
Crear un alcance para un proyecto de datos
Es el primer paso una vez que comprende el problema que necesita resolución con su experiencia en ciencia de datos. Para encontrar la estructura en un problema, primero tenemos que definir el alcance del problema de datos. Un alcance es un «bosquejo de una historia» que gira en torno a una razón. La razón por la que estamos trabajando, el problema real y nuestras expectativas para el final de la historia.
Cuando estamos trabajando en un proyecto de ciencia de datos, el proyecto en un entorno profesional, es probable que sea una parte integral de una configuración más amplia. Puede haber personas o equipos que se vean afectados por el proyecto o que sean parte de su equipo. Un alcance bien diseñado nos da un control sobre los contornos del problema y facilita la comunicación con las partes interesadas. Hay 4 partes del alcance de un proyecto de datos de la siguiente manera:
- Contexto
- Necesidades (el proyecto está tratando de cumplir)
- Visión (del logro)
- Salir
La finalización del alcance del proyecto de datos conduce a conversaciones en el equipo de ciencia de datos, y las partes interesadas se vuelven mucho más convenientes, y los pensamientos se pueden escribir. Un mnemotécnico conveniente para estos cinco elementos del alcance del problema de datos es CoNVO como en Contexto , Necesidades , Visión y Resultado .
Debe poder mantener una conversación con un profano inteligente, no técnico y un extraño, y él o ella debe poder comprender el concepto del proyecto en un alto nivel. Él o ella debe ser capaz de entender el razonamiento de los logros. En esencia, ninguna historia está completa sin una estructura firme y los alcances de los proyectos de datos no son diferentes. Los cuatro elementos del alcance del proyecto de datos descritos anteriormente tienen aplicaciones para cualquier estructura de la historia, y la narración de datos es bastante similar. Un buen consejo es que si desea dominar los problemas de datos de alcance, practique la narración de historias.
Es crucial anotar el CoNVO. Una vez que llegamos a un escrito aclaratorio que se reduce a unas pocas oraciones simples, podemos obtener datos, aclarar nuestra comprensión y destilar más a algo inteligente y útil. En este asunto, tenga en cuenta que la ciencia de datos es un proceso iterativo.
1. Contexto (Co)
El contexto se refiere al trabajo que realizan las personas con las que estamos trabajando y el trabajo que están realizando. La comunicación es la clave para adquirir el contexto de las personas, y una comprensión profunda de su objetivo a largo plazo es nuestro objetivo principal. El contexto ayuda a establecer pautas para tomar una decisión significativa sobre el proyecto que involucra datos.
El contexto puede ser dinámico durante un proyecto de datos cuando nuevos empleados, socios o supervisores se unen a la organización o la misión de la organización se transforma abruptamente. La articulación adecuada de los objetivos de una organización es una parte vital para ganar contexto.
2. Necesidades (N)
Las «necesidades» son las cosas que se requieren arreglar o comprender para llevar a cabo los objetivos de una organización, ya que cada entidad puede enfrentar desafíos tarde o temprano en su vida útil. El objetivo principal de la ciencia de datos es diseñar pasos para crear conocimiento. Una necesidad que puede ser satisfecha con el poder de los datos es en su esencia pura sobre el conocimiento y el saber hacer. Comprender los mecanismos en el funcionamiento de alguna parte del mundo es lo que proporciona la necesidad.
Cuando establecemos correctamente las necesidades por escrito sobre lo que se puede mejorar con el conocimiento tapando todos los espacios vacíos de nuestro entendimiento, estamos avanzando en la dirección correcta satisfaciendo las “necesidades” de nuestros compañeros de trabajo.
Abarca las enseñanzas obtenidas por una hoja de cálculo, la información obtenida de una herramienta, la información anticipada antes de hacer un gráfico previamente desconocido son todas fuentes de «necesidades».
3. Visión (V)
Cuando se lanza un proyecto de ciencia de datos, el primer paso no es recopilar, recopilar o adquirir datos en absoluto. Por lo tanto, los pasos de procedimiento para realizar transformaciones, probar ideas, etc., también están fuera de discusión. Primero debe visualizar el proyecto y hacer algunas preguntas críticas, como ¿hacia dónde vamos y cómo será alcanzar nuestras metas?
Una Visión en un proyecto de datos nos ayuda a vislumbrar los objetivos obtenidos y la meta final. Este vistazo podría consistir en una maqueta, precisando los resultados esperados y una meta, un esquema de argumento que vamos a plantear, e incluso algunas preguntas para acotar nuestro enfoque en nuestros objetivos.
Llegar a una visión convincente como parte del proceso de alcance depende más de la experiencia. Tiene su base en el hecho de que las ideas que uno extrae de las observaciones previas que tuvo durante su vida.
4. Resultado (O)
Por último, pero no menos importante, antes de ensuciarse las manos con los datos (recopilación), debe considerar este factor del alcance del proyecto de datos. La comprensión de cómo la solución resuena para cambiar o incluso interrumpir la organización como científico de datos.
Haga las siguientes preguntas críticas para un resultado estable.
- ¿Cómo se supone que debe usarse la solución?
- ¿Cómo se integrará la solución en la organización?
- ¿Quién de la organización realizará esta integración?
- ¿Quién va a utilizar esta solución para marcar la diferencia en la organización?
- ¿Cómo se medirá el éxito de la solución?
El resultado es diferente de la visión. La visión se centra en la forma de la obra que se va a producir al final. El resultado es el resultado real o la solución. En otras palabras, lo que sucede cuando terminamos. Es una práctica crítica de la ciencia de datos que adopte las mejores prácticas al darse cuenta del verdadero potencial del alcance de un proyecto de datos. En la misma nota, la comprensión previa de cómo priorizar sus pasos es crucial antes de ensuciarse las manos con datos sucios y tener éxito en cada proyecto de ciencia de datos que emprenda o registre.
Publicación traducida automáticamente
Artículo escrito por Tauqeer_Khurram y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA