Título del proyecto: recomendación de anuncios de YouTube
Idea :
una aplicación B2B, para segmentar videos de YouTube en función del contenido, para optimizar la tasa de conversión de anuncios.
Lo que tenemos : las
personas (como SocialBlade ) actualmente hacen esto principalmente mediante la extracción de metadatos (como título, idioma, vistas actuales, fecha de publicación) y retroceden para generar vistas futuras.
Lo que propongo :
la parte más importante de una publicación de YouTube es el contenido (video) en sí. Desafortunadamente, esto no está en uso debido a la falta de poder de cómputo. Sin embargo, la idea es generar un conjunto de datos utilizando la tecnología de visión artificial y aplicar métodos de conjunto en el conjunto de datos generado para generar información útil como la demografía del público objetivo, el género, la región y, finalmente, la predicción de popularidad (siendo esta la parte más importante).
Cosas que necesitaremos :
- GPU (recomendado: Nvidia GTX 980)
- Lista de enlaces a videos de YouTube (así es, no necesitamos descargar el conjunto de datos M)
- Internet de alta velocidad
Conceptos :
Esta idea se puede dividir en dos partes:
- Generación de conjuntos de datos
- Modelado y predicción
En la primera parte, escribimos un script para obtener instancias de video en el entorno de Python y extraemos toda la información útil de él. Esto se puede hacer por –
import pafy import vlc url = "https://www.youtube.com / watch?v = dZ0fwJojhrs" video = pafy.new(url)
Una vez que obtengamos el video, podemos usar uno en cada pocos cuadros y ejecutar la detección de objetos sobre él (esto se puede hacer con bibliotecas de código abierto como OpenCV). Puedes verlo en acción aquí .
Luego votamos, tomamos los objetos más relevantes y completamos una tabla. Después de ejecutar un video completo, su entrada en la tabla se verá así:
Por supuesto, también podemos incluir metadatos en nuestro conjunto de datos final. Nuestra variable objetivo será el número de reacciones y el número de visualizaciones. También podemos agrupar el conjunto de datos para facilitar los anuncios.
En la siguiente parte, usamos bibliotecas de aprendizaje automático estándar, como LightGBM/XGBoost, para generar predicciones.
Conclusión :
YouTube se ha convertido en el mayor poseedor de contenido. Los principales ingresos son los anuncios y la industria publicitaria garantizará la colocación de anuncios personalizados en el contenido para mejorar la tasa de conversión. Si la empresa de publicidad sabe qué video tiene el potencial de ser popular, colocará anuncios que no se pueden omitir desde el principio. Esto también evitará que veamos anuncios irrelevantes. Por ejemplo, si está viendo un video relacionado con el acondicionamiento físico, verá un anuncio de batidos de proteínas y no de Zomato.
Nota: esta idea de proyecto es una contribución de Mohit Sinha para ProGeek Cup 2.0: una competencia de proyectos de GeeksforGeeks.
Publicación traducida automáticamente
Artículo escrito por mohit.sinha y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA