Proyecto de Pipeline de Respuesta a Catástrofes
Introducción
Como estudiante del Programa Nanodegree de Data Scientist de Udemy, tengo la tarea de resolver el Proyecto Disaster Response Pipeline y publicar los resultados.
Este proyecto pretende revolucionar la respuesta ante catástrofes mediante el desarrollo de un sistema inteligente que categorice y dirija rápidamente los mensajes entrantes a las agencias de ayuda apropiadas. Utilizando PNL y aprendizaje automático avanzados, proporciona una clasificación multicategoría instantánea a través de una interfaz web fácil de usar, lo que permite una asignación de recursos rápida y eficiente. El objetivo es mejorar significativamente la eficacia de la gestión de catástrofes y, en última instancia, salvar más vidas y minimizar el impacto de las crisis mediante estrategias de respuesta basadas en datos.
Este proyecto aplica conocimientos de ingeniería de datos para analizar los datos de catástrofes de Appen y construir un modelo para una API que clasifique los mensajes de catástrofes. Los componentes principales incluyen:
- ETL Pipeline: Procesa y limpia los datos de los mensajes de catástrofe y los almacena en una base de datos SQLite.
- Canalización ML: Desarrolla un modelo de aprendizaje automático para clasificar los mensajes de catástrofe.
- Aplicación web Flask: Proporciona una interfaz para que los trabajadores de emergencias introduzcan nuevos mensajes y reciban los resultados de la clasificación.
Características principales:
- Clasificación en tiempo real de mensajes de catástrofes
- Visualización de los datos de respuesta a la catástrofe
- Utiliza PNL y técnicas de aprendizaje automático
El proyecto presenta:
- Desarrollo de canalizaciones de datos
- Creación de modelos de aprendizaje automático
- Despliegue de la aplicación web
- Estructura de código limpia y organizada
El cuaderno y el código fuente están disponibles aquí:
