Respondiendo Preguntas sobre El Precio de la Vivienda con Técnicas Avanzadas de Regresión

Como estudiante del Programa Nanodegree de Científicos de Datos de Udemy, tengo la tarea de escribir una entrada de blog y un kernel siguiendo el proceso CRISP-DM. En mi entrada de blog, voy a adoptar un nuevo enfoque mediante la adhesión al proceso CRISP-DM para abordar tres cuestiones fundamentales que se plantean a menudo en los mercados de la vivienda, utilizando el conjunto de datos Ames como un estudio de caso.

La competición Kaggle House Prices - Advanced Regression Techniques es un campo de juego fantástico para los científicos de datos en ciernes como yo. Nos reta a predecir los precios de la vivienda en Ames, Iowa, aprovechando 79 variables predictoras mediante modelos de aprendizaje automático. Este conjunto de datos bien analizados ha recibido más de 20.000 propuestas, lo que lo convierte en un recurso excelente para desarrollar y mostrar nuestras habilidades.

Objetivos

En la entrada de mi blog, adoptaré un nuevo enfoque siguiendo el proceso CRISP-DM para abordar tres cuestiones fundamentales que se plantean a menudo en los mercados de la vivienda, utilizando el conjunto de datos de Ames como estudio de caso.

¿Cuáles son las principales horquillas de precios de la vivienda?

Identificar los principales rangos de precios de las viviendas en el conjunto de datos. Es esencial identificar los rangos de precios específicos que abarcan la mayoría de las viviendas y su distribución. Esta información ayudará a segmentar el mercado de la vivienda y a adaptar el análisis a los rangos de precios más relevantes.

¿En qué zonas se pueden localizar estos rangos de precios?

Determinar las zonas o barrios donde se concentran estos rangos de precios. Identificar las zonas geográficas o los barrios asociados a los distintos rangos de precios es crucial. Puedo descubrir patrones

¿Qué variables predicen mejor el rango de precios de cada vivienda?

Identificar las variables clave que mejor predicen el rango de precios de cada vivienda. Determinar las variables más influyentes que predicen con exactitud el rango de precios de cada vivienda.

Siguiendo el proceso CRISP-DM, analizaré y preprocesaré sistemáticamente los datos, construiré modelos predictivos y presentaré las conclusiones en una entrada de blog y un cuaderno exhaustivos. Este proyecto me permitirá mostrar mis habilidades, incluida la exploración de datos, la ingeniería de características, la selección de modelos y la interpretación de resultados.

El cuaderno y el código fuente están disponibles aquí: https://github.com/anibalsanchez/answering-house-prices-questions-based-on-advanced-regression-techniques

 

Aníbal Sánchez - Perdido y Encontrado en la Computación

Aníbal Sánchez

Versatile Software Engineer | Full-Stack Developer (PHP, Laravel, Java, Spring, Vue.js/Vite) | Data Science Enthusiast | Open Source Contributor | Tech Entrepreneur

Bio

  • PHP-Prefixer / Product Manager
  • PHP-Prefixer is an automated online service powered by a complex rule-based system to apply prefixes to Composer dependencies.
  • Extly Tech / Team Leader
  • Empower your project with our web solutions. Today, working on Laravel, Amazon AWS, and Ionic. A Joomla Volunteer.

Follow @anibalsanchez


Aikido Manual Aetaiki - Aikikai


Red Astur de Bloggers

Jonatan Weber - Consultor de Marketing Automatizado