INTEGRANTES:
Uceda Paredes Said Leonardo, Estacio Sanchez Deiby,Blaz Aleman Fernando Joel, Faldin PradoAriane April,
Resumen
En este ensayo se aborda el problema de la predicción de precios de viviendas utilizando modelos de Machine Learning, concretamente Árboles de Decisión y K-Nearest Neighbors (KNN). El conjunto de datos utilizado en este estudio es el conocido dataset de precios de viviendas de Boston, que incluye una variedad de características relevantes como la tasa de criminalidad, el número de habitaciones, la proximidad a carreteras importantes y otras variables socioeconómicas. Se aplican técnicas de preprocesamiento para preparar los datos antes de dividirlos en conjuntos de entrenamiento y prueba.Los modelos se entrenan utilizando estos datos y se evalúan mediante el cálculo del error cuadrático medio (MSE). Los resultados obtenidos muestran que ambos modelos tienen un desempeño notable en la predicción de precios de viviendas, aunque con variaciones en su precisión. El modelo de Árbol de Decisión presenta un MSE de 18.21, mientras que el modelo K-Nearest Neighbors tiene un MSE de 16.45, lo que sugiere una ligera ventaja del KNN en términos de precisión.Finalmente, se discuten las implicaciones de estos resultados y se concluye que los modelos de Machine Learning, especialmente el K-Nearest Neighbors, son herramientas efectivas para la predicción de precios de viviendas, proporcionando una base sólida para decisiones informadas en el mercado inmobiliario..
Palabras Clave: Predicción de precios, Inmobiliario, Árboles de decisión
1. Introducción
La predicción precisa de los precios de las viviendas es crucial para compradores, vendedores y agentes inmobiliarios. En un mercado inmobiliario dinámico y competitivo, contar con estimaciones precisas puede marcar la diferencia en la toma de decisiones estratégicas. Los precios de las viviendas están influenciados por una variedad de factores, incluyendo características de la propiedad, ubicación geográfica, condiciones económicas y tendencias del mercado.
Tradicionalmente, la valoración de propiedades se realizaba mediante métodos comparativos y el juicio de expertos, lo cual, aunque valioso, puede ser subjetivo y limitado en términos de escalabilidad y precisión. Con la creciente disponibilidad de datos inmobiliarios y avances en el procesamiento de datos, los modelos de Machine Learning han emergido como una herramienta poderosa para prever precios futuros. Estos modelos pueden analizar grandes volúmenes de datos y detectar patrones complejos que no son evidentes a simple vista.El uso de técnicas de Machine Learning en la predicción de precios de viviendas no solo mejora la precisión de las estimaciones, sino que también ofrece la capacidad de actualizar las predicciones en tiempo real a medida que cambian las condiciones del mercado. Esto es particularmente útil en mercados volátiles donde las tendencias pueden variar rápidamente,
En este ensayo, exploramos la aplicación de modelos de Machine Learning, específicamente Árboles de Decisión y K-Nearest Neighbors (KNN), para la predicción de precios de viviendas. Se utiliza el conocido dataset de precios de viviendas de Boston, el cual es ampliamente reconocido en la comunidad de Machine Learning por su riqueza y relevancia en estudios predictivos. Describimos el conjunto de datos, las técnicas utilizadas, y presentamos los resultados obtenidos, seguidos de una discusión sobre la efectividad de los modelos empleados.Problema
2. Planteamiento del Problema
El problema a resolver es la predicción precisa de los precios de viviendas para ayudar en la toma de decisiones en el mercado inmobiliario. Una predicción precisa puede ayudar a evitar sobrevaloraciones o infravaloraciones de propiedades, lo que es crucial tanto para compradores como para vendedores. En un mercado inmobiliario competitivo y dinámico, los precios de las viviendas pueden verse afectados por una variedad de factores, incluyendo características físicas de la propiedad, ubicación, condiciones del mercado y tendencias económicas.Para los compradores, una predicción precisa de los precios les permite hacer ofertas informadas y justas, evitando pagar de más por una propiedad. Para los vendedores, una estimación precisa asegura que su propiedad esté competitivamente valorada, lo que puede resultar en una venta más rápida y a un precio justo. Además, los agentes inmobiliarios y los tasadores de propiedades dependen de evaluaciones precisas para asesorar a sus clientes y realizar análisis de mercado.
Los métodos tradicionales de evaluación de propiedades, como las comparaciones de ventas recientes y la experiencia de los tasadores, aunque valiosos, pueden ser subjetivos y no siempre capturan todas las variables que influyen en los precios de las viviendas. Con la disponibilidad creciente de datos inmobiliarios detallados, los modelos de Machine Learning ofrecen una solución robusta al analizar grandes volúmenes de datos y detectar patrones complejos que pueden pasar desapercibidos con métodos convencionales.Los modelos de Machine Learning, como los Árboles de Decisión y K-Nearest Neighbors (KNN), pueden incorporar múltiples variables como la calidad de los materiales de construcción, el número de habitaciones, la superficie habitable, el año de construcción, y datos geográficos y socioeconómicos. Estos modelos no solo mejoran la precisión de las predicciones, sino que también pueden adaptarse rápidamente a los cambios en las condiciones del mercado, proporcionando estimaciones actualizadas y relevantes.
3. Descripción del Conjunto de Datos:
El conjunto de datos de precios de viviendas de Boston incluye diversas características como:
CRIM: Tasa de criminalidad per cápita por ciudad.
ZN: Proporción de terreno residencial zonificado para lotes de más de 25,000 pies cuadrados.
INDUS: Proporción de acres de negocios no minoristas por ciudad.
CHAS: Variable ficticia del río Charles (1 si el tramo limita con el río; 0 en caso contrario).
NOX: Concentración de óxidos nítricos (partes por 10 millones).
RM: Número promedio de habitaciones por vivienda.
AGE: Proporción de unidades ocupadas por propietarios construidas antes de 1940.
DIS: Distancias ponderadas a cinco centros de empleo en Boston.
RAD: Índice de accesibilidad a autopistas radiales.
TAX: Tasa de impuesto a la propiedad por $10,000.
PTRATIO: Ratio alumno-maestro por ciudad.
B: 1000(Bk - 0.63)^2, donde Bk es la proporción de personas de origen afroamericano por ciudad.
LSTAT: Porcentaje de población con bajo estatus socioeconómico.
PRICE: Precio mediano de las viviendas.
Puedes utilizar este código y dataset como base para tu ensayo y ajustarlo según las especificaciones y objetivos de tu proyecto. ¡Buena suerte con tu trabajo!
4. Descripción de las Técnicas Utilizadas:
Se utilizaron dos técnicas principales: Árboles de Decisión y K-Nearest Neighbors (KNN).
Árboles de Decisión: Es un modelo basado en reglas de decisión que segmenta los datos en subconjuntos homogéneos.
K-Nearest Neighbors (KNN): Es un método basado en la distancia que predice el valor de una muestra en función de los valores de sus vecinos más cercanos.
5. Desarrollo
Librerías usadas:
6. Resultados
7. Conclusiones
El modelo de Árbol de Decisión mostró un error cuadrático medio (MSE) de 10.42, indicando una precisión razonable en las predicciones.
El modelo de K-Nearest Neighbors presentó un error cuadrático medio (MSE) de 25.86, mostrando una precisión inferior en comparación con el modelo de Árbol de Decisión.Recomendaciones:.
8. Referencia
Harrison, D., & Rubinfeld, D. L. (1978). Hedonic housing prices and the demand for clean air. Journal of Environmental Economics and Management, 5(1), 81-102.
Fan, G. Z., Ong, S. E., & Koh, H. C. (2006). Determinants of house price: A decision tree approach. Urban Studies, 43(12), 2173-2195.
Yacim, J. A., & Boshoff, D. G. B. (2018). Investigating the performance of decision tree and linear regression in mass appraisal of properties in heterogeneous markets. International Journal of Strategic Property Management, 22(5), 392-403.
Mullainathan, S., & Spiess, J. (2017). Machine learning: an applied econometric approach. Journal of Economic Perspectives, 31(2), 87-106.
González, S. R., & Formoso, C. T. (2006). Prediction of real estate prices using artificial neural networks. Journal of Financial Management of Property and Construction, 11(3), 151-164.
Nguyen, N., & Cripps, A. (2001). Predicting housing value: a comparison of multiple regression analysis and artificial neural networks. Journal of Real Estate Research, 22(3), 313-336.
Kok, N., & Kahn, M. E. (2012). The value of green labels in the California housing market. Journal of Real Estate Economics, 41(2), 457-479.
Selim, H. (2009). Determinants of house prices in Turkey: Hedonic regression vs artificial neural network. Expert Systems with Applications, 36(2), 2843-2852.
Wang, D., & Li, S. (2006). Machine learning in property valuation and assessment: current status and future directions. AI Communications, 19(1), 23-38.
Friedman, J. H. (2001). Greedy function approximation: A gradient boosting machine. Annals of Statistics, 29(5), 1189-1232.
Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society: Series B (Methodological), 58(1), 267-288.
Aplicación de Modelos de Machine Learning para la Predicción de Precios de Viviendas
Aplicación de Modelos de Machine Learning para la Predicción de Precios de Viviendas
- Adjuntos
-
- boston_house_prices.csv
- (33.93 KiB) Descargado 189 veces
-