Excelente articulo !Gracias por compartirlo!
Si one esta buscando algoritmos que hacen gradient boosting, recomiendo esta libraria: https://catboost.ai/
Nos ha dado buenos modelos. Maneja data categorica tanto como la continua muy bien. Muestra la importancia de cada variable en las predicciones. Es efficiente.
Hay otras librerias que tambien son muy buenas por supuesto (LightGBM, XGBoost, etc.)
Se encontraron 3 coincidencias
- 13 May 2024, 09:40
- Foros: BI & Data Sciences
- Tema: Aprendizaje conjunto o Ensemble Learning
- Respuestas: 2
- Vistas: 170811
- 13 May 2024, 09:22
- Foros: BI & Data Sciences
- Tema: Python for Data Analysis
- Respuestas: 1
- Vistas: 14976
Re: Python for Data Analysis
Buena introduccion a varias librerias importantes. !Gracias por compartitla!
Estos tutoriales gratuitos pueden ser un buen complemento:
https://www.w3schools.com/python/pandas/
https://www.w3schools.com/python/matplotlib_intro.asp
https://www.w3schools.com/python/python ... tarted.asp
Estos tutoriales gratuitos pueden ser un buen complemento:
https://www.w3schools.com/python/pandas/
https://www.w3schools.com/python/matplotlib_intro.asp
https://www.w3schools.com/python/python ... tarted.asp
- 28 Abr 2024, 14:20
- Foros: BI & Data Sciences
- Tema: Data Analysis with PANDAS
- Respuestas: 2
- Vistas: 19971
Re: Data Analysis with PANDAS
Excelente resumen, ¡gracias por compartir! Lo leí con atención y lo encontré muy acertado.
Al haber estado practicando Data Science por 15 años, tengo comentarios que añadir. De las dos palabras que forman el término "Data Science", la más importante es la segunda y es una que a veces no recibe tanta atención. Por ejemplo, durante un análisis es importante aplicar el pensamiento crítico y cuestionar incluso nuestras propias hipótesis en busca de explicaciones alternativas. Digamos que estamos analizando los resultados de una campaña de marketing y vemos un aumento en los ingresos. Podríamos asumir que esos resultados son atribuibles a la campaña (y a veces asumir cosas es adecuado y necesario), pero mucho mejor es preguntarse: ¿estoy seguro de que los resultados que estoy midiendo fueron causados por la campana o es posible que otros factores hayan contribuido a ellos? Tal vez hubo un cambio en precio, competencia, o en la economía en general. ¿Qué metodología puedo utilizar para medir la contribución exacta de la campana? En la práctica, suelen haber muchos factores que afectan nuestras mediciones, pero felizmente hay formas de manejar ese problema de forma científica. Si lo hacemos objetivamente, la validez de nuestras conclusiones y los beneficios para nuestra compañía serán mayores.
En resumen, Data Science es mucho más que manipular, analizar y visualizar datos; es un proceso riguroso y sistemático para obtener conocimiento a partir de ellos, aplicando el pensamiento crítico y la búsqueda de la verdad.
Al haber estado practicando Data Science por 15 años, tengo comentarios que añadir. De las dos palabras que forman el término "Data Science", la más importante es la segunda y es una que a veces no recibe tanta atención. Por ejemplo, durante un análisis es importante aplicar el pensamiento crítico y cuestionar incluso nuestras propias hipótesis en busca de explicaciones alternativas. Digamos que estamos analizando los resultados de una campaña de marketing y vemos un aumento en los ingresos. Podríamos asumir que esos resultados son atribuibles a la campaña (y a veces asumir cosas es adecuado y necesario), pero mucho mejor es preguntarse: ¿estoy seguro de que los resultados que estoy midiendo fueron causados por la campana o es posible que otros factores hayan contribuido a ellos? Tal vez hubo un cambio en precio, competencia, o en la economía en general. ¿Qué metodología puedo utilizar para medir la contribución exacta de la campana? En la práctica, suelen haber muchos factores que afectan nuestras mediciones, pero felizmente hay formas de manejar ese problema de forma científica. Si lo hacemos objetivamente, la validez de nuestras conclusiones y los beneficios para nuestra compañía serán mayores.
En resumen, Data Science es mucho más que manipular, analizar y visualizar datos; es un proceso riguroso y sistemático para obtener conocimiento a partir de ellos, aplicando el pensamiento crítico y la búsqueda de la verdad.