Se encontraron 5 coincidencias

por sangulo
25 May 2018, 09:22
Foros: BI & Data Sciences
Tema: How to get your first job in Data Science?
Respuestas: 0
Vistas: 1161

How to get your first job in Data Science?

How can one get his/her first entry level job as a Data Scientist/Analyst?

If you scroll through the data science subreddit, you will find many questions around this topic. Readers of my blog (data36.com) asking the same from me time to time. And I can tell you this a totally valid problem!


I have decided to summarize my answers for all the major questions!


More of this on :

por sangulo
25 May 2018, 09:16
Foros: Inteligencia Artificial
Tema: How to solve 90% of NLP problems: a step-by-step guide
Respuestas: 0
Vistas: 647

How to solve 90% of NLP problems: a step-by-step guide

Whether you are an established company or working to launch a new service, you can always leverage text data to validate, improve, and expand the functionalities of your product. The science of extracting meaning and learning from text data is an active topic of research called Natural Language Processing (NLP).


NLP produces new and exciting results on a daily basis, and is a very large field. However, having worked with hundreds of companies, the Insight team has seen a few key practical applications come up much more frequently than any other:

-Identifying different cohorts of users/customers (e.g. predicting churn, lifetime value, product preferences)

-Accurately detecting and extracting different categories of feedback (positive and negative reviews/opinions, mentions of particular attributes such as clothing size/fit…)

-Classifying text according to intent (e.g. request for basic help, urgent problem)

more of this on : https://blog.insightdatascience.com/how ... a605278e4e
por sangulo
04 May 2018, 10:07
Foros: Startups & Innovación
Tema: Biblioteca análisis técnico sobre series de tiempo para ML
Respuestas: 0
Vistas: 808

Biblioteca análisis técnico sobre series de tiempo para ML

Desde Lecrin Technologies, en los últimos meses nos hemos enfrentado a algunos problemas relacionados con la aplicación de Machine Learning a series temporales en un contexto financiero (financial time series). Como puede ser la predicción del precio a futuro de bitcoin, o diferentes retos para científicos de datos propuestos por Numer.ai, Two Sigma Investment o G-Research.

Por ello, este equipo decido desarrollar una biblioteca de análisis técnico en python, usando la biblioteca “pandas” como base:

Mas info aca :
por sangulo
04 May 2018, 09:59
Foros: Startups & Innovación
Tema: Como escoger la mejor metrica para modelos de ML
Respuestas: 0
Vistas: 764

Como escoger la mejor metrica para modelos de ML

En estos artículos Alvira discute sobre la utilidad de cada metrica de error dependiendo del objetivo y del problema que se esta resolviendo. Cada modelo de machine learning trata de resolver un problema con un diferente objetivo usando un diferente dataset y asi. Es importante entender el contexto antes de elegir una meetrica

En la primera parte ella cubre metricas de regresion:

https://lnkd.in/e52Dk3D

y en la segunda metricas de clasificacion

https://lnkd.in/eb7tNwK

Un trabajo realmente excelente que vale la pena leer
por sangulo
04 May 2018, 09:55
Foros: BI & Data Sciences
Tema: El concepto de Heterocedasticidad
Respuestas: 0
Vistas: 855

El concepto de Heterocedasticidad

En econometría se dice que un modelo de regresión lineal presenta heterocedasticidad cuando la varianza de las pertubaciones no es constante a lo largo de las observaciones. Esto implica el incumplimiento de una de las hipótesis básicas sobre las que se asienta el modelo de regresión lineal.
Recordemos que uno de los supuestos básicos de la regresión lineal es “ Que los errores tengan varianza constante”. De ella se deriva que los datos con los que se trabaja son heterogéneos, ya que provienen de distribuciones de probabilidad con distinta varianza.
Esta secuencia se relaciona con el supuesto del modelo de regresión e introduce el tema de heterocedasticidad. Esto se relaciona con la distribución del término de perturbación en un modelo de regresión.

pueden ver mas información aca: