Aprendizaje de máquinas vs Estadística

Muchas personas tienen esta duda, ¿cuál es la diferencia entre las estadísticas y el aprendizaje automático? ¿Hay algo como el aprendizaje de máquina frente a las estadísticas?

¿Qué es el aprendizaje de Máquinas?, aquí un vídeo

Desde un punto de vista analítico de datos tradicional, la respuesta a la pregunta anterior es simple.

  • Aprendizaje de la máquina es un algoritmo que puede aprender de los datos sin depender de la programación basada en reglas.
  • El modelado estadístico es una formalización de relaciones entre variables en los datos en forma de ecuaciones matemáticas.

El aprendizaje automático tiene que ver con predicciones, aprendizaje supervisado, aprendizaje sin supervisión, etc.

Las estadísticas son sobre muestra, población, hipótesis, etc.

Dos criaturas diferentes, ¿verdad? Bueno, vamos a ver si son realmente diferentes!

Tanto el aprendizaje mecánico como las estadísticas tienen el mismo objetivo:

Según Larry Wasserman,

Ambos se preocupan por la misma pregunta: ¿cómo aprendemos de los datos ?” En su blog, afirma cómo los mismos conceptos tienen nombres diferentes en los dos campos,

Estadística Aprendizaje automático
Estimacion ~ Aprendizaje
Clasificador ~ Hipótesis
Punto de datos ~ Ejemplo / instancia
Regresión ~ Aprendizaje supervisado
Clasificación ~ Aprendizaje supervisado
Covarianza ~ Característica
Respuesta ~ Etiqueta

Robert Tibshirani, un estadístico y experto en aprendizaje automático de Stanford, califica el aprendizaje de máquinas de “estadísticas glorificadas“.

Hoy en día, tanto el aprendizaje automático como las técnicas estadísticas se utilizan en el reconocimiento de patrones, el descubrimiento de conocimientos y la minería de datos. Los dos campos son cada vez más convergentes, aunque la siguiente figura puede mostrar que son casi exclusivos.

Tanto el aprendizaje mecánico como las estadísticas comparten el mismo objetivo: aprender de los datos. Ambos métodos se centran en el conocimiento de dibujo o conocimientos de los datos. Pero, sus métodos se ven afectados por sus diferencias culturales inherentes.

Están relacionados, claro. Pero sus padres son diferentes.

El aprendizaje automático es un subcampo de la informática y la inteligencia artificial. Se trata de sistemas de construcción que pueden aprender de los datos, en lugar de instrucciones explícitamente programadas.
Un modelo estadístico, por otro lado, es un subcampo de matemáticas.
El aprendizaje automático es comparativamente un campo nuevo.
El poder informático barato y la disponibilidad de grandes cantidades de datos permitieron a los científicos de datos entrenar a las computadoras para que aprendieran analizando los datos. Sin embargo, el modelado estadístico existía mucho antes de que se inventaran las computadoras.
Diferencias metodológicas entre el aprendizaje automático y las estadísticas:
La diferencia entre los dos es que el aprendizaje de la máquina enfatiza la optimización y el rendimiento sobre la inferencia, que es lo que se refiere a las estadísticas.
Así es como un practicante de estadística y aprendizaje de máquinas describirá el resultado del mismo modelo:
Profesional de ML: “El modelo tiene un 85% de precisión en la predicción de Y, dado a, byc”.

Estadístico: “El modelo tiene un 85% de precisión en la predicción de Y, dado a, byc; y estoy 90% seguro de que obtendrá el mismo resultado “.

El aprendizaje automático no requiere suposiciones previas sobre las relaciones subyacentes entre las variables. Sólo tienes que tirar todos los datos que tienes, y el algoritmo procesa los datos y descubre los patrones, con lo que puede hacer predicciones en el nuevo conjunto de datos. Aprendizaje de la máquina trata un algoritmo como una caja negra, mientras trabaja. Generalmente se aplica a conjuntos de datos de alta dimensión, cuantos más datos tenga, más exacta será su predicción.

En cambio, los estadísticos deben entender cómo se recolectaron los datos, las propiedades estadísticas del estimador (valor de p, los estimadores no sesgados), la distribución subyacente de la población que están estudiando y los tipos de propiedades que se esperaría si hiciera el experimento muchas veces . Usted necesita saber exactamente lo que está haciendo y llegar a los parámetros que proporcionarán el poder predictivo. Técnicas de modelado estadístico se aplican generalmente a conjuntos de datos de baja dimensión.

Para leer el artículo original completo haga clic aquí . Para obtener más estadísticas de aprendizaje de máquina artículos relacionados con DSC haga clic aquí .

LEER  Petya Ransomware se extiende rápidamente en todo el mundo, al igual que WannaCry

1 comment on “Aprendizaje de máquinas vs EstadísticaAdd yours →

Deja un comentario