Traducci贸n del libro de Andrew Un, Pasi贸n por el aprendizaje autom谩tico, Cap铆tulo 33

cap铆tulos anteriores


Comparaci贸n con la calidad humana.


33. 驴Por qu茅 comparar con el nivel de calidad disponible para el hombre?


Muchos sistemas de aprendizaje autom谩tico tienen el objetivo de automatizar tareas que las personas hacen bien. Los ejemplos incluyen reconocimiento de im谩genes, reconocimiento de voz y clasificaci贸n de spam en el correo electr贸nico. Los algoritmos de aprendizaje han mejorado tanto que logran superar a una persona en cada vez m谩s tareas.


Adem谩s, hay varias razones en funci贸n de las cuales se simplifica la construcci贸n de sistemas de aprendizaje autom谩tico si est谩 intentando realizar una tarea que las personas pueden hacer bien con ellos:


  1. Simplemente marque los datos con los accesores. Por ejemplo, dado que las personas reconocen bien las im谩genes de los gatos, los evaluadores pueden marcar con precisi贸n las muestras necesarias para entrenar su algoritmo.
  2. El an谩lisis de errores puede basarse en la intuici贸n humana. Supongamos que un algoritmo de reconocimiento de voz funciona peor que una persona. Por ejemplo, el algoritmo descifra incorrectamente el fragmento y da: "Esta receta requiere un escritorio escolar de manzanas", tomando "un par" para un "escritorio escolar". Puede usar la intuici贸n de una persona e intentar comprender qu茅 informaci贸n usa una persona para obtener la transcripci贸n correcta, y luego usar esta informaci贸n para cambiar el algoritmo de aprendizaje.
  3. Puede utilizar la calidad de una persona para resolver un problema como referencia, y tambi茅n establecer la "tasa de error deseada". Suponga que la calidad del algoritmo al realizar una tarea ha alcanzado un nivel que corresponde al 10% de los errores, y una persona comete solo el 2% de los errores. Entonces sabemos que la tasa de error 贸ptima no supera el 2%, y el sesgo evitable para nuestro algoritmo es al menos del 8%. Por lo tanto, deber铆amos probar m茅todos para reducir el sesgo.

Aunque el punto 3 puede parecer poco importante, creo que tener un objetivo de error razonable y alcanzable ayuda a acelerar el progreso del equipo. La comprensi贸n de que el algoritmo tiene un sesgo evitable grande es incre铆blemente 煤til y sugiere una variedad de m茅todos que puede intentar aplicar.


Hay algunas tareas que incluso las personas no pueden hacer frente. Por ejemplo, elija un libro para recomendarle; o seleccione un anuncio para mostrarlo a un usuario en un sitio web; o predecir la situaci贸n en el mercado de valores. Las computadoras ya superan la calidad de resolver estos problemas por la mayor铆a de las personas. En estas aplicaciones encontramos los siguientes problemas:


  • Es m谩s dif铆cil obtener una muestra etiquetada para algoritmos de aprendizaje. Por ejemplo, a los evaluadores les resulta dif铆cil dise帽ar una base de datos de usuarios que indique el libro "贸ptimo" para cada uno de ellos. Si tiene un sitio web o una aplicaci贸n que vende libros, puede obtener datos etiquetados mostrando a los usuarios libros y anotando los que compran. Si no utiliza dicho sitio, necesita encontrar formas m谩s creativas de obtener datos.
  • No se puede contar con la intuici贸n humana. Por ejemplo, casi nadie puede predecir el comportamiento del mercado de valores. Entonces, si nuestro algoritmo de predicci贸n del precio de las acciones no funciona mejor que la adivinaci贸n aleatoria, es dif铆cil descubrir c贸mo mejorarlo.
  • Es dif铆cil entender cu谩l es la tasa de error 贸ptima y la tasa de error deseada razonable. Supongamos que el sistema de recomendaci贸n de libros existente funciona bastante bien. 驴C贸mo averiguar, sin tener un nivel b谩sico ("humano") de calidad y una proporci贸n correspondiente de errores, cu谩nto m谩s se puede mejorar?

para continuar

Source: https://habr.com/ru/post/484680/


All Articles