Fecha de deformación profesional de los científicos


“Si tienes un martillo en tus manos, todo parece uñas”


Como practicantes de datos, los científicos se dedican al análisis de datos, su recopilación, purificación, enriquecimiento, construimos y entrenamos modelos del mundo que nos rodea, basados ​​en datos, encontramos relaciones internas y contradicciones entre los datos, a veces incluso donde no hay ninguno. Por supuesto, tal inmersión no podría sino afectar nuestra visión y comprensión del mundo. La deformación profesional está presente en nuestra profesión de la misma manera que en cualquier otra, pero ¿qué nos aporta exactamente y cómo afecta nuestra vida?


Descargo de responsabilidad


Este artículo no pretende ser científico, no expresa un único punto de vista de la comunidad ODS y es la opinión personal del autor.



Preámbulo



Si está interesado en cómo funciona nuestro cerebro, cómo percibimos el mundo que nos rodea y, de hecho, qué estamos haciendo aquí, entonces muchas de las cosas descritas en este artículo no serán algo completamente nuevo para usted. De una forma u otra, todo esto ya se ha descrito más de una vez desde ángulos completamente diferentes. Mi tarea es tratar de ver todo esto desde la perspectiva de un analista de datos, y también establecer paralelismos entre las herramientas y los enfoques que utilizamos en nuestro trabajo y en la vida real fuera del monitor.



Introduccion



Primero, imagine una configuración algo simplificada:


A nuestro alrededor hay un mundo a nuestro alrededor para sobrevivir y funcionar con éxito en él, una persona necesita comprender lo que él (el mundo) representa, cómo interactuar con él y qué resultados se obtienen de varias interacciones. Es decir, en otras palabras, una persona necesita un modelo del mundo a su alrededor que resuelva adecuadamente sus tareas actuales . La clave es " tareas actuales ". Cuando la tarea de supervivencia estaba en primer lugar, el modelo del mundo se construyó, en primer lugar, sobre el reconocimiento rápido del peligro y una reacción adecuada al mismo. Es decir, aquellos que tenían un modelo peor, no podían transmitirlo; aquellos con uno mejor, fueron transmitidos a sus descendientes. Con la mejora de las condiciones de vida, el énfasis en el modelo comenzó a cambiar de pura supervivencia a algo más altamente organizado, y cuanto más seguro es el medio ambiente, más diverso se vuelve este "algo". El espectro de "algo" es muy amplio, desde Bitcoin y DS hasta el feminismo radical y la tolerancia.


La naturaleza creó nuestro cerebro para resolver el problema de la supervivencia en condiciones de recursos limitados: no había suficiente comida, no había suficiente energía para la basura, por lo tanto, para sobrevivir, era necesario resolver dos tareas mutuamente excluyentes:


  • Descubre el mundo, mejora el modelo, aumenta las posibilidades de supervivencia (una tarea que consume mucha energía)
  • No mueras por falta de energía.

La naturaleza resolvió este dilema de manera muy elegante, introduciendo en nuestro cerebro la capacidad de almacenar en caché los flujos de datos y las reacciones, cuando la energía prácticamente no se desperdicia para resolver problemas básicos (en el marco del modelo actual) de interacción con el mundo exterior.


Puede leer más sobre este método de almacenamiento en caché y la "teoría de la atención de recursos" en los excelentes trabajos de D. Kahneman " Piense despacio, decida rápidamente " [1] y " Atención y esfuerzo " [3]



De acuerdo con D. Kahneman:



Los psicólogos distinguen dos modos de pensamiento, que llamaremos Sistema 1 y Sistema 2.

El sistema 1 funciona de forma automática y muy rápida, sin requerir o casi sin esfuerzo y sin dar una sensación de control intencional

El sistema 2 brinda la atención necesaria para el esfuerzo mental consciente, incluso para cálculos complejos. Las acciones del Sistema 2 a menudo se asocian con un sentido subjetivo de actividad, elección y concentración.

Los patrones de comportamiento, reacciones y respuestas se programan en nuestros cerebros (forman y cambian el modelo del mundo) desde la infancia hasta la muerte. Dos factores dependen de la etapa en la que se ubica la formación del modelo: la velocidad a la que se aceptan los cambios y la cantidad de energía necesaria para cambiar. En la infancia, cuando el modelo es flexible y flexible, la velocidad es alta y los costos de energía son mínimos. Cuanto más denso es el modelo, más energía se necesita para cambiarlo. Incluso más que eso, también se necesita energía para que una persona simplemente quiera cambiar algo en el modelo . Y cualquier desperdicio de energía es controlado por el cerebro, y él es muy reacio a permitir que se gaste.


El cerebro rechazará la orden de cambiar el modelo (aún así, consume mucha energía, pero ¿por qué ?, porque todo está bien para nosotros) hasta que funcionar dentro del marco del modelo anterior amenaza la supervivencia. Bueno, o hasta que la energía sea recibida por un estallido espontáneo (choque de algo, un golpe psicológico, etc.)



TL / DR:


  • Para sobrevivir, una persona construye en su cabeza un modelo del mundo que lo rodea, resolviendo sus tareas actuales
  • Al resolver cualquier problema, el cerebro intenta minimizar el consumo de energía.
  • La operación menos intensiva en energía en el marco del Sistema-1 (Kahneman), la incapacidad de tomar decisiones sobre el cambio
  • Lo más intensivo en energía es funcionar dentro del marco del Sistema-2, tomar decisiones sobre cambiar el modelo y cambiar el modelo mismo


Metamodel (modelo modelo)



Entonces, para interactuar con el mundo exterior, una persona construye un modelo del mundo en su cerebro y actúa de acuerdo con él durante el mayor tiempo posible (recuerde una vez más acerca de minimizar los costos de energía). Pero, desafortunadamente o afortunadamente, una persona es un animal social: no podemos interactuar con otras personas y, a menudo, esa interacción nos confunde.


Para interactuar efectivamente con otras personas, construimos en nuestra cabeza un modelo de comportamiento de estas personas , es decir, un modelo de cómo se comportarán en ciertas circunstancias en presencia de ciertos datos. Es decir, estamos construyendo un modelo del modelo del mundo circundante de esta persona en particular.


Detente y piensa: el modelo del mundo en la cabeza de una persona es imperfecto y solo cumple con sus propios criterios de suficiencia y adecuación , y construimos un modelo de este modelo (extraño) e interactuamos con esta persona de acuerdo con nuestro modelo. Sí, y también queremos que la gente haga lo que nuestro "modelo de su modelo" nos dice . Optimista? Sí, más que ...


Para construir y entrenar un modelo adecuado, no me corresponde decirte que necesitas mucho tiempo, energía y datos. Y a menudo no tenemos uno ni el otro, y cuantos más grados de libertad (parámetros) tenga el modelo, más datos se necesitan: la maldición de la dimensión, ¿recuerdas?


Y la vida vuela, y el tiempo es corto, por lo tanto (el Sistema-1 funciona), conociendo a una persona e incluso comunicándose con él en algunas condiciones, seleccionamos una de nuestras plantillas de modelos precompiladas que ya tenemos en él a la cabeza ("perra", "niño normal", "molehill", "solo" No; ak ", etc.), tal vez un poco fintyunya para un caso específico.


Sí, por supuesto, hay excepciones, hay personas por las que no sentimos lástima ni por el tiempo ni por la energía, y a quienes hemos conocido toda nuestra vida. Pero en este caso, solo sabemos acerca de la persona que está en nuestro modelo de esta persona.



¿Qué sigue de aquí? Algunas cosas obvias:


Bueno, en primer lugar , la fecha en que el científico no siente resentimiento hacia otras personas .

Absolutamente de la palabra por completo. En su vocabulario, falta el término "resentimiento". Por qué Todo es simple: en el centro de cualquier insulto se encuentra nuestro malentendido:


  • ¿Cómo podría él (ella) así (decir, hacer, actuar)?
  • ¿O NO (decir, hacer, hacer)?

Es decir, en nuestro modelo de esta persona, él en circunstancias específicas con un paquete de información de entrada específico debería haber actuado de esta manera, pero no lo hizo. Ese bastardo, ¿eh? Sí, él no es un bastardo, pero nuestro modelo de esta persona está equivocado. Nos perdimos algo, o no nos entusiasmamos por circunstancias específicas, pero simplemente tomamos una plantilla, o los datos de entrada en la situación actual son diferentes de aquellos en los que capacitamos al modelo.


¿Qué hacer en este caso? Lo mismo de siempre: observamos lo que está mal en los datos y sobreentrenamos el modelo con la nueva información.


En segundo lugar , la fecha del científico no tiene el reflejo de " alguien está equivocado en Internet ".

Funciona no solo en Internet, sino también en el trabajo, en la sociedad, etc. Si una persona no entiende algo (como le parece a usted), o entiende, pero no de la manera que usted lo hace, tal vez simplemente tenga un modelo completamente diferente para esta parte del mundo . Y para convencer a tales, es decir hacer que cambie su modelo (especialmente si no quiere) es muy difícil y requiere mucha energía. Lo necesitas


Una opción completamente diferente, cuando una persona está lista para cambiar su modelo, quiere expandirlo o ajustarlo, y tiene la fuerza y ​​la energía para esto. Puede ayudar, ayudar, no puede, dirigir a alguien que pueda. No puede ayudar ni dirigir, no interfiera .


La próxima vez, no se agite con una persona si, en su opinión, está "equivocada" o "no entiende algo". En su modelo del mundo, todo es diferente. Cuanto más grueso y "más simple" sea el modelo, mayor será la energía requerida para al menos sacarlo del punto de equilibrio , sin mencionar el cambio de algo.


Y en tercer lugar , la fecha del científico recuerda el principio " Las cosas no siempre son lo que parecen ".

Al comprender cómo funciona este sistema, existe la oportunidad de imitar, adaptarse a una plantilla básica, familiar para la sociedad en la que se encuentra actualmente, y hasta que salga de él, todo estará bien. Funciona en ambos sentidos, así que no olvides: "Un búho no es lo que parece ".


"La percepción de una cuerda como serpiente es tan falsa como la percepción de una cuerda como una cuerda" (C)



Construcción de modelos y entrenamiento



Como fecha de los científicos, entendemos lo difícil que es construir, entrenar y constantemente volver a entrenar un modelo más o menos adecuado. Y, por lo tanto, la fecha del científico se refiere con calma y paciencia a la imperfección de los modelos en la cabeza de otras personas y mejora constantemente la suya . Y como todavía es un profesional, recuerda perfectamente los principios básicos del modelado exitoso:



Lo que va alrededor viene (Basura adentro - basura afuera).


La precisión y adecuación del modelo depende de la pureza de los datos más que de cualquier otra cosa. Todos lo sabemos, pasamos una gran cantidad de tiempo limpiando datos, preprocesando, normalizando, y así sucesivamente. Alimente el modelo de basura, y el resultado es predecible. Aliméntela con los datos normalizados borrados, y las ideas en su bolsillo. Los modelos en nuestras cabezas funcionan exactamente igual. Entendiendo esto, tratamos de utilizar los datos más precisos y limpios para el procesamiento y la capacitación, utilizamos constantemente un ojo crítico para analizar la idoneidad de los datos y nos esforzamos por evitar la información sucia y ruidosa en nuestro modelo . En resumen: lea el Habr y no mire el primer canal.



La diferencia entre Train y Test (nuestro dolor de cabeza)


El científico entiende que la aplicabilidad del modelo depende directamente de la similitud de las distribuciones en las que se estudió el modelo y para las cuales se aplica . Las reglas de comportamiento en una sociedad no funcionan en otra, los principios de éxito en un área no son aplicables a otra, el "modelo típico de comportamiento" del sexo opuesto, construido sobre la base de las historias de mi madre, de repente resulta no ser del todo correcto, bueno, etc.


Siempre tenemos en cuenta la posible diferencia del conjunto de datos de entrenamiento en el que formamos nuestro modelo del mundo y el conjunto de datos real en el que aplicamos nuestro modelo.


En resumen, entendemos la causa de la discrepancia y estamos listos para gastar energía en el entrenamiento previo del modelo para que coincida más con el mundo real.



Elección de función objetivo y aprendizaje multidominio


Casi cualquier tarea puede transferirse a otro dominio cambiando la función objetivo. ¿El problema no se resuelve como regresión? Rehaga el objetivo para las clases y resuélvalo como una tarea de clasificación. Mejor aún, haga dos cabezas en la cuadrícula, deje que una resuelva un problema y la segunda reformule. En el mismo conjunto de datos, se pueden entrenar dos modelos diferentes, enfocados en cosas completamente diferentes. Recuerde esto, la mejor opción, como en la vida, es el aprendizaje multidominio, cuando su función objetivo final cubre varios dominios a la vez . En el trabajo, por ejemplo, solo puede ganar dinero, aún puede descargar habilidades profesionales, aún puede mejorar las habilidades de interacción social. Como en el caso de los modelos convencionales, este enfoque permite, al final, enriquecer y mejorar todos los objetivos multidominio, como si los hubiéramos descargado por separado. Y no se olvide del tiempo: tres modelos para propósitos individuales requieren tres veces más tiempo, y en la vida real no es tanto , y desafortunadamente, no podrá paralelizar el entrenamiento a una docena o dos TPU-shek.



Entrenamiento en bloques (Batch-learning)


El entrenamiento modelo con lotes ha demostrado su eficacia durante mucho tiempo. Si no tiene en cuenta áreas específicas que requieren capacitación en línea, entonces no tiene sentido actualizar los pesos solo después de pasar por toda la era. Sí, el entrenamiento en lotes produce ruido de alta frecuencia, pero esto se compensa con una mayor tasa de convergencia con casi la misma precisión.


¿Qué nos da esto? Entendiendo que no tiene sentido esperar mucho antes de cambiar ligeramente su modelo del mundo basado en nuevos datos. No es necesario esperar toda la era, bueno, no lo sé, un año en un nuevo trabajo, un año de relaciones con una nueva persona, cambiar con más frecuencia: obtendrá un movimiento más rápido hacia su objetivo final , bueno, la exploración le dará más oportunidades. Tampoco tiene sentido gritar que "todo se perdió" después de un solo incidente , tal vez sea solo un estallido, tal vez las estrellas se hayan desarrollado así, esperen hasta el final del lote, acumulen errores y luego cambien el modelo.




Hay muchos artículos ( ejemplo ) sobre el tema que al buscar los mejores hiperparámetros, la ordenación aleatoria es mejor que una búsqueda de cuadrícula. Por lo tanto, en nuestro caso, la elección de la acción "aleatoria" es mejor hacer "pseudoaleatoriamente", y no estrictamente de acuerdo con alguna cuadrícula predeterminada . Los fanáticos y los partidarios de los enfoques estrictos me pisotearán ahora, pero en serio, el caso gobierna el mundo , y el uso de tal método, por extraño que parezca, puede ser aún más racional.


Mejor aún, por supuesto, es utilizar la optimización bayesiana . Pero aquí no entiendo cómo se puede aplicar a la vida real. No es el enfoque bayesiano para comprender la información, sino la optimización bayesiana al elegir hiperparámetros.



Conjuntos


Todos conocemos el poder de los conjuntos, en el que cada modelo mira los datos a su manera, extrayendo alguna señal de ellos, y el mejor resultado se logra mediante el uso de un metamodelo en la parte superior de los modelos de primer nivel. En la vida, todo es exactamente igual, puedes construir tu propio modelo del mundo no solo sobre la base de tu propia experiencia, sino también absorber lo mejor (o viceversa, comprender y cortar lo peor) de los modelos de mundo de otras personas. Estos modelos se describen en libros, películas y, simplemente observando el comportamiento de otras personas, puede comprender qué tipo de modelo tienen, tomar lo mejor y desarrollarse.


Recuerde: "Muchas cosas son incomprensibles para nosotros, no porque nuestros conceptos sean débiles, sino porque estas cosas no están incluidas en el círculo de nuestros conceptos". Kozma Petrovich entendió el problema de los modelos limitados, incluso sin ser un practicante científico. :)


Diferentes personas, diferentes entornos, diferentes datos, diferentes modelos, incluso para cosas aparentemente obvias. Si trabajó en grandes empresas, probablemente recuerde todos estos entrenamientos interminables sobre comportamiento, reglas de comunicación, acoso y más. Qué demonios, pensaste. Pero no, no basura. En las grandes compañías internacionales (debido a las diferencias en cultura, mentalidad y valores), simplemente es necesario introducir una capa de principios básicos en el modelo de cada empleado para garantizar una interacción y un trabajo normales.



TL / DR


  • Lo que te está sucediendo en este mundo, solo tú y tu modelo del mundo tienen la culpa
  • Los modelos mundiales de otras personas no tienen que correlacionarse con los suyos.
  • Sus metamodelos de modelos mundiales de otras personas probablemente no se correspondan con la realidad.
  • Es difícil crear en su cabeza un modelo abierto del mundo, listo para el cambio de acuerdo con el principio bayesiano. Es aún más difícil mantenerlo en este estado abierto durante toda la vida. Es muy difícil seguir siendo una persona.


Lo que queda detrás de escena




Teorema del límite central


Como dice el CTC, la suma de eventos aleatorios muestreados de cualquier tipo de distribuciones débilmente dependientes es en sí misma una variable aleatoria y normalmente distribuida en el límite.


Toda nuestra vida consiste en eventos aleatorios : el tiempo de espera para un ascensor o un autobús en una parada, te perdiste una esquina o no, etc. Puede evaluar condicionalmente el día como exitoso o no exitoso (otra variable aleatoria), dependiendo de en qué parte de la distribución final llegamos, al centro o la cola. En una muestra suficientemente grande (por ejemplo, un año) se puede ver que esta variable aleatoria nuestra se distribuye normalmente, centrada en " bueno, más o menos todo está bien "


La fecha en que el científico comprende todo lo anterior y no se vaporiza si cae en el llamado Una "línea negra" cuando todo está mal, y el autobús se fue por debajo de la nariz, sirvió café y no guardó el código, etc. Él entiende que hoy tenemos la cola de la distribución, solo tenemos que sobrevivir este día , y mañana, tal vez, el mundo nos muestre los eventos de una manera ligeramente diferente.


Por cierto, la transición a un nuevo punto de referencia de eventos (un nuevo conjunto de muestras) es un sueño . No es un día calendario, no es medianoche, sino un nuevo día subjetivo después de que te levantas. Nuestros ancestros entendieron esto intuitivamente (aunque no sabían sobre xgboost y keras), fue a partir de aquí que los dichos "la mañana de la tarde son más sabios " y " si quieres trabajar, vete a la cama y todo pasará ".


“ ” ( p-value “”), , - ( , ), .




, “ ”. . [1].


, - , . , , , - )


, “ , ”.



(Exploitation vs Exploration)


, , . , , , — “ — ! ”. , , , , - , , , - .


… . - , . ( ), , , - . , “ , ”. , , . . , - , .


“ ” RL( Reinforcement learning ). , , , , , , . , , , , - , , . RL . , ( ) , , , - .


, , , , exploration , .




, , , , - , . , ” “ ”.


, “” . , , , “ ”, .


, - (, , ..) “”, , , .




- , , -1. , , , , .., .. . , -2. . , , -2 , , .



“ ”


, , , -1 , .




, “ , ” (). . , , - , , , . , , , , , , , .



TL/DR


  • ,
  • . ,
  • (exploration)
  • , . , - , 1

Conclusión



, - , , , , , .



  1. . … . — .: , 2013. — 625 .
  2. ., ., . : ., : , 2005. — 632 . — [ISBN 966-8324-14-5]
  3. . / . . . . . — .: , 2006. — 288 .
  4. . , “ : "

Source: https://habr.com/ru/post/447362/


All Articles