Apprentissage guidé

Pour discussion, une méthode originale d'apprentissage automatique est proposée. La capacité d'apprendre dans des échantillons courts et organisés est supposée. Peut être pertinent dans les domaines où il n'y a pas de big data.

Question centrale :

Dans quelles conditions un nombre fini d'exemples d'entrées-sorties restaure-t-il uniquement un programme?

Formalisme :

Nous appelons l' appareil programmé les quatre {PRG, IN, OUT, COMPUTE}, où PRG, IN et OUT sont des alphabets, PRG *, IN *, OUT * sont les ensembles de mots qu'ils contiennent. COMPUTE - une fonction correspondant à une paire de mots de PRG et IN à un mot de OUT
CALCUL: PRG * × IN * → OUT *. Ou:

sortie = COMPUTE (programme, entrée)

(Je)


où programme, entrée, sortie sont des mots dans PRG *, IN *, OUT *, respectivement.

Le programmeur COMPUTE est universel si pour toute fonction calculable de IN à OUT il y a un programme de PRG qui l'implémente.

Un exemple est une paire (entrée, sortie) ∈ {IN * × OUT *} pour laquelle l'égalité (I) est valable. Un échantillon d' exemples sera appelé tout ensemble fini d'entre eux.

Soit le programme ∈ PRG *. Nous appellerons un symbole α du programme significatif s'il y a un exemple dans la zone de définition du programme pour lequel l'égalité (I) peut être violée lorsque α est remplacé par un autre symbole de PRG.

Nous disons qu'un échantillon couvre un programme si, pour tout symbole significatif du programme dans cet échantillon, il existe un exemple confirmant sa signification.

Théorème

Pour tout programme, il existe quelques échantillons - la référence et le contrôle - vous permettant d'identifier ce programme avec précision jusqu'à l'équivalence.

Preuve:

De toute évidence, pour tout programme, il existe un échantillon de couverture fini, depuis l'enregistrement final du programme. Nous formons un tel échantillon et l'appelons celui de référence. De nombreux programmes couverts par l'échantillon de référence sont énumérables, car la plupart de tous les programmes en général sont énumérables. Nous renumérotons tous les programmes de cet ensemble. Des exemples pour l'échantillon de contrôle seront sélectionnés dans le cadre de notre programme afin qu'un par un
exclure tous les programmes dont le nombre est inférieur au numéro du programme souhaité.
Le processus s'arrêtera sur un programme équivalent à celui recherché, sinon
lui-même. De toute évidence, seul un nombre fini d'exemples sont nécessaires pour l'échantillon de contrôle.

Explication:

Un nombre fini d'exemples peut être généralisé par un nombre infini, généralement parlant, de méthodes. Les conclusions des programmes respectifs ne coïncideront que dans une multitude d'exemples et varieront au-delà. Cependant, le choix de l'option de généralisation peut être contrôlé en sélectionnant des questions de contrôle avec des réponses connues de l'examinateur afin que des programmes autres que celui souhaité conduisent à des erreurs et que seul le programme équivalent puisse passer tous les tests.

Par analogie avec le processus éducatif, nous couvrirons l'échantillon en justifiant les faits (par souci de concision, simplement les faits ), les questions de contrôle du manager ( tests ). Afin d'identifier de manière unique (jusqu'à l'équivalence) le programme, l'échantillon d'apprentissage doit être composé de deux parties - la référence et le contrôle.

Méthodes d'apprentissage automatique gérées


Apprentissage organisé («Défi étudiant»)


L'échantillon de formation est commandé et disposé, se compose de leçons. La leçon se compose de deux parties - faits et tests. Chaque leçon a son propre programme. Les programmes du programme des leçons précédentes sont utilisés comme matériau de construction pour les suivants comme sous-programmes ou modèles.

Programmation inductive ("expérience de vie")


L'échantillon de formation est rationalisé mais non étiqueté, il n'y a pas de division en faits et tests. La tâche consiste à adapter systématiquement le programme (connaissances) à chaque nouvel exemple (expérience). Pour ce faire, vous devez gérer votre propre exemple de formation (interne) et le modifier (le réapprovisionner) chaque fois que le programme actuel entraîne une erreur.

Pouvoir prédictif ("la tâche du scientifique")


De nombreux exemples ne sont ni commandés ni marqués. Il est nécessaire de trouver l' échantillon de formation minimum nécessaire pour construire un programme pour lequel (I) est valide dans tous les exemples de l'ensemble.

La solution générale est une énumération complète des options de numérotation des exemples et une synthèse inductive pour chacun, avec un suivi du minimum. Ignorer la vérification des options lorsque le nombre de faits dépasse le minimum déjà connu.

Organisation de la formation («tâche d'enseignant»)


Le programme est connu. Il lui est nécessaire de construire un échantillon de formation afin de minimiser la complexité de l'apprentissage pour l'étudiant. L'enseignant ne peut pas transférer ses connaissances et compétences (programme) directement à l'élève; il doit créer les conditions de leur acquisition indépendante par l'élève.

La tâche du professeur de robots prendra tout son sens lorsque l'intelligence artificielle surpassera l'humain. Il sera important non seulement de trouver une solution à un problème difficile, mais il est clair de l'expliquer aux gens.



© 2019 Averin A.V.

Source: https://habr.com/ru/post/fr485530/


All Articles