Salut, ce sont des moteurs intelligents. Le groupe d'atterrissage de 28 développeurs de systèmes de reconnaissance de l'intelligence artificielle vient de rentrer d'Amsterdam, où nous avons participé à la conférence scientifique internationale de l'ICMV sur la vision par ordinateur. Dans cet article, nous tenterons d'expliquer pourquoi nous consacrons autant de temps à la science et allons à des conférences scientifiques.
Aujourd'hui, dans le monde du développement de la science et de la haute technologie, il y a eu une substitution catastrophique des concepts: pour la science, elle est émise qui n'est pas une science en quelque sorte, les scientifiques appellent des programmeurs et des ingénieurs, la science appelle la solution aux problèmes d'ingénierie les plus simples. Dans l'espace de l'information, le rôle de la science fondamentale dans le développement de la technologie est clairement sous-estimé. Beaucoup de gens oublient que l'écran tactile d'un iPhone n'est pas l'écran tactile d'un iPhone, mais l'incarnation des idées de recherche fondamentale sur les hétérostructures semi-conductrices de notre compatriote Nobel J.I. Alferova. Les cartes Google (ou Yandex) ne sont pas seulement des cartes dans un téléphone mobile, mais l'incarnation de la recherche fondamentale dans le domaine de la géométrie informatique. Et soit dit en passant, le film «Avatar» est également une géométrie de calcul à 99%. La vision industrielle, les réseaux de neurones et l'intelligence artificielle ne font pas exception: tout ce complexe fonctionne bien et correctement uniquement parce que la recherche fondamentale en est la base. Une approche fondamentale du développement, d'une part, est la clé du bon vecteur pour le développement de l'industrie, et d'autre part, elle démontre diverses startups de garage qui ont inondé le marché, dont la science fondamentale donne toujours un net avantage.Nous sommes des scientifiques. Nous sommes des scientifiques et n'hésitons pas du tout. Notre startup (qui en fait n'a pas été une startup depuis longtemps, mais une entreprise plutôt performante, connue à la fois en Russie et à l'étranger, développée exclusivement grâce aux technologies développées sans aucun investissement de l'État ou des fonds) est à peu près de ce battage médiatique , que tout le monde entend aujourd'hui: vision par ordinateur, apprentissage automatique, intelligence artificielle, réseaux de neurones - en général, l'ensemble des mots bingo bullshit, dont l'utilisation, selon de nombreuses startups, rend le projet évidemment réussi. Ce n'est bien sûr pas le cas. Il est important que vous compreniez l'essence du problème. C'est pourquoi beaucoup de départs
en position
haute se retrouvent très rapidement en position
basse , puis en position
sortie . Parce que pas les scientifiques.
Nous allons rarement aux réunions de startups, visionnaires et évangélistes dans le domaine de l'intelligence artificielle. Le fait est que maintenant tout le monde a appris à faire de belles présentations. Qui n'a pas appris - a trouvé un entrepreneur. D'énormes ressources sont investies dans la promotion et la promotion de solutions technologiques (d'abord pour attirer les investissements, puis pour justifier les activités d'une équipe faible), pour lesquelles il n'y a ni nouveauté ni efficacité. Dans un bel emballage pour les présentations, les infographies et les animations, en particulier lorsque des termes scientifiques et technologiques à la mode et obscurs y sont tissés, vous pouvez toujours cacher le manque d'un vrai sens de l'activité. Pour de nombreuses présentations, il n'y a pas de science. C'est un vide enveloppé dans une belle coquille. C'est un appât pour les investisseurs qui picorent (ou font semblant de picorer) sur du verre brillant et donnent de l'argent pour une raison quelconque. En réalité, peu de gens veulent comprendre la composante scientifique, la plupart préfèrent faire attention à l'extérieur du «tangage». Que faire - présenter l'économie en action. Et nous ne parlons pas de cela. Nous parlons de science.
Nous allons à des conférences scientifiques. Par exemple, nous avons récemment visité l'Australie lors d'une conférence de reconnaissance de documents. La Russie - et pas seulement elle - est un pays avec un niveau de développement accru de la bureaucratie. Certains, souffrant, ramassent des morceaux de papier, d'autres qui n'en souffrent pas moins travaillent avec eux. Les ministères annoncent des appels d'offres pour la numérisation et l'automatisation des processus de routine, des sociétés d'exécution assez sérieuses apparaissent, proposant leurs approches dans ce domaine. Des hauteurs, il est expliqué que cette fois, il est temps de remplacer non seulement l'œil et la main, que nous parlons d'intelligence artificielle qui peut comprendre les documents de manière significative. Et dans ce contexte, il est très étrange que seuls Abbyy et nous étions à la principale conférence de profil de Russie. Nous n'avons pas vu de représentants des fleurons de la transformation numérique et de participants au programme national de développement de l'intelligence artificielle. Il s'avère que dans le domaine de la compréhension des documents en Russie, il n'y a plus de scientifiques?

Nous venons de rentrer d'Amsterdam, où s'est
tenue l'
ICMV , une conférence scientifique sur la vision par ordinateur. Là, nous n'avons pas du tout fixé l'objectif de favoriser le succès de notre entreprise en tant que structure d'entreprise. Nous avons expliqué à la communauté des professionnels les problèmes fondamentaux sur lesquels notre équipe de recherche travaille. Pour nos jeunes scientifiques (ce sont précisément les jeunes collaborateurs qui proposent et développent des idées audacieuses dans notre domaine qui agissent comme conférenciers d'honneur lors de la conférence) c'est l'occasion de nous immerger dans l'activité scientifique, de nous développer scientifiquement et professionnellement.
Nous sommes sûrs que pour qu'une start-up
"décolle" et devienne une entreprise en développement, elle doit être basée sur la science, à partir de laquelle une technologie de travail va croître, qui est le "moteur" d'un service ou d'un produit qui est demandé par le marché et qui répond à ses exigences.
Dans notre domaine - les domaines de reconnaissance (ce sont les documents d'identification, les différents profils, les cartes bancaires, les tableaux, les codes-barres, les images) - la technologie et la science qui le sous-tendent en sont le fondement. Le prix de l'erreur est très élevé, et c'est pourquoi nous avons des exigences très élevées pour les algorithmes. C'est comme un avion - il vole ou ne vole pas, il n'y en a pas de troisième. S'il vole mal, cela signifie qu'il ne vole pas du tout. Et tout comme dans la fabrication d'avions, l'algorithme est basé sur la science, une science fondamentale sérieuse issue de l'arriéré de nos compatriotes qui étaient à la pointe de notre foyer, l'intelligence artificielle. Beaucoup sont maintenant engagés dans la reconnaissance, créant un marché pour ces services, qui est encore à ses balbutiements. Il n'est pas complètement formé, malgré le fait que les analystes prédisent le volume mondial de ce marché à 16-17 milliards de dollars d'ici 2024. Mais nous voyons très peu de collègues aux conférences scientifiques. Encore moins sont ceux publiés dans des revues scientifiques. Maintenant, nous pouvons entendre comment les pantoufles des startupers indignés ont volé en nous, qui sont sûrement convaincus de la futilité de mener des recherches et d'écrire des articles. "Nous faisons des affaires, pas une sorte de science théorique!" C'est précisément pourquoi de nombreux systèmes de reconnaissance sur le marché fonctionnent franchement mal (malgré de belles vidéos de présentation et des slogans publicitaires), ils se trompent, ils nécessitent la participation d'un opérateur humain (ou d'une usine entière de ces opérateurs) , qui examinera l'image floue et ajustera la décision de la machine avec ses propres poignées fatiguées. Mais la tâche est de faire en sorte que le processus de reconnaissance soit complètement automatisé. Dans notre cas, cela ne signifie pas éliminer complètement l'erreur, mais obliger la machine à faire des erreurs plusieurs fois, des dizaines et des centaines de fois moins souvent que les humains.
Nous travaillons constamment pour améliorer notre propre technologie. Il s'agit d'un processus associé à beaucoup de travaux théoriques et de recherches sérieuses. En technologie, nous améliorons la précision, la vitesse, la flexibilité, rendons la technologie plus «légère», moins exigeante en matériel, moins énergivore. C'est notre «IA verte» (le vert n'est pas dans le sens de «immature», mais dans le sens de «vert»). Nous comprenons que la technologie environnementale est une tendance. Et les clients potentiels dans le monde s'accrocheront à cette tendance. Et nous avons compris cette tendance précisément grâce à notre participation à des conférences scientifiques. Comme le dit le proverbe scandinave, "lorsque vous coupez la forêt, n'oubliez pas d'aiguiser la hache à temps". La participation à des conférences scientifiques n'est pour nous que le processus d'affûtage d'une hache. La technologie ne peut pas se développer à partir de zéro, comprendre comment l’améliorer ne semble pas immédiatement. La communauté scientifique est organisée d'une manière fondamentalement différente de la communauté des start-ups, des investisseurs, des analystes de la blockchain et des visionnaires de la technologie. Il ne suffit pas de montrer une belle présentation. S'il n'y a ni pensée ni nouveauté, ils picoreront. Ils mangeront et enterreront. Oui, et arrangé lors de conférences scientifiques, tout est un peu différent. Nous n'y montrons pas le résultat final, mais ce qui y conduit, décrivons les méthodes et les approches, piétinons une clairière pour nous-mêmes, présentant au monde les résultats de nos propres recherches. Il ne suffit pas de montrer ce que vous avez fait, il faut expliquer comment cela fonctionne.
Maintenant, de nombreuses startups dans le domaine de l'IA sont des ateliers de réparation automobile si particuliers où ils ne réparent pas la voiture, mais remplacent les nœuds défectueux. Quelque chose ne fonctionne pas - nous ne le réparons pas, nous changeons immédiatement le module. C'est plus facile, surtout lorsque vous ne savez pas comment tout cela fonctionne et ce que vous devez faire pour y remédier.
Nous sommes des scientifiques, et nous montrons en toute confiance: la technologie basée sur la science fondamentale profonde fonctionne mieux, plus rapidement, avec plus de confiance et de manière plus fiable que celle où toutes les technologies ne sont que d'une belle présentation. Il casse moins, consomme moins d'énergie, fonctionne dans la neige, dans la chaleur, la nuit et le matin, car nous savons quel type de
néon est dans son "intérieur" , à quel endroit il faut "
tirer la petite fille " et frapper le tambourin.
Notre entreprise emploie plus de 50 développeurs, chacun détruisant la thèse du manque de demande de travaux scientifiques. Notre équipe comprend à la fois des scientifiques établis et ceux qui commencent tout juste leur carrière dans une carrière scientifique. Nous soulignons que ce ne sont pas seulement des programmeurs qui traitent exclusivement du code. Chacun d'eux est une unité scientifique indépendante, à partir de laquelle l'équipe scientifique est formée, la flexibilité et la variabilité des solutions utilisées sont assurées.
Et tout cela parce que nous allons à des conférences scientifiques.


Lors de la conférence internationale sur la vision par ordinateur (ICMV) à Amsterdam, nous avons proposé nos approches fondamentalement nouvelles pour le développement de réseaux de neurones et de technologies de reconnaissance, qui visent à réduire l'empreinte carbone et à minimiser les dommages environnementaux causés par l'utilisation des nouvelles technologies. L'accent a été mis principalement sur l'optimisation des algorithmes de calcul utilisés dans les systèmes matériels et logiciels, ce qui devrait réduire la consommation d'énergie pour la formation et le fonctionnement des réseaux de neurones à l'échelle mondiale.
Aujourd'hui, le développement durable de notre planète devient l'agenda principal des rapports des organisations mondiales soucieuses de l'avenir de la Terre. Et ce n'est pas seulement Greta Tunberg. À bien des égards, la place d'une personne sur la planète dépend de la mesure dans laquelle nous pouvons trouver un équilibre entre le développement des technologies, l'appétit croissant des sociétés mondiales et l'attitude responsable envers l'environnement. Les moyens possibles de minimiser les dommages causés par les technologies en développement rapide de la dernière décennie sont largement associés à la réduction de la consommation d'énergie et à la recherche des outils les plus optimaux et les plus économes en énergie pour résoudre les problèmes technologiques modernes.
Notre arsenal possède des réseaux de neurones et il est de notre responsabilité, scientifiques, de les faire fonctionner rapidement, efficacement et de résoudre correctement les tâches qui leur sont assignées. Du point de vue de «l'intelligence artificielle verte», la question d'une percée n'est pas de créer un réseau neuronal vaste, puissant et énorme - une sorte de rorqual bleu avec son réseau neuronal étonnamment grand, mais une mouche, avec ses capacités «informatiques» très modestes, mais sa capacité à l'énergie résoudre efficacement les tâches nécessaires. Un tel réseau de neurones devrait avoir une productivité spécifique très élevée. Le bon choix d'algorithmes vous permet de dépenser 1 000 fois moins de ressources en tâches de reconnaissance d'image que certains fabricants d'équipements ne le prétendent aujourd'hui.

Aujourd'hui, nous comprenons que dans notre région, l'augmentation de la capacité des appareils pour effectuer des opérations est un aller simple. Et la tâche des scientifiques aujourd'hui (avec une attitude responsable envers le développement) est de faire en sorte que la technologie charge les appareils le moins possible, ne fasse pas chauffer le processeur à la température de la chaudière, ne consomme pas d'énergie, comme un «cadavre gastro-insatisfait». Et puis cette technologie devient conviviale et en même temps high-tech.
Pour que cela devienne une réalité, des «faisceaux» complètement non évidents de domaines scientifiques complètement différents sont nécessaires. Est-il clair pour beaucoup que le passage des technologies d'apprentissage en profondeur à l'algèbre tropicale peut réduire considérablement le nombre de transistors dans les neuroprocesseurs tout en maintenant la puissance expressive? Ou que la présence de couches de radon dans un réseau neuronal lui permet de décrire économiquement des invariants projectifs qui, à leur tour, déterminent la structure interne des images du monde réel?
La participation à des conférences scientifiques est d'abord l'occasion de comparer des montres avec des leaders mondiaux, de voir leurs vrais concurrents (oui, les vrais concurrents vont aussi aux conférences scientifiques, car ils sont aussi des scientifiques), de voir où la technologie évolue de première main, et pas dans le récit des visionnaires et des évangélistes, qui pour la plupart n'ont rien à voir avec la vraie science, mais ont seulement appris à mettre des mots à la mode dans des phrases relativement lettrées. Sans cette compréhension des tendances et des tendances de la science fondamentale, aucun progrès n'est possible. La technologie sans science «ne décollera pas», ou elle sera déjà obsolète à l'avance.