Hallo, das ist Smart Engines. Die Landing Party von 28 Entwicklern von Erkennungssystemen für künstliche Intelligenz ist gerade aus Amsterdam zurückgekehrt, wo wir an der internationalen wissenschaftlichen ICMV-Konferenz zum Thema Computer Vision teilgenommen haben. In dem Artikel werden wir versuchen zu erklären, warum wir so viel Zeit für die Wissenschaft verwenden und zu wissenschaftlichen Konferenzen gehen.
In der heutigen Welt der Entwicklung von Wissenschaft und Hochtechnologie hat es eine katastrophale Substitution von Begriffen gegeben: Für Wissenschaft wird in keiner Weise Wissenschaft ausgegeben, Wissenschaftler nennen Programmierer und Ingenieure, Wissenschaft nennt die Lösung der einfachsten technischen Probleme. Im Informationsraum wird die Rolle der Grundlagenforschung bei der Entwicklung der Technologie deutlich unterschätzt. Viele Menschen vergessen, dass der Touchscreen eines iPhones nicht der Touchscreen eines iPhones ist, sondern die Verkörperung der Ideen der Grundlagenforschung zu Halbleiter-Heterostrukturen unseres Landsmanns Nobelpreisträger J.I. Alferova. Google- (oder Yandex-) Karten sind nicht nur Karten in einem Mobiltelefon, sondern die Verkörperung der Grundlagenforschung auf dem Gebiet der rechnergestützten Geometrie. Übrigens besteht der Film "Avatar" auch zu 99% aus Computergeometrie. Bildverarbeitung, neuronale Netze und künstliche Intelligenz sind keine Ausnahme: Dieser ganze Komplex funktioniert gut und richtig, nur weil Grundlagenforschung die Grundlage ist. Ein grundlegender Entwicklungsansatz ist zum einen der Schlüssel zum richtigen Vektor für die Entwicklung der Branche, zum anderen werden verschiedene marktüberflutete Autohaus-Start-ups aufgezeigt, von denen die Grundlagenforschung immer einen klaren Vorteil hat.Wir sind Wissenschaftler. Wir sind Wissenschaftler und zögern nicht. Bei unserem Startup (das eigentlich schon lange kein Startup mehr ist, sondern ein gut funktionierendes Unternehmen, das sowohl in Russland als auch im Ausland bekannt ist und ausschließlich aufgrund der entwickelten Technologien ohne staatliche oder finanzielle Investitionen entwickelt wurde) handelt es sich um diesen Hype , die heute jeder hört: Computer Vision, maschinelles Lernen, künstliche Intelligenz, neuronale Netze - im Allgemeinen ist die ganze Menge der Wörter Bullshit Bingo, deren Verwendung laut vielen Startups das Projekt offensichtlich erfolgreich macht. Das ist natürlich nicht so. Es ist wichtig, dass Sie das Wesentliche des Problems verstehen. Aus diesem Grund befinden sich viele von der
oberen Position aus sehr schnell in der
unteren Position und dann in der
oberen Position. Weil keine Wissenschaftler.
Wir gehen selten zu Treffen von Startups, Visionären und Evangelisten auf dem Gebiet der künstlichen Intelligenz. Tatsache ist, dass jetzt jeder gelernt hat, schöne Präsentationen zu machen. Wer nicht gelernt hat - fand einen Auftragnehmer. Es werden enorme Ressourcen in die Förderung und Förderung technologischer Lösungen investiert (zuerst, um Investitionen anzuziehen, und dann, um die Aktivitäten eines schwachen Teams zu rechtfertigen), für die es weder Neuheit noch Effizienz gibt. In einer schönen Hülle für Präsentationen, Infografiken und Animationen, insbesondere wenn modische und undurchsichtige wissenschaftliche und technologische Begriffe in sie eingewoben sind, können Sie immer das Fehlen eines echten Gefühls für Aktivität verbergen. Für viele Präsentationen gibt es keine Wissenschaft. Es ist eine Leere, die in eine schöne Hülle gewickelt ist. Dies ist ein Köder für Anleger, die auf glänzendes Glas picken (oder so tun als würden sie picken) und aus irgendeinem Grund Geld geben. In Wirklichkeit wollen nur wenige Menschen die wissenschaftliche Komponente verstehen, die meisten bevorzugen es, außerhalb des „Pitchings“ auf sich aufmerksam zu machen. Was zu tun ist - Präsentationsökonomie in Aktion. Und darüber reden wir nicht. Bei uns geht es um Wissenschaft.
Wir gehen zu wissenschaftlichen Konferenzen. Zum Beispiel haben wir kürzlich Australien auf einer Konferenz zur Dokumentenerkennung besucht. Russland - und nicht nur es - ist ein Land mit einem erhöhten Entwicklungsstand der Bürokratie. Manche, die leiden, sammeln Papierstücke, andere, die nicht weniger leiden, arbeiten mit ihnen. Die Ministerien kündigen Ausschreibungen für die Digitalisierung und Automatisierung von Routineprozessen an. Ernsthafte ausführende Unternehmen bieten ihre Ansätze in diesem Bereich an. Von den hohen Ständen wird erklärt, dass es diesmal nicht nur Zeit ist, das Auge und die Hand zu ersetzen, sondern dass es sich um künstliche Intelligenz handelt, die Dokumente auf sinnvolle Weise verstehen kann. Und in diesem Zusammenhang ist es sehr seltsam, dass nur Abbyy und wir an der führenden Profilkonferenz aus Russland teilgenommen haben. Wir haben keine Vertreter der Flaggschiffe der digitalen Transformation und Teilnehmer des staatlichen Programms zur Entwicklung der künstlichen Intelligenz gesehen. Es stellt sich heraus, dass es auf dem Gebiet des Dokumentenverständnisses in Russland keine Wissenschaftler mehr gibt?

Wir sind gerade aus Amsterdam zurückgekehrt, wo die
ICMV , eine wissenschaftliche Konferenz zum Thema Computer Vision, stattfand. Dort haben wir uns keineswegs zum Ziel gesetzt, den Erfolg unseres Unternehmens als Unternehmensstruktur zu fördern. Wir haben den Fachleuten mitgeteilt, an welchen grundlegenden Problemen unser Forschungsteam arbeitet. Für unsere jungen Wissenschaftler (es sind genau die jungen Mitarbeiter, die mutige Ideen in unserem Bereich anbieten und entwickeln, die als Hauptredner auf der Konferenz auftreten) ist dies eine Gelegenheit, sich in die wissenschaftliche Tätigkeit zu vertiefen, sich wissenschaftlich und professionell weiterzuentwickeln.
Wir sind sicher, dass ein Start-up,
das sich zu einem aufstrebenden Unternehmen entwickeln soll, auf wissenschaftlichen Erkenntnissen basieren sollte, aus denen eine funktionierende Technologie hervorgeht, die der „Motor“ einer Dienstleistung oder eines Produkts ist, die bzw. das vom Markt nachgefragt wird und dessen Anforderungen erfüllt.
In unserem Bereich - Anerkennungsbereiche (das sind Ausweisdokumente, verschiedene Profile, Bankkarten, Tabellen, Barcodes, Bilder) - liegt die Technologie und Wissenschaft zugrunde. Der Preis des Fehlers ist sehr hoch, und deshalb haben wir sehr hohe Anforderungen an die Algorithmen. Es ist wie mit einem Flugzeug - es fliegt oder fliegt nicht, es gibt kein drittes. Wenn es schlecht fliegt, bedeutet das, dass es überhaupt nicht fliegt. Und genau wie im Flugzeugbau basiert der Algorithmus auf der Wissenschaft, einer fundamentalen Wissenschaft, die aus dem Rückstand unserer Landsleute hervorgegangen ist, die an der Spitze unserer heimischen künstlichen Intelligenz standen. Viele befassen sich jetzt mit der Anerkennung und schaffen einen Markt für diese Dienstleistungen, der noch in den Kinderschuhen steckt. Es ist nicht vollständig gebildet, obwohl Analysten das weltweite Marktvolumen bis 2024 auf 16-17 Milliarden Dollar prognostizieren. Wir sehen aber nur sehr wenige Kollegen auf wissenschaftlichen Konferenzen. Noch weniger werden in wissenschaftlichen Fachzeitschriften veröffentlicht. Jetzt können wir hören, wie die Pantoffeln empörter Starter in uns geflogen sind, die sicherlich von der Sinnlosigkeit der Recherche und des Schreibens von Artikeln überzeugt sind. „Wir machen Geschäfte, keine theoretische Wissenschaft!“ Genau deshalb funktionieren viele Erkennungssysteme auf dem Markt offen gesagt schlecht (trotz schöner Präsentationsvideos und Werbeslogans), sie sind falsch, sie erfordern die Teilnahme eines menschlichen Bedieners (oder einer ganzen Fabrik dieser Bediener) , der das unscharfe Bild untersucht und die Entscheidung der Maschine mit seinen eigenen müden Griffen korrigiert. Die Aufgabe besteht jedoch darin, den Erkennungsprozess vollständig zu automatisieren. In unserem Fall bedeutet dies nicht, dass der Fehler vollständig beseitigt wird, sondern dass die Maschine viele Male, Dutzende und Hunderte Male weniger Fehler macht als Menschen.
Wir arbeiten ständig daran, unsere eigene Technologie zu verbessern. Dies ist ein Prozess, der mit viel theoretischer Arbeit und ernsthafter Forschung verbunden ist. In der Technologie verbessern wir Genauigkeit, Geschwindigkeit und Flexibilität, machen die Technologie „leichter“, stellen geringere Anforderungen an die Hardware und sind weniger energieintensiv. Dies ist unsere „grüne KI“ (grün ist nicht im Sinne von „unreif“, sondern im Sinne von „grün“). Wir verstehen, dass Umwelttechnologie ein Trend ist. Potenzielle Kunden auf der ganzen Welt werden an diesem Trend festhalten. Und genau durch die Teilnahme an wissenschaftlichen Konferenzen haben wir diesen Trend verstanden. Wie das skandinavische Sprichwort sagt: "Wenn Sie den Wald fällen, vergessen Sie nicht, die Axt rechtzeitig zu schärfen." Die Teilnahme an wissenschaftlichen Konferenzen ist für uns nur der Prozess des Schärfens einer Axt. Technologie kann nicht von Grund auf neu wachsen, und das Verständnis, wie sie verbessert werden kann, erscheint nicht sofort. Die wissenschaftliche Community ist grundlegend anders organisiert als die Community aus Start-ups, Investoren, Blockchain-Analysten und Technologie-Visionären. Es reicht nicht aus, eine schöne Präsentation zu zeigen. Wenn es keinen Gedanken und keine Neuheit gibt, werden sie picken. Sie werden essen und begraben. Ja, und auf wissenschaftlichen Konferenzen ist alles ein bisschen anders. Wir zeigen dort nicht das Endergebnis, sondern was dazu führt, beschreiben die Methoden und Ansätze, treten eine Lichtung für uns selbst nieder und präsentieren der Welt die Ergebnisse unserer eigenen Forschung. Es reicht nicht aus zu zeigen, was Sie getan haben, es muss erklärt werden, wie es funktioniert.
Inzwischen sind viele Startups auf dem Gebiet der KI so eigenartige Autowerkstätten, in denen sie das Auto nicht reparieren, sondern die fehlerhaften Knoten ersetzen. Etwas funktioniert nicht - wir reparieren es nicht, wir wechseln sofort das Modul. Dies ist einfacher, insbesondere wenn Sie nicht wissen, wie alles funktioniert und was Sie tun müssen, um es zu beheben.
Wir sind Wissenschaftler und zeigen es mit Zuversicht: Die Technologie, die auf fundamentalen wissenschaftlichen Erkenntnissen basiert, funktioniert besser, schneller, sicherer und zuverlässiger als die, bei der alle Technologien nur eine schöne Präsentation bieten. Es bricht weniger, verbraucht weniger Energie, arbeitet im Schnee, in der Hitze, in der Nacht und am Morgen, da wir wissen, welche Art von
Neon sich in seinem „Inneren“ befindet. An welcher Stelle muss man „
das kleine Mädchen ziehen “ und auf das Tamburin schlagen.
Unser Unternehmen beschäftigt mehr als 50 Entwickler, von denen jeder die These der mangelnden Nachfrage nach wissenschaftlicher Arbeit zunichte macht. Unser Team besteht sowohl aus etablierten Wissenschaftlern als auch aus Wissenschaftlern, die gerade ihre Karriere beginnen. Wir betonen, dass dies nicht nur Programmierer sind, die sich ausschließlich mit Code befassen. Jede von ihnen ist eine eigenständige wissenschaftliche Einheit, aus der sich das wissenschaftliche Team zusammensetzt, wobei die Flexibilität und Variabilität der verwendeten Lösungen gewährleistet ist.
Und das alles, weil wir zu wissenschaftlichen Konferenzen gehen.


Auf der internationalen Konferenz über Computer Vision (ICMV) in Amsterdam haben wir unsere grundlegend neuen Ansätze zur Entwicklung neuronaler Netze und Erkennungstechnologien vorgestellt, die darauf abzielen, den CO2-Fußabdruck zu verringern und Umweltschäden durch den Einsatz neuer Technologien zu minimieren. Der Schwerpunkt lag auf der Optimierung der in Hard- und Softwaresystemen verwendeten Rechenalgorithmen, die den Energieverbrauch für das Training und die Funktionsweise neuronaler Netze auf globaler Ebene senken sollen.
Heute wird die nachhaltige Entwicklung unseres Planeten zum Hauptthema in den Berichten der Weltorganisationen, die sich um die Zukunft der Erde kümmern. Und das ist nicht nur Greta Tunberg. Der Platz eines Menschen auf dem Planeten hängt in vielerlei Hinsicht davon ab, inwieweit wir ein Gleichgewicht zwischen der Entwicklung von Technologien, dem wachsenden Appetit globaler Unternehmen und dem verantwortungsvollen Umgang mit der Umwelt herstellen können. Mögliche Möglichkeiten zur Minimierung des Schadens durch sich schnell entwickelnde Technologien des letzten Jahrzehnts hängen weitgehend mit der Reduzierung des Energieverbrauchs und der Suche nach den optimalen und energieeffizienten Werkzeugen zur Lösung moderner technologischer Probleme zusammen.
Unser Arsenal verfügt über neuronale Netze und es liegt in unserer Verantwortung, Wissenschaftler, dafür zu sorgen, dass sie schnell, effizient und korrekt arbeiten und die ihnen zugewiesenen Aufgaben lösen. Aus Sicht der „grünen künstlichen Intelligenz“ geht es beim Durchbruch nicht darum, ein großes, leistungsfähiges, riesiges neuronales Netzwerk zu schaffen - eine Art Blauwal mit seinem überraschend großen neuronalen Netzwerk, sondern um eine Fliege mit ihren sehr bescheidenen „rechnerischen“ Fähigkeiten, sondern um ihre Fähigkeit, schnell und sicher zu sein energieeffizient die notwendigen aufgaben lösen. Ein solches neuronales Netz sollte eine völlig himmelhohe spezifische Produktivität aufweisen. Mit der richtigen Auswahl von Algorithmen können Sie 1000-mal weniger Ressourcen für Bilderkennungsaufgaben aufwenden, als manche Gerätehersteller heute behaupten.

Heute wissen wir, dass die Erhöhung der Kapazität von Geräten für die Durchführung von Operationen in unserer Region eine Einbahnstraße ist. Und die Aufgabe der Wissenschaftler heute (mit einer verantwortungsvollen Einstellung zur Entwicklung) ist es, die Technologie so zu gestalten, dass sie die Geräte so wenig wie möglich belastet, den Prozessor nicht auf die Kesseltemperatur erwärmt, keine Energie frisst, wie ein „gastro-unzufriedener Kadaver“. Und dann wird diese Technologie benutzerfreundlich und gleichzeitig Hightech.
Um dies zu verwirklichen, bedarf es ganz und gar nicht offensichtlicher „Bündel“ ganz unterschiedlicher Wissenschaftsbereiche. Ist es vielen klar, dass die Verlagerung von Deep-Learning-Technologien in die tropische Algebra die Anzahl der Transistoren in Neuroprozessoren drastisch reduzieren und gleichzeitig die Ausdruckskraft erhalten kann? Oder dass das Vorhandensein von Radonschichten in einem neuronalen Netzwerk es ermöglicht, projektive Invarianten wirtschaftlich zu beschreiben, die wiederum die interne Struktur von Bildern der realen Welt bestimmen?
Die Teilnahme an wissenschaftlichen Konferenzen ist zuallererst eine Gelegenheit, Uhren mit Weltmarktführern zu vergleichen, ihre echten Konkurrenten zu sehen (ja, echte Konkurrenten besuchen auch wissenschaftliche Konferenzen, weil sie auch Wissenschaftler sind), um zu sehen, wohin sich die Technologie aus erster Hand bewegt, und nicht in der Nacherzählung von Visionären und Evangelisten, die größtenteils nichts mit echter Wissenschaft zu tun haben, sondern nur gelernt haben, modische Wörter in relativ gebildeten Sätzen zu formulieren. Ohne dieses Verständnis von Trends und Trends in der Grundlagenforschung ist keine Bewegung nach vorne möglich. Technologie ohne Wissenschaft "wird nicht abheben", oder sie wird bereits im Voraus veraltet sein.