RUVDS startet zusammen mit Habr ein Projekt, das aus einer Reihe von Interviews mit interessanten, unserer Meinung nach Menschen in der IT-Umgebung besteht. Heute präsentieren wir ein Interview mit dem Leiter der Entwicklung interaktiver Systeme in Yandex, Boris Yangel.
Warum Alice, nicht Max, was der frühere Kommunikationsminister Nikifirov falsch gemacht hat, warum Tesla ins All starten. Antworten im Video und Text unter dem Schnitt.
Die Interviews wurden von Lera Negra und Habr-Redakteur Nikolai Zemlyansky vorbereitet.
Hallo. Ich bin Lera Negra und heute ist unser Gast Boris Yangel, der Leiter der Entwicklungsgruppe für Dialogsysteme bei Yandex. Natürlich werden wir mit Ihrer Arbeit beginnen. Was machen Sie jetzt in Yandex?- Jetzt in Yandex ist mein Hauptprojekt Alice, die Sprachassistentin, die Yandex im letzten Oktober gestartet hat, und meine Gruppe ist verantwortlich für das, was willkürlich als Alices Gehirn bezeichnet werden kann. Wir interpretieren das, was der Benutzer gesagt hat, in natürlicher Sprache und verwandeln es in eine strukturierte Darstellung. Dies ist unsere erste Aufgabe, und die zweite ist, wenn wir bereits wissen, was der Benutzer beantworten muss, und daraus auch eine Antwort in natürlicher Sprache zu machen.
"
Sie sind jetzt seit zwei Jahren in dieser Position." Die ganze Zeit waren Sie in der Entwicklung beschäftigt. War die Veröffentlichung eines Sprachassistenten zu spät, als die Konkurrenten ihn früher veröffentlichten?"Nein, natürlich ist es nicht zu spät." Wenn wir Wettbewerber betrachten, wer ist der wahre Wettbewerber? Es gibt Siri, den einzigen Sprachassistenten, der auch die russische Sprache versteht, aber nur unter iOS und MacOS funktioniert. Es ist nicht die beliebteste Plattform in Russland, und es gibt bestimmte Fragen zu Siri als Produkt. Nehmen wir weiter an, Google würde seinen Google-Assistenten bereits auf Russisch starten. Lohnt es sich, sich zu engagieren? Nun, vielleicht hat es sich trotzdem gelohnt, weil Sie versuchen können, mit Google in Ihrem Gebiet um ein Publikum zu konkurrieren, zumal wir mit einer Suche mehr oder weniger erfolgreich sind. Nun, und wahrscheinlich ist der letzte Punkt hier wichtig: Was wir jetzt sehen, ist der Beginn der Ära der Dialogsysteme, und tatsächlich wissen weder Google noch Apple, noch wissen wir wahrscheinlich noch, wie wir sie normalisieren können. Im Vergleich zu Suchmaschinen, mit dem, was in den frühen 2000er Jahren geschah, ist dies bedingt die Ära der Altavisten, wenn es einige Produkte gibt, aber sie arbeiten immer noch nach seltsamen Prinzipien und arbeiten so lala und zu jeder Zeit Kommen Sie mit Google und verändern Sie die Branche komplett. Daher lohnt es sich natürlich immer noch, darauf einzugehen. Viele technologische Herausforderungen und Probleme, die noch nicht gelöst wurden. Ein neuer Spieler kann kommen und alles umdrehen, und wir sind tatsächlich in einer etwas vorteilhafteren Position, weil wir später angefangen haben, was bedeutet, dass wir weniger Legacy-Stack haben, dh wir können sofort mit neuen Technologien arbeiten. Und Siri zum Beispiel, von dem Gott weiß, wann er es getan hat, hat viel alten Code, der bereits schwer zu ändern ist, und aus diesem Grund stoßen sie auf viele Probleme.
-
In Ihrer Rede an der Yandex Academy haben Sie gesagt, dass Sie einen bestimmten Hype-Zug erwischt haben. Wie ist es gelungen und ist dieser Zug jetzt abgereist?- Wahrscheinlich war es vor allem dank einer sehr mutigen Entscheidung möglich, die in unserem Produkt getroffen wurde. Alle Wettbewerber haben eine bestimmte Anzahl von Szenarien, die in diesen Produkten streng formuliert sind: „Wir können diese und jene Frage beantworten, über das Wetter oder etwas anderes sprechen und wenn das, was der Benutzer sagt, nicht unter eines fällt Aus diesen Szenarien antworten wir mit einer Art Stich wie "Entschuldigung, ich habe dich nicht verstanden." Wir haben uns entschieden, anders zu handeln, und ein neuronales Netzwerkmodul entwickelt, das in solchen Situationen mit etwas reagieren kann, das im Kontext des vorherigen Dialogs angemessen sein könnte, und tatsächlich mit dem Benutzer zu jedem Thema kommunizieren kann. Es mag nicht immer 100% angemessen sein, aber in mehr als der Hälfte der Fälle kann er sicherlich einige Dinge sagen, die in diesem Moment gesagt werden mussten. Und unser Modul hat viele Dinge gesagt, die den Benutzern gefallen haben. Alices lächerliche Antworten, die wir nicht dort eingegeben haben, die sie aber selbst generiert hat, haben sich sofort über soziale Netzwerke verbreitet, und dies hat den Hype-Zug ausgelöst. Natürlich geht er ein wenig, das ist unvermeidlich, all diese Witze sind langweilig, aber wir versuchen, das Produkt weiterzuentwickeln und nach und nach Hype zu fangen, wo wir können.
-
Sie haben versucht, Alice für einen russischen Benutzer so interessant wie möglich zu machen. Wie wurde die Stimme gewählt und warum war sie Alice?- Ehrlich gesagt habe ich mich nicht an der Auswahl einer Stimme beteiligt und weiß nicht, nach welchen Prinzipien sie umgesetzt wurde, außer dass es sich um eine coole Stimme der russischen Schauspielerin Tatyana Shitova handelt, die jeder liebt und die durchaus erkennbar ist.
Ich kann über den Namen Alice und über die Eigenschaften sprechen. Wir dachten und schrieben eine Reihe von Eigenschaften auf, für die wir einen Assistenten haben möchten. Zum Beispiel sollte er nicht arrogant sein, einer Person helfen, freundlich sein, intelligent sein, dh einige positive und negative Eigenschaften. Und dann haben wir den Leuten auf unserer Crowdsourcing-Plattform Fragen gestellt. Ist dieser Name beispielsweise mit dieser Immobilie verbunden oder nicht? Wir haben uns angesehen, welche Namen, die wir zuvor aus einigen Prinzipien ausgewählt hatten, mehr mit positiven als mit negativen Eigenschaften korrelieren, und nach diesem Kriterium hat der Name Alice einfach alle anderen Konkurrenten aus der Shortlist zerstört. Dies ist wahrscheinlich auf die Tatsache zurückzuführen, dass dieser Name in der russischen Kultur einige positive Anmerkungen enthält, zum Beispiel Alice im Wunderland, Alice Selezneva, klassische Beispiele. Dies gilt auch für die phonetischen Eigenschaften des Namens. Da dies der Name ist, der an Alice gerichtet wird, ist es notwendig, dass es keine Geräusche gibt, die manche Leute nur schwer aussprechen können. Zum Beispiel sollte der Buchstabe "P" definitiv nicht vorhanden sein, Zischen auch nicht. Der Name Alice erfüllt diese Eigenschaften.
-
Warum Alice, nicht Max, warum ist sie kein Mann?- Tatsächlich wurde viel geforscht, und eine Frau ist eine sicherere Wahl. Die Evolution hat uns so glücklich gemacht, dass eine Frau eine Mutter ist, etwas Sicheres, Liebes, und ein Mann ein Krieger ist, der einfach mit einem Speer kommt und dich tötet. Daher ist eine Assistentin sowohl für Frauen als auch für Männer normal. Wenn die Assistentin jedoch ein Mann ist, wird ein solches Produkt weniger verwendet.
-
Vor einigen Jahren gab es eine nicht sehr angenehme Geschichte, als sich der Microsoft-Chat-Bot völlig falsch verhielt. Gab es ein ähnliches Risiko bei Alice oder passierten vielleicht sogar ähnliche Situationen?- Natürlich war es das und wir haben viel über diese Geschichte nachgedacht, als Alice ins Leben gerufen wurde. Wie ich bereits sagte, haben wir ein neuronales Netzwerkmodul, das in jeder Situation reagiert und nicht nur im Rahmen eines Szenarios. Und er hat tatsächlich absolute Freiheit. Innerhalb der Grenzen einiger Einschränkungen, die wir festlegen, hat er die Freiheit zu sprechen, und in einigen Situationen kann er Dinge sagen, die wir nicht von ihm erwarten würden. Unsere Sprache ist sehr mächtig und reichhaltig. Es gibt eine Milliarde Möglichkeiten, zuzustimmen oder nicht zuzustimmen. Wir werden sie niemals alle zählen. Es ist bereits eine sehr schwierige Forschungsaufgabe, zu verhindern, dass sie zustimmt, wenn sie nach etwas Gefährlichem gefragt wird.
-
Hat das irgendwie damit zu tun, dass sie oft sagt: „Ich will nicht darüber reden“?- Sie sagt "Ich möchte nicht darüber sprechen", wenn wir verstehen, dass die Situation zu gefährlich ist, als dass das neuronale Netzwerkmodul eine Antwort geben könnte. Wenn Sie Alice erlauben, nur Ja oder Nein zu sagen, reicht dies aus, um jemanden zu beleidigen. Es reicht aus, sie zu fragen: "Unterstützen Sie X", wo X Faschismus, Völkermord oder was auch immer ist. Wenn sie ja sagt, ist alles, was geschrieben ist, weg.
-
Nach dem Abschluss haben Sie sofort bei Yandex angefangen, einer Abteilung, die sich mit der Suche nach Bildern auf Textanfrage befasst. Wurde danach plötzlich beschlossen, bei Microsoft Research in Cambridge zu arbeiten?
- Nun, nicht so plötzlich, es war natürlich. Ich habe bei Yandex gearbeitet, ich wollte mich weiterentwickeln, um einige komplexere Dinge zu tun.
-
Hat es in Yandex nicht funktioniert?- In Yandex stellte sich einerseits heraus, dass ich bereits eine Gruppe in Yandex leitete, die für die Qualität der Suche in Bildern verantwortlich war. Ich war wahrscheinlich nicht sehr gut auf die Arbeit eines Leiters vorbereitet und es hat mir nicht wirklich gefallen, ich habe es geliebt und jetzt programmiere ich gerne und die Arbeit ließ nur sehr wenige Möglichkeiten dafür, es sei denn, Sie möchten 16 Stunden am Tag arbeiten. Es hat mir nicht sehr gut gefallen, ich wollte mich nur als Programmierer, Datenanalysespezialist entwickeln, und hier habe ich eine großartige Option gefunden, eine Stelle bei Microsoft, die für meinen Hintergrund sehr relevant ist.
-
Was hast du dort gemacht?- Es gibt einen solchen Bereich im maschinellen Lernen, heißt Bayes'sche Schlussfolgerung. Hier geht es darum, unter Bedingungen unvollständiger Informationen absolut rationale Entscheidungen zu treffen, so dass man beweisen kann, dass in dieser Situation keine rationalere Entscheidung getroffen werden kann. Ich habe in einem Team gearbeitet, das eine Softwarebibliothek erstellt hat, mit deren Hilfe in einigen Situationen die volle Leistung dieses mathematischen Apparats genutzt werden kann, um Entscheidungen zu treffen. Tatsächlich ist dies eine Bibliothek für maschinelles Lernen, die einfach auf einigen spezifischen Prinzipien basiert und unkonventionell ist.
-
Und die Arbeit dort bereitete sich auf eine Führungsposition vor?- Nein, als ich von Cambridge nach Yandex zurückkehrte, bat ich mich ehrlich, niemanden zu führen. Wenn möglich, würde ich Code schreiben, ich schreibe wirklich gerne Code. Gleichzeitig war ich nicht an den wichtigsten Projekten des Unternehmens beteiligt und habe meine Funktionalität nicht vollständig offengelegt. Zuerst entwickelte ich ein Backend für einige experimentelle mobile Anwendungen, dann entwickelte ich Textklassifizierungsmethoden in einer Gruppe neuronaler Netze, und irgendwann entschied das Management: Warum machst du nichts Nützliches, mach Alice.
-
Vor zwei Jahren hat die Presse aktiv darüber diskutiert, dass die grundlegende IT-Ausbildung zumindest in unserem Land nicht ausreichend entwickelt ist. Wie gut waren Sie vorbereitet? Was hat dir geholfen? Ist das eine Yandex-Schule oder haben Sie sich nach dem Studium sicher genug gefühlt?- Ich kann programmieren, weil ich gerade viel programmiert habe. Als Kind saß ich an einem Computer und programmierte auch an der Universität. Dort gingen alle irgendwohin, um etwas zu trinken, und ich ging entweder etwas trinken oder saß beim Programmieren. Vom ersten Jahr an arbeitete ich fast ein bisschen in echten Unternehmen und sammelte Erfahrungen in der Branche. Dieses grundlegende Wissen reichte aus, um die anderen Dinge zu verstehen, die direkt benötigt werden, um selbst zu arbeiten.
Die Schule für Datenanalyse hat natürlich geholfen, dies ist eine coole Initiative, die das Wissen vermittelt, das derzeit am Ausgang der Universität fehlt. Ich habe dort nur ein Jahr lang studiert, weil es so viel Zeit gekostet hat, es gab so viele Aufgaben, so schwierige. Ich habe damals schon bei Yandex gearbeitet, ich hatte einfach keine Zeit. Aber im Allgemeinen würde ich jedem empfehlen, dorthin zu gehen.
-
Laut dem ehemaligen Kommunikationsminister Nikiforov gibt es in unserem Land bereits zu viele Programmierer, zu viele Spezialisten im IT-Bereich. Ist es so? Gibt es wirklich viele wirklich gute Spezialisten?- Ich weiß nicht, wie Herr Nikiforov denkt, aber als Person, die Spezialisten direkt für sein Team einstellen muss, habe ich große Probleme mit der Einstellung. Wir haben eine ziemlich schwierige Aufgabe, und Spezialisten mit einem überdurchschnittlichen Niveau sind erforderlich. Es gibt praktisch keine solchen Spezialisten, die ich auf dem Markt brauche, all diejenigen, die höchstwahrscheinlich bereits in Yandex arbeiten, na ja, an einigen wenigen anderen Orten. Ich weiß nicht, wen er als Programmierer betrachtet, aber es gibt nur sehr wenige hochqualifizierte Spezialisten, insbesondere auf dem Gebiet der neuronalen Netze, die eine gründliche Ausbildung erhalten.
-
Was ist für Sie der Sinn Ihrer Arbeit, sowohl in einem separaten Unternehmen als auch allgemein in der Branche?- Wenn Sie sich die Dinge global ansehen, wäre es wahrscheinlich großartig, sich etwas Cooles, eine Technologie oder eine Idee auszudenken, damit Leute, die nach mir in die Branche kommen, ihre eigenen Entwicklungen auf dieser Technologie aufbauen. Das heißt, es wird sozusagen in das Fundament eintreten, auf dem nach und nach alles aufgebaut wird. Ich weiß nicht, was es sein wird, aber ich möchte zumindest eine Spur davon hinterlassen, und es ist einfacher, dies zu tun, wahrscheinlich wenn Sie sich als Führungskraft entwickeln, weil es dann mehr Ressourcen gibt, können Sie einige globalere und ehrgeizigere Ideen ausprobieren . Aber wenn ich meine Hand gerade in mein Herz lege, kann ich nicht sagen, dass ich wirklich gerne Menschen führe, es ist wirklich harte Arbeit, es braucht viel Zeit, moralische Stärke und erlaubt mir nicht zu tun, was ich gerne mache - zu programmieren. Daher möchte ich mich in eine Richtung entwickeln, die es mir ermöglicht, das optimale Gleichgewicht zwischen dem Umfang der Dinge, die ich tun und die ich beeinflussen kann, und der Fähigkeit, diese Dinge direkt mit meinen eigenen Händen zu tun, zu finden. Für die gesamte Branche ist dies eine interessantere Frage. Es scheint mir, dass das Gleiche mit Sprachschnittstellen passiert, die mit grafischen Oberflächen geschehen sind, als sie gerade erschienen, als die ersten Farbmonitore erschienen, und wir von Konsolen, auf denen Befehle eingegeben werden mussten, zu einigen Schaltflächen gewechselt sind, auf denen dies möglich war zu drücken. Und als sie zum ersten Mal auftauchten, wusste niemand, wie man sie normal macht, es gab keine Paradigmen, Architekturmuster, Rahmenbedingungen, jeder tat, was er wollte, und die Schnittstellen waren schief, elend, es war sehr schwierig, sie zu machen, es war unmöglich, den Code zu lesen, aber Menschen Wir haben darüber nachgedacht, und nach und nach entstanden einige schöne Konzepte für die Erstellung dieser Schnittstellen. Es erschienen praktische Tools, und jetzt kann ein Fachmann auf diesem Gebiet sehr schnell eine Website mit einer ziemlich komplizierten Benutzeroberfläche erstellen. Wir überlegen, wie wir dasselbe mit Sprachschnittstellen machen können. Welche Werkzeuge sollten sein, damit sie bequem gemacht werden können und sich als gut herausstellen. Selbst wenn wir plötzlich kein gutes Produkt mehr bekommen würden, würden wir vielleicht der gesamten Branche zugute kommen, wenn wir etwas in diese Richtung erfinden würden.
-
Was kann Alice ersetzen?- Ich weiß nicht, was es sein wird. Welche Schnittstelle könnte noch bequemer sein als Sprache ... Wahrscheinlich die Kraft des Denkens kontrollieren, so etwas.
"
Wenn Alice stirbt, wirst du traurig sein?"- Ich werde ohne Arbeit bleiben, ja, ich werde traurig sein.
-
Große Unternehmen, große Projekte, was sind Ihrer Meinung nach die ersten Kandidaten für eine Abreise?"Nun, ich werde wahrscheinlich keine Namen nennen, das wäre falsch." Ich kann nicht sagen, dass jemand ein Kandidat für den Flug ist, weil er ein schlechtes Produkt herstellt. Wo ich mit Fehlern gerechnet habe, sind hier Subventionen für die Entwicklung des Geschäfts erforderlich. Zum Beispiel ein Taximarkt oder eine Art bedingte Lebensmittellieferung - Food Fox, Deliveru Club. Dies sind einerseits IT-Projekte, andererseits interagieren sie mit der realen Welt. Um dorthin zu gelangen, müssen Sie jetzt viel subventionieren, Konkurrenten aus dem Verkehr ziehen, um sehr wettbewerbsfähige Preise zu erzielen, alle vom Markt zu verdrängen und dann die Preise zu erhöhen. Dies führt dazu, dass viele Menschen kommen und dort brennen, nur weil ihnen das Geld ausgeht. Sie haben keine Zeit, jemanden herauszuquetschen, und Mastodons wie das Yandex-Taxi auf einigen Uber-Märkten zermalmen jeden.
-
Kryptowährungen. Sie investieren, nein, investiert, was, warum.- Ich bin nicht der erfolgreichste Krypto-Investor, ich bin einer von denen, die beschlossen haben, im ungünstigsten Moment ein wenig zu investieren, und jetzt sitzen sie und hoffen, dass Bitcoin schließlich wieder wächst. Mag mich nicht.
-
Haben Konkurrenten versucht, Sie zu locken?- Ja, ich antworte normalerweise, dass ich jetzt keinen anderen Job suche.
-
Wenn es nicht für die IT wäre, was dann?- Ich weiß nicht, ich mag Fallschirmspringen, vielleicht würde ich dann Ausbilder im Fallschirmspringen werden.
-
Warum Tesla ins All starten?- Weil es cool ist.
-
Vielen Dank, Boris. Unser heutiger Gast Nikolay Zemlyansky, Herausgeber von Habr, wird Ihnen noch einige Fragen stellen.-
Hallo Boris. Ich möchte an den kürzlich veröffentlichten Film Blade Runner 2049 erinnern, in dem Agent K einen Android-Assistenten hatte. Ich kann mich nicht an ihren Namen erinnern, lass Mascha sein. Wenn sie redeten und er etwas nicht mochte, konnte er sagen: "Mascha, Zickigkeit minus drei" oder "Mascha Sexualität plus fünf". Abhängig davon wurde die Kommunikation mit dem Assistenten angepasst. Was denkst du ist auf absehbare Zeit real und gibt es überhaupt einen Sinn?- Ich habe bereits ein wenig darüber gesprochen, wie wir mit den beleidigenden Antworten von Alice umgehen. Das ist alles wirklich eine große Geschichte und deshalb. Damit Alice den Gesprächspartner nicht beleidigt, bringen wir einigen Modellen bei, um vorherzusagen, ob und in welchem Umfang diese oder jene Antwort beleidigend ist. Jetzt verwenden wir diese Modelle nach einem sehr einfachen Prinzip: Wenn das Modell sagt, dass die Antwort beleidigend ist, geben wir ihr keine Antwort. In Begriffen, die Sie sagen, verdrehen wir die Beleidigung auf Null. Tatsächlich haben wir bereits ein Modell, das die Abstufung dieser Beleidigung bewertet, und wenn es einen Produktbedarf gab, könnten wir bereits einen Schieberegler erstellen, der die Antworten mehr oder weniger fett macht. Der Ansatz, den wir hierfür verwenden, kann auf andere Merkmale des Systemverhaltens angewendet werden. Dies erfordert natürlich einige Arbeiten, die für jedes spezifische Merkmal spezifisch sind, aber um einen solchen Assistenten herzustellen, dessen Eigenschaften mit Schiebereglern eingestellt werden können, wird dies in 20 Jahren nicht möglich sein, sondern eher bald, wie es mir scheint.
—
, , , , , «». , . . , , ?— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .
, « » -, , , , - — - , — , . « », . .
—
, . , , , - ?— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .
—
, .— , , , , .
—
, , , , .— , -.
—
. ? , , , . , ?— . Google, , Google- , . , , , . , , .
—
, , ?— . . , , , . Google, , . , .
—
, Siri. ?— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .
—
, , , , ?— , , . , , . , - — , . - , . — , , , . , Google .
- Danke Boris, es war sehr schön mit dir zu reden.
- Immer gerne.