Cómo los muchachos de Storyline regresaron de Silicon Valley a Minsk con $ 770 mil para una startup

En 2017, Vasily Shinkorenko y Maxim Abramchuk crearon el servicio Storyline, donde puede desarrollar aplicaciones para el asistente de voz de Amazon sin usar la programación. Los muchachos participaron en dos aceleradores en Silicon Valley: Boost VC e Y Combinator. En la primavera de 2018, recibieron $ 770 mil de inversiones.

Fillpackart y yo los llamamos y les preguntamos sobre todo: bajo el capó del servicio, qué se siente ser un desarrollador de inicio, cómo vivían en el valle y qué tan pronto los asistentes de voz cambiarán el mundo.




- ¿Estás en Bielorrusia ahora?

Vasily : Sí, estuvimos en California durante 8 meses, y en abril volamos de regreso a Minsk tan pronto como pasó YC. Allí también consideramos opciones sobre la mejor manera de construir una empresa. Había muchas opciones, pero decidió regresar a Minsk.

En primer lugar, por supuesto, debido a los recursos. En Minsk es mucho más fácil y barato buscar personas que en el valle. Allí compites con grandes empresas, con nuevas empresas geniales que se lanzan cada año. Y aquí somos los únicos que pasaron YC en la historia de Bielorrusia. Aquí no necesitamos recaudar tanto dinero para pagarle a los ingenieros 200 mil al año. Ahora estamos en la etapa donde trabajamos 12 horas al día. No importa dónde es seguro trabajar. Por lo tanto, elegimos Minsk.


Maxim Abramchuk y Vasily Shinkorenko

- La oficina ya ha sido alquilada, ¿se estableció?

P: - ¡Sí, sí! Tenemos una oficina maravillosa en el cuarto piso, con vista al río, en el centro de la ciudad.

- ¿Planeas reclutar un equipo grande?

P: - Ahora somos 6 personas. A finales de año serán 10. Y luego todo depende en gran medida de las métricas. Para lograr los objetivos que nos propusimos para el año, necesitaremos entre 10 y 15 personas.

- No estoy muy interesado en el tema, pero viví en Minsk durante un par de años y escuché desde el fondo de mi oído que supuestamente todos los chicos allí fueron llevados a Wargaming, EPAM y al extranjero. ¿No has encontrado tal problema?

P: - Sí, pero el truco es que todavía hay muy pocas compañías de alimentos, especialmente nuevas empresas. Y las nuevas empresas que son más o menos adecuadas hacen algo y no parecen zombis medio muertos en los dedos de una mano para contar. No creo que cinco empresas, esto es mucha competencia.

- ¿Ya sientes que te estás convirtiendo en un negocio?

P: - Podemos decir que ya hemos encontrado algo, pero no puedo decir que esto es lo que nos llevará al éxito global.

Antes de que apareciera el producto, solo los desarrolladores hicieron aplicaciones para Alex, escribieron código y contrataron compañías. Básicamente, creamos un nuevo segmento de mercado; ahora las personas sin experiencia técnica también los crean. Y ahora este segmento está creciendo, y nosotros estamos creciendo ahora, y el mercado de altavoces inteligentes en su conjunto está creciendo, la cantidad de aplicaciones de los usuarios está creciendo. Ya estamos haciendo un poco de dinero, aún no es una ganancia, está lejos de él, pero ya está en algún lugar en el horizonte.

Creo que, si bien todas las personas entran en una habitación, esto es más un producto que un negocio. Ahí es cuando pasas de 15 a 20 personas, entonces tendrás que pensar en los procesos y mucho más.

- Cuando recibió la inversión, ¿qué era más? ¿Euforia o temor de no poder hacerlo?

P: - Probablemente, hubo una sensación de un hito. La mayoría de las startups no viven ni siquiera los primeros seis meses. Y cuando viviste, hiciste algo que es interesante para alguien, la gente lo usa y, lo más importante, realmente ama y está dispuesto a pagar, entonces tienes un poco más de comprensión sobre qué hacer a continuación.

Bueno, es decir, no había tal sensación de bailar en mi cabeza y tirar zapatillas. Solo un entendimiento de que el siguiente paso está comenzando, y que tiene sus propios objetivos, sus propios KPI. YC ayudó mucho con esto, dijeron cómo debería verse el producto en un año, y qué se debe hacer para esto. Y aqui estamos.



- Cuéntanos, ¿qué estaban haciendo los valles en Bielorrusia antes de partir?

P: - Escribí el código yo mismo durante bastante tiempo, pero no muy bien. Luego me di cuenta de que es mejor que me den comunicaciones, todo tipo de cosas de negocios, marketing. Empecé a hacer esto y accidentalmente caí en la esfera de las interfaces de diálogo: bots en Telegram, en otros mensajeros, motores, marcos para bots. Girando alrededor de esto. En 2015, los chicos y yo hicimos varios productos e incluso recaudamos algo de dinero.

Junto con Max, comenzamos a hacer un producto. Aunque no tuvo éxito, obtuvimos experiencia. Luego juntos se construyó una agencia de 7 personas. Y para el verano del año 17, volvieron a los productos.

- Max, y tu?

Maxim: - Programa comenzó en su primer año. Tenía una especie de actitud en mi cabeza que, mientras me preparaba para la universidad, estaba estudiando física, matemáticas y todo tipo de cosas, pero no estoy fundamentalmente involucrado en la programación. Tan pronto como me vi en las listas de BSUIR, lo tomé de inmediato, comencé C ++, todo tipo de otras cosas. Los primeros meses que fui tonto, fue muy difícil. Luego se enteró de que hay una red, comenzó a pegarse en la interfaz. Vi a Ruby, escribí en él durante un par de meses. En general, se apresuró, giró y se detuvo en el backend.

Establece una meta para encontrar un trabajo. Durante varios meses crió a Ruby, SQL, hizo un par de pruebas. Me llevaron a una empresa y trabajé allí durante seis meses. Éramos cinco, y solo subcontratamos diferentes productos. Luego fue a otra empresa, trabajó allí durante aproximadamente un año y medio. Y luego la plataforma bot en telegrama acaba de comenzar. No recuerdo por qué, pero todo esto me inspiró. Hice un sitio web en un par de días (aún puede estar funcionando). Comenzamos a hacer bots por encargo.

Y a raíz de todo esto, Vasya y yo nos conocimos y comenzamos a fabricar productos.

Phill : - Entonces, ¿tienes más back-end en la pila?

M: - Bueno, el back-end es para mí una especie de rocklist o javist. Y como estoy escribiendo un backend en Ruby, hay un lugar para recorrer. Entre el 30 y el 40% de las veces tuve que escribir al frente, así que puedo decir que soy una pila completa. Ocho o nueve meses, hasta que tomamos el primer desarrollador, escribí todo el Storyline yo mismo, y el frente, la parte posterior y los devops, y todo lo demás.

F: ¿Desea dejar de escribir código y convertirse en un líder puro?

M: - Me gusta escribir código y también me gusta administrar desarrolladores, pero no lo haría a tiempo completo con eso. Tengo el deseo de tratar con el producto. Pruebe todo tipo de hipótesis, vea análisis, escriba hojas de ruta, comuníquese con los usuarios, etc. Esto es super interesante. Quizás en el futuro, cuando reclutemos más hombres, y su experiencia sea más fuerte, pueda transferirles todo. Pero no sé cuándo se realizará.

Cómo llegamos al valle y fallamos la primera idea




Nuestro amigo que una vez participó en Boost VC vino a Minsk. Nos conocimos, le mostramos un proyecto que se hizo para un café. Él dijo: “¡Cosas geniales! ¿Alguna vez has pensado en convertirlo en un producto separado para cafeterías?

Estamos, "intentemos". Resultó que conoce bien a Adam Draper de Boost VC, y dice: “solicítelo allí y, si puede llegar, viaje al valle. Será más interesante que lo que está haciendo con la agencia ahora ". Estamos muy bien, completamos una solicitud e hicimos un aterrizaje. Primero revisaron la selección, luego una entrevista de Skype con Adam. Se nos hizo una oferta (BoostVC generalmente da entre 25 y 50 mil por el 7% de la compañía). Lo recibimos y fuimos al valle con un producto para restaurantes.


Adam Draper

McDonald's y todo tipo de comidas rápidas tienen terminales de autoservicio. Son bastante caros. La mayoría de los cafés promedio no tienen la oportunidad de entregarlos, pero no quiero contratar muchos cajeros. Descubrimos cómo reemplazar dichos terminales de una manera fácil: ordenar comida a través de bots.
Las personas a través del mensajero podrán hacer pedidos o, si es un café, al lado del trabajo, averiguar si ahora hay una línea, para no perder el tiempo y no caer en vano. Es decir, haces un pedido, vienes en un momento conveniente, bueno, obtienes un descuento por esto. Y para los propietarios y gerentes, el punto principal es la automatización.

Así que llegamos, intentamos negociar con estas personas. Pero resultó que los pequeños cafés no necesitan automatización, sino clientes. Y a las grandes empresas no les importa que el terminal de autoservicio cueste una docena. Si no eres nadie y no hay forma de llamarte, casi no hay posibilidad de que un gran cliente te preste atención.

Encontré a un tipo que hace tabletas para pedidos en restaurantes. Pasó por YC y luego trabajó en un acuerdo con Wendy's durante tres años. Nos dimos cuenta de que nada nos funcionaría en absoluto, no entendemos nada en los restaurantes y no viviremos en ese régimen durante tres años.

Comenzamos a pensar cuál era el encanto. Cuando creamos bots personalizados, siempre dibujé tales mapas mentales: diagramas de cómo irá el diálogo, qué líneas dirá el usuario, qué bot. Una gran conversación con flechas, que mostramos a los clientes para su aprobación. Y luego pensamos lo genial que sería transferir este diagrama a un bot real con un solo botón. Y para que no tenga que codificar, extraiga desarrolladores, si el cliente envía ediciones.

Entonces decidimos cambiar a Storyline.

F: Max, ¿te pareció interesante la idea de Storyline en términos de implementación?

M: - Yo, de hecho, no soy un fanático especialmente para programar por el bien de la programación. Me gustó la idea en sí. Sí, fue divertido escribir un editor interactivo de aplicaciones, fue interesante ver nuevas funciones, admitir las antiguas, corregir errores, aumentar las métricas. Y ahora el front-end nos ha llegado, y es muy interesante optimizar el lienzo juntos, para que se muestre más rápido, se abra en el lugar de los usuarios, no se retrase.



F: ¿Y antes de eso, no trabajabas con lienzo y gráficos bidimensionales?

M: - Sí, no funcionó. Pero esto es lo que yo llamo: lienzo. De hecho, usamos d3.js y SVG porque escribir en lienzo sería aún más difícil. En Canvas, tendríamos que decir: "Tome este punto aquí con tales coordenadas, dibuje una línea hacia algunas coordenadas, con tal y tal grosor". Y dibujar un bloque con relleno, con sombras y para poder arrastrar y soltar, llevaría mucho tiempo. Por lo tanto, elegimos SVG, y no hay problemas especiales de rendimiento.

F: - ¿Gastas mucho esfuerzo en la creación de prototipos?

M: - No sé si es bueno o malo, pero lo hago bastante rápido. ¿Por qué nos movimos tan rápido? Nos llevó literalmente un día o medio desde la idea hasta la implementación mínima.

Por supuesto, ahora estoy pisando un rastrillo debido a esto, así que tengo que pasar a un proceso más estándar. Aún así, no tenemos cientos de usuarios, sino decenas de miles. Encuentran algunos errores específicos, usan casos que no previmos. Por lo tanto, debe reducir la velocidad, agregar pruebas: manual, automatizado.

Pero es genial cuando puedes pensar en un par de horas, hacerlo de inmediato y recibir comentarios de inmediato. En mi opinión, esto no es suficiente en la mente de muchos desarrolladores. Demasiados aserran para aserrar, durante semanas y meses. Pero para mí es muy animado: venir, hacer y mostrar rápidamente.

- Cuando salió el prototipo, ¿lo terminas o comienzas a reescribirlo desde cero?

M: - Cuando comenzamos, tuvimos una situación tensa: los usuarios comenzaron a ingresar de inmediato, era necesario mostrar que había tráfico. Luego no reescribimos todo, pero decidimos seguir usando el prototipo y seguimos viendo características encima.

Inicialmente, existía ese concepto: escribes el texto que dice Alexa, pones dos barras y escribes el texto que dice el usuario. Entonces era necesario pervertir, hacer todo tipo de transiciones, variables, y de hecho había un texto simple que era difícil de debatir. Y nuestros usuarios no son técnicos. Abrieron el soporte, olvidaron cerrarlo y todo se rompió. Pero luego fuimos a YC, realmente nos empujaron: “¡Vamos! ¡Vamos! Los usuarios crecieron, los errores crecieron. Parece que estamos tan obsesionados con este prototipo durante tres meses.

Cómo lanzamos el prototipo y lo reemplazamos con un producto sobre la marcha




Hicimos la primera versión súper primitiva del producto y comenzamos a mostrárselo a todos. En este momento, ya habíamos reunido a la comunidad, hecho un canal de telegramas. Preguntaron "mira tal cosa, ¿qué te parece?" Muchos tipos nos escribieron. Todos llamamos, preguntamos y nos dimos cuenta de que lo que quieren es mucho más complicado que lo que hacemos.

Nos ayudó el tipo de Slack - Amir Shevat, ahora es vicepresidente de Experiencia de Desarrollador en Twitch. También se mete en bots, incluso escribió uno de los libros más populares sobre el tema "Diseño de bots". Llegamos a su oficina de Slack, mostramos nuestro "prototipo", en ese momento era una imagen en Sketch.


Amir Shevat

Él dice: "Bueno, genial, pero ¿cómo quieres desarrollar esto más?" Decimos, sigamos con los mensajeros: Telegram, Facebook. Pero también pensamos que es genial para las cosas de voz, como Alexa, Cortana, Google Assistant porque no hay controles, menús. Solo hay lo que dice el usuario y lo que es el dispositivo. Amir dice: “Genial, intenta hacer la primera versión. Será interesante ". Y el mismo día, vimos que Amazon acababa de abrir una API para Alexa, lo que permitía crear habilidades mediante programación (sin pasar por la consola de desarrolladores de Amazon).

Comenzamos a hacer un producto, pero rápidamente encontramos un problema. Fue muy difícil hacer un lienzo en la aplicación, algo en lo que puedes extraer bloques, escribir algo.

El día de demostración se acercaba en Boost VC. Le quedaba un mes, y el trabajo sobre lienzo necesitaba casi lo mismo. Nos sentamos por la noche en la habitación donde vivíamos y pensamos: "Maldita sea, no tenemos tiempo para nada. No tendremos tiempo para comenzar la campaña ".

Y luego encontramos un servicio para los mapas mentales de Coggle, lo implementamos en un par de horas con un iframe, apretamos rápidamente un par de botones y lo llenamos. Resulta que cuando te registraste en Storyline, viste Coggle (pero acabamos de pegar su logotipo y controles con una franja de color de fondo). Los usuarios hicieron diagramas en él, y tomamos su JSON y lo convertimos en una habilidad para Alexa.

Y luego reunieron esto, tomaron un pequeño reproductor de video en el teléfono, cómo funciona y lo lanzaron a varios grupos de Facebook relacionados con Alexa. Al día siguiente ya teníamos más de cien me gusta y comentarios. Todos pidieron acceso. De allí vinieron un par de cientos de primeros usuarios.

Como Coggle era esencialmente texto, y allí era imposible crear objetos, imágenes, todo tipo de cosas, había una gran tarea para migrar todos los objetos de usuario del mapa mental a las estructuras. En ese momento ni siquiera teníamos nuestra propia base de datos. Solo mantuvimos a los usuarios en nuestro lugar, todos los mapas mentales se almacenaron en Coggle, y él nos los dio en el sitio web.

Era necesario llenar todo el almacenamiento con nosotros, transferir todos los proyectos a nuestra base. Y esto fue cuando los usuarios ya comenzaron a publicar sus proyectos. Entonces, todas estas historias sobre startups, cuando se dispara un prototipo y hay que reemplazarlo por un producto sobre la marcha, se trata directamente de nosotros.

F: - Si vamos a hacer un proyecto con amigos, elegiremos tecnologías que conozcamos, y no aquellas que podrían ser más adecuadas. ¿Ese también fue el caso contigo?

M: - Sí, básicamente así. Pero tuvimos mucha suerte porque JS y Ruby son una gran pila para las nuevas empresas. En Ruby, puedes romper todo muy rápido, y no diría que todo se pone mal después. A menos que, por supuesto, alcance el nivel de Twitter, es por eso que Twitter ha sido reescrito de Ruby a Scala.

Mientras eres una startup, Ruby on Rails es todo lo que necesitas. Pero si escribiera en Java, probablemente no todo sería tan optimista.

F: Aquí está el problema de que solo puedes hacerlo bien con lo que puedes. ¿Tienes JS limpio?

M: - Tenemos JavaScript regular y reaccionamos con Redux

F: - ¿Y por qué los elegiste?

M: - Cuando comenzamos a escribir Storyline, no usé React. Antes de eso, escribí en Angular 1.4, 1.5. Un poco asomó el segundo Angular, que está en TypeScript. Cuando comenzamos Storyline, React ya ganó la guerra, por lo que era más prometedor escribir sobre él (y más fácil, como me parece ahora). Así que busqué en Google el Tutorial de React, lo introduje durante un par de días, até un generador predeterminado de Dan Abramov y ya estaba Redux. Ahora no me arrepiento, aunque no tenía mucha experiencia con otras bibliotecas.



F: - ¿Puedes decir algunas palabras sobre arquitectura?

M: - Todo es bastante simple, tenemos una aplicación de una sola página en React. Los rieles se usan para dos cosas. Primero, esta es la aplicación para la aplicación cliente. El segundo es el alojamiento de habilidades creadas por los usuarios a través de Storyline.

El frente consta de dos grandes componentes. El primero es el Tablero y todo lo que se encuentra dentro del proyecto, y el segundo es el editor de habilidades. Ya está escrito entremezclado con d3.js. Los bloques se dibujan allí: es necesario que todo esto sea rápido, súper interactivo y hermoso, para poder dibujar todo tipo de flechas, animaciones, etc. Fue muy importante para nosotros, porque esencialmente tenemos una herramienta para la programación visual.

Y Alexa, se puede decir, funciona como un bot regular en Telegram o Facebook. Le das de comer algún tipo de punto final, algún tipo de servochka. Tan pronto como el usuario comienza a hablar con Alexa, ella le envía solicitudes. Trabaja como representante: recibe una solicitud y la responde. Alexa, tu respuesta lo formatea y lo pronuncia. Nada sobrenatural: la aplicación ferroviaria monolítica habitual, todo funciona en Amazon Web Services. Intentamos hacer todo de forma estándar: React, Redux, Ruby on Rails, es más fácil encontrar desarrolladores.

F: - ¿Qué parte ahora parece la más difícil?

M: - Tanto técnica como conceptualmente compleja, parece la implementación de multiplataforma. Ahora solo admitimos a Alex, luego tendremos Google en casa, y Cortana, y otras cosas. Honestamente, todavía no estamos técnicamente preparados para esto. Creo que habrá grandes problemas y será un gran desafío.

F: - ¿Puede decirme cuántas líneas de código hay en el archivo más grande del proyecto ahora?

M: - En la interfaz hay probablemente 700 líneas, hay un archivo allí. Probablemente más pequeño en el backend (solo escribo mejor en Ruby). Puede haber 250-300.

Cómo se organizan los programas en aceleradores y cómo transcurre la vida en Silicon Valley



Tim Draper

Vivíamos en San Mateo, California, en la Draper University. Fue construido por el padre de nuestro inversionista Adam Tim Draper. Es uno de los tipos más famosos allí. Incluso se le llama el padre fundador del valle. Compró un hotel y lo convirtió en una universidad, donde dirige su propio programa dos veces al año. Tanto nosotros como otras compañías vivimos allí. Y para aquellos que participan en Boost VC, ofrecen alojamiento gratuito durante cuatro meses.

, -… , 10 — . : , Boost, , . 97% .

YC Boost VC . . , . Quora ( CTO Facebook), AirBnb, Amplitude, Zapier, Dropbox. , , , , .



. , - — , . - 40 , 14. . (CEO YC Twitch) (head of growth Airbnb).

, , , . : , , $1 .

, — . , , . 50%, , . , , .

- En el valle, una comunidad genial, todos ayudan a todos. ¿Es posible llevar su código a una de las principales plataformas de desarrollo, mostrar, pedir consejo?

M: - Creo que se verá un poco extraño. A los mismos muchachos de Slack se les puede pedir algunos consejos para los cuales no hay una respuesta correcta. Puedes sentarte, filosofar. Solo pueden dar consejos desde su campanario.

Pero con la programación, no lo sé. Sin embargo, puedes googlear, probar, encontrar en el github. No creo que algún tipo súper genial esté en contra, pero eso realmente no tiene sentido.

P: - Tiene sentido en áreas específicas. Si haces algo sobre aprendizaje automático, y hay un tipo que ha estado haciendo esto durante 20 años, entonces sí, será muy útil.

F: - Max, ¿qué piensas, qué pasa con los desarrolladores en una startup en comparación con otras áreas?

M: - Solo sé lo que se siente ser un fundador, como desarrollador, no he trabajado en startups antes. Ahora no me considero un desarrollador, porque tengo que escribir cada vez menos código y sumergirme más en un montón de procesos diferentes, casi antes de comprar agua en la oficina.

Pero aún así, ser desarrollador en una startup es muy bueno. No solo corta las características que el cliente le dijo, sino que usted mismo puede influir en ellas, inventarlas. Pero esto también es muy estresante. Todos quieren rápido, y tú también. En outsourcing, puede decir "Pasé 10 horas en la tarea", aunque en realidad pasé 4, y todo estará bien. Simplemente puede sentarse y clasificar la tecnología, reescribir una clase muchas veces, cubrir todo con pruebas.

Y luego tú mismo controlas tu tiempo. Siempre hay un interés en hacer más rápido, mejor. En una startup, necesitas equilibrar entre un montón de piezas diferentes.

F: - ¿Tuviste que confirmar de alguna manera tu habilidad para obtener una inversión?

M: Puede sonar triste e insultante, pero me parece que el papel de la tecnología no era particularmente importante. Creo que el 95% de las nuevas empresas hacen lo mismo, si no estamos hablando de compañías tecnológicas sofisticadas donde la esencia del producto es la tecnología.

Y todo el resto de la tecnología se desvanece en el fondo. Escribir alguna cosa o aplicación no es mucha mente. Hay muchos marcos, tutoriales, todo es bastante comprensible y simple. Y encontrar una buena idea y una buena audiencia, hacer un producto, comprender quién lo necesita, es muchas veces más difícil.

Me parece que el papel de la tecnología en las startups está sobreestimado en las cabezas de las personas. Apila, rápido o lento, escribes código: no todo es tan importante. Mucho más importante es su estrategia, ¿cómo encontrar soluciones?



- ¿Qué están mirando más? ¿La idea en sí o tu habilidad para aprovecharla y llevarla al final?

P: - YC primero mira a los fundadores: cuántas unidades de trabajo puede hacer por unidad de tiempo. Lo principal es qué tan rápido puede hacer, probar, comprender qué no funciona dónde y hacer a continuación.

Lo segundo que miran es el mercado. Si lo haces muy rápido, pero en un mal mercado, no llegarás lejos. Los mercados muy grandes tienden a tener una alta competencia, por lo que intentan encontrar pequeños pero de rápido crecimiento. Nosotros, creo, tuvimos el momento perfecto. Hicimos el producto tan pronto como fue posible hacerlo. Y el tiempo es una de las cosas más importantes.

Y el tercero es el producto en sí. Para ellos es importante que la gente lo ame. Es mejor hacer un producto que les guste a cientos que un producto que les guste a miles. Si simplemente te gusta, entonces será difícil de convertir. Es mucho mejor encontrar una comunidad pequeña. Crecimos de cero a 14 mil usuarios orgánicamente simplemente porque algunas personas le contaron a otros sobre nosotros.

La semana pasada, una persona con su negocio inmobiliario escribió en nuestro grupo en Facebook. Ahora, un fenómeno popular es cuando la gente mira a su casa no con un agente inmobiliario, sino con ellos mismos. Quería hacer una habilidad para Alexa, ponerla en todas las casas del dispositivo, para que los propios clientes pudieran preguntarle sobre todo. Le pidió a la agencia que desarrollara tal habilidad, y allí le pidieron $ 45 mil.

Estaba molesto y fue a buscar cómo hacerlo él mismo. Encontré nuestro producto e hice esto, para lo cual la agencia pidió 45 mil, en solo unos días. Y entonces compró nuestra versión paga, aunque ni siquiera necesitaba las funciones que están allí (una buena razón para que pensemos en nuevos segmentos). Simplemente amaba el producto y nos apoyaba.

¿Qué pasará con los asistentes de voz en los próximos años?




, . , - - . . , - . , . , .

. . , . .

— . . - . 50 . Google actions -, 86.2% . Microsoft 500 Windows, 50% .

. , (, ), . 18-24 . .

3-5 : , . , «, ». , , . , . , , . .

, , . -, . BMW Lexus . Amazon -, -. 40 , , . «, , , ». , . , . «always listening» , .


- ¿Te interesó el tema de la lingüística? ¿Enseñar a la computadora a hablar, todo eso?

P: - Sí, es muy bueno. Recuerdo que en Star Trek había una computadora con la que hablaban. Fue divertido, pero parecía muy futurista. Y ahora esto realmente está sucediendo.



Hay una historia Voy del trabajo al entrenamiento, me siento en Uber y el conductor está hablando con alguien. Miro, nadie está en el auto. Resultó que habló con Alice en Yandex Navigator. Y había un tipo que lo respaldaba. El conductor comenzó a maldecir, y Alice pensó que la estaba maldiciendo. Le dijo: "¿Cómo me estás hablando?" El conductor dice: "cállate, no depende de ti". Se veía tan real. ¿Crees que el futuro está en algún lugar lejano, pero está aquí, ya ha llegado?

Por supuesto, hasta qué punto los dispositivos y los ayudantes pueden responder contextualmente aún está lejos de ser ideal. Pero el reconocimiento de voz está mejorando. Si Alexa entiende correctamente 8 de cada 10 palabras (de acuerdo con mis sentimientos), en unos años comprenderá las 10. Esto afectará en gran medida la forma en que las personas hablarán con su dispositivo. Siri es súper tonta, no entiende nada en absoluto y realmente me molesta. El asistente de voz es un producto de este tipo: para que funcione bien, la tecnología en sí misma debe ser buena.

"¿Te gustaría vincular algún tipo de entrenamiento para que Alex no entienda literalmente lo que le estás diciendo, pero usa el contexto?"

P: - Ahora funciona parcialmente en Storyline. Por ejemplo, hay intenciones SÍ / NO, y se les agrega automáticamente un montón de sinónimos en el lado de Amazon. Si pregunta Sí, Alexa entenderá Ok, Bien, Verdadero, etc. Todo esto se hace, a nivel de Alexa, y lo usamos como interfaz.

- ¿Cuándo los autos hablan mejor que nosotros?

P: - Esta es una pregunta sobre inteligencia artificial en general. La prueba de Turing ahora es bastante posible de pasar, para entrenar específicamente el sistema para una tarea estrecha. Pero hablar mejor que una persona significa comprender el contexto, las emociones, las entonaciones, combinar todo para dar una respuesta. No sé, es muy difícil para mí imaginar esto.

Puedo estar completamente equivocado, pero me parece que no antes de 10-15 años.

Source: https://habr.com/ru/post/es419381/


All Articles