Andrey Sebrant (Yandex): Negócios na era da inteligência artificial

Agora todo mundo está falando sobre a nova revolução trazida pela inteligência artificial e aprendizado de máquina. Algoritmos inteligentes penetram em todas as esferas da vida: desde a busca pelo bóson de Higgs até a escolha de um filme para a noite. As empresas mais avançadas já estão implementando ativamente essas tecnologias em seus produtos e marketing. Recomendações personalizadas, publicidade, interface do site - tudo isso não é algum tipo de magia negra, mas tecnologias já disponíveis.

No mercado interno, sem dúvida, a Yandex é a empresa mais avançada que utiliza o poder das máquinas. Em seu relatório ao #amoCONF, o diretor de marketing da Yandex Services Andrei Sebrant falou sobre o futuro e as oportunidades que se abrem para cada empresa. Otimize seus negócios para tendências futuras!

Isenção de responsabilidade . Este artigo é uma transcrição do discurso de Andrei Sebrant. Há pessoas que economizam tempo e adoram texto, há quem não pode assistir a vídeos no trabalho ou na estrada, mas lê Habr com alegria, há pessoas com deficiência auditiva para as quais a trilha sonora é inacessível ou difícil de entender. Decidimos que todos eles decifrassem conteúdo excelente. Quem prefere o vídeo é o link no final.

Inteligência de máquinas e comoditização de tecnologias


Boa tarde Olá, todos reunidos no Olímpico. Obrigado pelo delineador. É verdade que vou falar sobre o futuro, usando palavras assustadoras. Suspeito que o termo “comoditização da tecnologia” não seja amplamente conhecido por ninguém - não seja tímido, geralmente não é conhecido por muitos. Mas é útil, é realmente simples. Falo sobre ele mais tarde. E sim, havia a frase certa: vou falar sobre o futuro que está chegando, está chegando, alguns vieram para que apenas a raspagem permaneça.

O problema é que, durante 20 anos do meu trabalho na Internet, pareceu-me que tudo é incrível, acontecendo rapidamente - que legal! Agora entendo que tudo o que ocorreu nesses 20 anos foi um processo monstruosamente inibitório, incrivelmente lento, mas está começando rapidamente agora. Em geral, em todo o relatório, a história se baseia no princípio de um mosaico estranho, um mosaico que ... Nem melhor, eu diria assim: no princípio de um quebra-cabeça disperso. Se, como resultado de olhar para essas peças, a imagem dessas peças do quebra-cabeça começar a se formar na sua cabeça - o objetivo é alcançado, se não - bem, eu não sei, olhe para o registro, tente - talvez ele acabe no final. Porque este não é um livro de receitas - não vou lhe dizer como fazê-lo. Vou lhe dizer em que futuro, em apenas alguns anos, em 3-4-5 (não mais), você precisará organizar suas vendas, atrair clientes, comunicar-se de alguma forma com pessoas que estão relacionadas a você.

Um futuro que já chegou. Dois casos não são sobre a Internet e não sobre marketing.


Mas vou lhe contar alguns casos estranhos. Aqui está a história de um homem da Califórnia. Não foi por acaso que eu coloquei a idade dele no escorregador - o homem tem 65 anos, é ainda mais velho que eu. Ele tem um problema: ele tem uma esposa que ama seu gramado limpo (mas aqui é a Califórnia, não há cercas de dois metros ao redor dos gramados); gatos vizinhos andam no gramado e porcaria. Como essa tarefa é resolvida em 2016?

Gatos vizinhos e gramado favorito: como resolver um problema com sua esposa


Em 2016, este homem, Robert Bond, compra um pouco de ferro no seu computador doméstico, conecta-o a uma câmera de vigilância que já está de pé, com vista para o gramado e faz uma coisa um tanto incomum - ele baixa um software de código aberto gratuito e acessível, que é uma rede neural e começa a treinar essa rede neural para reconhecer gatos na imagem da câmera.

E a tarefa a princípio parece trivial, porque se algo é fácil de aprender, são gatos, porque os gatos estão cheios de Internet, dezenas de milhões de gatos estão na Internet. Se tudo fosse tão simples - reconhecer um gato "diurno" pode ser treinado no "conjunto de dados", que carrega simplesmente com a velocidade do canal de taxa de transferência. Mas as coisas são piores: na vida real, os gatos vão cagar principalmente à noite. Praticamente não há fotos de gatos noturnos fazendo xixi no gramado na Internet. O homem tinha, como nós, como qualquer empresa envolvida em ciência de dados normal e treinamento de redes neurais ... Ok, vamos desenterrar as imagens adicionalmente, fazer elas mesmas; a rede aprendeu a reconhecer gatos noturnos também é muito confiável ...



E depois disso - o último passo: uma válvula controlada eletricamente é conectada à saída deste computador. A válvula fica no tubo que leva ao pulverizador. Portanto, assim que o gato entra no gramado e quer se adaptar, ele começa a regá-lo - o gato despeja.

O problema é resolvido, a esposa é feliz, os gatos não andam, e tudo isso é um milagre estranho - redes neurais aprendendo a reconhecer gatos, que descobriram que na Internet, inferno, não há imagens fonte suficientes para o treinamento. Ok, vamos terminar você! Ela terminou seus estudos. Esta é provavelmente a única rede neural no mundo que pode reconhecer gatos noturnos.

Tudo isso é feito por uma pessoa que não é hiperprogramadora, que não trabalha no Google ou no Yandex por toda a vida e, com a ajuda desse hardware, em geral, é bem barato, compacto e simples.

Pepinos japoneses: como ajudar a mãe


Outra história. Do outro lado do oceano, na Califórnia, os japoneses cultivam pepinos em uma pequena fazenda. Pepinos neste formulário são geralmente classificados em 9 categorias diferentes.

Essa classificação é feita manualmente por uma mãe idosa. É difícil para ela - ela fica perto da transportadora 8 horas por dia, e ela é toda a sua vida ... Bem, não tudo, mas ela dedicou os últimos anos de sua vida ao que ela entende, olhando um pepino (suas espinhas, cor, tamanho e forma), no qual de nove categorias deve ser atribuída. Eles têm problemas - eles não podem nem contratar um trabalhador temporário, porque o trabalhador deve ser ensinado por vários meses esse glorioso processo - a reconhecer pepinos. Então você provavelmente já adivinhou.



Era um computador novamente. Desta vez, no entanto, a grade estava na nuvem, porque o computador Raspderry Pi é de baixa potência. Na rede foi ensinado o que a mãe faz como amostra de treinamento, eles usaram a ação da própria mãe: aqui está uma foto do pepino, para onde a mãe a levou. Depois que minha mãe fez isso 10 mil vezes: "Setochka, aqui está um novo pepino para você, você entende qual a categoria que ele tem?" "Eu entendo", diz o setochka.



E tudo isso foi incorporado nesse projeto: um transportador, pepinos andam ao longo dele antes de cair no transportador, uma câmera olha para eles, empurradores ficam ao longo do transportador e empurram um pepino em uma caixa da categoria correspondente. Novamente, esta é a decisão de 2016. Isso ilustra um ponto muito importante que agora é pouco compreendido. Está escrito na tela:



O que costumávamos chamar de tecnologia da informação deixou de ser informação. Estas são tecnologias operacionais: a própria máquina treinada executa ações e não nos informa; a campainha não soa - “O gato chegou. O que você vai fazer? Você vai amarrá-lo com uma toalha ou o quê? E exibe o número da categoria sobre um pepino flutuante. “Bem, agora você pode empurrá-lo com sua mão real” ... Não! Não há ninguém nesse processo após o término do treinamento. Esta é uma imagem muito versátil que caracteriza como o futuro funciona, em que máquinas resolvem tarefas intelectuais (identificar um gato, entender a qual categoria um pepino pertence).

A tecnologia da informação tornou-se operacional


E, na verdade, esse não é o nosso capricho. E, em geral, isso não é propriedade apenas da Internet e de algumas coisas virtuais que acontecem em um computador. Eu trouxe especialmente o slide: a General Electric é uma empresa bastante grande que trabalha com colossais negócios off-line, que acreditam que 2015 foi o ano em que essa conversão ocorreu - a tecnologia da informação se tornou operacional e eles determinam o nosso futuro. De fato, para acompanhar tudo isso, precisamos pensar em como estabelecer a mesma transição em nossos processos de negócios, porque a transformação é sempre uma coisa dolorosa e não instantânea.

Mas se você não se preparar para essas informações agora, poderá se encontrar entre aqueles que foram pisoteados. Um bom exemplo: eles pisaram na Kodak, ele pensou que estava bem protegido (uma tecnologia como essa!). Eles atacaram o Blackberry - pensaram sinceramente que era valioso que as pessoas pressionassem os botões, e ninguém arrastaria os dedos pela tela, sujando-a. Onde está o Blackberry?

Finalmente, outra referência às autoridades. No início deste ano, em Davos, no Fórum Econômico Mundial, essas mesmas palavras foram oficialmente pronunciadas repetidamente: estamos agora no centro da quarta revolução industrial. Essa revolução industrial se deve principalmente à velocidade frenética com a qual a inteligência artificial e o aprendizado de máquina estão sendo introduzidos.



Eu odeio as palavras "inteligência artificial" e agora vou explicar o porquê. Porque, na verdade, estamos tentando comparar o carro conosco neste local e de alguma forma assustar o carro (não tem medo): "Você nunca se compara a nós! Nós somos pensadores! Veja bem, a máquina ao longo da história da humanidade provou que pode fazer mais - mais porque criamos.

Um carro sempre pode fazer mais


Aqui está um bom exemplo que eu gosto de dar em várias palestras - essa é uma história sobre um pássaro artificial. Não podemos reproduzir isso. Realmente não temos idéia de como cada pena em sua asa funciona, qual a função que ela desempenha no vôo. Além disso, a diversidade dessas asas emplumadas na natureza é monstruosa! ... E depois existem morcegos.

O que é um "pássaro artificial"?


É verdade que não podemos e não podemos apenas reproduzir, e não podemos, a julgar pelo desenvolvimento da tecnologia, nos próximos anos - não podemos entender completamente a física do voo com a precisão de como cada fio da asa funciona. Mas nós, como somos pessoas, a humanidade, fomos inspirados pelo pássaro como uma idéia de fuga. E, nesse sentido, o primeiro pássaro artificial foi um balão, criado muitos séculos antes de hoje. Porque ele permitiu que as pessoas levassem ao ar.

Depois de algum tempo, eles voltaram à ideia de uma asa completamente diferente, com o perfil que o pássaro não conhece - está estático, sem movimentos de giro pode manter o carro no ar. Mas ele tem um motor a jato, e essa máquina começou a nos transportar através do oceano, o que os pássaros não podem.

Além disso, em algum momento, nós, a humanidade, voamos para as estrelas ... Ok, para Marte! Até agora, não para as estrelas, mas essa "Curiosidade" está se arrastando em Marte e está transferindo selfies de lá. O mesmo pássaro artificial o trouxe lá. Veja bem, o que pensamos sobre a idéia de voar e o que deveria ser um pássaro artificial.



Ouça, quando eles me falam agora sobre inteligência artificial ... Bem, não sabemos como isso funciona (aponta para a cabeça) ... Sim! Assim como não sabemos nada sobre a asa do pássaro. Isso não nos impediu no momento em que os balões apareceram, inventaram um ábaco e simplificaram uma certa operação da qual os animais não são capazes, mas temos um relato oral - mas, caramba, é mais fácil. Então a tecnologia nos ajudou a torná-lo ainda mais fácil e, em seguida, alcançou as redes neurais treinadas - isso é importante! Eles aprendem sozinhos!

O que é inteligência artificial?


Se recordarmos o exemplo de um gato, ninguém explicou a essa grade os parâmetros formais da diferença entre um gato e um bebê e um cachorro. Grid se estudou, olhando milhões de fotos de gatos e acabou aprendendo. Nós não sabemos como. Bem, como aprendemos a nós mesmos?

E, na verdade, do que estou falando agora, que a inteligência artificial (falar em máquina ainda é mais correta) terá a mesma relação com o cérebro que um foguete para um pardal - e torna a vida tão interessante. Um foguete não pode twittar e cagar em nossas cabeças. Pardal pode.



Ao mesmo tempo, um foguete, como você pode imaginar, pode: uma carga nuclear para um continente vizinho, de Kurioshiti a Marte, um satélite em órbita para que a Internet via satélite funcione, muitas coisas, mas isso não tem absolutamente nada a ver com pardais. Exatamente o mesmo acontecerá com a inteligência da máquina: ela fará coisas que não podemos descobrir, o que o cérebro pode fazer, mas pode.



Ao mesmo tempo, outra história interessante aconteceu em paralelo, que diz respeito a não muitos serviços ... Porque agora estou falando de serviços específicos - reconhecimento de imagens, na verdade a função em torno da qual os dois exemplos foram construídos, em torno dos quais a pesquisa de imagens é construída, vários coisas Mas este ainda é um serviço específico. Você pode dizer personalização - terei exemplos separados sobre isso. Este também é um serviço separado - para entender algo sobre o comprador que veio até você. Mas este é um serviço.

Não apenas os próprios serviços, mas também as interfaces


Sistemas de autoaprendizagem, redes neurais em primeiro lugar tornaram possível resolver outro problema interessante que é absolutamente assim - em todos os serviços. Esta tarefa é front-end.

Há algum tempo, havia um problema (embora existisse): você precisa trazer as informações para um formato legível por máquina, para que a máquina possa começar a trabalhar com ela. Não há mais esse problema! Porque ... O que é uma visualização legível por máquina? Ela pode ler o texto até do manuscrito, da tela ou do desenho da caverna, se o texto estiver lá. Além disso, ela pode entender o que aconteceu nessa figura, se for uma figura. Ela pode ouvir o que foi dito em voz alta e transformá-lo em texto impresso, se você precisar, por algum motivo; pior do que isso - o significado de tudo isso é entender ...

Reconhecimento de fala, imagens, síntese de fala


E esta é a história mais interessante que está acontecendo agora. O que está acontecendo agora está mudando imensamente a vida, digamos, em alguns anos. Para que a máquina aprendesse a não ouvir estupidamente e simplesmente traduzir sons em letras, era necessário ensinar-lhe algum significado. Aqui começou uma tarefa interessante, uma tarefa absolutamente prática, que não é visível do lado de fora, e essa é uma grande inovação que foi resolvida, por exemplo, pelos mecanismos de pesquisa que precisavam resolver o problema ...



Você sabe, para algumas doenças mentais (se houver psicólogos na sala - eles conhecem esse teste), eles dão quatro objetos ou mais e dizem: “O que é supérfluo aqui? Encontre. " Em muitos casos, para algumas doenças, respostas completamente surpreendentes e estranhas que nos parecem ilusórias. Portanto, a mesma tarefa para o carro: quatro objetos - encontre o extra.



E acontece que, no modelo antigo e tradicional de análise linguística, essa é uma grande emboscada. Porque, se olharmos para o objeto nº 2 e o objeto nº 4, verifica-se que, embora esse texto escrito e o estresse não sejam ouvidos, LOCK e LOCK não diferem. Além disso, mesmo uma análise aprofundada do adjetivo mostra que isso é algo que descreve o material do qual esse substantivo é aparentemente feito. E parece que esses dois objetos estão muito próximos (aponta para "Castelo de Pedra" e "Castelo de Ferro"), e este ("Fortaleza Velha") geralmente não está em lugar algum, não há nada parecido. Mas você e eu entendemos que a história é completamente diferente: de um modo geral, esse objeto é supérfluo (o Castelo de Ferro), mas esses três são iguais. Como explicar isso para um carro? Especialmente quando se trata de uma imagem em geral e, por simplicidade, mais precisamente por realismo, assumimos que essa imagem não contém texto em figuras - por exemplo, na página em que é encontrada. Apenas uma imagem. No álbum de fotos. Como classificá-lo? Devo exibi-lo a pedido da "antiga fortaleza"?

E aconteceu que existe algo que durante algum tempo pareceu ficção não científica, como um espaço multidimensional de significados no qual você pode ensinar uma máquina a construir alguns vetores. Partes desses vetores são mostrados abaixo das figuras, e até mesmo uma rápida olhada mostra que essas (as três primeiras figuras) são geralmente semelhantes - bem, pessoal, há algo 8, 7, 1, 3 ... e aqui - brrr, é obviamente algo - isso não é de todo. Ou seja, esses três se destacam em algum lugar em um lugar, em uma área, aproximadamente em uma área desse monstruoso espaço multidimensional de significados, e a quarta em algum lugar em algum lugar lá.

E isso resolve o problema de entender o significado, pelo menos do ponto de vista de quais objetos estão significativamente próximos um do outro. É legal que essa tarefa agora, por exemplo, resolver problemas semelhantes entre si, permita que a mesma Microsoft forneça excelente tradução simultânea no Skype. Porque no exato momento em que, em vez de modelos linguísticos clássicos que tropeçam nesse problema (lock-lock), as redes neurais estavam conectadas - tornou-se significativo traduzir. E então, pessoal, eles já conectam idioma por idioma. Nesse momento, quando o espaço desses vetores de significado está cheio, sua projeção em qualquer idioma é uma operação puramente técnica. Neste momento, os problemas de linguagem em nosso planeta desaparecem como uma classe.

Esta é uma história muito não trivial! Não estou dizendo que o engenhoso Yandex, a engenhosa Microsoft, o engenhoso Google estão fazendo isso agora. Estou falando de como isso muda a vida da maneira que não conseguimos imaginar, de alguma forma assim - com um chute meio. Nem veremos que de repente tudo na interface foi traduzido automaticamente. Será assim - não como nenhum super serviço separado.

Tentativa de ciência tradicional? Não, simbiose com ela!


Quero mostrar o que está acontecendo com áreas tradicionais especificamente no exemplo da ciência, e não em algum produto comercial. Olha, a ciência que interessa a todos nós é a meteorologia. Todos nós queremos entender: precisamos pegar um guarda-chuva, vai chover hoje? Talvez, na verdade, não seja necessário ter um guarda-chuva, mas simplesmente vestir-se mais quente, e não haverá chuva e o bastardo é terrível.

E aqui vou falar agora sobre a solução Yandex, porque, novamente ... não quero vender Yandex aqui, é grande o suficiente sem minhas vendas. Agora, essas coisas com a meteorologia estão sendo feitas por todas as grandes empresas envolvidas na previsão de fenômenos climáticos no mundo: tanto o Weather Channel quanto outros, a IBM se conectou em termos de aprendizado de máquina. Felizmente, temos uma previsão interna (um dos serviços Yandex) e, para alguma coisa, temos aprendizado de máquina suficiente.

Sobre a previsão do tempo e Meteum


Então, o Meteum aparece. Um breve tour sobre o que é a previsão do tempo. Essa é uma incrível variedade de dados completamente diversa, que chega em tempo real aos supercomputadores. Os dados são retirados do que está agora na tela. São dezenas de satélites meteorológicos, dos quais informações fluem sobre a parte da Terra que está localizada abaixo deles, em várias partes do espectro. , (, , ) : , , , , , , – .



, , , , , - ( , ) – , , , , – , ( ), , (, , ).



-, , , -, ( «» )… , , , , , , .

, , - . : +30 (). , ( , ) – , , , , ?

, – , «» ( ). , , : -- (, 9 «»). , , – , 9 , . , . - .



– , , ; , , ( , - ) , .

, : , , . , . Porque ! , . , , , , , , -.

«.» , , -, , , … - - . , , . «» , , , … , – . , - .

, . . – . . , , , , . , , , , . , .

:


- - , . , . , : amoCRM , , , , .

, , , amoCRM. , amoCRM, , ( , , ).


2016 : , . : , – , , , - , «», 20 . , , - , – , , , , , , . , , – . , «-» . – , .




, ? , , , … , … , ?! , , , , , .



, . , , , : . , , - . , , , .

Crypta


, – … -, . , , , , « » , «» - «».



!


: , , . . . - RFM-, , … , . , – , , , , .

( ), -, – «! ?». – ; …



«»?


, , , «». . – , , « »… --… , , .



«.»


, , , «». . «» , . , : , , , – .



. , , – , . , – .

«»


«» . , , . , .



. , - . , . – . . , , …


Eu posso imaginar o que aconteceria se eu agora ... Em qual bolso eu tenho um smartphone?

Bem, aqui não vai funcionar. Mas imagine, eu gastei - e sei o que conversar com cada um de vocês.

, . , – . – , , «», . , -. , . , : – , – . , , «-» , API – , ( ).

, , , , .

2020+:


Gente, quando me pediram para fazer este slide: “Bem, você me diz algo sobre vinte ou vinte?” Eu digo: “Sim, é fácil”. Porque tudo se resume a três pontos principais.



Você precisa trabalhar em conjunto com máquinas inteligentes criativas (se quiser, se não quiser, precisará). É muito difícil. Eu sei da minha própria experiência na Yandex. Aqui (eu não te vejo bem por causa dos holofotes ofuscantes), peço que você responda a pergunta em voz alta: existem pessoas aqui que têm outros funcionários subordinados (da platéia eles dizem "sim")? Ok, foi fácil delegar a eles ("não" da platéia)? Esperado. Nós também! Imagine: você tem que delegar nas máquinas e não sai à noite com um carro para tomar uma cerveja ou algo para beber e dizer: "Vasya, o que você é ... Vamos, você não será mais assim". Esta máquina realmente não pode explicar por que ela tomou essa decisão. Mas se você não aprender a trabalhar com ele (sim, às vezes será "falso", como qualquer um de nós e nossos funcionários), será apenas uma "cobertura".

Lei de Clark


Este é o slide mais recente. Esta é uma das leis de Clark. Eu saio com uma cauda cinza e digo algumas coisas estranhas. Existe uma lei que diz: se uma pessoa da minha idade sair, começa a transmitir algo sobre o fato de que: “Isso nunca vai acontecer! O homem é a medida de todas as coisas, então a máquina nunca será ... (respira fundo) Isso é conservadorismo de idade, pessoal, desculpe. ”



E quando uma pessoa diz: "Escute, apesar de todo o meu conservadorismo, será!", Ele provavelmente está certo se for um especialista nesse assunto. Mas eu tenho fervido na Internet nos últimos vinte anos.

Então obrigado! De um jeito ou de outro, mas vai acontecer!


Um pouco de publicidade :)


Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos o VPS na nuvem para desenvolvedores a partir de US $ 4,99 , um desconto de 30% para os usuários da Habr em um analógico exclusivo de servidores de nível básico que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6) Núcleos) 10GB DDR4 240GB SSD 1Gbps de US $ 20 ou como compartilhar um servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).

Dell R730xd 2 vezes mais barato? Somente temos 2 TVs Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV a partir de US $ 199 na Holanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - a partir de US $ 99! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?

Source: https://habr.com/ru/post/pt475342/


All Articles