Mais de um ano se passou desde a última grande atualização do Korolev . As idéias incluídas nessa versão receberam desenvolvimento adicional durante esse período e encontraram novos aplicativos. Na atualização de Andrômeda, focamos nos aspectos do mecanismo de pesquisa que permitem que nossos usuários resolvam o maior número possível de tarefas de maneira rápida e conveniente.
Hoje, tradicionalmente contaremos aos leitores da Habr sobre o trabalho que fizemos.

No total, esta atualização inclui mais de mil melhorias diferentes. Para resumir, os agrupamos em três grandes blocos:
- Respostas rápidas . Aqui estão implementadas coletadas que permitem obter respostas diretamente da página com os resultados da pesquisa, sem a necessidade de acessar sites de terceiros.
- Conveniência de escolha . Quando um usuário precisa receber informações de um site externo, é necessário facilitar o processo de seleção para ele e aumentar a probabilidade de que a transição seja útil.
- Coleções . Encontrado na Internet nos serviços Yandex, você precisa salvar facilmente seus favoritos para uso futuro.
O trabalho na qualidade da Pesquisa não se refere apenas à implementação da funcionalidade para cenários específicos. Também precisamos trabalhar constantemente na qualidade das métricas que medem a utilidade do nosso produto para os usuários.
No ano passado, aprendemos a entender muito melhor quando um usuário só precisa examinar uma página com resultados de pesquisa para resolver seu problema - por exemplo, lendo explicitamente a resposta à sua pergunta; Além disso, aprendemos a distinguir entre transições "úteis" da Pesquisa e aquelas sem resultados.
Agora, nossos usuários estão resolvendo com sucesso um milhão e meio a mais de tarefas de pesquisa todos os dias do que no inverno passado. A solução para o problema de pesquisa pode ser uma transição útil para o site ou algum tipo de interação com a página de resultados da pesquisa.
1. Respostas rápidas
A capacidade de obter respostas rápidas dos resultados da pesquisa sem ir a nenhum site foi e continua sendo um ponto forte do Yandex. No ano passado, aumentamos mais de uma vez e meia o número de solicitações às quais os usuários podem receber uma resposta instantânea da página de resultados de pesquisa ( por exemplo ); portanto, agora nossos usuários usam respostas rápidas mais de treze milhões de vezes por dia.
Mas agora as respostas rápidas não são apenas textos ou tabelas. Adicionamos respostas rápidas e interativas para um grande número de novos cenários.
Aqui, por exemplo, está a resposta rápida para a consulta " café nas proximidades ".

Cada organização pode ser estudada com mais detalhes: endereço de acesso, fotos, críticas, informações de presença e muito mais. Tudo isso pode ser feito sem sair dos resultados da pesquisa!
Respostas semelhantes agora podem ser vistas para outros tipos de organizações. Digamos que você possa ver uma lista de hotéis em Samara ou academias de Rostov .
Desenvolvemos significativamente nossa resposta às questões esportivas. Agora, para a maioria dos campeonatos de futebol, está disponível uma bela resposta contendo uma programação, uma classificação, as últimas notícias e, em alguns casos, também links para transmissões ao vivo, partidas e repetições de momentos interessantes.

A propósito, um grande número de novas respostas rápidas na pesquisa Yandex é uma conseqüência direta do desenvolvimento de métricas, sobre as quais escrevi no começo do artigo. Anteriormente, quando a qualidade da Pesquisa era associada principalmente ao número de cliques feitos pelos usuários, era difícil imaginar essas respostas. Agora podemos medir quanta informação útil cada elemento contém e com que frequência os usuários realmente a usam.
Outro recurso que facilita a obtenção de respostas pelos usuários é o diálogo com as organizações. Se não houver resposta para a pergunta na Internet ou for difícil encontrá-la, pergunte diretamente aos proprietários do site que apoiaram esta oportunidade . Os documentos relevantes na pesquisa são acompanhados por um botão "Conversar com a empresa".

Finalmente, em algumas situações, pode ser necessário aconselhamento ou discussão, em vez de uma resposta curta específica. Para esses casos, criamos o serviço Yandex.Creatives . No serviço, você pode fazer perguntas e receber respostas de especialistas de várias especialidades - médicos, treinadores, cozinheiros, estilistas, advogados. Agora, as respostas do Yandex.Znatokov estão integradas à Pesquisa, para que você possa assisti-las diretamente na página de resultados:

O serviço permite que você responda a qualquer usuário e, é claro, você pode se perguntar em qual das opiniões deve confiar. Portanto, damos acesso a todas as respostas de cada usuário: você pode entender em quais tópicos ele responde, qual é sua classificação e, por fim, formar sua própria opinião.
2. Facilidade de escolha
Ao desenvolver algoritmos de pesquisa, sempre prestamos atenção à qualidade desses sites que nossos usuários acessam. As versões anteriores da pesquisa, no entanto, se concentraram principalmente em responder a uma solicitação específica, de modo que a qualidade geral do site teve um papel secundário na seleção de documentos.
Na nova versão do Search, essa influência se tornou significativamente maior: ceteris paribus, preferimos sites que ofereçam um bom serviço, mesmo fora do contexto de uma solicitação específica.
Mais especificamente, aprendemos como identificar automaticamente várias características importantes dos sites e levá-las em consideração na classificação:
- conveniência;
- a presença de um público leal permanente;
- equilíbrio de informações úteis e intrusivas;
- índice do site para comparação aos pares com outros resultados de pesquisa.
O problema é que as características levadas em consideração na classificação não são visíveis para os usuários. Para corrigir isso, introduzimos sinais especiais para sites . Agora usamos três tipos de tais sinais.
O primeiro sinal é um rótulo azul, semelhante aos rótulos das contas verificadas nas redes sociais. Esses sinais são obtidos nos sites oficiais das organizações, de acordo com o Yandex.Directory, nos sites dos revendedores oficiais, segundo o Avto.ru, nos sites das organizações financeiras, nos serviços Yandex do Banco Central da Federação Russa; eles também podem ser exibidos para respostas de navegação e, de fato, perfis confirmados nas redes sociais.
O segundo sinal é um "site popular". Esse sinal é recebido por sites muito populares com um enorme público leal.
O terceiro sinal é "escolha do usuário". Essa marca pode ser obtida por um site de nicho, mesmo com um público modesto, se for leal e frequentemente retornar a este site.
Verificamos que a presença de caracteres na página de resultados da pesquisa ajuda os usuários a navegar e encontrar rapidamente os resultados necessários. Um de nossos gerentes de produto que participou do lançamento nos ajudou a ilustrar sua utilidade. Ele estava procurando informações sobre certificação ágil e, é claro, há um grande número de sites com informações relevantes sobre esse tópico.
No entanto, entre os resultados da pesquisa, há também um artigo do habr.com, no qual o autor descreve sua experiência de aprovação no treinamento. Está longe de ser um artigo que seja a resposta mais relevante para essa solicitação, portanto não estará necessariamente na primeira posição. Mas, ao mesmo tempo, o sinal informa ao usuário que este é um resultado do site, o que pode ser muito útil para o usuário no futuro.

Outro aspecto importante da escolha é o feedback. No ano passado, conseguimos aumentar drasticamente o número de críticas e classificações coletadas: agora os usuários compartilham suas impressões com o Yandex mais de 150 mil vezes por dia.
Não são possíveis boas análises de trabalho sem poderosas tecnologias de aprendizado de máquina. Estamos combatendo ativamente qualquer manifestação de fraude e spam em nossas análises. A velocidade dos algoritmos é extremamente importante aqui: é claro que, se os dados forem processados com atraso de um dia, um usuário sem escrúpulos poderá ter tempo para deixar um grande número de revisões prejudiciais e outros usuários terão tempo para vê-los antes de tomar qualquer medida. Portanto, uma das maiores implementações para nós foi a capacidade de processar dados e levá-los em consideração em nossos modelos com atraso em questão de minutos. Isso significa que as análises e classificações do Yandex estão quase sempre em boas condições, tanto quanto possível.
Obviamente, como no Yandex.Connectors, é importante que os usuários entendam as resenhas que lêem. Não divulgamos as personalidades dos autores, mas nos familiarizamos com todas as suas análises. Assim, você pode conhecer melhor o autor específico, entender se seus gostos são semelhantes e só então fazer suas próprias escolhas.

3. Coleções
Nossos serviços de pesquisa, como o Yandex.Pictures , Yandex.Video ou a Pesquisa realmente grande, permitem que você encontre rapidamente as informações necessárias na Internet.
Mas, muitas vezes, apenas encontrar informações não é suficiente, você deseja salvá-las para uso futuro - digamos, depois de algum tempo, retorne ao site em que está interessado, salve a foto ou o videoclipe e depois compartilhe-o com os amigos. Até agora, não havia uma solução para armazenar de maneira conveniente e uniforme informações de vários tipos.
Foi para solucionar esse problema que atualizamos nosso serviço Yandex.Collections . As coleções permitem salvar informações de vários tipos: fotos, vídeos, sites, até filmes, séries e livros. As coleções estão intimamente relacionadas aos nossos serviços de pesquisa: a capacidade de adicionar coleções é implementada no Yandex.Pictures e Yandex.Video: preste atenção aos botões "Adicionar à coleção". Além disso, esse botão está disponível para objetos em uma grande pesquisa.

E no aplicativo Yandex, você pode adicionar sites encontrados na Pesquisa às coleções. Em breve, esse recurso estará disponível para todos os usuários de pesquisa do Yandex em todas as plataformas.
Portanto, os usuários podem criar suas coleções nos serviços de pesquisa Yandex. Após a criação da coleção, as recomendações ficam disponíveis: por exemplo, imagens com estilo semelhante às fotos da coleção coletada. Para fazer isso, nossas tecnologias para encontrar imagens semelhantes e garantir a diversidade funcionam com força total. Queremos recomendar objetos semelhantes, mas não idênticos.
O estudo das recomendações permite entender melhor o tópico de seu interesse. Digamos que montei uma coleção de belos interiores de apenas três cartões. Depois disso, um grande número de recomendações de outras coleções de usuários ficou disponível para mim e, é claro, isso simplificou bastante a busca por uma opção que eventualmente me interessasse.

As coleções podem ser tornadas privadas, para que ninguém tenha acesso a elas e nem sequer saiba sobre sua existência. Você pode manter algo secreto lá. Por outro lado, você pode abrir coleções e elas estarão disponíveis para todos os usuários do Yandex: no serviço Yandex.Collection e na grande pesquisa.

Este exemplo demonstra perfeitamente o que a Pesquisa vai fazer com serviços como Especialistas e Coleções. Os usuários, resolvendo suas tarefas, criam novos objetos que ficam disponíveis para todos os usuários e ajudam esses, por sua vez, a resolver suas tarefas muito mais rapidamente. Assim, a Pesquisa moderna permite não apenas encontrar informações em uma matriz de dados existente, mas também criar novas informações úteis para outras pessoas.
Podemos ver claramente como os resultados do nosso trabalho afetam o compartilhamento de pesquisa. Desde o lançamento anterior, o compartilhamento de pesquisa da Yandex em dispositivos móveis aumentou mais de 6 pontos percentuais, e esse obviamente não é o limite.

Obviamente, continuaremos a desenvolver as áreas listadas aqui, bem como a desenvolver propositadamente a qualidade da Pesquisa em todas as suas manifestações, melhorar nossos métodos de aprendizado de máquina e métricas de qualidade.