Astrofísicos do Vale do Silício Quantificando Moda

Pesquisadores espaciais se afastam do céu para ajudá-lo a decidir o que vestir, o que assistir e o que ouvir. Mas os dados em estrela e os dados da loja Stitch Fix são processados ​​usando o aprendizado de máquina.



A Stitch Fix é uma das empresas que usa a física para entender melhor todos os problemas de estilo de seus clientes.

Chris Moody conhece em primeira mão o universo. Como astrofísico, ele fez simulações de galáxias, simulando em supercomputadores a expansão do universo e colisões de galáxias. Uma noite, pouco depois de defender um doutorado na Universidade da Califórnia em Santa Cruz, ele se encontrou com um grupo de outros astrofísicos por um copo de cerveja. Mas naquela noite, nenhum deles falou de galáxias. Eles conversaram sobre moda.

Alguns amigos da Moody's, astrofísicos, recentemente abandonaram a ciência e se mudaram para a Stitch Fix, uma empresa de moda on-line que agora custa US $ 2 bilhões, e Moody olhou para eles com surpresa. "Eles me perguntaram: você não acha esta tarefa interessante?" Ele diz. E ele realmente achou que sim. No entanto, quando seus amigos, usando frases como “modelos bayesianos” ou “espaço Poincaré”, descreveram em detalhes o trabalho deles, consistindo em prever que tipo de roupa um cliente poderia gostar, parecia estranhamente o trabalho que ele estava fazendo. para o doutorado. Ele descobriu que uma avaliação quantitativa do estilo "acabou por ser uma analogia muito próxima da teoria geral da relatividade".

Quatro anos se passaram, e agora Moody também trabalha para o Stitch Fix. Ele é de um grupo gradualmente crescente de desertores da astrofísica que parou de explorar o espaço e começou a criar algoritmos de recomendação e modelos de dados para a indústria de tecnologia. Eles são membros de equipes de ciência de dados de empresas como Netflix, Spotify e Google. E mesmo nas universidades de elite, cada vez menos astrofísicos, depois de defender um doutorado, permanecem no ambiente acadêmico. Mais e mais dessas pessoas são enviadas para o Vale do Silício.

Para entender que os astrofísicos são atraídos por startups envolvidas em produtos de consumo, lembremos do recente aumento no interesse em aprendizado de máquina (MO). Os astrofísicos que processam grandes quantidades de dados coletados por poderosos telescópios que olham para o céu há muito tempo usam modelos MO, “ensinando” computadores a executar tarefas com base nos exemplos fornecidos. Diga ao computador o que você precisa encontrar em uma foto do espaço intergaláctico, e ele poderá fazer isso pelos 30 milhões de fotos restantes e depois começar a fazer previsões. No entanto, o MO também pode ser usado para prever o comportamento do usuário e, em 2012, as empresas começaram a recrutar pessoas que sabiam aplicar esse método.

Hoje, a MO está no centro de quase tudo, desde caixas de roupas no Stitch Fix até recomendações personalizadas de filmes no Netflix. Como o Spotify consegue prever músicas que o surpreenderão e encantarão tão perfeitamente nas listas semanais personalizadas? Isso funciona com aprendizado de máquina. E embora a região de Moscou já constitua seu próprio campo de pesquisa, uma vez que cientistas de campos como a astrofísica trabalham com esses modelos há muitos anos, eles são candidatos ideais para preencher equipes que trabalham com ciência de dados.

"Nós já estávamos envolvidos em big data, mesmo antes de big data se tornar uma área separada", disse Sudip Das, ex-astrofísico da Netflix.

Das defendeu seu doutorado em Princeton examinando a radiação de relíquia - radiação eletromagnética que sobra do Big Bang [ mais precisamente, foi formada 380.000 anos após o Big Bang quando a “idade das trevas” terminou / aprox. perev. ] Depois disso, ele estudou os dados obtidos pelo Telescópio Cosmológico Atacama no Chile por vários anos. O telescópio coletava todas as noites cerca de um terabyte de dados do espaço e, nessa enorme variedade de dados, Das descobriu um sinal astrofísico indescritível. Foi uma recompensa rara por anos de trabalho meticuloso. Essa descoberta atraiu a atenção da Universidade de Michigan, onde lhe foi oferecido o cargo de professor assistente.

No entanto, Das recusou e se mudou para o Vale do Silício - primeiro para trabalhar como especialista em dados na Beats Music, depois na OpenTable e agora na Netflix.

Poucos fatores influenciaram a decisão de deixar o mundo científico: o salário é mais alto e o trabalho é mais rico. "Existem obstáculos para se tornar um membro em tempo integral do instituto", diz ele. E na área da baía de San Francisco, nem ele nem sua esposa - também astrofísica - precisavam se preocupar em encontrar um emprego. No entanto, uma verdadeira surpresa para ele foi que o trabalho em empresas de tecnologia foi realmente interessante. Ele se encontrou no Beats com "pessoas afins trabalhando em tarefas semelhantes em complexidade intelectual". A matemática é a mesma, a aplicação é diferente.

Das percebe como cada vez mais físicos estão mudando a parte pesada do cientista - onde você pode realizar o precário trabalho financeiro de um pós-doutorado por dez anos - para um trabalho fácil e bem remunerado em empresas de tecnologia. "De todos os meus colegas que defenderam seu doutorado em Princeton, apenas dois não entraram em empresas comerciais", diz ele. "Para ficar lá, você precisa ser um cientista."

Esse big bang conquistou toda a indústria. "Os astrofísicos são nosso grupo número um", diz Eric Colson, especialista emérito chefe em Algoritmos da Stitch Fix. “A maioria das pessoas tem doutorado no campo de trabalho com dados numéricos, mas se você construir um gráfico, acho que os astrofísicos virão primeiro. Eles ensinam matemática muito bem - muitos físicos são mais versados ​​em matemática do que os matemáticos. Eles também ensinam bem a programação. Eles são mais versados ​​em ciência da computação do que a maioria dos cientistas da computação. ”

Moody, que ingressou na equipe da Colson em 2015, direcionou o conhecimento adquirido enquanto trabalhava no campo da astrofísica para resolver problemas como marcar o “estilo oculto” do cliente - um gosto pessoal único em roupas. O Stitch Fix não solicita que os clientes definam seu estilo usando algumas etiquetas comuns. Ele coleta dados sobre as preferências das pessoas para fazer compras e com ferramentas como o Style Shuffle - uma espécie de tinder de roupas, onde as pessoas podem marcar se gostam ou não de certas coisas. Após a coleta, todos esses dados formam um "espaço de estilo" - um mapa de tudo o que os clientes gostam e como esses itens se relacionam. Moody e a equipe usam esse modelo para prever o que mais o cliente pode gostar. O algoritmo pode concluir que, se você gosta de contas grossas, também pode gostar de contas - da mesma forma, os algoritmos da Netflix sugerem que você queira assistir a outra comédia com uma mulher no papel principal.

Moody diz que essas tarefas não são tão diferentes daquelas com as quais ele lidou durante o doutorado. Cartão de estilo oculto? “Este é o espaço de Poincaré. Foi isso que Einstein usou para descrever os espaços relativísticos ”, diz Moody.

Outros princípios físicos estão envolvidos na compreensão do estilo oculto. A equipe de Moody usa algo como decomposição espectral de uma matriz , um conceito de álgebra linear para separar "notas" individuais em um estilo individual - algo como "puxar uma corda de violão e ouvir algumas notas". Um cliente pode gostar de coisas femininas, mas mais casuais do que profissionais. O estilo de cada pessoa tem muitos pontos de dados - poucas pessoas podem ser atribuídas a estilos claramente definidos - e Moody diz que, com a ajuda da física, sua equipe entende melhor todas as complexidades da atitude de um cliente em relação ao estilo.

"Nenhum dos que estudam física vai fazer roupas, mas acontece que essa área é fenomenalmente rica", diz Moody. "É incrível tentar pensar no estilo pessoal de uma pessoa do ponto de vista científico".

Colson diz que muitos astrofísicos de sua equipe são atraídos para trabalhar na empresa "por causa dos resultados visíveis que raramente são encontrados na ciência teórica". Aqui eles podem enviar algo para a produção e ver os resultados. ” Quando Moody faz tudo certo, é mais provável que o Stitch Fix ofereça aos clientes o que eles gostam - e sua equipe pode acompanhar e melhorar essa métrica diariamente.

No mundo científico, os astrofísicos podem lutar pela mesma tarefa por anos. E muitos dos problemas mais interessantes já foram resolvidos, diz Amber Roberts, ex-engenheira e astrofísica de aprendizado de máquina e agora funcionária da Insight Data Science, que ajuda os cientistas a se mudarem para o setor. “Nós aprendemos o tamanho do universo. Medimos a velocidade da luz. Encontramos pulsares. Encontramos buracos negros ”, diz ela. - Muitas dessas grandes descobertas, por exemplo, uma compreensão dos princípios de espaço-tempo ou distorção gravitacional, tornaram as pessoas interessadas na exploração espacial e na cosmologia. No entanto, o que você está realmente fazendo é expandir uma fração muito pequena do campo do conhecimento e por três anos trabalhando na redação de um artigo científico que interessará uma dúzia de pessoas em todo o mundo. ”

Das, astrofísico da Netflix, diz que é difícil desistir do romance que envolve explorar o universo. “Quando explico o que está acontecendo com meus pais, eles dizem: Você fez coisas tão impressionantes com o Universo e agora recomenda filmes para as pessoas!” - diz Das. No entanto, ele concorda que seu trabalho de rotina está mais relacionado a questões técnicas, como "tentar reduzir o erro na medição do parâmetro de 50% para 5%", em vez de explorar o universo.

Na Netflix, o trabalho técnico se parece com isso. Mas quando ele pensa sobre o que realmente faz no trabalho - ele une pessoas de todo o mundo com filmes e histórias que os ajudarão a se entender melhor - ele não sente menos satisfação com sua contribuição do que quando trabalhou como astrofísico. "É como explorar outro universo", diz Das. "O universo dos seres humanos."

Source: https://habr.com/ru/post/pt472930/


All Articles