
Lidares e câmeras são dois itens de configuração padrão para praticamente qualquer robomóvel. Tanto o primeiro como o segundo trabalham com luz refletida. Ao mesmo tempo, as câmeras operam no modo passivo, ou seja, captam o reflexo de fontes de luz de terceiros, mas os lidares geram pulsos de laser e medem a "resposta" refletida nos objetos próximos. As câmeras formam uma imagem bidimensional e os lidares formam uma imagem tridimensional, algo como uma “nuvem de pontos”.
A Ouster
desenvolveu um dispositivo hĂbrido que funciona tanto como câmera quanto como lidar. Este sistema Ă© chamado OS-1. Este dispositivo tem uma abertura maior que a maioria das DSLRs, e o sensor criado pela empresa Ă© muito sensĂvel.
As imagens obtidas pelo sistema consistem em três camadas. A primeira é a imagem obtida como se fosse uma câmera normal. O segundo é uma camada de "laser" obtida usando a reflexão do feixe de laser. E a terceira é a camada "profunda", que permite estimar a distância entre os pixels individuais das duas primeiras camadas.
Vale ressaltar que as imagens ainda tĂŞm limitações significativas. Em primeiro lugar, estas sĂŁo imagens de baixa resolução. Em segundo lugar, eles sĂŁo preto e branco, nĂŁo coloridos. Em terceiro lugar, o lidar nĂŁo funciona com uma fonte de luz visĂvel, mas com um espectro prĂłximo ao infravermelho.
No momento, o custo do lidar Ă© bastante alto - cerca de US $ 12.000. Ă€ primeira vista, nĂŁo há sentido em um sistema que receba imagens com resolução mais baixa que as câmeras padrĂŁo, mas custa como uma ponte de ferro fundido. Mas os desenvolvedores afirmam que um princĂpio diferente de trabalho Ă© usado aqui do que no caso usual.
Estes sĂŁo materiais gráficos fornecidos pela Ouster. TrĂŞs camadas de imagens e uma “imagem” geral sĂŁo mostradas aqui, o que resulta deEm uma situação tĂpica, os robomobiles combinam dados de várias fontes diferentes, o que leva tempo. Câmeras e lidares funcionam em diferentes modos, o resultado tambĂ©m Ă© diferente. AlĂ©m disso, eles geralmente sĂŁo montados em vários locais da carroceria do carro, portanto o computador tambĂ©m precisa lidar com a correlação de imagens para que sejam compatĂveis. AlĂ©m disso, os sensores exigem recalibração regular, o que nĂŁo Ă© tĂŁo simples.
Alguns desenvolvedores do lidar já tentaram combinar a câmera com o lidar. Mas os resultados não foram muito bons. Era um sistema “câmera padrão + lidar”, que não diferia muito dos esquemas existentes.
O Ouster utiliza um sistema que permite ao OS-1 coletar todos os dados em um padrão e em um local. Todas as três camadas da imagem se correlacionam perfeitamente, no tempo e no espaço. Nesse caso, o computador entende a distância entre os pixels individuais da imagem final.
Segundo os autores do projeto, esse esquema Ă© quase ideal para aprendizado de máquina. Para sistemas de computador, o processamento desse tipo de imagem nĂŁo Ă© difĂcil. Tendo “alimentado” o sistema várias centenas de fotos, ele pode ser treinado para entender exatamente o que Ă© mostrado na “foto” final.
Alguns tipos de redes neurais sĂŁo projetados de forma a trabalhar com várias camadas de mapas de pixels sem problemas. AlĂ©m disso, as imagens podem conter uma camada vermelha, azul e verde. Treinar esses sistemas para trabalhar com o resultado do OS-1 nĂŁo Ă© difĂcil. Ouster já conseguiu isso.
Como material de origem, eles pegaram várias redes neurais projetadas para reconhecer imagens RGB e as modificaram para atender Ă s suas necessidades, ensinando-as a trabalhar com diferentes camadas de suas imagens. O processamento de dados Ă© realizado em equipamentos com o Nvidia GTX 1060. Usando redes neurais, o computador do carro foi ensinado a "pintar" a estrada em amarelo e os possĂveis obstáculos - outros carros - em vermelho.

Segundo os desenvolvedores, seu sistema Ă© um complemento dos já existentes, e nĂŁo um substituto. É melhor combinar todos os tipos de sensores, sensores, câmeras, lidares e sistemas hĂbridos para formar uma imagem clara do ambiente que ajudará o carro a navegar.