O scanner MIT terahertz lê livros fechados e cartas seladas


Foto: AP Photo / Akira Suemori

Pesquisadores do Instituto de Tecnologia de Massachusetts e do Instituto de Tecnologia da Geórgia desenvolveram um scanner terahertz que permite ler livros sem abri-los. Isso é necessário para digitalizar fólios frágeis que podem ser danificados ao virar as páginas. Além disso, a tecnologia pode ser usada para ler cartas em envelopes selados, por exemplo.

Pesquisadores do MIT Media Lab relatam que a administração do Metropolitan Museum of Art em Nova York já demonstrou interesse na tecnologia. Como em alguns outros museus, sua coleção de museus tem vários livros antigos que são assustadores de abrir. "Eles nem querem tocá-los", diz Barmak Heshmat, pesquisador do MIT Media Lab e um dos autores de um artigo científico que descreve um scanner inovador.

O cientista acrescentou ainda que o dispositivo é útil não apenas para digitalizar livros ou ler cartas em envelopes selados, mas também para estudar qualquer material aplicado em várias camadas finas. Pode ser um desenho antigo sob uma camada de tinta, o conteúdo de uma pastilha sob uma concha ou um revestimento de carro sob uma camada de tinta externa.


Especialistas do Instituto de Tecnologia de Massachusetts desenvolveram o hardware do scanner e colegas do Instituto de Tecnologia da Geórgia desenvolveram o software para eliminar distorções e melhorar a qualidade das imagens digitalizadas. Os cientistas dizem que o programa de eliminação de distorção de letras funciona tão bem que reconhece facilmente muitas imagens CAPTCHA que usam caracteres distorcidos.

A radiação Terahertz é um tipo de radiação eletromagnética cujo espectro de frequência está localizado entre as faixas de infravermelho e microondas. Faixa de frequência de 0,01 a 10 THz. A radiação Terahertz é amplamente usada em sistemas de segurança para digitalizar bagagens e pessoas. Na medicina, os tomógrafos terahertz começam a ser utilizados e, na história da arte, oito anos atrás, começaram a usarscanners terahertz para estudar padrões ocultos sob camadas de tinta. Esses scanners podem detectar defeitos estruturais ocultos em vários materiais.

O principal problema ao digitalizar superfícies de livros com várias camadas é a rápida queda no nível do sinal refletido quando “imerso” várias camadas de profundidade. O sinal é tão fraco que se torna muito difícil isolá-lo do ruído. Os pesquisadores inventaram uma técnica especial para filtrar o sinal e "focar" em uma camada fina específica.

Em particular, eles encontraram uma maneira de focar em cada camada do material multicamada, de acordo com as estatísticas da radiação eletromagnética detectada. Em seguida, eles selecionam as imagens espectrais com o maior contraste para cada camada, usando o método de restrição do tempo médio do excesso espectral. Este método permite que você leia com êxito as páginas, mesmo com uma taxa SNR baixa inferior a 10 dB, fornecendo uma taxa de contraste 18 vezes maior que a correspondência de amplitude convencional.


Uma configuração experimental com uma pilha de 9 folhas, cada uma com uma letra do alfabeto latino impressa em um lado. Folhas de papel de escritório mais espessas que o normal

A distinção entre o texto nas páginas é possível devido ao fato de que entre as páginas do livro fechado permanecem cavidades de ar com uma espessura de cerca de 20 micrômetros. Essas cavidades grandes estão associadas à rugosidade do papel, porque é feito de madeira e não é submetido a trituração especial. Devido aos diferentes índices de refração do ar e do papel, é possível determinar com precisão os limites dessas cavidades pelo sinal refletido recebido pelo detector de terahertz. Isso permite que você reconheça folhas específicas em uma pilha.


Resultado da medição: 9 letras latinas nas folhas (A); resultado da varredura, o tempo de chegada do sinal refletido corresponde à profundidade da camada, a mudança na saturação corresponde ao valor normalizado da amplitude do campo em unidades arbitrárias, valores inferiores a 0,5 correspondem à amplitude negativa do campo (B); Uma fatia do cubo de dados da amplitude registrada do campo elétrico correspondente a um tempo específico de chegada do sinal refletido, ou seja, a uma camada específica (C)

Até agora, o algoritmo pode determinar corretamente a distância das cavidades do ar nas 20 principais folhas da pilha, mas a cada página o sinal se torna mais fraco. Durante o teste, o scanner reconheceu com êxito 9 páginas em uma pilha no modo automático sem intervenção e configuração humana.


O resultado do scanner no modo automático, com melhor contraste no pós-processamento e no OCR

Os cientistas não perdem a esperança de melhorar a qualidade da digitalização usando detectores mais sensíveis e fontes mais poderosas de radiação terahertz.

A radiação Terahertz é uma área relativamente nova da engenharia. O trabalho do Instituto de Tecnologia de Massachusetts e do Instituto de Tecnologia da Geórgia é um dos primeiros em que novas ferramentas e métodos avançados de processamento de imagens de computador são combinados. Este é apenas o começo.

A tecnologia está agora se desenvolvendo ativamente, portanto, nos próximos anos, instrumentos mais prováveis ​​e sensíveis e precisos aparecerão. Talvez eles consigam ler o conteúdo de não uma carta selada, mas imediatamente um pacote inteiro de cartas.

Artigo científico"Imagens espectrais com restrição de tempo da Terahertz para
extração de conteúdo através de estruturas em camadas" foi
publicada em 9 de setembro de 2016 na revista Nature Communications (doi: 10.1038 / ncomms12665).

Source: https://habr.com/ru/post/pt397399/


All Articles