El escáner MIT terahertz lee libros cerrados y cartas selladas


Foto: AP Photo / Akira Suemori

Investigadores del Instituto de Tecnología de Massachusetts y el Instituto de Tecnología de Georgia han desarrollado un escáner de terahercios que le permite leer libros sin abrirlos. Esto es algo necesario para digitalizar folios frágiles que pueden dañarse al pasar las páginas. Además, la tecnología se puede utilizar para leer cartas en sobres cerrados, por ejemplo.

Investigadores del MIT Media Lab informan que la administración del Museo Metropolitano de Arte de Nueva York ya ha mostrado interés en la tecnología. Como en algunos otros museos, su colección de museos tiene una serie de libros antiguos que dan miedo abrir. "Ni siquiera quieren tocarlos", dice Barmak Heshmat, investigador del MIT Media Lab y uno de los autores de un artículo científico que describe un escáner innovador.

El científico también agregó que el dispositivo es útil no solo para escanear libros o leer cartas en sobres sellados, sino también para estudiar cualquier material que se aplique en varias capas delgadas. Este puede ser un dibujo antiguo debajo de una capa de pintura, el contenido de una tableta debajo de una carcasa o un revestimiento de automóvil debajo de una capa de pintura externa.


Especialistas del Instituto de Tecnología de Massachusetts desarrollaron el hardware del escáner, y colegas del Instituto de Tecnología de Georgia desarrollaron el software para eliminar distorsiones y mejorar la calidad de las imágenes escaneadas. Los científicos dicen que el programa de eliminación de distorsión de letras funciona tan bien que reconoce fácilmente muchas imágenes CAPTCHA que usan caracteres distorsionados.

La radiación de Terahercios es un tipo de radiación electromagnética cuyo espectro de frecuencia se encuentra entre los rangos de infrarrojos y microondas. Rango de frecuencia de 0.01 a 10 THz. La radiación de Terahercios se usa ampliamente en sistemas de seguridad para escanear equipaje y personas. En medicina, los tomógrafos terahercios comienzan a usarse, y en la historia del arte hace ocho años comenzaron a usarseescáneres de terahercios para estudiar patrones ocultos debajo de capas de pintura. Dichos escáneres pueden detectar defectos estructurales ocultos en diversos materiales.

El problema principal al escanear superficies de libros de varias capas es la caída rápida en el nivel de la señal reflejada cuando se "sumerge" varias capas de profundidad. La señal es tan débil que se hace muy difícil aislarla del ruido. Los investigadores han inventado una técnica especial para filtrar la señal y "enfocar" en una capa delgada específica.

En particular, encontraron una manera de enfocarse en cada capa del material multicapa de acuerdo con las estadísticas de la radiación electromagnética detectada. Luego seleccionan las imágenes espectrales con el mayor contraste para cada capa utilizando el método de tiempo promedio de activación del exceso espectral. Este método le permite leer páginas con éxito incluso con una relación SNR baja de menos de 10 dB, proporcionando una relación de contraste 18 veces mayor que con la coincidencia de amplitud convencional.


Una configuración experimental con una pila de 9 hojas, cada una de las cuales tiene una letra del alfabeto latino impresa en un lado. Hojas de papel de oficina más gruesas de lo habitual

La distinción entre el texto en las páginas es posible debido al hecho de que entre las páginas del libro cerrado hay cavidades de aire con un grosor de aproximadamente 20 micrómetros. Tales cavidades grandes están asociadas con la aspereza del papel, porque está hecho de madera y no está sujeto a una molienda especial. Debido a los diferentes índices de refracción del aire y el papel, es posible determinar con precisión los límites de estas cavidades mediante la señal reflejada recibida por el detector de terahercios. Esto le permite reconocer hojas específicas en una pila.


Resultado de la medición: 9 letras latinas en las hojas (A); resultado del escaneo, el tiempo de llegada de la señal reflejada corresponde a la profundidad de la capa, el cambio en la saturación corresponde al valor normalizado de la amplitud de campo en unidades arbitrarias, los valores inferiores a 0.5 corresponden a la amplitud de campo negativa (B); Una porción del cubo de datos de la amplitud registrada del campo eléctrico correspondiente a un momento específico de llegada de la señal reflejada, es decir, a una capa específica (C)

Hasta ahora, el algoritmo puede determinar correctamente la distancia a las cavidades de aire en aproximadamente las 20 hojas superiores de la pila, pero con cada página la señal se debilita. Durante las pruebas, el escáner reconoció con éxito 9 páginas en una pila en modo automático sin intervención y configuración humana.


El resultado del escáner en modo automático, con un contraste mejorado en el procesamiento posterior y el OCR

Los científicos no pierden la esperanza de mejorar la calidad del escaneo utilizando detectores más sensibles y fuentes más potentes de radiación de terahercios.

La radiación de Terahercios es un área relativamente nueva de ingeniería. El trabajo del Instituto de Tecnología de Massachusetts y el Instituto de Tecnología de Georgia es uno de los primeros en que se combinan nuevas herramientas y métodos avanzados de procesamiento de imágenes por computadora. Esto es solo el comienzo.

La tecnología ahora se está desarrollando activamente, por lo que en los próximos años aparecerán instrumentos más probables y más sensibles y precisos. Quizás puedan leer el contenido de no una sola carta sellada, sino de inmediato una bolsa completa de cartas.

Artículo cientificoEl
9 de septiembre de 2016 se publicó en la revista Nature Communications (doi: 10.1038 / ncomms12665) "Imágenes espectrales de tiempo limitado de Terahertz para la extracción de contenido a través de estructuras en capas" .

Source: https://habr.com/ru/post/es397399/


All Articles