Le scanner térahertz du MIT lit les livres fermés et les lettres scellées


Photo: AP Photo / Akira Suemori Des

chercheurs du Massachusetts Institute of Technology et du Georgia Institute of Technology ont développé un scanner térahertz qui vous permet de lire des livres sans les ouvrir. C'est une chose nécessaire pour numériser des folios fragiles qui peuvent être endommagés lors de la rotation des pages. De plus, la technologie peut être utilisée pour lire des lettres dans des enveloppes scellées, par exemple.

Des chercheurs du MIT Media Lab rapportent que la direction du Metropolitan Museum of Art de New York a déjà montré de l'intérêt pour la technologie. Comme dans certains autres musées, leur collection de musée possède un certain nombre de livres anciens qui sont effrayants à ouvrir. «Ils ne veulent même pas les toucher», explique Barmak Heshmat, chercheur au MIT Media Lab et l'un des auteurs d'un article scientifique décrivant un scanner innovant.

Le scientifique a également ajouté que l'appareil est utile non seulement pour numériser des livres ou lire des lettres dans des enveloppes scellées, mais également pour étudier tout matériau appliqué en plusieurs couches minces. Cela peut être un ancien dessin sous une couche de peinture, le contenu d'une tablette sous une coque ou un revêtement de voiture sous une couche de peinture externe.


Des spécialistes du Massachusetts Institute of Technology ont développé le matériel du scanner et des collègues du Georgia Institute of Technology ont développé le logiciel pour éliminer les distorsions et améliorer la qualité des images numérisées. Les scientifiques disent que le programme d'élimination de la distorsion des lettres fonctionne si bien qu'il reconnaît facilement de nombreuses images CAPTCHA qui utilisent des caractères déformés.

Le rayonnement térahertz est un type de rayonnement électromagnétique dont le spectre de fréquence est situé entre les gammes infrarouge et micro-ondes. Gamme de fréquences de 0,01 à 10 THz. Le rayonnement térahertz est largement utilisé dans les systèmes de sécurité pour scanner les bagages et les personnes. En médecine, les tomographes térahertz commencent à être utilisés, et dans l'histoire de l'art il y a huit ans, ils ont commencé à utiliserscanners térahertz pour étudier les motifs cachés sous les couches de peinture. Ces scanners peuvent détecter des défauts structurels cachés dans divers matériaux.

Le principal problème lors de la numérisation de surfaces multicouches de livres est la baisse rapide du niveau du signal réfléchi lorsqu'il est "immergé" plusieurs couches en profondeur. Le signal est si faible qu'il devient très difficile de l'isoler du bruit. Les chercheurs ont inventé une technique spéciale pour filtrer le signal et "se concentrer" sur une couche mince spécifique.

En particulier, ils ont trouvé un moyen de se concentrer sur chaque couche du matériau multicouche en fonction des statistiques du rayonnement électromagnétique détecté. Ensuite, ils sélectionnent les images spectrales avec le contraste le plus élevé pour chaque couche en utilisant la méthode de la synchronisation temporelle moyenne de l'excès spectral. Cette méthode vous permet de lire avec succès des pages même avec un faible rapport SNR inférieur à 10 dB, offrant un rapport de contraste 18 fois plus élevé qu'avec la correspondance d'amplitude conventionnelle.


Une configuration expérimentale avec une pile de 9 feuilles, chacune ayant une lettre de l'alphabet latin imprimée sur un côté. Feuilles de papier de bureau plus épaisses que d'habitude

La distinction entre le texte des pages est possible du fait qu'entre les pages du livre fermé il y a des cavités d'air d'une épaisseur d'environ 20 micromètres. Ces grandes cavités sont associées à la rugosité du papier, car il est en bois et n'est pas soumis à un meulage spécial. En raison des différents indices de réfraction de l'air et du papier, il est possible de déterminer avec précision les limites de ces cavités par le signal réfléchi reçu par le détecteur térahertz. Cela vous permet de reconnaître des feuilles spécifiques dans une pile.


Résultat de la mesure: 9 lettres latines sur les feuilles (A); résultat du balayage, l'heure d'arrivée du signal réfléchi correspond à la profondeur de la couche, le changement de saturation correspond à la valeur normalisée de l'amplitude du champ en unités arbitraires, les valeurs inférieures à 0,5 correspondent à l'amplitude du champ négatif (B); Une tranche du cube de données de l'amplitude enregistrée du champ électrique correspondant à une heure spécifique d'arrivée du signal réfléchi, c'est-à-dire à une couche spécifique (C)

Jusqu'à présent, l'algorithme peut déterminer correctement la distance aux cavités d'air dans environ les 20 premières feuilles de la pile, mais à chaque page, le signal devient plus faible. Pendant les tests, le scanner a réussi à reconnaître 9 pages dans une pile en mode automatique sans intervention humaine et configuration.


Le résultat du scanner en mode automatique, avec un contraste amélioré en post-traitement et OCR Les

scientifiques ne perdent pas espoir d'améliorer la qualité de la numérisation en utilisant des détecteurs plus sensibles et des sources de rayonnement térahertz plus puissantes.

Le rayonnement térahertz est un domaine d'ingénierie relativement nouveau. Les travaux du Massachusetts Institute of Technology et du Georgia Institute of Technology sont l'un des premiers à combiner de nouveaux outils et des méthodes avancées de traitement d'images informatiques. Ce n'est que le début.

La technologie se développe maintenant activement, donc dans les années à venir, des instruments plus probables et plus sensibles et plus précis apparaîtront. Peut-être pourront-ils lire le contenu non d'une seule lettre scellée, mais immédiatement d'un sac entier de lettres.

Article scientifique"L'imagerie spectrale temporelle Terahertz pour l'
extraction de contenu à travers des structures en couches" a été
publiée le 9 septembre 2016 dans la revue Nature Communications (doi: 10.1038 / ncomms12665).

Source: https://habr.com/ru/post/fr397399/


All Articles