Comprenez-moi si vous le pouvez
La semaine dernière, nous avons reçu une lettre d'un candidat qui n'a pas réussi un entretien en anglais. Il s'est avéré que nos collègues ont participé à une expérience technique qui s'est déroulée parallèlement à l'entretien. Nous fournissons une lettre avec des changements minimes et remercions l'auteur pour une idée intéressante et du courage dans sa mise en œuvre.«Je suppose que je ne vous convient pas, car j'ai malheureusement échoué au test d'anglais. Oui, je n'ai pas une bonne pratique de l'anglais parlé, mais cela ne me dérange pas de lire les fiches techniques et de communiquer avec le support étranger par mail. En fait, il ne s'agit plus de cela, sachant à l'avance que je ne passerai pas le test de compétence linguistique, je n'ai pas pu m'empêcher de prendre la chance d'adopter une approche technique à ce problème. Bien que je n'ai pas eu l'occasion de tester ma méthode en direct à l'avance, en particulier avec une personne qui parle couramment l'anglais et qui connaît les fonctionnalités de prononciation, j'ai décidé de l'essayer.Je dois m'excuser pour l'expérience auprès de l'employé qui a effectué le test, et pour la qualité sonore médiocre associée aux caractéristiques techniques de "mon" complexe.En compensation de ma participation à l'expérience, je raconterai son idée. Bien que ce ne soit pas nouveau, je pense que ce sera intéressant pour vos spécialistes techniques, et avec le bon niveau de formation et d'approche d'équipe, il peut être utilisé pour obtenir un résultat intéressant et même un produit commercial.Je vais décrire l'essentiel: j'ai utilisé deux ordinateurs connectés à Internet, et Google Translate avec reconnaissance vocale et un synthétiseur. Pour ce faire, j'ai connecté le chemin analogique de mon téléphone portable aux cartes audio de deux unités centrales.Une unité centrale est configurée pour traduire de l'anglais vers le russe, respectivement, la sortie audio du téléphone a été connectée à l'entrée ligne de la carte audio. Dans les paramètres de la carte son, le mode de duplication du signal de l'entrée ligne à la sortie casque de mon casque a été défini, j'ai donc entendu le discours d'origine et vu l'exactitude de la reconnaissance vocale Google Translate.La deuxième unité centrale est configurée pour traduire du russe vers l'anglais, son entrée microphone était connectée au microphone du casque qui était sur moi. J'ai connecté la sortie audio de l'unité centrale au chemin analogique du téléphone.Ainsi, j'ai vu le texte anglais et entendu l'original, j'ai vu la traduction et quand j'ai dit la réponse au deuxième ordinateur, je l'ai synthétisée en parole. Comme Google parle d'une voix féminine, j'ai utilisé des filtres numériques Fruity Loops pour lui donner une tonalité masculine basse et j'ai envoyé du son déjà traité vers le chemin analogique du téléphone.Bien que j'aie échoué au test d'anglais, la raison n'était pas d'une mauvaise reconnaissance. J'ai été déçu par le col étroit du système, à savoir la connexion Internet 3G - malheureusement, je n'ai pas d'autre ligne de vitesse. Le matin, si je comprends bien, la station de base était moins chargée et j'avais suffisamment de bande passante. Mais après le déjeuner, le réseau a coulé au moment le plus inopportun.Le résultat de l'expérience a été que j'ai pu tenir les premières phrases, puis la vitesse de la synthèse vocale a cessé d'être suffisante, je suis passé à des réponses indépendantes et j'ai échoué. Bien que j'aie vu la traduction correcte, je ne suis pas en mesure de construire rapidement des phrases. C'est drôle que l'interlocuteur n'ait pas remarqué le passage du robot à une personne, ne mettant en évidence que l'arrêt du générateur de bruit de confort, à cause de quoi, dans les pauses, mon interlocuteur a pensé que la connexion était bien perdue.Le système doit être amélioré - pour prétraiter le signal provenant du microphone, couper le bruit qui ne donne pas l'effet de silence, important pour Google. Il pourra alors interrompre le traitement et allouer un composant vocal, ce qui réduira le trafic sortant, augmentera la vitesse de connexion et ne perdra pas les paquets UDP. Dans ce cas, le système est assez combatif. Nous transférons cela sur deux Raspberry PI et obtenons un traducteur en temps réel.Je ne peux moi-même pas réaliser cette idée - j'ai besoin de DSP pour le prétraitement, je dois faire des circuits, multiplier la topologie de la carte de circuit imprimé, écrire un algorithme de traitement pour DSP (bien qu'ils soient dans le domaine public), puis écrire un programme pour Raspberry PI avec des fonctionnalités pratiques et une interaction appropriée avec l'API Google Cette tâche est en mon pouvoir, mais convient mieux à l'équipe de développement. Pourtant, il a trop de sous-tâches.Je pense que l'idée est intéressante et va trouver un acheteur, l'entreprise sera facile à réaliser, et je ne ramasserai pas de poussière sur les étagères de son propre enthousiasme.Merci d'avoir pensé à ma candidature! »Source: https://habr.com/ru/post/fr398561/
All Articles