如果可以的话,请理解我



上周,我们收到了一位未通过英语面试的候选人的来信。事实证明,我们的同事参加了与面试同时进行的技术实验。我们提供了一封最少更改的信件,并感谢作者提出一个有趣的想法和勇气。

“我想我不适合你,因为不幸的是我没有通过英语考试。是的,我没有良好的英语口语能力,但这不会打扰我阅读数据表和通过邮件与外国支持人员进行交流。实际上,现在不是关于此的事情,因为事先知道我不会通过语言能力测试,所以我不禁借此机会对这个问题采取技术方法。尽管我没有机会提前现场测试我的方法,尤其是在与一个会英语的人并且知道发音特征的人打交道时,我还是决定尝试一下。

我必须为进行测试的员工向实验道歉,并为与“我的”复合体的技术特征相关的音质不太好表示歉意。

为了补偿参加实验,我将讲他的想法。尽管它不是新事物,但我认为它将对您的技术专家感兴趣,并且通过适当水平的培训和团队合作,它可以用于获得有趣的结果,甚至是商业产品。

我将描述其实质:我使用了两台连接到Internet的计算机,以及带有语音识别和合成器的Google Translate。为此,我将手机的模拟路径连接到两个系统单元的声卡。

一个系统单元配置为将英语分别翻译为俄语,电话的音频输出已连接到声卡的线路输入。在声卡设置中,设置了从线路输入到耳机的耳机输出的信号复制模式,因此我听到了原始语音,并看到了Google翻译语音识别的正确性。

第二个系统单元配置为将俄语翻译成英语,其麦克风输入连接到我身上的头戴式麦克风。我将系统单元的音频输出连接到电话的模拟路径。

因此,我看到了英文文本,听到了原文,看到了翻译,当我说出第二台计算机的答案时,我将其合成为语音。由于Google以女性声音说话,因此我使用了Fruity Loops数字滤波器,使其具有男性化的低调音色,并将经过处理的声音发送到电话的模拟路径。

尽管我的英语考试不及格,但原因并不是错误的认识。我被系统的狭窄脖子(即3G互联网连接)所困扰-不幸的是,我没有其他速度限制。据我了解,早晨,基站的负载减少了,我有足够的带宽。但是午餐后,网络在最不适当的时刻沉没了。

实验的结果是我能够坚持最初的几个句子,然后语音合成的速度就不再足够了,我转向了独立的答案而失败了。尽管我看到了正确的翻译,但我无法快速构建句子。有趣的是,对话者没有注意到从机器人到人的切换,只强调了舒适噪声发生器的关闭,因此,对话者在暂停时以为连接已紧密断开。

该系统需要改进-对来自麦克风的信号进行预处理,以消除不会产生静音效果的噪声,这对Google至关重要。然后,他将能够中断处理并分配语音组件,这将减少传出流量,提高连接速度并且不会丢失UDP数据包。在这种情况下,该系统颇具战斗力。我们将其转移到两个Raspberry PI并实时获取翻译器。

我自己无法实现这个想法-我需要DSP进行预处理,需要做电路,选择电路板拓扑结构,为DSP编写处理算法(尽管它们是在公共领域),然后为Raspberry PI编写程序,该程序具有便捷的功能以及与API的正确交互谷歌 我可以完成此任务,但更适合开发团队。尽管如此,它还有太多子任务。

我认为这个想法很有趣,可以找到买家,公司将很容易实现,我也不会出于自己的热情而尘土飞扬。

谢谢您考虑我的候选人资格!”

Source: https://habr.com/ru/post/zh-CN398561/


All Articles