阅读笔记之间:音乐内部的数据传输系统



表达语言无法传达的内容; 感受最复杂的情​​绪与飓风交织在一起; 脱离地球,天空,甚至脱离宇宙本身,继续前进,没有地图,没有道路,没有标志。 创造,讲述和重温一个始终保持独特和独特性的故事。 所有这些使您能够创作音乐-这是一种已经存在了数千年的艺术,它令我们耳目一新。

然而,音乐,或者更确切地说,音乐,不仅可以用于审美上的愉悦,而且可以用于传输编码在其中的信息,该信息旨在用于任何设备并且对于听众是不可见的。 今天,我们将与您面谈一项非常不寻常的研究,来自苏黎世瑞士高等技术学校的研究生能够将某些数据无法察觉地插入人耳的音乐作品中,因此音乐本身就成为数据传输渠道。 他们如何准确地实现自己的技术,有没有内置数据的旋律有很大不同,实际测试显示了什么? 我们从研究人员的报告中了解到这一点。 走吧

学习基础


研究人员称他们的技术为声学数据传输技术。 当说话者再现改变的旋律时,人们会像往常一样感知它,但是,例如,智能手机可以读取行之间的编码信息,更准确地说,可以读取音符之间的编码信息。 在这种数据传输方法的实现中,最重要的方面是,科学家(事实上这些家伙仍是研究生,这并不妨碍他们成为科学家)在保持这些参数级别不变的情况下,调用了传输的速度和可靠性,无论选择了哪个音频文件。 心理声学研究了人类对声音的感知的心理和生理方面,有助于应对这一任务。

声音数据传输的核心可以称为OFDM(正交频分复用),它与子载波随时间推移对原始音乐的适应性变化一起,可以最大程度地利用传输频谱来传输信息。 因此,可以在24米的距离内实现412位/秒的传输速度(错误率<10%)。 涉及40名志愿者的实际实验证实了一个事实,即几乎不可能听到原始旋律与嵌入信息之间的差异。

这项技术可以在哪里应用? 研究人员有自己的答案:几乎所有现代智能手机,笔记本电脑和其他手持设备都配备了麦克风,并且在许多公共场所(咖啡馆,饭店,购物中心等),都有带有背景音乐的扬声器。 例如,可以将连接到Wi-Fi网络的数据嵌入此背景音乐中,而无需执行其他操作。

声学数据传输的一般特征对我们来说已经很清楚了,现在我们来详细研究该系统的结构。

系统说明


由于频率掩蔽,将数据合并到旋律中。 在时间间隔中,确定屏蔽频率,并在靠近这些屏蔽元素的OFDM子载波中填充数据。


图像#1:将源文件转换为通过扬声器传输的复合信号(旋律+数据)。

首先,将原始音频信号分为连续的片段进行分析。 L = 8820个样本的每个这样的片段(H i )等于200 ms,然后乘以窗口*以最小化边界效应。
窗口*是权重函数,用于控制由于频谱估计中存在旁瓣而产生的影响。
然后,发现初始信号的主要频率在500 Hz至9.8 kHz的范围内,这使得有可能获得该段的掩蔽频率f M,l 。 此外,在9.8至10 kHz的小范围内传输数据,以确定子载波在接收机中的位置。 由于智能手机的麦克风在高频下的灵敏度较低,因此使用频率范围的上限设置为10 kHz。

针对每个分析的片段分别确定掩蔽频率。 使用HPS方法(产品的谐波频谱),确定了三个主要频率,然后将它们四舍五入为谐波色阶的最接近音符。 这样便获得了位于音调C0(16.35 Hz)和B0(30.87 Hz)之间的主要音符f F,i = 1 ... 3。 基于主要音符太低而无法用于数据传输的事实,在500 Hz ... 9.8 kHz的范围内,计算出它们的较高八度2 k f F,i 。 由于HPS的特性,这些频率中的许多(f O,l 1 )更为明显。


图片编号2:主要音符的计算八度音阶f O,l 1和最强音调的谐波f H,l 2

八度音阶和谐波的总和被用作掩蔽频率,在此基础上获得了子载波f SC的 OFDM频率k 。 在每个屏蔽频率之下和之上,插入了两个子载波。

然后,在副载波频率f SC,k处对音频片段H i的频谱进行滤波。 然后,基于Bi中的信息位,创建了一个OFDM符号,由于该符号,复合段C i可以通过扬声器传输。 必须选择子载波的值和相位,以便接收器可以检索传输的数据,而听众则不会注意到旋律的变化。


图3:原始旋律Hi片段的子载波的频谱和频率图。

当通过扬声器再现了带有编码信息的音频信号时,接收设备的麦克风会记录下来。 为了找到嵌入的OFDM符号的起始位置,必须首先通过带通滤波跳过这些条目。 以此方式,在子载波之间没有音乐干扰信号的情况下提取较高的频率范围。 您可以使用循环前缀找到OFDM符号的开头。

在检测到OFDM符号的开头之后,接收器通过对较高频域进行解码来获取有关最主要音符的信息。 另外,OFDM对窄带干扰源具有足够的鲁棒性,因为它们仅影响某些子载波。

实际测试


KRK Rokit 8扬声器充当了旋律的来源,而Nexus 5X智能手机充当了主机端。


图像4:OFDM的真实表现与扬声器和麦克风之间5 m处在室内测得的相关峰之间的差异。

大多数OFDM点的范围是0到25 ms,因此您可以在66.6 ms的循环前缀内找到有效的起点。 研究人员指出,接收器(在本实验中为智能手机)考虑到了OFDM符号的周期性复制,从而改善了其检测能力。

首先要检查的是距离对误码率(BER)的影响。 为此,在不同类型的房间中进行了三个测试:带地毯的走廊,在地板上有油毡的办公室和在木地板上的观众。


Van Halen的歌曲“ And The Cradle Will Rock”被选为“测试对象”。

调节音量,以使智能手机在距扬声器2 m处测得的音量为63 dB。


5号图:BER指示器取决于扬声器和麦克风之间的距离(蓝线-听众,绿色-走廊,橙色-办公室)。

在走廊上,智能手机在距扬声器最多24米的距离处拾取了40 dB的声音。 在距离15 m的听众中,声音为55 dB,在距离8米的办公室中,智能手机感知的声音水平达到57 dB。

由于观众和办公室混响的事实,较晚的OFDM符号回声超过了循环前缀的长度,并增加了BER。
混响* -由于多次反射,声音强度逐渐降低。
此外,研究人员通过将其应用于三种流派的6首不同歌曲,证明了其系统的多功能性(下表)。


表1:测试中使用的歌曲。

另外,通过表中的数据,我们可以看到每首歌曲的比特率和误码率。 数据传输速度有所不同,因为当使用相同的子载波时,差分BPSK(相移键控)效果更好。 当相邻的段包含相同的遮罩元素时,这是可能的。 连续大声的歌曲为隐藏数据提供了最佳基础,因为在很宽的频率范围内掩盖频率更加明显。 由于分析窗口的固定长度,快速变化的音乐只能部分掩盖OFDM符号。

接下来,人们开始测试该系统,他们应该确定哪个旋律是原始的,而哪些旋律是通过嵌入其中的信息进行修改的。 为此,将1号表中歌曲的12秒摘录张贴在一个特殊站点上。

在第一个实验(E1)中,为每个参与者提供了修改后的片段或原始片段供收听,并且他必须决定该片段是原始片段还是更改片段。 在第二个实验(E2)中,参与者可以听任意次数的两个选项,然后确定哪个是原始的,哪个被更改。


表2:实验E1和E2的结果。

第一个实验的结果有两个指标:p(|)-正确标记了原始旋律的参与者的百分比和p(|)-将旋律的更改版本标记为原始的参与者的百分比。

研究人员认为有些参与者认为某些修改的旋律比原始的旋律更奇怪。 两项实验的平均指标表明,普通听众不会注意到常规旋律与嵌入数据的旋律之间的差异。

自然,音乐鉴赏家和音乐家将能够在变化的旋律中捕捉到一些不准确和可疑的元素,但是这些元素并不重要,不会引起不适。

现在我们自己可以参加实验了。 以下是相同旋律的两个选项-原始和修改。 您听到区别了吗?

旋律的原始版本

旋律的修改版

为了更详细地了解研究的细微差别,建议您查看研究小组的报告

您还可以通过此链接下载研究中使用的原始和修改的旋律的音频文件的ZIP存档。

结语


在这项工作中,苏黎世瑞士高级技术学院的研究生描述了音乐中令人惊叹的数据传输系统。 为此,他们使用了频率屏蔽功能,该功能可将数据嵌入扬声器播放的旋律中。 设备的麦克风会感知到这种旋律,它会识别隐藏的数据并对其进行解码,而普通的收听者甚至不会注意到其中的差异。 将来,他们计划开发他们的系统,选择更高级的方法将数据嵌入音频中。

当有人提出不寻常的事情(最重要的是工作)时,我们总是很高兴。 但是,更令人高兴的是,这项发明是由年轻人创造的。 科学没有年龄限制。 如果年轻人认为科学很无聊,那么可以这么说,它以错误的角度呈现。 毕竟,众所周知,科学是一个永无止境的神奇世界。

周五顶峰:

由于我们是在谈论音乐,更具体地说是在谈论摇滚音乐,因此这是一段穿越岩石的绝妙旅程。


女王,加加广播电台(1984)。

谢谢大家的关注,保持好奇心,祝大家周末愉快! :)


感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

戴尔R730xd便宜2倍?在荷兰,我们有2台Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100电视 戴尔R420-2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB-$ 99起! 阅读有关如何建立基础架构的信息 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN459594/


All Articles