语音的形式化。 一些注意事项



规范自然语言的主要困难是什么? 事实是,我们习惯于在语言的帮助下对其进行形式化,从而导致邪恶的无限性。 语言本身就是形式化的一种手段,人类长期以来一直没有成功地使用它。

我们采用第一个定义:
飞行-物体在气态介质或真空中的独立运动。

它有六个术语,这又需要定义:

  • 独立的
  • 搬家
  • 对象
  • 气态的
  • 星期三
  • 真空。

每个术语都有其自己的定义,通过这些定义,我们可以获得需要新定义的新定义,等等。 最后,事实证明,所有使用的术语都已提前给出定义,也就是说,我们有了一个循环。 当然,这不是我们梦想的主题。 其中一个事务需要停止,但是...什么时候停止? 选择什么作为停止标准? -这些是该死的问题。

回想一下为什么我们通常需要一种语言。 在沟通过程中正确反映我们周围的现实。 顺便说一下,周围的现实是由物理对象组成的。 我们无法感知其他任何东西:物理对象-这是人类最初感知到的。

由此可以得出结论,就表示物理对象而言,在发布定义的过程中停止是必要的。 原理是这样的:我们所见即所得。
在这里等待是一个逻辑陷阱:要了解我们要传达的内容,必须定义该术语。

假设有人用手指指着惊叫:
-野兔!

“兔子”需要主题知识或定义-我们发现自己处于同样令人羡慕的位置。 但是,如果您采取一些基本的措施,那么令人羡慕的地位就会消失-例如,大喊:
-白色!

什么是白色? 当然,它不是物体,但其特征是颜色。 不需要定义的术语:白色是白色。 人眼可用的颜色数量受到限制-因此,不需要定义的术语数量也受到限制。

人们认为一个人有五种感觉(有时被称为更多,但这并不重要):

  • 视野
  • 触碰
  • 嗅觉
  • 听觉
  • 有品位。

每个器官功能的结果都是某种感觉,其值不需要定义,因为它们对应于周围现实中不可检测的元素。

问题是,可以将周围现实的哪些要素描述为简单的五种感觉? 基本对象! 这个想法是将一个相同的“兔子”的复杂对象分解为基本组成部分,每个组成部分都具有感觉特征。 放回组件,我们在集合中得到了“兔子”:一个具有正式且最重要的是完整的口头定义的对象。

让我们看看这是怎么可能的。

这是一个物理对象。 请注意,观察(更精确地说,是感觉,因为不仅可以从视觉上看到物体,而且可以借助其他感官感知到物体),还可以使用专门的,即个性化的物体。 当我看到野兔时,这是一种非常特殊的野兔-这是一种野兔,一点都没有。

通常,对象的个性化是通过其命名进行的,但是,就像在野兔的情况一样,它远非总是如此(仅在需要时)。 因此,根据情况,“兔子”一词可能表示:

  1. 一只特别的兔子
  2. 任何野兔所属的类的名称。

这些细微差别必须加以区别-假设使用“个人”(代表我们用第一个字母表示)和“类”(代表我们用最后一个字母表示,因为括号中的“ c”与版权符号相关联)的缩写:

野兔(i)。
类似文字:野兔-个人名字;

野兔。
类似文字:野兔-班级名称;

如果野兔有一个独特的名字,它将变得更加明显:
Stepashka(i)。

“ Stepashka”不能是类的名称,但是需要表明属于特定类。 你打给任何人吗? 我们必须表明属于该类。 为此,我们使用符号“∈”:
Stepashka(i)∈野兔(s)。

现在确定Stepashka是野兔之一,但尚未确定野兔是什么。 如前所述,“野兔”必须分解成各个组成部分,每个组成部分都必须具有与人的感觉相对应的特征。

这是非常困难的,主要是由于对象组成部分的三维性,因此只能有条件地完成。 但原则上可以。

假设野兔由头,躯干,腿和尾巴组成,并且列出的对象是基本的(当然,实际上不是)。 然后,使用符号“⊂”表示材料整体中某个组件的出现,我们获得:
头&&躯干&& 4 *爪子&&尾巴⊂兔子。
文字模拟:头,躯干,4条腿和尾巴组成了一只野兔。

由于对象应该是基本的,因此可以为它们指定每种感觉的特征。 由于感觉对人的综合影响,可能需要定义空间和时间。

我们得到一组近似的特征:

•颜色
•形式
•气味
•味道
•表面(触摸的结果),
•声音
•位置(空间坐标),
•运动(作为两个位置之间的差异),
•时间点
•持续时间(两个时间点之间的差),
•速度(作为运动和持续时间之间的商)。

正如我所说,该集合是近似的:只有与感觉相对应的特征是无条件的,其余的将进行讨论。 例如,很明显,一个人并没有这样感知时间:它可以由小工具上的符号或天空中太阳的位置来确定,但不能直接由感觉来确定。 同样,位置不是绝对设置的,而是相对于其他对象的。

现在,我将尝试刻画“头部”的特征:

  • 形状:圆形
  • 表面:坚硬。

其他特征未定义。

也就是说,如果我们有条件地将其视为基本对象,则头部是圆形且坚固的。 当然,有条件地,有条件地。 毕竟,语言是形式化的一种手段,它给出了近似的结果:例如,如何口头描述一个复杂的几何形状的点? 没办法:您无法形容。 因此,在条件示例中,头部大约是圆形的并且大约是实心的,并且在此点上是一个点。

如果您同意,我们将其写在大括号中:
头{形状:圆形; 表面:坚硬}。

即,指定的对象具有指定的特征。

当然,当然,头部不仅可以是圆形的,而且可以是不同的:例如,苏联时期有胡子的轶事中的沃沃卡(Vovochka)具有方形的头部。 没有什么可以阻止我们将逻辑操作数引入到符号系统中,尤其是“或”操作数:
头{形状:圆形II正方形; 表面:坚硬}。

但是野兔的头是圆的,而不像Vova的那样是方形的! 好吧,对于这两个方面,我们要介绍一下含义:
头{形状:圆形}如果头⊂野兔。

代替野兔,可以指示特定野兔Stepashka,从而设置他的个性:
头部{shape:round}如果头部⊂Stepashka(i)。


特征中使用的术语(“圆形”,“正方形”,“实心”等)不可检测:我们直接感觉到它们,因此不需要口头定义。

我将用“ a”(来自“ attribute”的符号)来指定这种类型的单词,如下所示:
圆(a)。

我提请您注意以下事实:单个对象和类是名词(这些是实体!),而特征是形容词(因为它们是特征!)。 从类型与词性对应的角度来看,一切都是合法的。

形容词“回合”是无法检测到的特征,但是例如,形容词“野兔”与人的任何感觉都不匹配,因此不适合属性。

显然,“野兔”的定义应该通过我已经做过的“野兔”来定义(通过将“野兔”分解成其组成部分)。 也就是说,术语“野兔”首先出现,然后形容词“野兔”由此形成,意思是:与野兔有关,类似于野兔。

我们从“依赖关系”中得到一个新的类型,用符号“ d”表示。 类型指示当然是不够的-必须引用父项。 我们引入一个新的名称,使用符号“ =>”表示关系:
野兔(d)=>野兔(s)。

现在定义了术语“野兔”-通过父名词“野兔”。

我们通过父名词定义了从属形容词。 反之亦然:当从形容词形成从属名词时。 例如,“正方形”是表示对象形状的形容词。 根据前述内容,很明显“正方形”来自“正方形”,而不是“正方形”来自“正方形”。
正方形(d)=>正方形(a)。

因此,在每组同源术语中,都有一个父术语,所有其他术语都起源于此。

现在,我设法从原始的无法发现的所有术语? 仍然没有-仍然存在一个尚未涵盖的重要术语组:可以通过公式推论的概念。

采取动词-例如,“移动”:我们尚未遇到动词。 什么是“移动”? 我使用的不是学术定义,而是我认为可以反映问题本质的定义:
“移动”是指一个对象在另一个对象的影响下更改其位置的情况。

计算公式如下:
X(i)1#移动(f)X(i)3 {移动:非零(a)}。

我赶紧给出必要的解释。

该公式由三个部分组成,分别表示主题,动作和对象:

  • X(i)1是主题。 “ X”是指序列号为1的任何单个实体。
  • #movef是一个动作。 “ F”是来自“公式”的公式。 格子表示可定义的单词(在此示例中,这是多余的,但是在指向特定主题或对象时可能需要)。
  • X(i)3是物体。 其余部分与主题相同。 圆括号表示由于拍摄对象的影响而改变的特征。

规则很灵活:新概念很容易按照它们来构造。 采取一般的未填充结构(主题-动作-对象):
X(i)1 X(f)2 X(i)3。

必要的元素替换为特定的术语,指示特征,用网格标记要标识的元素,并在必要时使用逻辑操作数。

让我们进行一些练习,例如使用副词,也可以用公式术语来表示。

副词“小心地”-从我的角度来看,父母在同类词组中(“小心”,“小心”,“小心”,“保护”)。 该词表示特征,但不是对象,而是动作。 我将给您一个有条件的原始定义:
“小心”是指某人缓慢移动某物的时间。

事物定义为“慢”-取决于“慢”,这是物体在速度上的特征。
慢(d)=>慢(a)。

并且术语“移动”已经被处理。 因此,定义“仔细”一词有必要:
X(i)1移动(f){#小心(f)} X(i)3 {速度:慢速(a)}。

在这里,“小心地”是通过“移动”和“缓慢地”定义的,并且像其他方言一样,指的是动作。

根据这样的规则,可以从先前获得的公式概念中确定新的公式概念,以此类推,包括使用含义以及可能的其他逻辑方法。 抽象概念越复杂,所得公式的结构越复杂且越深。 我们可以获得任何术语的正式定义,而究竟多少才是正确的取决于我们。

当然,可以扩展提议的语言-足够多的可能性。 例如,同义词的符号表示为:

河马=河马。

它没有谈论语音的其他部分:用于句子(感叹词)或各种技术需求(联合)的情感着色的那些部分。

是的,你永远都不知道! 但是,思想的方向很重要,而这种语言的语法只是纯粹的次要问题和应用问题。

我总结一下。

我们有以下几种类型的单词:

  • i-单个对象:通过属于该类而确定,是名词;
  • c-类:由分解成组件确定,达到基本类的水平。 基本类由特征定义。 两者都是名词。
  • a-对象和类的特征。 它们是形容词;
  • d是从属术语。 由父项形成。 可能是演讲的任何部分;
  • f-公式概念。 它们是名词,动词或形容词。

以及以下单词形成顺序:

  1. 在较低级别上是基本对象的特征,并通过它们来分类-红色,实心,圆形等类别。
  2. 原始特征的组合使得可以为基本对象分配名称:例如,树上生长的所有圆形和红色对象都可以称为苹果。 结果,我们获得了一个既适合于指定一个类(整个苹果)又可以指定单个对象(恰好是这个苹果)的术语。
  3. 单个对象的存在使您可以为其分配唯一的名称(Stepashka野兔)。
  4. 初始术语是任意形成的,如有必要(此野兽可以称为野兔,也可以称为兔子,对此没有任何改变)。
  5. 通常,从属词是初始词,这是词性的其他部分。
  6. 根据已定义的术语,可以编译公式以定义以下具有复杂逻辑条件的术语。

读者可能已经有一个问题,为什么这一切都是必要的?

我在雕刻聊天机器人时遇到了这个问题。 我们设法吸引的测试人员只有几个人! -从我的角度来看,举止同样发疯:他们问了问题,想得到答案。 天真! 好像他们不知道在提问之前,您应该在数据库中输入信息。 但是,即使成功克服了这一障碍,鉴于人类语音的不变性,预测问题的形式还是很成问题的。

将文本输入数据库无需花费任何费用:
“鸟儿在飞。”

然后可以获得问题的答案。 很难等待一个更复杂的问题的答案,这实质上是第一个问题的变体:
“凤头鹦鹉拍动翅膀吗?”

为此,您需要了解单词之间的许多关系,即:

  • 美冠鹦鹉属于鸟类类别;
  • “飞行”和“飞行”是词根;
  • 你可以飞翔的翅膀;
  • 翅膀在挥舞。

原则上,前两点可以从字典中下载到聊天机器人中(尽管我深信我内心深处无法摆脱的悲伤,但是白天却找不到字典。) 要实现最后两点,根本就没有路可走。 在我们的脑海中,信息以医生处方的形式提供,但您无法从那里获得信息。 虽然按定义缺少字典,但缺少所需的内容:偶尔会遇到麻烦的字典提供口头表达,而需要严格的形式表达。

因此,我问了自己一个问题:如何使语音形式化,以便在无法定义的术语的基础上为其他人提供定义,从而使汇编完整的词汇关系词典成为可能。 如果成功,聊天机器人将能够回答美冠鹦鹉在飞行中是否拍打翅膀的问题。

在我目前的人生阶段,指出道路是我唯一的可能。 但是,我不确定这里表达的考虑是否完全是原始的:在AI开发过程中进行了形式化语音的尝试,而且肯定不止一次。 但是,我提议的技巧不仅是用自然语言或人工语言填充短语(有意义的基础填充不适用于所讨论的主题),而且还在于从有限数量的未定义概念中定义任何后续术语。 我对实现这个想法一无所知。

实际上,仅此而已。

[笑话]
不要告诉我,诺贝尔奖是通过支票,银行转账或现金发行的?
[/开个玩笑]

Source: https://habr.com/ru/post/zh-CN448936/


All Articles