情感人工智能除了与机器学习和神经网络有着明显的联系外,还与心理学特别是与情感科学直接相关。 如今,这方面存在一些挑战。 其中之一是形成准确,完整的情绪状态分类,注释过程直接依赖于此分类,包括将观察到的面部表情和其他非语言信号与某些情绪和情感状态进行比较。

情绪分类
如今,情感数据分类的三种方法被广泛使用:离散模型和多维模型以及混合方法,将前两种类型结合在一起。
离散方法基于我们在自然语言中发现的情感分类。 每个情感都与一个语义字段相关联,语义字段是我们归因于某种情感状态的一种特定含义或一组含义。 基本情绪理论是离散方法最著名的例子之一。
在早期的哲学著作中,例如希腊或中国的遗产中,首次提到与
基本或主要情感相似的事物。 柏拉图在著名的作品《共和国》中将情感归因于人类思想的主要组成部分。 在亚里士多德的情感功能理论中,理性,情感和美德是相互联系的,每个健康人的情感生活总是(或几乎总是)与理性和美德保持一致,无论他是否意识到。 在中国儒学中,我们发现四到七个“清”,这是任何人自然的情绪。
在20世纪,该主题成为科学兴趣的焦点,包括最基本的基本情感理论的作者Paul Ekman在内的许多作者提出了自己对此类情感量的看法。 埃克曼(Ekman)建议,基本情感应该具有普遍性,因为在所有文化中它们的表现形式都是相同的。 在不同的理论中,我们可以发现6至22种情绪(埃克曼,鹦鹉,弗里达,普卢奇克,汤姆金斯,松本-有关详细信息,请参见坎布里亚等,2012)。
如今,基本情绪的存在仍然是一个有争议的问题(例如,参见Barret&Wager,2006;或Crivelli&Fridlund,2018)。 许多研究表明基本情绪与个体大脑结构活动之间存在相关性(例如Murphy等,2003和Phan等,2002),尽管其他研究尚未证实这种相关性(参见Barrett&Wage,2006)。 有趣的是,一些关于孤立民族的情感感知的研究不支持情感的跨文化普遍性的假设。 一个例子是来自巴布亚新几内亚的Trobrians(见Crivelli&Fridlund,2018,和Gendron等人,印刷中)。 在一个实验中,向该部落的代表展示了一个表达恐惧的人的照片,但特罗布洛人认为这种表达是威胁的信号。
保罗·埃克曼(Paul Ekman)提出的情感地图集: atlasofemotions.org 。 1999年的原始版本还包含“惊奇”。如今,情感计算领域中的许多决策都是基于离散模型,并且仅包含基本情感,并且大多数情况下都是根据Ekman的理论进行的(例如,情感AI的先驱者Affectiva的解决方案)。 这意味着对自动系统进行了训练以识别数量有限的情感状态,尽管在生活中我们不断体验大量的情感,包括复杂的混合情感,并且在人际交流中我们使用了许多社交信号(例如手势)。
另一方法-
多维 -表示多维多维空间中的情绪。 由于这个空间是不可分割的,因此有些情绪具有相同的性质,但在许多参数上却有所不同。 在情感科学中,这些参数(或测量值)最常由化合价和激活(刺激)表示,例如,在Ringeval等人的RECOLA数据集中。 情绪的强度也经常被使用。 因此,悲伤可以看作是悲伤的一种较不强烈的表达,而一种更为明显的沉思,同时更像是厌恶而不是信任。 测量数量可能因型号而异。 Plutchik的情绪转盘只有2个维度(相似度和强度),而Fontaine则假设4个维度(效价,效价,激活,不可预测性)。在这样的空间中,任何情绪都会具有许多特征它在特定维度中所呈现的值。
混合模型结合了离散方法和多维方法。 混合模型的一个很好的例子是Cumbria,Livingston和Hussein提出的“沙漏情感”(Cambria等,2012)。 每个情感维度的特征在于表达情感的六个力量级别。 这些水平也称为24种情绪的集合。 因此,任何情绪都可以被视为固定状态,并且可以视为与非线性关系中其他情绪相关联的连续体的一部分。
情感计算中的情感
那么,为什么情感分类对于情感计算如此重要? 在本文的开头,我们强调情感的分类以及我们坚持的方法会直接影响注释过程-标记视听情感彩色内容。 为了训练神经网络识别情绪,需要一个数据集。 但是,这组的标记完全取决于我们的人,以及我们与特定面部表情相关联的情感。
如今,有几种注释工具很常见。 它们是用于多维模型的ANNEMO(Ringeval等人),用于离散系统的ANVIL(Kipp)和ELAN(马克斯·普朗克心理语言学研究所)。 在ANNEMO中,注释在2个情感维度中可用:激活和价,其值的范围从-1到+1。 因此,可以为任何情绪状态分配表征其强度和积极/消极的值。 社会维度也可以在5个维度上以7分制进行评估:协议,主导,参与,绩效和融洽关系。
ANVIL和ELAN允许您使用自己的过滤器来标记视听情感内容。 过滤器或标记可以由单词,句子,注释或与情感状态描述相关的任何其他文本表示。 这些标记是静态的,无法用大小表示。
方法和注释系统的选择取决于目标。 当某些语言中存在某些单词,而其他语言可能没有描述这些情感的单词时,多维模型可以避免一个众所周知的问题。 这使得注释过程在上下文和文化上都具有依赖性。 然而,离散模型是用于对情绪进行分类的有用工具,因为很难客观地评估数量变化的效价或激活程度,并且不同的注释者将对这些数量的严重性给出不同的估计。
奖励:机器人
顺便提及,情感分类不仅在情感识别领域中广泛使用,而且在情感合成中也广泛使用。 例如,在机器人技术中。 机器人可用的情绪频谱可以集成到多维的情绪空间中。 情感系统-一种情绪状态系统,可能是AI行业中最可爱的机器人-麻省理工学院(MIT)开发的Kismet基于多维方法。 情感空间的每个维度(激活,效价和状态(姿势),即准备交流)都与一组面部表情相关联。 一旦达到所需的值,机器人将切换到下一个情绪状态。
视频:Kismet机器人的工作原理