用于学习外语的电报机器人:从填字游戏到说话


不久前,我写了关于我的机器人学习外语的文章。 更准确地说-扩大词汇量(又称填字游戏)。 在同一篇文章中,我写道,在没有上下文的情况下学习单词是徒劳的,学习文本比仅尝试将特定数量的单词引入脑海更好。

另外,我一直想快速切换到更实用的内容-例如,阅读Quora或Wikipedia上的文本,新闻,甚至使用该语言的简化版本。 让我提醒您,我学习芬兰语与移居芬兰有关,因此对我而言,尽早开始与周围的人交谈非常重要,其中芬兰人经常会遇到这些问题:-)

因此出现了一项新任务-使学习单词本身不是目的,而是一种使我感兴趣的文本的工具。 理想情况下-一种准备就我想说的话题发表讲话的工具。

计划


怎样才能更接近目标?

首先,对词的研究仍然是必要的,但应考虑到词中上下文的存在而进一步发展。

其次,需要在语法,句子结构方面的任务,因为首先理解句子的结构非常重要,特别是对于可能使用自由单词顺序(例如芬兰语)的语言。

第三,我们需要处理全文的任务。

好吧,最后一件事-如果我想学习说话,那么我需要语音识别和基于文本的语音生成以及使用这些技术的任务。

工作流程(又名教学法)


如何制定培训步骤以使培训尽可能高效?
基于文本的口语教学已经为人所知很长时间,并且已被广泛使用。 这个想法很简单-首先我们阅读文本,然后分析文本的词汇和语法,语法,结构和含义。 接下来,我们从被动学习转变为主动学习-例如,我们在文本中编写摘要,并根据演示文稿进行重述。 因此,一个人可以从阅读逐渐变成说话。

让我提醒您,为我创建机器人的主要动机是能够使用我认为必要或有趣的任何文本来学习语言。 因此,那里没有静态内容-一切均由学生自行决定。 因此,我们可以建立一个自动化的语言学习系统,该系统结合了指令的个性化和行之有效的外语教学方法。

发生什么事了


原来是旧机器人的新版本。 在OppiWordsBot (也就是所谓的)中,您仍然可以对单词进行很好的老式填充,现在可以将其与频率列表和基于word2vec的所谓“智能列表”一起添加。
但是现在出现了/ addtext命令,它允许您将任何文本插入输入行,之后将对其进行处理,并从中提取所有句子,单词和短语。

(以下所有示例均为英文)


从接收到的词汇单元中,将生成一个列表,单词和短语,用户可以使用/ addwords命令从中添加单词和短语进行学习。 添加每个单词时,您可以从Wiktionary,Yandex词典,Google翻译中选择定义选项,也可以添加自己的版本。


/ learning命令提示您选择要学习的单词列表,如果用户选择了从文本创建的列表,则从此刻开始,开始学习文本词汇的过程。


首先,机器人向用户介绍新词汇-任务是记住新单词和短语的含义。


然后,您需要记住单词的发音方式并尝试自己发音。 系统会告诉您用户在发音时出现错误的地方。 这里使用Google的付费服务,因此只有付费订阅(每月3欧元)才能使用这些练习。


接下来,用户必须仅依靠含义来发音。 这里的单词是在句子中给出的,出现在文本中。 再次,系统将告诉您用户语音中的错误。 在这里-仅通过订阅进行练习。


最后的词汇任务是按其含义写一个单词。 再说一次-上下文中的一个词。


掌握了词汇表并输入了/ learning命令后,该机器人将主动提供处理语法的功能。 没错,到目前为止,仅使用语法,到目前为止,仅通过一种练习即可-按正确的顺序排列单词。


掌握完所有句子后,如果您再次输入/学习 ,该漫游器将提供处理文本的功能。 首先,对每个段落进行简要总结。 如果该段不包含对整个文本重要的信息,则可以通过输入任何字符(一个)来跳过该段。


机器人将提供的文本摘要,以供您从内存中读取或播放。 文本将被识别,并且自动程序将显示您的文本与预期文本之间的差异。 这也仅可通过订阅获得。


因此,机器人引导用户从简单地记住词汇到讲到用户选择的文本主题并依靠他的第一步。

使用方法


主要规则是不要等待奇迹)

不值得希望的是,如果您将具有初始语言水平的大而复杂的文本加载到机器人中,则可以以某种方式神奇地学习整个语言并开始自由地阅读,理解和说话。 机器人可以做的就是帮助您记住词汇表,并在一定程度上帮助您记住文本语法,并引导您根据该文本讲话。 这已经很多了,但是奇迹当然还很遥远。

为了尽可能高效地使用漫游器,您需要选择不太复杂的文本。 否则,您会发现自己陷入了新词汇量繁重的工作之下,最终可能使您的动机降低为零。

我尝试选择对我感兴趣的主题不太复杂(适应性更好)的小文本(三至五个段落)。 通常,这要么是经过改编的演示中的新闻,要么是教育文本。 您可以尝试使用Google翻译来创建自己的文本并进行研究,但请记住,自动翻译可能会产生不完美的文本,并且存在学习所要学习的语言的风险。

由于该机器人的界面完全为英语,因此使用该机器人学习任何语言都需要一定的知识。 本地化是有计划的,但是到目前为止,既没有优势,也没有时间。

接下来是什么


由于该机器人的大多数用户都学习英语,因此我计划添加临时表格(Present Simple,Past Perfect等)的练习。 它们还将从用户文本中自动生成,并由区间重复算法(即语法现象,而不是其词法表示)进行处理。
现在,我也在努力优化练习-其中一些练习很可能会相互重复,并且可以简化以加快学习过程。 将增加有关词汇(语义和形态)和语法(例如纠错)的新练习。

有计划制定演讲任务,但是现在谈论这个还为时过早。

如果您想讨论机器人,提出建议或提出问题,可以在Telegram组OppiWordsBotGroup中进行

该代码发布在github https://github.com/tezer/OppiWordsBot上

那些具有基本英语和英语界面的用户的UPDATE会引起问题。
最简单的入门方法是:
/启动 -启动机器人
/设置 -设置您的语言(例如,俄语- 俄语 ),然后选择将用于您的词典。 最好只选择YandexDictionaryGoogleTranslate ,因为它们会将定义翻译成您的语言。
不要忘记使用命令/ setlanguage指示要学习的语言(仅以英语指定语言,即用英语英语 ,例如用德语- 德语 ,而不用德语)
之后,您可以使用/ addwords命令一个接一个地添加单词,或者可以添加所研究语言中频率最高的单词的列表/ wordlist ,然后添加第一个按钮(“ 最高频率单词” ),然后输入例如0:20以获取20个最频繁的单词话。
您还可以使用/ addtext添加研究文本,然后使用/ addwords从该文本添加单词。 最主要的是保持文本简单。

Source: https://habr.com/ru/post/zh-CN476264/


All Articles