谷歌教人工智能编写维基百科风格的文章



Google在人工智能领域从事研究已有很长时间了。 这对于公司满足个人需求(改善各种服务的工作)以及为客户提供新机会都是必需的。 现在,Google已经为其AI宣布了一项新功能,该功能被教导可以“阅读”多种文本,并根据Wikipedia风格的已阅读文章的结果来形成表格。

人工智能从互联网上获取资料并进行分析,然后创建类似简历的内容。 根据工作成果,公司员工写了一篇文章,指出了许多技术要点。 本文的主要思想-对读取的内容进行分析对于计算机而言是一项非常困难的任务。 其他公司曾试图在Google之前完成类似的任务,但他们没有成功-大多数类似的项目都失败了。

但是有些人成功了。 例如,Salesforce能够训练其神经网络来收集信息并根据给定算法对其进行分析。 这类似于Google所做的事情,结果也可以作为文章提供。 结果可以令人满意-神经网络可以应付一般任务,但是计算机生成的文本不是很好。 句子大部分都是简单而简短的。

对于计算机而言,维持内容的语义结构也很困难,一个人可以毫不费力地处理它。 至于谷歌,这家公司的表现要好一些。 计算机提供的报价比SalesForce的报价更长,并且看起来更自然。 到目前为止,该机器只能使用英文文本。 下面是带有两个不同注释的示例。 左边是一个人写的。 右侧是“打字”材料,即神经网络在不同资源上寻找的信息。



由于例如在新句子开头缺少大写字母,计算机编写的文本有些难以阅读。 此外,大多数建议都有些繁重。 但是,一般而言,此文本阅读得很好。 在这种特殊情况下,最终版本并未包含来自来源的所有重要信息,因此该示例本身不能被视为具有指示性。 但是,很明显,神经网络确实具有很多功能-目前,这是计算机在分析原始文本之后可以产生的内容的最佳选择。

系统在不同站点上搜索有关给定主题的信息,并生成包含所需数据的十个最相关页面的列表。 结果是带有链接的完整文章-与Wikipedia的格式大致相同。 顺便说一下,由Google创建的系统是自学的,因此读取和创建的每个页面都可以帮助计算机进行改进。

顺便说一句,计算机故意剪切长句子,使其更像电子百科全书Wikipedia上文章所采用的样式。 因此,计算机不会自行编写所有内容-它仅构成自己的句子,减少了开头的句子,可以从中删除某些单词,而不会影响所阅读材料的含义。

该过程不能被称为太快,但是结果是可以接受的。 根据形成该算法的专家的说法,在整个项目中,“瓶颈”是分配单个文本片段以形成新文章。 所有这些工作都不会太快地完成,因此该算法还有发展和改进的空间。 该公司的代表说,目前用于此类工作的软件和硬件还不太完善,因此该公司计划进一步改进其技术。

当前系统的主要缺点是计算机根据页面的受欢迎程度(访问,阅读时间等)获取带有信息的页面,以撰写有关该主题的文章。 并且,如果在页面之一上发布的信息不是很准确,则计算机创建的摘要也将包含错误和不准确之处。 尽管如此,该公司希望在不久的将来能够显示出更高级的文本生成过程。

Source: https://habr.com/ru/post/zh-CN410287/


All Articles