科学家正在研究您的Twitter语以帮助AI

什么?whaat。什么?whaaaattt?虽然以上所有的表达都令人困惑,但您理解它们的意思是稍有不同的事情。这是基于您想象的声音意义的方式

什么? whaat。什么? whaaaattt?

尽管以上所有内容都是混乱的表达,但您了解它们的意思是略有不同的事情。这是基于您想象的方式,通过重复或重点对某些字母的重复或重点表示声音的方式。在我们的白话,lang语和故意拼写错误的单词中充满了根本的含义是我们如何与人类情感的数字交流。

巧合的是,这被证明是语言处理人工智能的主要挑战之一。但是科学家正在尝试,他们正在研究我们的Twitter术语,以使计算机迅速地了解人类的真正沟通方式。

图片来源:dole777 / unsplash

在过去的二十年中,社交媒体为科学家提供了有关人类行为和语言的免费信息。佛蒙特大学的一群数学家使用Twitter来研究年轻人如何故意在文本中伸出文字以进行数字通信。他们创建了一种方法来基本上量化拉伸单词之间的语义细微差别,例如“右”与“ riiiiiight”,目的是教授未来的AI算法人类数字俗语。

“书面交流最近已经开始编码新的表达形式,包括通过伸展单词传递的情感重点,”佛蒙特州复杂系统中心的数学和统计学教授克里斯·丹佛斯(Chris Danforth)说,研究团队的研究团队成员。

该团队在上周发表在《 PLOS One》杂志上的研究中,分析了从2008年至2016年产生的大约1000亿条推文中的语言。他们开发了两项测量方法来评估推文中的模式:平衡和伸展。例如,哈哈哈哈哈将被认为是一个平衡的伸展世界,而像wtffffff这样的术语的平衡却很少,因为只有一个字母f,f造成了弹力。这意味着要强调字母“ F”所缩写的世界。“如今,通过电子方式进行了如此多的沟通,我们都在努力找到通过文本传达情感的方法。表情符号在帮助,但是诅咒词中30个连续元音的视觉效果使平淡无奇的亵渎变成了一种艺术形式。”丹佛斯说。

有趣的是,在语言上发现了细长单词的使用。例如,“ kkkkkkk”表示巴西葡萄牙语中的笑声,而“ wkwkwkwkwkwk”在印度尼西亚语中表达了这一点。

最终,该项目可以帮助人工智能算法了解我们交流文本或其他语言符号(例如标点符号和表情符号)中特质变化中包含的关键内在含义。

字典的定义几乎不能反映我们实际上数字上彼此交流的方式。但是,研究人员发现的是,人们伸出的一词不是任意的。相反,它们具有图案化的分布,例如单词的哪一部分被拉伸或伸展多少。毕竟,通俗的数字语言是一个符号系统,要转移这意味着我们必须在模式上“融入”。

这项研究表明,通过了解社交媒体上使用的拉伸单词,可以打开更多的门,以帮助AI更好地理解我们的语。开发了可能在未来的研究中很有用的工具和方法,例如对故意错误类型和拼写错误的研究。首先,可以使用新工具来改善自然语言处理,搜索引擎和垃圾邮件过滤器。

研究人员在新闻稿中说:“我们能够全面收集和计算诸如’gooooooaaaalll’和’hahahaha’之类的伸展词,并在整体伸展和平衡的两个维度上绘制它们,同时开发了新工具,同时开发了新工具的平衡。还将有助于他们的持续语言研究,以及在其他领域,例如语言处理,增强词典,改进搜索引擎,分析序列的构建等等。”

原创文章,作者:点数网,如若转载,请注明出处:http://www.dsonekey.com/3308.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息