A.I.可以通过查看朋友的帐户来预测您的未来推文

知道可以从Twitter上拿走您过去的所有著作,让计算机检查它们,然后对其做出非常准确的预测,这可能不足为奇。

知道可以从Twitter中获取所有过去的著作,让计算机检查它们,然后对其进行非常准确的预测,这可能不足为奇。 。然而,更令人惊讶的是,一项新研究表明:A.I.有可能通过仅查看少数人的朋友的在线行为,可以准确预测某人的Twitter活动。

结果突出了一个令人不安的含义:甚至没有删除您的Twitter或Facebook帐户,理论上会阻止某人对您开发个人资料 – 正如研究所暗示的那样,它可能非常准确:

“机器学习方法从在线痕迹中准确介绍个人的能力反映在其书面文本的可预测性中。”

这项研究发表在《自然人类行为》杂志上,旨在找出理论上可以通过在社交网络中使用有关人员的数据来制作一个人未来社交媒体活动的预测的准确性。

“我们使用了信息理论中一些非常有趣的数学来说:如果您拥有完美的机器学习方法,那么您能做得如何?”佛蒙特大学的数据科学家詹姆斯·巴格罗(James Bagrow)告诉《科学》杂志。

这是一份关于机器学习技术将如何做出这样的预测的摘要,如研究作者所写:

机器学习方法从在线痕迹中准确介绍个人的能力反映在其书面文本的可预测性中。的确,通过接受培训的语言模型,可以预测用户将在线发布的单词,因此可以通过评估要发布的各种单词的可能性(例如与政治有关的术语)来构建用户的个人资料。因此,量化用户文本中包含的预测信息使我们能够了解使用用户数据的潜在准确性。对于研究,研究人员查看了来自大约13,900个Twitter用户的3000万张帖子有50至500个关注者。从这些数据集中,他们指定了927个所谓的自我网络,其中心是Twitter用户,大约9个最常提及的Twitter联系人。然后,研究人员查看了所有用户过去的著作,根据推文的内容和时间对它们进行分类,发现用户通常仅在45和256个不同的单词之间使用撰写推文,这比“远小于典型用户的小”。 〜5,000字词汇,”作者写道。这个有限的范围使预测用户可能会写的单词相对容易。

在进行了各种测试之后,结果表明,仅使用其社交关系的给定人员就可以实现95%的潜在预测准确性,而无需检查个人的个人Twitter数据。尽管该研究实际上并未预测特定的推文,但该研究说明了社会群体中有关我们的大量预测信息。

关于发现的一个有趣的说明:通常,当研究人员衡量给定用户的潜在预测准确性时,准确性提高了,因为他们将更多用户的朋友添加到了数学混音中。但是在某个时候,添加新朋友停止了提高准确性。有趣的是,作者写道,这个限制似乎与邓巴的数字兼容,这描述了人类通常只能维持约150个社会关系。或者,正如邓巴(Dunbar)所解释的那样,这是“如果您碰巧在酒吧里碰到他们的人,您不会感到尴尬的人数。”在线隐私中,您的朋友可以控制您的数据

在许多人已经担心缺乏控制权的时代,他们对自己的个人数据产生了影响,该研究意味着,即使组织可以通过使用您的朋友的数据来建立您的准确概况,即使对我们自己的数据的完全控制也可能无关紧要独自的。换句话说,即使从理论上离开Facebook或Twitter也不会阻止有人收集有关您的政治倾向,消费者习惯,宗教信仰等的可靠信息。

这项新研究的合着者刘易斯·米切尔(Lewis Mitchell)今天对佛蒙特大学的UVM今天说:“没有地方可以隐藏在社交网络中。”

另一个含义是:当您使数据访问时,您也有可能揭露与您联系的人的数据,就像Bagrow告诉《科学》杂志:

巴格罗说:“当他们放弃自己的数据时,他们也放弃了朋友的数据。” “我们认为社交网络中的个人选择不是真正的选择。”

当然,某些人的在线活动比其他人更难预测,而在机器学习技术预测行为的能力方面,Twitter可能被证明是一个独特的平台。尽管如此,只要有可能做出这样的预测,就不难看出像Twitter这样的平台如何在不知不觉中或疏忽大意,通过使用这种信息来扩展其产品,造成损害,正如作者所写:“语言模型得出的语言模型这样可以产生重要的后果:例如,将语言模型的预测与推荐新的社会关系的算法相结合,有可能创建或加剧过滤器气泡。”

原创文章,作者:互联世界,如若转载,请注明出处:http://www.dsonekey.com/6099.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息