加州理工学院的研究人员已经证明,机器学习算法可以监控在线社交媒体对话。随着他们的发展,这可能有一天会导致一种有效和自动化的方式来寻找在线漫游。
该项目汇集了人工智能(A I)研究员Anima Anandkumar、计算和数学科学教授Bren和政治学教授MichaelAlvare z。他们的工作于12月14日在2019年加拿大温哥华举行的神经信息处理系统会议上展示了人工智能社会良好研讨会。他们的研究团队包括博士后学者刘安琪、加州理工学院大三学生玛雅斯里坎特和尼古拉斯亚当斯-科恩(MS' 16,博士)。斯坦福大学博士。
阿尔瓦雷斯说:“这是我喜欢加州理工学院的地方之一:它可以跨越界限,发展社会科学和(在这种情况下)计算机科学之间的协同作用。
防止在线骚扰需要快速检测攻击性、骚扰性和负面的社交媒体帖子,这反过来又需要监控在线互动。目前获取这类社交媒体数据的方法要么完全自动化,无法解释,要么依赖一组静态关键词,很快就会过时。斯里坎特说,这两种方法都不是很有效。
她说:“人类试图用手完成这项工作是不可延伸的,这些人类可能会有偏见。另一方面,关键词搜索也受到网络会话发展速度的影响。新术语出现,旧术语改变含义,所以真诚使用的关键词可能意味着第二天的讽刺。
相反,该团队使用GLoby(全局向量的单词表示)模型来发现新的和相关的关键词。GloVe是一种单词嵌入模型,意思是在向量空间中表示单词,两个单词之间的“距离”是它们的语言或语义相似性的度量。这个模型可以从一个关键词开始,找到与该词密切相关的其他关键词,从而揭示实际使用的相关术语的聚类。例如,在推特上搜索“MeToo”在对话中的使用会产生一系列相关的标签,如“支持幸存者”、“ImWithHer her”和“NotSilent”。该方法为研究人员提供了一个动态的、不断发展的关键词集进行搜索。
但仅仅知道某次谈话是否与感兴趣的话题有关是不够的。语境很重要。为此,GloVe会显示一些关键词的相关程度,并为其使用提供输入。例如,在专门讨论厌女症的在线Reddit论坛中,“女性”一词更有可能与推特上关于#MeToo运动的帖子中的“陪伴”、“欲望”和“受害者”等词联系在一起。"
这个项目是一个概念的证明,旨在有一天给社交媒体平台一个更强大的工具来发现在线骚扰。Anandkumar参加了将神经信息处理系统会议的缩写名称从最初的首字母缩写“NIPS”改为“NeuriIPS”的活动,这让她对这个话题更感兴趣。