谷歌称其改进了搜索引擎理解同义词的方式

导读 谷歌1月19日表示,它已经改进了其搜索引擎理解同义词的方式,这是该公司让其搜索服务看起来更像人类或人工智能的计算机行业的重要一步。用

谷歌1月19日表示,它已经改进了其搜索引擎理解同义词的方式,这是该公司让其搜索服务看起来更像人类或人工智能的计算机行业的重要一步。用于解析的同义词是Hakia、Yebol和微软的Powerset(现在为Bing提供动力)等搜索引擎初创公司在语义搜索的旗帜下所做的工作。这个想法是对搜索引擎进行微调,以区分含义相似的单词。

谷歌搜索质量工程师已经研究了五年多,这导致了该公司的“同义词系统”,甚至折磨“分析同义词的影响和质量。”1月19日,谷歌软件工程师史蒂芬贝克的博文《我们的系统分析PB级Web文档和历史搜索数据》,以此来理解“不同语境下的词义”。

贝克说,该公司发现“同义词影响了70%的用户在谷歌支持的100多种语言中的搜索”。

他说:“让计算机理解语言仍然是人工智能中最困难的问题之一。”“搜索引擎的目标是为您的搜索返回最佳结果,而理解语言对于返回最佳结果非常重要。关键部分是我们的同义词理解系统。”

贝克说,人工智能挑战的一个很好的例子是帮助谷歌的搜索引擎区分“图片”和“照片”这两个词,这两个词通常是一回事。

贝克说:“如果用户搜索“咖啡做的照片”,看看如何使用咖啡粉作为开发者来开发照片,谷歌必须明白,即使页面显示的是“照片”而不是“照片”,它仍然与搜索相关。请看这里的例子。

谷歌现在在其搜索结果摘要中以粗体字母显示搜索同义词,以帮助搜索用户理解为什么显示结果,即使结果不包含原始搜索单词。例如,对于“用咖啡打印的照片”搜索,第一个结果标题中的“照片”一词以粗体显示。

这是一个简单的例子。谷歌还指出,涉及术语的查询可能有更复杂的同义词,如“通用汽车”。在这里看到谷歌对术语的分析。正如贝克所说:

“大多数人都知道主要意思:通用汽车。对于【通用汽车】的搜索,可以看到谷歌在搜索结果中加粗了“通用汽车”一词。这说明对于这个搜索,我们认为“通用汽车”和“通用汽车”的意思是一样的。通用可以在【通用大学】代表乔治梅森,在【通用荧幕星球大战】代表游戏经理,在【通用学院】代表Gangadhar Meher,【nba通用】代表总经理,甚至是【海军将军】的炮手队友。”

谷歌处理同义词有多准确?贝克说:“每50个使用同义词显著改善搜索结果的查询中,[谷歌]只有一个真正糟糕的同义词。”

同时,偶然发现不良同义词的用户应该知道几件事。一是同义词背后的AI不够完善;其次,谷歌不会手动修复错误的同义词,因为它倾向于迭代改进搜索算法。

贝克邀请用户在网络搜索帮助中心论坛上发布问题,或者通过推特将问题发送给#googlesyns。用户还可以通过在特定术语前添加“”或将这些单词放在引号中来关闭它们的同义词。

谷歌搜索质量工程师之一马特卡茨(Matt Cutts)为贝克的帖子欢呼,并呼吁谷歌为其搜索质量工作提供更多透明度。他还放弃了挑战兵士的竞争者,如冰,并指出:

“事实是,谷歌比大多数人意识到的要复杂得多。我想说的是,谷歌在“语义”方面做得更多,比几乎任何其他搜索引擎都更了解文档和查询。”