已有之事,后必再有;已行之事,后必再行。
——《传道书》
你能提出的大部分问题别人都已经提过了,并大都有了答案。所以一直在抓取网上信息的 Google 能够给出你查询的结果,只要你的定义够清晰明确。但是总有一些含义模糊或没人问过的问题存在,以往 Google 只能遗憾地宣布未能找到符合查询的结果。不过最近情况有了变化,据彭博社报道,过去几个月Google 悄然上线了名为 RankBrain 的 AI,对相当一部分比例的查询进行结果过滤和回答一些 Google 没见过的问题。结果表明其搜索的相关性改进效果不错,在结果页面选择的测试中还击败了公司的专家。
据统计,每天向 Google 提交的查询中有约 15%是其未曾见过的。公司的资深研究科学家 Greg Corrado 透露,为了更好回答这些问题,Google 利用了 RankBrain 来将海量的书面语嵌入到计算机可以理解的向量里面。
如果 RankBrain 看到自己不熟悉的单词或短语,它会去猜测其类似的意思并对结果进行相应过滤,从而有效地处理一些从未见过的搜索查询。比方说 RankBrain 能够有效回答 “What’ s the title of the consumer at the highest level of a food chain?(食物链当中最高级的消费者的头衔叫做什么?)” 这样的问题。
对于 Google 的搜索处理机制来说,RankBrain 只是为其搜索算法提供输入的数百个信号之一,但这种信号跟别的信号的不同之处在于它懂得学习,而别的只是别人在信息获取中的发现和洞察。正是因为 RankBrain 具备了学习能力,几个月后它就已经成为对搜索第三大重要的信号,其效果之好甚至出乎 Google 人员的预料。Google 内部曾让做算法的工程师人工去猜测搜索算法会选择哪个页面作为排名第一的结果,其准确率为 70%,然后 RankBrain 去做了同样的事情,准确率达到了 80%,超过了那帮做算法的工程师的平均水平。
RankBrain 原先由 Google 的 5 人团队用了一年的时间进行研发,在今年初获得了搜索负责人 Amit Singhal 的放行后又投入了几十个人进行优化。为了确保结果排名的相关性,团队一直在进行细致的监控,并通过不断地向这个 AI 提供大量新数据来帮助它学习新概念,AI 仍在进化中。
本文参考了多个信息来源:bloomberg.com
咨询热线
02131122998