首頁 » 将模糊的搜索查询转换为易于

将模糊的搜索查询转换为易于

解释的搜索查询

有趣的是,该专利还涉及重写搜索查询。它以“基于规则的搜索查询查询转换细化用于搜索系统组件中的查询处理”开头。有时,这是通过从搜索词中删除某些停查询转换用词来实现的,例如“the”、“a”等。

重写查询之后

一旦查询被重写,它就可以“提交给搜索系统并返回响应重写查询的搜索结果”。该专利还告诉我们有关“人们还搜索 X”的查询(我看到的第一个提到的专利)。我们被告知这些类似的查询用于推荐与提交的查询相关的其他查询(例如“人们也在寻找 X”)。

这些“与给定查询相似的查询通常由导航 电报数据 聚类确定。”举例来说,提到搜索查询“有趣的猫图片”,通过它可以确定类似的搜索查询“带有标题的有趣的猫图片”,因为这个类似的搜索查询经常由搜索者在提交搜索查询“有趣的猫图片”之后进行。

确定查询是否为唯一搜索查询

该专利描述了一种可用于确定搜索查询是否唯一的方法。如果不是这种情况,则使用训练有素的规范化模型来创建此搜索查询的唯一变体。

首先,我们给出“独特”的定义。检查短语和/或 什么是否定关键字运算符? 其他附加语言元素,以查看搜索查询是否符合特定语言的语法规则。”

这需要三个步骤:

  • 语法正确查询转换
  • 没有拼写查询转换错误
  • 提出一个明确的问题

该专利的第一份白皮书告诉我们有关搜索查询的以下信息:

查询结构缺乏规律性,这导致很难训练 泰国数据 能够最佳地处理查询的模型,以提取有助于理解查询背后的用户意图的信息。

这是这篇文章最重要的要点:

独特的搜索查询的结构使得搜索引擎可以理解用户查询背后的意图。

该专利给出了一个例子:

“去咖啡馆的路线是什么”是搜索词“咖啡馆路线”的独特版本的一个例子

分类模型的工作原理

该专利还描述了专利中方法背后的目的是使用训练有素的分类模型和/或搜索查询的独特变体来确定搜索查询是否唯一,以及是否可以使用训练有素的规查询转换范化模型生成此格式良好的版本。

它可以通过使用搜索查询的查询转换特征作为分类模型的输入并判断搜索查询是否唯一来创建该模型。

这些搜索查询特征可能包括:

  • (英文)
  • 字)
  • 词性
  • 搜索查询中包含的实体
  • 和/或搜索查询的其他语言表示(例如word-n-gram,词袋等)

专利中描述了分类模型的类型:

分类模型是一种机器学习模型,例如包含一个或多个层(例如一个或多个前馈层、softmax层和/或附加神经网络层)的神经网络模型。例如,分类模型可以包括用于生成前馈输出的几个前馈层。所得到的前馈输出可以应用于 softmax 层以生成指示搜索查询是否格式良好的度量(例如概率)。

 

返回頂端