台湾新闻

分類: 电报号码

  • 根据与查询无关的特征评估答案段落

    可以根据查询征评估答所确定的搜索中的 N 个最佳排名资源来生成候选答案段落。 N 可以与SERP首页返回的搜索结果数相同(例如 10)

    评估过程可能使用文本段落的位置评估。分数可以是候选答案的一段内容在结果中所处的位置。位置越高,分数越高。

    评估过程可以使用自然语言处理的

    分数。 NLP分数是根据考生的答案段落生成的。

    这可以基于句子和语法结构。这可能意味着 电报筛查 包含部分句子的候选答案段落可能比包含完整句子的候选答案段落获得更低的分数。该专利还告诉我们,如果考生的答案段落中包含结构化内容,则结构化内容不受自然语言处理的评估。例如,表中的某一行根据 NLP 可能具有非常低的分数,但却可能包含非常有用的信息。 (有关更多信息,请参阅自然语言处理中的知识图谱和搜索引擎的数据挖掘文章自然语言处理的词汇表文章)。

    可以使用的另一种评分过程是考征评估答虑考生答案段落中的文本是否与总体答案文本相似。

    与查询无关的评分过程使用以前的答案段落访问 NLP 模型,其中历史答案段落是针对所有搜索查询提供的答案段落。所提供的答案段落通常具有相似的 n-gram 结构,因为答案段落往往包含解释性和陈述性语句。

    独立于查询的评估可征评估答以使 分解销售流程的基本要素 用三元组模型将考生答案征评估答段落的三元组与历史答案段落的三元组进行比较。质量较高的候选答案段落通常与质量较低的候选答案段落相比,具有更多与历史答案段落的三元匹配。 (有关三元组和 n 元组的更多信息,请参阅维基百科)

    下一步是对部分边界的评估。如果候选答案段落包含跨越格式界限的文本(例如段落和分节符),则可能会受到惩罚。

    评估过程确定问题分数。与查询无关的评估过程在答案候选段落中搜索疑问词。包含问题或疑问词的潜在答案段落,例如“月球距离地球有多远?”对于寻求答案的搜索者来说,“通常”不如仅包含陈述句的候选答案段落那么有帮助,例如“月球距离地球约 238,900 英里”。

    评估过程还确定了话语边界 临时邮箱 概念位置的得分。话语边界词是引入与刚刚提出的陈述或想法相矛盾或修改该陈述或想法的术语。例如“相反地”、“然而”、“另一方面” 等等。

    考生的答案段落以这样的术语开头将获得相对较低的分数,从而降低答案分数。

    包含此类术语但不以其开头的答案段落比以征评估答该术语开头的答案段落获得更高的分数。

    不包含此类术语的答案段落将获得高分。

  • 用于评估精选摘要候选片段

    基于搜索查询的评估,查询相关评级基于文本段落的术语属性。

    搜索中依赖于答案的问题并未描述搜索者正在寻找的内容,因为搜索者在搜索时并不知道答案。

    基于查询的评分过程首先搜选摘要

    候选索一组可能的答案词,然后将该集合与可能的特色片段候选的答案段落进行比较,以生成答案词的命中分数。可能的术语集可能取自搜索查询返回的前 N ​​个排名结果。

    该过程根据查询结果中排名靠 电报数据 前的子集所包含的术语创建一个术语列表。专利告诉我们,每个结果都经过解析,并且每个术语都包含在一个术语向量中(请参阅向量空间分析的词汇表条目)。可以从词向量中省略停用词。

    对于列表中的每个术语,可以为该术语生成一个术语权重。每个词的权重可以基于该词出现的最高排名结果子集中的众多结果,乘以该词的逆文档频率 (IDF) 值。IDF 值可以从大量文档中得出,并提供给查询依赖评估器。或者可以从返回结果中的前 N ​​个文档中得出 IDF 值。 (有关 TF-IDF 分析的更多信息,请参阅同事 Kai Spriestersbach)。该专利告诉我们,也可以使用其他合适的术语加权技术。

    每个候选答案段落术语的选摘要候 您的目标群体是谁? 如果您想要瞄准新客户 选评分过程决定了该术语在潜在精选片段候选的文本段落中出现的频率。因此,如果术语“apogee”在考生的文章中出现两次,则该考生答案段落中“apogee”的术语值为 2;然而,如果同一个术语在另一位考生的答案段落中出现了三次,那么另一位考生答案段落中“apogee”的术语值为 3。选摘要候选

    对于候选答案段落中的每个术语,评分过程将其术语权重乘以该术语在答案段落中出现的次数。假设“apogee”的词权重为 0.04。对于考生的第一段答案,以“远地点”为基础的值为0.08(0.08×2);对于考生的第二段答案选摘要候选,基于“远地点”的值为0.12(0.04乘以3)。

    也可使用其他特征来确定评估分数。例如,依赖于查询的评估过程可以确定对搜索查询的响应的实体类型。可以通过识别以下术语来确定实体类选摘要候选型: B. 人物、地点或事物,并选择评级最高的术语。实体也可以从搜索查询中确定(例如,对于搜索查询“谁是跑得最快的人”,答案的实体类型为“人”)。对于每个候选答案,评估过程随后会识别在可能的候选答案中描述的实体。如果实体不包含与所识别实体类选摘要候选型匹配的内容,则候选答案段落的评估分数会降低。(有关实体类型主题的更多信息,请参阅文章《您应该了解的有关实体类型、类别和属性的一切》)。

    假设针对问题[谁是 临时邮箱 跑得最快的人],提供了以下候选答案段落供评估:奥运会短跑运动员经常在奥运会期间创下短跑项目的世界纪录。最受欢迎的短跑项目是100米短跑。

    依赖查询的积分管理器将识别几个实体——奥运会、短跑运动员等——但它们都不是“人类”类型的。 “短跑运动员”一词不分性别。因此,响应词分数会降低。分数可以是二进制分数,例如 1 表示存在实体类型的概念,0 表示不存在正确类型的概念;或者,它可以是正确术语出现在答案候选段落中的概率的度量。

  • 项专利的更新告诉我们谷歌如何

    本周发布的一评估片段的结果。

    当搜索引擎根据搜索查询对搜索结告诉我们果进行排名时,它可能会结合使用与查询相关的排名信号和与查询无关的排名信号来确定这些排名。

    查询相关信号可能取决于搜

    索查询中的术语以及搜索告 电报数据 诉我们结果与该搜索术语的相关程度告诉我们。与查询无关的信号将取决于查询中的术语以外的其他内容,例如B. 指向结果的链接的质量和数量。

    可以根据查询相关信号和查询独立信号的组合对搜索查询中问题的答案进行排名,这可以确定特定片段答案分数的评级。关于文本答案片段的更新专利揭示了如何将它们组合起来以生成精选片段答案分数,以便从搜索查询中出现的问题的答案中进行选择。

    一年半前,我在文章《谷歌是否使用架构来编写精选摘要的答案段落?》中撰写了有关精选摘要答案的内容。该专利为“专利申请人答案段落告诉我们”,最初于 2015 年 8 月 12 日提交,并于 2019 年 1 月 15 日确认为延续专利。

    该专利是原始答案段落专利

    的延续,谷歌会搜索位于具有相关事 培训销售团队进行虚拟销售电话 实的结构化数据附近的问题的文本答案。这可能类似于数据表,或者甚至可能是架构标记。这意味着谷歌可以为一个问题提供基于文本告诉我们的答案,并包含与该答案相关的许多事实。

    该专利第一版的另一个延续版本已于近期公布。它提供了更多信息和对特色摘录的响应进行排名的不同方法,值得比较这两个版本专利中的标准。

    该专利的新版本可以告诉我们在这里找到:

    对候选答案段落进行评分
    发明人:
    受让人:Google LLC
    美国专利:10,783,156
    授权日期:2020 年 9 月 22 日
    提交日期:2018 年 2 月 22 日

    概括:

    候选答案段落的更新标准

    该专利有一些变化,要求根据问题潜 临时邮箱 在答案的查询相关和查询独立分数对潜在答案进行更详细的分析。专利描述包含有关查询相关和查询独立分数的详细信息。第一项专利中的标准涵盖了答案的查询相关分数,但不包括最新版本的查询独立分数。

    它包含有关标准中查询相关和查询独立结果的更多细节,但新版本似乎更加重视查询相关和查询独立结果。

    从 2015 年版的“答案段落评分”专利中可以明显看出这一点: