Home » 根据与查询无关的特征评估答案段落

根据与查询无关的特征评估答案段落

可以根据查询征评估答所确定的搜索中的 N 个最佳排名资源来生成候选答案段落。 N 可以与SERP首页返回的搜索结果数相同(例如 10)

评估过程可能使用文本段落的位置评估。分数可以是候选答案的一段内容在结果中所处的位置。位置越高,分数越高。

评估过程可以使用自然语言处理的

分数。 NLP分数是根据考生的答案段落生成的。

这可以基于句子和语法结构。这可能意味着 电报筛查 包含部分句子的候选答案段落可能比包含完整句子的候选答案段落获得更低的分数。该专利还告诉我们,如果考生的答案段落中包含结构化内容,则结构化内容不受自然语言处理的评估。例如,表中的某一行根据 NLP 可能具有非常低的分数,但却可能包含非常有用的信息。 (有关更多信息,请参阅自然语言处理中的知识图谱和搜索引擎的数据挖掘文章自然语言处理的词汇表文章)。

可以使用的另一种评分过程是考征评估答虑考生答案段落中的文本是否与总体答案文本相似。

与查询无关的评分过程使用以前的答案段落访问 NLP 模型,其中历史答案段落是针对所有搜索查询提供的答案段落。所提供的答案段落通常具有相似的 n-gram 结构,因为答案段落往往包含解释性和陈述性语句。

独立于查询的评估可征评估答以使 分解销售流程的基本要素 用三元组模型将考生答案征评估答段落的三元组与历史答案段落的三元组进行比较。质量较高的候选答案段落通常与质量较低的候选答案段落相比,具有更多与历史答案段落的三元匹配。 (有关三元组和 n 元组的更多信息,请参阅维基百科)

下一步是对部分边界的评估。如果候选答案段落包含跨越格式界限的文本(例如段落和分节符),则可能会受到惩罚。

评估过程确定问题分数。与查询无关的评估过程在答案候选段落中搜索疑问词。包含问题或疑问词的潜在答案段落,例如“月球距离地球有多远?”对于寻求答案的搜索者来说,“通常”不如仅包含陈述句的候选答案段落那么有帮助,例如“月球距离地球约 238,900 英里”。

评估过程还确定了话语边界 临时邮箱 概念位置的得分。话语边界词是引入与刚刚提出的陈述或想法相矛盾或修改该陈述或想法的术语。例如“相反地”、“然而”、“另一方面” 等等。

考生的答案段落以这样的术语开头将获得相对较低的分数,从而降低答案分数。

包含此类术语但不以其开头的答案段落比以征评估答该术语开头的答案段落获得更高的分数。

不包含此类术语的答案段落将获得高分。

返回頂端