Page 1 of 1

更加细致入微的饼图

Posted: Mon Mar 17, 2025 8:30 am
by nusaiba131
很难衡量真正令人费解的问题,但据传闻,自 2021 年 8 月以来,谷歌的重写引擎在真正奇怪的极端情况方面确实有所改进。不过,这里有一个有趣的例子,来自 Google.com 本身:


甚至 Google 也认为 Google 在这个 <title> 标签中说了太多次“Google”。我怀疑重写引擎将“Google”一词标记为冗余,但我绝对认为这是一次失误。


我给自己定了个任务,要制作一张“有细微差别的饼图”,现在我意识到这是不可能的。所以,这里有一张误导性稍弱的饼图。许多重写很难分类和计数,但如果我们剔除截断场景(全部三种)和添加内容,让我们来看看数据:


除截断和添加外,我们的数据集中还有大约 30% 的 <title> 标签被重写。请记住,这些重写中的许多都是次要的,有些可能涉及难以通过编程检测到的截断和/或添加形式。

反过来看,有 70% 的标题没有被重写。我们如何将其与 Google 的 87% 相协调?这可能只是数据集的一个功能,但让我们仔细重读一下文章开头的那句话:

根据您的反馈,我们对系统进行了更改,这意味着标题元素的使用时 ig数据库 间现在约为 87%,而不是之前的 80% 左右。

请注意突出显示的文本 — Google 明确表示,他们 87% 的时间都使用了 <title> 元素/标签。他们可能从原始数据中减去、添加或略微修改了数据(他们并没有真正说明)。因此,此处的 13% 的情况可能仅当 Google 从页面的其他区域(正文、标题等)提取搜索中的显示标题时才会发生。

至于更大的问题,即在最初的强烈抗议之后,谷歌在多大程度上减少了重写,很难准确衡量,但我会说“没有太多”。确实看起来一些极端情况(包括括号和方括号的错误处理)确实有所改善,我认为谷歌总体上降低了重写量,但标题的更改仍然相当普遍,这些更改的原因与 2021 年 8 月类似。