首页 > 最新文章 > 点击率数据的偏差与纠正

点击率数据的偏差与纠正

点击率(CTR)是一个重要指标,可用于对网站的搜索引擎优化表现进行评估,从估算收入机会,选择更合理的关键字优化。

大多数SEO都知道为其网站创建自定义CTR曲线的价值。Google Search Console(GSC)数据中自定义CTR曲线的唯一问题是,提供的数据不准确。通过仔细清理数据并仔细实施分析方法,您可以使用4个基本步骤更准确地计算网站的点击率:

  1. 从GSC中提取您的网站关键字数据 – 您可以获得的数据越多越好。
  2. 删除有偏见的关键字 – 品牌搜索字词会丢弃您的点击率曲线,因此应删除它们。
  3. 为您的数据集找到最佳展示级别 – Google会以低展示级别对数据进行抽样,因此删除Google可能在这些较低级别上报告不准确的关键字非常重要。
  4. 选择您有排名位置的关键词 – 没有数据集是完美。

在深入研究计算CTR曲线的细节之前,简要介绍计算点击率的最简单方法。

要计算点击率,请使用点击,展示和排名数据下载您网站排名的关键字。然后将点击总和除以每个等级级别的展示次数总和,使用自定义点击率曲线得出GSC数据。有关实际处理CTR曲线数字的更多详细信息,如果您不熟悉该过程,可以通过SEER查看本文。

这种计算变得棘手的是当你开始尝试控制CTR数据本身​​带来的偏差。然而,即使我们知道它提供的数据不好,我们也没有其他许多选项,所以我们唯一的选择就是尽量消除数据集中尽可能多的偏差,并了解使用过程中出现的一些问题。

如果不控制和操纵来自GSC的数据,您可以获得看似不合逻辑的结果。例如,您可能会发现曲线显示位置2和3 CTR的平均值比位置1大得多。如果您不知道您在Search Console中使用的数据存在缺陷,您可能会接受该数据作为事实和a)尝试提出假设为什么CTR曲线基于不正确的数据看起来那样,以及b)根据这些CTR曲线创建不准确的估计和预测。

第1步:提取数据

任何分析的第一部分实际上是拉动数据。这些数据最终来自GSC,但是有许多平台可以从中提取这些数据,这比GSC的网络提取要好。

Google Search Console — 获取数据的最简单平台来自GSC本身。您可以进入GSC并提取过去三个月的所有关键字数据。谷歌将自动下载一个csv。档案给你。这种方法的缺点是GSC一次只导出1,000个关键字,这使得您的数据量太小而无法进行分析。您可以尝试通过使用关键字过滤器来排除这个问题,并为下载多个1k文件以获取更多数据,但这个过程非常艰巨。除了下面列出的其他方法更好,更容易。

Google Data Studio — 对于任何寻求从Search Console免费获取更多数据的非程序员来说,这绝对是您的最佳选择。Google Data Studio直接连接到您的GSC帐户数据,但您可以提取的数据大小没有限制。在尝试从GSC获取数据的同样三个月期间,我将得到1k关键字(GSC中的最大值),Data Studio会给我200k关键字!

Google Search Console API — 这需要一些编程知识,但获取所需数据的最佳方法之一是使用其API直接连接到源。您可以更好地控制正在拉动的数据并获得相当大的数据集。这里的主要挫折是您需要具备编程知识或资源才能这样做。

Keylime SEO工具箱 — 如果您不知道如何编程但仍希望访问Google的展示和点击数据,那么这是一个很好的选择。Keylime直接从Search Console API存储历史搜索控制台数据,因此与直接连接到API的选项一样好(如果不是更好)。它确实花费了49美元/月,但考虑到您获得的数据的价值,这是非常实惠的。

您从中获取数据的平台的重要性在于列出的每个平台都会提供不同数量的数据。我在这里按照哪个工具从最少到最多提供最多数据的顺序列出它们。使用GSC的UI直接提供最少的数据,而Keylime可以连接到GSC和Google Analytics以组合数据,实际上为您提供比Search Console API更多的信息。这很好,因为无论何时您可以获得更多数据,您为网站制作的点击率平均值的可能性就越高。

第2步:删除关键字偏差

提取数据后,您必须清理它。由于这些数据最终来自Search Console,因此我们必须确保尽可能地清理数据。

删除品牌搜索和知识图关键字

为非品牌搜索创建常规CTR曲线时,从数据中删除所有品牌关键字非常重要。这些关键字应具有较高的点击率,这会剔除非品牌搜索的平均值,这就是为什么要将其删除的原因。此外,如果你知道任何SERP功能,如知识图表,你一直排名,你应该尝试删除这些,因为我们只计算位置1-10的点击率和SERP功能关键字可能会甩掉你的平均值。

第3步:在GSC中为您的数据找到最佳展示级别

搜索控制台数据的最大偏差似乎来自搜索展示次数较少的数据,这是我们需要尝试删除的数据。谷歌没有准确报告低印象数据并不奇怪,因为我们知道谷歌甚至不包括在GSC中搜索量非常低的数据。出于某种原因,谷歌决定大幅报告这些低印象条款的点击率。例如,这是我使用来自GSC的数据制作的展示次数分布图,其中只有1次展示的关键字和每个位置的点击率。

如果这对你来说没有多大意义,我就和你在一起。此图表显示只有一次展示的大部分关键字都有100%的点击率。无论您的网站的点击率有多好,一个展示关键字将获得100%点击率的大部分,这是极不可能的。对于排名低于#1的关键字尤其如此。这为我们提供了非常可靠的证据,即不能信任低印象数据,我们应该以较低的展示次数限制数据中的关键字数量。

a):使用正常曲线来帮助计算CTR

有关Google向我们提供有偏见数据的更多证据,我们可以查看数据集中所有关键字的点击率分布。由于我们正在计算点击率平均值,因此数据应遵循正常钟形曲线。在大多数情况下,来自GSC的CTR曲线高度偏向左侧,长尾巴再次表明Google在低印象量时报告了非常高的点击率。

如果我们更改了我们正在分析的关键字集的最小展示次数,我们最终会越来越接近图表的中心。下面是一个示例,下面是网站点击率的分布,点击率增量为.001。

上图显示了展示次数非常低的展示次数,大约25次展示。数据的分布主要位于该图的右侧,左侧的小的高浓度意味着该站点具有非常高的点击率。但是,通过将展示过滤器增加到每个关键字5,000次展示,关键字的分布变得更加接近中心。

此图最有可能永远不会以50%的点击率为中心,因为具有非常高的平均点击率,因此图表应向左倾斜。主要问题是我们不知道多少因为Google向我们提供了采样数据。我们能做的最好的就是猜测。但是这提出了一个问题,即过滤掉我的关键字以摆脱错误数据的正确印象级别是什么?

找到创建CTR曲线的正确展示级别的一种方法是使用上述方法来了解您的点击率分布何时接近正态分布。常规分布式CTR数据集具有较少的异常值,并且不太可能从Google获得大量错误报告的数据。

b):找到最佳展示次数来计算您网站的点击率

您还可以创建展示层,以查看您正在分析的数据中的可变性较小而不是正常曲线。估算值的变化越小,您就越接近准确的CTR曲线。

分层点击率表

需要为每个站点创建分层点击率,因为GSC针对每个站点的抽样因您排名的关键字而异。我已经看到CTR曲线变化多达30%而没有为CTR估计添加适当的控制。此步骤非常重要,因为使用点击率计算中的所有数据点可能会大大抵消结果。使用太少的数据点会使您的样本量太小,无法准确了解您的点击率实际上是多少。关键是找到两者之间的快乐媒介。

在上面的分层表中,从所有展示次数到> 250次展示都存在巨大差异。在那之后,每层的变化相当小。此网站的展示次数超过750次是因为曲线之间的差异相当小,因为我们提高了其他各级的展示次数,而且> 750次展示仍然为我们数据集的每个排名级别提供了大量关键字。

在创建分层CTR曲线时,重要的是还要计算在整个层中使用多少数据来构建每个数据点。对于较小的站点,您可能会发现没有足够的数据来可靠地计算CTR曲线,但仅通过查看分层曲线就不会显而易见。因此,在确定哪种展示级别对您的网站最准确时,了解每个阶段的数据大小非常重要。

第4步:确定分析数据的位置方法

在确定要过滤数据的正确展示级别后,您可以使用展示次数,点击次数和位置数据开始实际计算点击率曲线。位置数据的问题在于它通常是不准确的,所以如果你有很好的关键字跟踪,那么使用你自己的跟踪数据的数据远比谷歌更好。大多数人无法跟踪那么多关键字位置,因此有必要使用Google的位置数据。这当然是可能的,但重要的是要小心我们如何使用他们的数据。

如何使用GSC位置

使用GSC平均位置计算CTR曲线时可能出现的一个问题是,是使用圆形位置还是精确位置(即只有GSC中的位置正好排名为1.因此,排名1.0或2.0是精确位置,而不是1.3或2.1,例如)。

确切位置与圆形位置

使用精确位置的原因是我们想要的数据最有可能在我们测量的时间段内排在第1位。使用准确位置可以让我们最清楚地知道点击率位于1的位置。在您从中提取关键字的时间段内,精确排名关键字更有可能在该位置排名。问题是平均排名是一个平均值,因此无法知道某个关键字在一个地方的整个时间段内是否排名稳定,或者平均值恰好恰好显示了一个确切的排名。

幸运的是,如果我们比较精确位置点击率与圆形位置点击率,它们在实际点击率估算方面与足够数据方向相似。问题是当您没有足够的数据时,确切的位置可能会不稳定。通过使用圆形位置,我们可以获得更多数据,因此当没有足够的数据可用于精确位置时,使用圆形位置是有意义的。

一个警告是针对第1位CTR估计值。对于其他每个位置,平均排名可以提升关键字平均排名位置,同时可以降低平均值。这意味着如果关键字的平均排名为3.它可能在某个时间点排名第一和第5,平均值为3.但是,对于#1排名,平均值只能降低,这意味着点击率为如果您使用舍入位置,则始终会报告关键字低于实际值。

等级位置混合:调整的确切位置

因此,如果您有足够的数据,则只能使用位置1的确切位置。对于较小的站点,您可以使用调整后的准确位置。由于Google给出了最多两位小数的平均值,因此获得更多”精确位置”#1的一种方法是包括排名低于位置1.1的所有关键字。我发现这需要几百个额外的关键字,这使我的数据更可靠。

而且这也不应该降低我们的平均值,因为GSC在报告平均排名方面有些不准确。在Wayfair,我们使用STAT作为我们的关键字排名跟踪工具,在比较GSC平均排名与STAT平均排名之间的差异后,#1位置附近的排名接近,但不是100%准确。一旦你开始进一步降低排名,STAT和GSC之间的差异就会变大,所以要注意你的排名下降到你的数据集中包含更多关键词。

我对Wayfair上跟踪的所有排名做了这个分析,我发现位置越低,两个工具之间的排名越不匹配。所以谷歌并没有提供很好的排名数据,但它已经接近排名第一的位置,我很乐意使用调整后的确切位置来增加我的数据集而不必担心在合理范围内牺牲数据质量。

结论

GSC是一个不完美的工具,但它为SEO提供了理解单个站点在SERP中的点击性能的最佳信息。因为我们知道GSC会给我们提供一些曲线球,它提供的数据对于控制尽可能多的数据非常重要。这样做的主要方法是选择理想的数据提取源,摆脱低印象关键字,并使用正确的排名舍入方法。如果您执行所有这些操作,则更有可能在您自己的网站上获得更准确,一致的点击率曲线。

你可能感兴趣的文章

如何做营销,大公司和小公司想法不一样。

了解行业案例,对话资深专家

captcha