首页 > 最新文章 > Google如何识别文章作者

Google如何识别文章作者

阅读文章获取资讯时,“谁撰写了这篇文章”对于营销和确保信息的可靠性都非常重要。

过去,Google使用作者身份标记来尝试识别它。但是,作者身份标记已经过时了。那么Google如何识别内容的作者?这里想对Google所申请专利的内容的介绍,尚不清楚是否实现,但这会是一个非常有趣的开始。

Google是否关心谁在网络上创建了特定内容?您是否使用这些信息对搜索结果进行排名?我们没有办法知道。但是,Google已为内容的作者申请了专利,该专利描述了如何指示内容创建者在某处发布了某些内容。

Google对文章“作者”感兴趣

SEO中,文章的作者代表着某种意涵,可信赖度、专业度、权威性等。通过充分阅读作者的作品,我们可以逐渐识别出作者是怎样的一个人。

关键词排名与页面的作者有着密切的关系。当Google+社交网络出现时,Google引入了作者标记,可让您将内容绑定到Google+个人资料。通过查看Google提交的专利,我们确认了Google确实对作者感兴趣。

基于与页面相关联的作者和有助于排名的声誉得分。文章中的关键词排名可能影响了作者身份标记的实施。使用Google+个人资料实施作者身份标记。这可能会影响由与您联系的人在Google+上创建的内容的排名。Google已申请了与作者身份标记有关的多项专利。

什么是作者身份标记的替代方法?

Google宣布将停止使用作者身份标记后的几年,Google的发言人宣布了这一消息。他们指出可以删除作者身份标记。

什么是作者身份标记的合法继承人?

Google的质量评估指南涉及内容创建者的声誉。Google会发布质量评估指南,该指南会经常更新。Google为人工评估人员提供了有关他们评估的内容的信息,我们可以通过质量评估指南来实现这一想法。质量评估指南中有关于作者评估的部分。它使我想起了上面的“代理排名”专利中提到的声誉得分。

Google上的作者声望

Google提交的专利中,Google都提到了作者信息。这里介绍一些涉及其历史信息的文章。Google的作者信息是SEO行业中经常讨论的话题,并且有很多观点。

  • 为什么作者声誉对于搜索来说比以往任何时候都重要
  • SEO的三个支柱:权威,相关性和信任
  • Google:我们根据作者声誉对网站进行排名未附加

Google关于作者载体的新专利可了解谁撰写了什么

2019年3月,Google使用神经网络方法获得了有关文本分类的专利。这使人联想起“ Google使用网站表示向量对专业知识和权威进行分类 ”中提到的专利。表达载体专利使用神经网络根据站点上的功能将其划分为多个行业和专业水平。Author Vector专利描述了如何对网站进行分类。

文本分类系统可以对电子文本(例如,电子文档)的一部分进行分类。例如,文本分类系统可以将文本的一部分分类为与预定主题集或特定主题有关。一些文本分类系统将文本的一部分的特征作为输入,并使用该特征来生成文本的一部分的分类。

该专利还提到了神经网络的操作。神经网络是使用一层或多层模型来产生输出的机器学习模型。例如,输入内容的分类。除了输出层之外,还有包含一个或多个隐藏层的神经网络。这些隐藏层的输出用作网络中下一层的输入。例如,下一个隐藏层或网络输出层。网络的每一层都从与每个参数的当前值匹配的输入产生输出。

该专利流程如何运作?

我们首先获得一组单词序列。这组单词序列构成多个第一单词序列。对于这些第一单词序列,第二单词序列跟随第一单词序列。第一和第二单词序列被分类为由特定作者书写。在这些词集上训练神经网络系统以确定特定作者,并使用作者向量来表征特定作者。

该专利的内容描述了遵循该过程的优点。从该作者撰写的文本生成有效表征特定作者的作者矢量,即使没有标注谁撰写该文本的标签也是如此。生成后,作者矢量可以根据其使用的上下文来表征其作者的不同属性。对作者向量进行聚类可以有效地创建具有相似交流风格和个性的作者聚类。生成后,作者矢量及其群集将有效地用于多种目的。

专利信息如下:

生成作者载体
发明人:Brian Patrick Strope和Quoc V. Le
受让人:Google LLC
美国专利:10,599,770
授予:2020年3月24日
申请日期(提交日期):2018年5月29日

总结:

用于生成作者矢量的技术、系统和设备,包括存储在计算机存储介质上的计算机程序。该方法包括获得一组单词序列的方法,该单词序列的集合由多个第一单词序列和在每个第一单词序列之后的第二单词序列组成,其中每个第一单词和第二单词序列都由第一作者书写。然后在第一和第二单词序列上训练神经网络系统,以确定第一作者的作者向量,其中作者向量表征第一作者。

在某种程度上,该专利的要点也在这里。

Google使用神经网络来帮助他们学习,理解和区分作者风格。

该专利包含:从特定作者的作者向量系统生成的作者向量是标识该作者的数值向量。特别地,取决于作者向量的使用上下文,作者向量可以是作者的一种或多种通信方式,作者的个性,作者选择特定表达的可能性等。确定作者的特征。

该专利可能会看到由特定作者撰写的以下内容:

  • 句子
  • 段落
  • 多段汇总
  • 搜索查询
  • 多种自然语言的集合
  • 作者向量的观点建议

Google收集有关创建内容的作者的数据。声望分数的产生等:根据类似于作者身份的方法对内容进行排名,该方法由可能与Google+等社交网络上的其他人联系在一起的人组成。此外,Google可能正在探索使用神经网络来开发以下方法:

  • 更好地理解查询中单词的上下文
  • 更好地分类您的网站
  • 易于理解谁是内容的作者

并不是所有的作家都是威廉·莎士比亚,但我们真的不知道威廉·莎士比亚是谁。每个作者都有不同的写作风格,不同的专业水平以及对该主题的不同兴趣。Google 告诉我们,该专利可以潜在地识别未加标签的作者。

这种新方法是否可以代替作者标记?

至少一位Google员工告诉我们:不需要作者身份标记,而且Google足够聪明,可以知道哪个作者写了什么内容。

Author Vector专利于2018年向美国专利商标局提交。我们无法知道它何时被开发。没有证据证明谷歌使用作者向量。但我们确实知道“ Google可能会更好地识别谁是内容的作者。”

你可能感兴趣的文章