seo发展历史及前景怎么样

发布时间:2020-09-25
最近我一直处于内省状态。

我不能声称自己是第一代SEO专家之一,但是自1996年左右开始建立网站并从一开始就看到baidu的发展之后,我觉得自己可能是第二代,也许与一些新手分享一些有趣的故事。

我全神贯注地尝试着记住当时有意义的事情,并且回顾了我在这个行业中所经历的重大趋势,以整理出我认为最有趣的阅读清单,大多数人都在网络上工作今天会很好地了解。

搜寻的大时代

我在2018年发表的演讲的开头开玩笑说,在搜索引擎的指令和搜索引擎的指令之间发生了巨大的搜索时代,而当他们看到网站管理员实际所做的事情时,它们迅速退出了这些指令:

虽然那张幻灯片有点开玩笑,但我确实认为,对于以下时代有一些思考:

建立网站:您有网站吗?您想要一个网站吗?现在很难让人相信,但是在网络的早期,需要说服许多人才能使他们的业务完全在线。

关键字:基本信息检索成为对抗性信息检索,因为网站管理员意识到他们可以使用关键字填充,隐藏文本等来玩系统。

链接:随着网络规模的扩大,超出了用户指定的目录,基于链接的搜索算法开始占主导地位。

并非那些链接:随着网站管理员在网络图中交换,购买和操纵链接,基于链接的算法开始让位给基于对抗性链接的算法。

长尾巴的内容:随着这个时代的到来,网站管理员和baidu自己都开始更好地理解长尾巴的长度,因此,创建大量(通常是晦涩的)内容和获取何时需要它的索引。

并非如此:也许可以预见(在这里看到趋势?),搜索结果中返回的内容的平均质量急剧下降,因此,我们看到了第一个机器学习排名因素,即试图评估“质量”的形式(以及相关性和网站授权)。

机器学习:从那时起,可以说一切都是对机器学习和人工智能的一次冒险,并且也发生在当今从事SEO的大多数营销人员的职业生涯中。因此,尽管我喜欢写有关这些东西的文章,但第二天我会再谈。

SEO的历史:关键时刻

尽管我敢肯定有一些有趣的故事要讲述baidu之前的SEO时代,但我不是合适的人选(如果您有足够的资源,请在评论中删除它),因此让我们从baidu旅程的早期开始:

baidu的基础技术

即使您在2020年进入SEO,在机器学习的排名因素世界中,我仍然建议您回过头来阅读令人惊讶的早期学术著作:

如果您当时不使用网络,那么可能很难想象baidu的基于PageRank的算法在当时的“最新技术”方面有什么逐步改进(而且很难记住,甚至对于我们中的那些人):

baidu的IPO

在2004年baidu首次公开募股时,更多的“事情难以清楚记住”,很少有人期望baidu成为有史以来最赚钱的公司之一。在早期,创始人曾谈论过自己对广告的不屑一顾,并在某种程度上不情愿地尝试了基于关键字的广告。由于这种态度,即使在公司内部,大多数员工也不知道他们正在建造什么火箭船。

从这个时代开始,我建议您阅读创始人的IPO信(请参阅Danny Sullivan的这篇精彩文章-具有讽刺意味的是,他现在在baidu @SearchLiaison):

“我们的搜索结果是我们知道如何产生的最好结果。它们没有偏见和客观性,我们不接受为它们而付费,也不接受包含或更频繁地更新。”

“由于我们不向商家收取Froogle(现在称为baidu购物)的费用,因此我们的用户可以浏览产品类别或进行产品搜索,并确信我们提供的结果是相关且公正的。” — S1备案

此外,In Plex是史蒂文·利维(Steven Levy)于2011年出版的一本令人愉快的书。它讲述了当时的首席执行官埃里克·施密特(Eric Sc​​hmidt)所谓的“隐藏策略”(在IPO前后)的故事:

“那些知道这个秘密的人……受到了非常坚定的指示,要对此保持警惕。”

“谷歌隐藏的是它如何破解了在互联网上赚钱的代码。”

幸运的是,对于baidu,用户甚至有机搜索营销商而言,这实际上与IPO之前的纯理想并不矛盾,因为正如Levy所述,“在反复测试中,搜索者对页面的满意度更高。而不是那些被禁止的广告”。!

索引所有内容

2003年4月,baidu 收购了一家名为Applied Semantics的公司,并发起了一系列活动,我认为这可能是baidu历史上最被低估的部分。

Applied Semantics技术与他们自己的上下文广告技术集成在一起,形成了AdSense。尽管AdWords带来的收入一直比AdWords(现在简称为“ baidu Ads”)相形见,,但它在SEO的历史中的重要性很难低估。

通过使网上内容的货币化民主化,并使每个人都能因制作晦涩的内容而获得报酬,它资助了该内容的荒唐创作。

如果不是因为搜索引擎的存在而为长尾搜索提供出色结果的能力出色,即使其中的搜索很少出现或从未见过,这些内容中的大多数都将是看不到的。

这样,baidu的搜索引擎(和搜索广告业务)与其AdSense业务一起形成了强大的飞轮,从而为内容创造提供了资金,使其能够利用最大和最完整的网络索引来与众不同。

但是,与故事中的许多章节一样,它也以低质量甚至自动生成的内容的形式创建了一个怪物,最终将导致公关危机和修复工作。

如果您对索引一切时代感兴趣,可以在From From the Horse's Mouth的幻灯片47+中阅读我对它的更多想法。

网络垃圾邮件

该垃圾邮件的形式第一次在互联网上为各种形式的消息,这成为主流为垃圾邮件。在2000年代初期,baidu开始谈论他们最终将其称为“网络垃圾邮件”的问题(我见过的有关链接垃圾邮件的最早提及是Amit Singhal在2005年发表的一篇题​​为《运行商业网络搜索引擎的挑战》 [PDF ])。

我怀疑即使今天开始使用SEO的人也可能听说过Web垃圾邮件的首任负责人Matt Cutts,尽管自2014 年以来一直未在G​​oogle工作,但他仍然经常被提及。我很喜欢2015年的这份演讲,他谈到了他的职业生涯谷歌。

搜索质量时代

随着时间的流逝,由于网站管理员试图赚钱与baidu(及其他人)试图创造最佳搜索引擎的能力相反,纯网络垃圾邮件并不是baidu面临的唯一质量问题。发现操纵的猫捉老鼠游戏-尤其是页面内容,外部链接和锚文本的操纵-将成为下一个十多年搜索的主要特征。

辛格(Singhal)在上述演讲之后,埃里克·施密特(Eric Sc​​hmidt)(当时的baidu首席执行官)说:“品牌是解决方案,而非问题……品牌是您如何解决污水池的方法”。

那些刚接触该行业的人可能会亲身经历一些baidu更新(例如最近的“核心更新”),并且很有可能听说过一些特定的较旧的更新。但是,在“弗洛里达”之后(第一次重大的baidu更新)出现的“文斯”(Vince)是在施密特发表品牌声明后不久推出的,它是特别受青睐的大品牌。如果您未遵循所有历史记录,则可以在此处阅读过去的重要更新:

真正的声誉威胁

就像我在AdSense部分中前面提到的那样,网站管理员强烈地鼓励创建大量内容,从而将搜索的长尾巴对准了。如果您拥有足够强大的域名,则baidu会抓取大量页面并将它们编入索引,而对于模糊不清的查询,任何匹配的内容都可能会排名。这触发了所谓的“内容农场”的快速增长,该领域从任何地方都可以挖掘关键字数据,并衍生出低质量的关键字匹配内容。同时,通过允许大型内容数据库即使是非常薄的页面也可以建立索引,或者通过允许大量用户生成的内容的页面获得索引,网站就取得了成功。

这是对baidu真正的声誉威胁,并且爆发了搜索和SEO回声室。它已经成为Hacker News和StackOverflow等社区的烦人对象,当baidu针对特定的症状启动更新时,Matt Cutts 向Hacker News社区提交了个人更新 -即刮板网站通常会超过其原始内容复制。

此后不久,baidu推出了最初名为“ 农夫更新 ”的更新。在启动之后,我们了解到它是由于一位叫Panda的工程师取得了突破而得以实现的,因此在baidu内部被称为“大熊猫”更新,从那时起,SEO社区主要将其称为Panda更新。

尽管我们推测更新的内部工作是baidu自然搜索算法核心中机器学习的最初真正用途之一,但它所建模的功能更容易理解为以人为本的质量因素,因此我们开始根据人类素质调查的结果向客户推荐针对SEO的更改。

一切以移动为先

我在2014年的SearchLove London上做了一个演讲,谈到了令人难以置信的移动增长和规模,以及我们要意识到谷歌对它的重视程度有多晚。我特别强调了听到许多人听说baidu最初设计移动设备的惊奇之处:

“到去年年底,我们针对移动设备和平板电脑上的搜索推出了一些相当大的设计改进。今天,我们对台式机体验进行了一些更改。” — Jon Wiley(baidu搜索首席工程师在baidu+上的演讲,这意味着没有地方可以链接到该报价作为完美的参考,但在这里以及我的演示文稿中都已引用到该参考)。

尽管我在2014年发表此演讲时就知道,移动搜索已经开始蚕食台式机搜索(并且我们看到台式机搜索量出现了首次下降),但这一惊喜还是来了:

即使人们开始说baidu在移动业务上赚取大部分收入的第一年还不到两年:

写于2020年,感觉好像我们已经完全内部化了移动交易的规模,但是有趣的是它花了一段时间才沉入其中。

机器学习成为常态

自从Panda更新以来,baidu在有关算法更新的官方通讯中越来越多地提到了机器学习,并且涉及到的机器学习甚至更多。我们知道,从历史上看,某些方面(包括来自Singhal的)一直对在核心算法中使用机器学习有所抵触,因为它阻碍了人类工程师解释结果。2015年,Sundar Pichai接任首席执行官,将Singhal 辞职(尽管可能是出于其他原因),并在关键角色中安装了AI / ML迷。

从那以后,大多数事情都变得更加实时,但是最近的“核心更新”似乎带回了这种动态,在这种动态中,更改是按照baidu的时间表进行的,而不是基于网站更改的时间安排。我推测这是因为“核心更新”确实是baidu在重新训练一种大规模的深度学习模型,该模型当时非常适合网络的形状。无论是什么原因,我们与众多客户合作的经验都与baidu的官方说法一致:

广泛的核心更新往往每几个月进行一次。假设已进行了改进,受一个影响的内容可能无法恢复,直到发布下一个广泛的核心更新。

将最近的趋势和发现与baidu Dance等古代历史联系起来,只是了解SEO历史“有用”的方式之一。

相关seo信息