SEO 技术为王

本贴最后更新于 1738 天前,其中的信息可能已经时异事殊

来看着 SEOWHY 的帖子,忍不住又用上 n 多时间来写下自己的看法。以前写过一篇文章,谈论技术的重要性的,那篇文章很偏激,因为看到太多人轻视技术。然而现在还是这样。。。
那篇文章的回复,里面有说“我认为 SEO 还是要注重思维”什么的很多。但问题是,我是在写一个事实,而非阐述个人观点。这篇文章我就多分析一点实例来说明这个问题好了。希望能有更多人意识到这一点。多的不敢奢求,想至少能让一部分人深刻意识到这点吧。文章很长,但我可以绝对的说,这篇文章对大多数人会非常有价值,不然我也不必大半夜写这么多。

首先 SEO 的思维是什么?很多人说,SEO 不是技术是思维,那么自己先想下,到现在自己掌握过什么思维的东西呢?不是开玩笑,但在我眼里,王通是少数把 SEO 的思维玩好的人。尽管他自己博客上面删了,但在其他地方,或许还能找到金山爱词霸的例子,那个是一个很聪明的做法。人人网同名同姓与之也有着异曲同工之妙。但是,如果把次导航之类的初级优化手段当做高级思维的话,那就大错特错了。至少要想到足以比过金山爱词霸的那个例子的思维吧,不然所谓的思维,是什么呢?

然后刚才看到了一篇帖子(http://www.seowhy.com/bbs/thread-219448-1-1.html),讲百度分词的,copy 的是几年前的文章,没记错的话出自点石。多年前人家就在研究这个了,但现在的人怎么退步了呢?可以看 3 楼回复:

“百度分词一说以前有很多人发贴提到过,和上面的文章都差不多,与百度大更新算法好像没什么关联吧。

我们做关键词排名其实不用去考虑什么分词算法这些的,没有那么复杂,什么分词,什么百度算法啊,这些都是搜索引擎要做的事情,我们用锚文本去固定我们要做的关键字,直接用锚文本去告诉搜索引擎我们要做的关键字是什么,直接用锚文本去给我们要做的关键字投票就好了。

个人看法,仅供参考。”

几年前的点石一批人,其中有些就是真正的高手,其他一些至少技术不差,远远超过现在的国内平均水平。他们研究的是什么?就是分词之类的啊,难道会累积一堆自建博客资源吗?当然肯定点石那批人中多数还是会依赖外链资源的,但他们绝不会仅仅依赖外链,也重视其他技术。从每天论坛上面讨论什么这点上就可以看出来,点石讨论技术,现在的论坛(包括已死的点石),都在讨论网站怎么不收录之类的蛋疼问题。

但是对 3L 你个人没意见啦,几个月前我也是这么想的,能有自己的观点就是非常好的事情了。但是认识错误这点不得不提出来。后面我有个回复:

“做关键词的排名恰恰是最需要注意分词的,就把这个最简单化来说好了,以发锚文本来谈。“上海 SEO”,做这个的话,锚文本选择做什么?其实应该是“SEO”,因为精准的锚文本效果更好。根据 TF/IDF,“上海”在这里对于排名的作用几乎是可以忽视的。绝大多数人却意识不到这点。

而有些词则不然,举个例子“论文网”不能用“论文”做锚文本,效果很小。因为它是一个词,而“上海 SEO”是两个词。怎么看是否是一个词,可以看搜索结果的运算时间,看了就知道。

关键词和索引词是截然不同的概念。不认识到的话,是不可能做好 SEO 的。
这篇分词的文章没记错的话,是很多年前点石上面的,当时国内 SEO 平均水平反而远远高于现在的,实在是觉得这个行业很可笑。。。

认识到 SEO 的深奥以后才有机会一窥究竟,现在 SEO 行业的匮乏就是因为太多人觉得 SEO“很简单”。”

大地老哥有句话,自己再怎么样也要知道自己在做什么词的排名。但是实际上,大多数人恰恰不知道。

又如新浪等四大门户网站,以前在群里面和人提起的时候,有人竟然是以耻笑的态度的。殊不知我更是在耻笑那些人。在他们看来,门户站要做什么优化啊,网站权重高了什么都无所谓了。最简单的例子,新浪博客的权重也很高,为什么没什么人能够用新浪博客的排名做过新浪主站呢?当然有经验的都知道这是在瞎扯,新浪博客无论怎么做都是局限性太大了。但是很多人只把 SEO 归结为不断做锚文本,改改 title 之类的,那么新浪博客对他们而言已经足够用来优化了,可是呢?

大型门户的 SEO 竞争甚至是可以用惨烈来形容的,但太多人看不到,在他们看来或许没看到次导航就不算是 SEO。。。包括我现在也只能看到门户站优化的很小一部分,但看懂的这些,都不得不为之叹服(比如新浪娱乐站明星资料的 hub 页面优化,简短化锚文本等等)。以前有人吹牛的时候,说自己几大门户的 SEOer 都认识,现在的人吹牛的时候,把那些顶级高手视若无物。。。

抛开“网站权重”这类无聊的想法,真正去分析下新浪之类网站在各类词的良好排名,就会了解到自己的无知(不是骂谁,我自己也很无知,还看不出多少。。。)。

有很多人喜欢说 SEO 需要实践,我也被人喷过是纯理论。的确 SEO 需要实践,纯理论不可能有大的所为,但所谓的“实践”,是要在优化之后,分析大量数据来佐证优化效果才会有价值的。而理论一点都不懂,就算有了数据,甚至就算有人帮忙把数据整理好,照样不会知道什么情况是什么优化手段引起的。

就像刚看到一个帖子吧(http://www.seowhy.com/bbs/thread-209804-1-1.html 别怨我,方便说明问题而已),LZ 做了三年 SEO 还局限于发外链的阶段。发外链多累,经历过的人都应该有体会。而我到现在只研究了四个月的技术理论,但很多东西我都已经了然于心,做起优化来很方便。很多人对于 SEO 处于“猜测”的阶段,但我已经开始逐步迈向“知道”的阶段了。为什么?搜索引擎的底层技术是不会变的,技术思路上面,五六年前的东西和现在几乎没两样,只是搜索引擎在不断的靠技术来完善那些策略而已。

最简单的一些例子吧,很多人都认为搜索引擎原理什么的是生涩的没用的技术。而我学了一点点搜索引擎原理以后,就了解了不少可以直接应用到 SEO 上面去的东西。限于篇幅就讲一个,网页查重(判断伪原创)主要有两种算法,I-Match 和 Shingle,而后者更普遍被运用。后者最简单的说法就是,它按照一组一组词来判断两篇文章是否相似。

延伸出去就可以是,如果伪原创工具的同义词词库不够大,很可能会导致多组词相同,导致搜索引擎判断出文章是伪原创的。那么怎么办?要把词序也处理下(语句的顺序更改是没有半点用处的),而词序怎么处理,有投机取巧的方法。这里就不公布了,用烂掉的话不太好,而且也和本文的主题无关。真有需要的话,可以自己多想下,或许就能想出来。

目前我大多数时间都在研究技术原理,也接过几个单子。其中一个新站还搞不定,没办法新站对我目前的技术而言还是不得不需要多些的外链,而我又懒得做。而一些老站,我都没弄过什么外链,仅仅是优化了模板,排名慢慢就上去了。相比之下,“实践”了多年,最后把 SEO 归于发外链的苦活的人,你们认为还可以不再重视技术吗?

目前我正在研究搜索引擎原理,css(这个对 SEO 同样很有用,不是说特效,而是结构化),打算研究数据挖掘。听上去很麻烦,实际上也是有那么点,但应该比到处发外链为工作的好不少。。。

  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    36 引用 • 200 回帖 • 34 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    24 引用 • 242 回帖
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 125 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖 • 2 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 367 回帖
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 72 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    209 引用 • 2040 回帖
  • Word
    13 引用 • 41 回帖
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    500 引用 • 1396 回帖 • 244 关注
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖 • 2 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 36 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    36 引用 • 200 回帖 • 34 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 18 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    188 引用 • 319 回帖 • 241 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    7 引用 • 28 回帖 • 2 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1708 回帖 • 2 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 661 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    372 引用 • 1857 回帖 • 1 关注
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 1 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 33 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 1 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    201 引用 • 120 回帖
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    7 引用 • 69 回帖 • 7 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    336 引用 • 324 回帖
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    173 引用 • 414 回帖 • 365 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖 • 1 关注