SEO 技术为王

本贴最后更新于 1378 天前,其中的信息可能已经时异事殊

来看着 SEOWHY 的帖子,忍不住又用上 n 多时间来写下自己的看法。以前写过一篇文章,谈论技术的重要性的,那篇文章很偏激,因为看到太多人轻视技术。然而现在还是这样。。。
那篇文章的回复,里面有说“我认为 SEO 还是要注重思维”什么的很多。但问题是,我是在写一个事实,而非阐述个人观点。这篇文章我就多分析一点实例来说明这个问题好了。希望能有更多人意识到这一点。多的不敢奢求,想至少能让一部分人深刻意识到这点吧。文章很长,但我可以绝对的说,这篇文章对大多数人会非常有价值,不然我也不必大半夜写这么多。

首先 SEO 的思维是什么?很多人说,SEO 不是技术是思维,那么自己先想下,到现在自己掌握过什么思维的东西呢?不是开玩笑,但在我眼里,王通是少数把 SEO 的思维玩好的人。尽管他自己博客上面删了,但在其他地方,或许还能找到金山爱词霸的例子,那个是一个很聪明的做法。人人网同名同姓与之也有着异曲同工之妙。但是,如果把次导航之类的初级优化手段当做高级思维的话,那就大错特错了。至少要想到足以比过金山爱词霸的那个例子的思维吧,不然所谓的思维,是什么呢?

然后刚才看到了一篇帖子(http://www.seowhy.com/bbs/thread-219448-1-1.html),讲百度分词的,copy 的是几年前的文章,没记错的话出自点石。多年前人家就在研究这个了,但现在的人怎么退步了呢?可以看 3 楼回复:

“百度分词一说以前有很多人发贴提到过,和上面的文章都差不多,与百度大更新算法好像没什么关联吧。

我们做关键词排名其实不用去考虑什么分词算法这些的,没有那么复杂,什么分词,什么百度算法啊,这些都是搜索引擎要做的事情,我们用锚文本去固定我们要做的关键字,直接用锚文本去告诉搜索引擎我们要做的关键字是什么,直接用锚文本去给我们要做的关键字投票就好了。

个人看法,仅供参考。”

几年前的点石一批人,其中有些就是真正的高手,其他一些至少技术不差,远远超过现在的国内平均水平。他们研究的是什么?就是分词之类的啊,难道会累积一堆自建博客资源吗?当然肯定点石那批人中多数还是会依赖外链资源的,但他们绝不会仅仅依赖外链,也重视其他技术。从每天论坛上面讨论什么这点上就可以看出来,点石讨论技术,现在的论坛(包括已死的点石),都在讨论网站怎么不收录之类的蛋疼问题。

但是对 3L 你个人没意见啦,几个月前我也是这么想的,能有自己的观点就是非常好的事情了。但是认识错误这点不得不提出来。后面我有个回复:

“做关键词的排名恰恰是最需要注意分词的,就把这个最简单化来说好了,以发锚文本来谈。“上海 SEO”,做这个的话,锚文本选择做什么?其实应该是“SEO”,因为精准的锚文本效果更好。根据 TF/IDF,“上海”在这里对于排名的作用几乎是可以忽视的。绝大多数人却意识不到这点。

而有些词则不然,举个例子“论文网”不能用“论文”做锚文本,效果很小。因为它是一个词,而“上海 SEO”是两个词。怎么看是否是一个词,可以看搜索结果的运算时间,看了就知道。

关键词和索引词是截然不同的概念。不认识到的话,是不可能做好 SEO 的。
这篇分词的文章没记错的话,是很多年前点石上面的,当时国内 SEO 平均水平反而远远高于现在的,实在是觉得这个行业很可笑。。。

认识到 SEO 的深奥以后才有机会一窥究竟,现在 SEO 行业的匮乏就是因为太多人觉得 SEO“很简单”。”

大地老哥有句话,自己再怎么样也要知道自己在做什么词的排名。但是实际上,大多数人恰恰不知道。

又如新浪等四大门户网站,以前在群里面和人提起的时候,有人竟然是以耻笑的态度的。殊不知我更是在耻笑那些人。在他们看来,门户站要做什么优化啊,网站权重高了什么都无所谓了。最简单的例子,新浪博客的权重也很高,为什么没什么人能够用新浪博客的排名做过新浪主站呢?当然有经验的都知道这是在瞎扯,新浪博客无论怎么做都是局限性太大了。但是很多人只把 SEO 归结为不断做锚文本,改改 title 之类的,那么新浪博客对他们而言已经足够用来优化了,可是呢?

大型门户的 SEO 竞争甚至是可以用惨烈来形容的,但太多人看不到,在他们看来或许没看到次导航就不算是 SEO。。。包括我现在也只能看到门户站优化的很小一部分,但看懂的这些,都不得不为之叹服(比如新浪娱乐站明星资料的 hub 页面优化,简短化锚文本等等)。以前有人吹牛的时候,说自己几大门户的 SEOer 都认识,现在的人吹牛的时候,把那些顶级高手视若无物。。。

抛开“网站权重”这类无聊的想法,真正去分析下新浪之类网站在各类词的良好排名,就会了解到自己的无知(不是骂谁,我自己也很无知,还看不出多少。。。)。

有很多人喜欢说 SEO 需要实践,我也被人喷过是纯理论。的确 SEO 需要实践,纯理论不可能有大的所为,但所谓的“实践”,是要在优化之后,分析大量数据来佐证优化效果才会有价值的。而理论一点都不懂,就算有了数据,甚至就算有人帮忙把数据整理好,照样不会知道什么情况是什么优化手段引起的。

就像刚看到一个帖子吧(http://www.seowhy.com/bbs/thread-209804-1-1.html 别怨我,方便说明问题而已),LZ 做了三年 SEO 还局限于发外链的阶段。发外链多累,经历过的人都应该有体会。而我到现在只研究了四个月的技术理论,但很多东西我都已经了然于心,做起优化来很方便。很多人对于 SEO 处于“猜测”的阶段,但我已经开始逐步迈向“知道”的阶段了。为什么?搜索引擎的底层技术是不会变的,技术思路上面,五六年前的东西和现在几乎没两样,只是搜索引擎在不断的靠技术来完善那些策略而已。

最简单的一些例子吧,很多人都认为搜索引擎原理什么的是生涩的没用的技术。而我学了一点点搜索引擎原理以后,就了解了不少可以直接应用到 SEO 上面去的东西。限于篇幅就讲一个,网页查重(判断伪原创)主要有两种算法,I-Match 和 Shingle,而后者更普遍被运用。后者最简单的说法就是,它按照一组一组词来判断两篇文章是否相似。

延伸出去就可以是,如果伪原创工具的同义词词库不够大,很可能会导致多组词相同,导致搜索引擎判断出文章是伪原创的。那么怎么办?要把词序也处理下(语句的顺序更改是没有半点用处的),而词序怎么处理,有投机取巧的方法。这里就不公布了,用烂掉的话不太好,而且也和本文的主题无关。真有需要的话,可以自己多想下,或许就能想出来。

目前我大多数时间都在研究技术原理,也接过几个单子。其中一个新站还搞不定,没办法新站对我目前的技术而言还是不得不需要多些的外链,而我又懒得做。而一些老站,我都没弄过什么外链,仅仅是优化了模板,排名慢慢就上去了。相比之下,“实践”了多年,最后把 SEO 归于发外链的苦活的人,你们认为还可以不再重视技术吗?

目前我正在研究搜索引擎原理,css(这个对 SEO 同样很有用,不是说特效,而是结构化),打算研究数据挖掘。听上去很麻烦,实际上也是有那么点,但应该比到处发外链为工作的好不少。。。

  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    171 引用 • 813 回帖 • 1 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    10 引用 • 54 回帖 • 139 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    207 引用 • 2031 回帖
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 405 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 3 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 49 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 531 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    45 引用 • 113 回帖 • 284 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    16 引用 • 7 回帖
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    238 引用 • 224 回帖
  • 自由行
    2 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 319 关注
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 248 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    189 引用 • 1056 回帖 • 1 关注
  • abitmean

    有点意思就行了

    29 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖 • 1 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    4 引用 • 55 回帖 • 2 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    284 引用 • 247 回帖 • 148 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    124 引用 • 580 回帖
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    84 引用 • 122 回帖 • 619 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 60 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 390 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 2 关注
  • 脑图

    脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。

    21 引用 • 58 回帖 • 1 关注