链接熔炉设计

本贴最后更新于 2997 天前,其中的信息可能已经东海扬尘

背景

很多人都有收藏网络资料的习惯,常用的方式有两种:

  1. 浏览器书签
  2. 笔记软件

对于个人的知识管理这两种方式都比较有效,但是如果要将自己整理好的内容分享给其他人时,可选的方式就比较有限了,特别是当要批量分享某个类目时。

除了分享的场景,很多时候还 需要大众的力量进行资源的完善和维护 。完善意味着挖掘新的资源添加进来,维护意味着修正一些不可用的资源。这个场景下最有效的方式是通过 Wiki 进行协作编辑。

Wiki 方式主要站点是 [WiKiPedia] ,但因为维基百科是一个综合化的知识库,并且对于主题侧重的是权威性,所以一些我们觉得有帮助但比较小众的资源链接是整合不到其中的。

目前流行的一种方式是通过 [GitHub] 进行知识资源整理,比如一些关注数非常高的资源导航库(Awesome/资源合集等)。通常的协作流程是通过 Pull Request 发起,库 Owner 同意合并后就能够将 PR 发起者的变更(比如加入一个有价值的链接)同步到主库。这个协作方式略比 Wiki 复杂一些,但在程序员圈子是非常受欢迎的。

现状分析

通过观察 GitHub 上面很多实例我们发现,对于知识类型的资源共享/协同活动的共同点是: 少数人整理,多数人关注,很多 1K+ stars 的库其实贡献者很少。

以开源项目的观点来看的话,如果贡献者太少,那项目的活跃度主要依赖于 Owner,这样的开源项目是很难长远的。结合前面我们讨论的资源整理型项目来看,其他人的参与成本是非常低的(比如只需要提交链接和一段短小的说明),但是还是鲜有人参与,为什么呢?

原因至少应该有如下几点:

  1. PR 流程比较复杂,对于贡献者和 Owner 都存在 操作门槛
  2. 不能批量化进行变更,手工编辑过于 繁琐
  3. 大部分人喜欢占有(star/fork),对于 细节改进并不在意

另辟蹊径

在 GitHub 上进行资源整理和分享并不是最高效的方式,而 Wiki 也不太适合解决这个需求,我们得发明个轮子了 —— 链接熔炉

  1. 从浏览器书签导入资源链接:书签都是经过个人整理的,是 具有实用价值的资源链接 ,并且导入方式解决了手工、批量等操作繁琐的问题,当然,也支持提交单个链接
  2. 自动整理:根据大家提交的链接进行计算整理,按标签进行分类、 链接价值 进行排序,最终以一个单页面(比如程序员领域)展现给浏览者,该页面汇聚了一些标签以及每个标签最具价值的资源链接

技术关键点

  • 书签格式:以 Chrome 书签为例,导出后是一个 Netscape Bookmark 格式的 HTML 文件
  • 链接页面解析:按爬虫方式访问目标链接,跳过不可用(非 200)的链接,解析页面
  • 提取标签:按页面内容进行标签提取(接入第三方服务,例如玻森),并将标签结果和已有的标签库做匹配,抽取出最适合的标签
  • 链接评分:按搜索引擎结果(链接引用数)进行排序,引用越多说明越有价值(简化的 PageRank),还需要探索更精准的算法

结论

链接熔炉是一个自动化的链接整理系统,一旦加入了新的链接就会再计算以产生更具实时性的结果,也许以后你就只用关注这一个页面了,里面有所有分好类的高质量资源 😄

  • 奇思妙想

    虽然我们的世界构建在想象力上,但光想不实操也是没用的。

    60 引用 • 623 回帖 • 5 关注
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    524 引用 • 4601 回帖 • 700 关注
  • 链接
    12 引用 • 47 回帖

相关帖子

26 回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • virtualpier

    感觉好高深~

  • 714593351

    这功能超级好啊!!
    自己的书签很多但是很乱,一直都是收藏,懒得整理,而且浏览起来不方便。

    感觉自己对这个功能最需要的是:分类精确,链接够广。

  • 714593351

    这样做下来,是不是就成了一个知识库了?

    1 回复
  • 88250

    可以做成绝世武功的目录....

  • senowang

    链接多了,是不是很乱。有目录,有分类,标签么。。。

    1 回复
  • 88250

    初期可以不细分,一个页面就是一个大类,比如文中说的程序员。这个页面下面有各种程序员相关的标签,比如 Java、MySQL、Node.js 等,每个标签下面就是 top 50 的条目链接。

  • senowang

    然后每个标签下面还有关联标签 嗯,nice

  • yangyujiao

    我来新公司 把原来的浏览器书签打包带来了 但是导入不到浏览器里。。。郁闷·····

    1 回复
  • senowang

    现在很多浏览器不是可以同步么。比如 360 你用户登录了 自动同步。。。

    1 回复
  • yangyujiao

    我没有用户····· 不是在登录状态下收藏的····

    1 回复
  • pianopaper 1

    其实,这里有一句是重点:少数人整理,多数人关注,要完完全全改善这个问题,只能是多数人整理(原创 or 再创作)

  • huiyadanli

    这个想法好赞,是不是要有很多人把链接提交进这个“熔炉”才会有效果?

    1 回复
  • 88250

    是得有比较多的人提交才会见效果,所以考虑主要入口是书签导入,这样量比较大吧。另外,还可以从帖子 / 回帖里面解析链接,加速熔炉反应 😆

  • R

    脑洞好大,是不是可以融合我的优选来一起搞。。。另外从社区来看,信任系统和我的优选这两个优先级比较高。。。

    1 回复
  • 88250

    信任系统优先级较低,如果做早了我担心会成为束缚,我的优选确实迫在眉睫,不过这个链接熔炉更好玩,所以就先做了。。。。

    1 回复
  • relyn

    有意思,目前这是想法还是产品?

    1 回复
  • 88250 1 1 赞同

    准备揉到 Sym 里面,正在开发中 😅

    2 回复
  • R

    束缚倒不会,信任也系统也需要不断优化改进,不过规划好是必要的。

    不知道熔炉链接怎么解析 github 格式,如文中所说 目前流行的一种方式是通过 GitHub 进行知识资源整理 ,上面资源好多。。。

    1 回复
  • 88250

    发帖,然后从帖子里面提取,或者提交 repo 的地址,然后去解析 README.... 还没想好。

  • Eddie

    这个可以。

  • relyn

    帅!~发现 solo 的后台 UI 也变了哈!

  • relyn

    1473312852148

  • senowang

    下次记得注册下就好了。这样永远不愁了。

  • wizardforcel

    好主意,我正需要整理一些碎片化的,没有体系的文章。

    但是加上社交功能的话会不会跟 medium/简书一样了。。

    1 回复
  • 88250

    这个特性在设计时候的应用场景是比如 GitHub awesome xxx 库上面都是链接,通过链接熔炉可以提取出其中最有价值的。
    你说的碎片化的场景确实可能也奏效,主要还是链接价值评估的算法....

  • someone

    感觉好深奥啊。

请输入回帖内容 ...