【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

IPFS:替代 HTTP 的分布式网络协议

  • 2015-10-14
  • 本文字数:3255 字

    阅读完需:约 11 分钟

今年年初, Internet Archive 开始倡导分布式网络。现在关于它的声音已经变得越来越清晰而又响亮。而 IPFS 就是在这种环境下出现的一个典型的开源代表。IPFS 是点对点协议 InterPlanetary File System 的简称,它是一个面向全球的、点对点的分布式版本文件系统,试图将所有具有相同文件系统的计算设备连接在一起。

近日,IFPS宣布了一个未来web 发展计划,它用基于内容的地址替代基于域名的地址,也就是用户寻找的不是某个地址而是储存在某个地方的内容,不需要验证发送者的身份,而只需要验证内容的哈希,通过这样可以让网页的速度更快、更安全、更健壮、更持久。IPFS 表示,IPFS 未来将替代HTTP(以及其他的许多东西)。

一、HTTP 存在很多问题

HTTP 鼓励高度集中化

Web 的本意是去中心化,但它却变得越来越中心化,今天越来越多的人依靠的是少数网站的服务。HTTP 变成了一个脆弱的、高度集中的、无效的、过度依赖于骨干网的协议。像美国国家安全局这样的组织,现在只需要在几个点上拦截通信来进行监视。对政府来说,阻止网站访问这些高度集中化的资源变得容易。这也使通信容易遭受 DDoS 攻击而面临巨大的风险。

将 web 进行去中性化,可以降低极少数强大组织的延展性,并提高所有站点的自由度和独立性,同时也降低了由于服务器中断造成数据丢失的风险。

HTTP 是低效的

如果不是成规模的处理数据,将这些数据从中央数据中心分发仍然是非常昂贵的。IPFS 可代替总是从数据中心获取内容的 HTTP,如果将一个 ISP 网络上的每一台计算机变成流媒体 CDN,这时会怎么样?例如,获取江南 Style 视频,就可以完全在 ISP 网络上下载,而不需要在 Internet 骨干网上经过大量的传输,从而大大减少数据传输的费用。

HTTP 过度依赖于 Internet 主干网

当内容过度集中化之后,这让数据中心高度依赖于 Internet 骨干网。这样除了有利于政府对内容进行封锁和审查,事实上存在很多可靠性问题。即使允许冗余,主要的骨干有时还是会被损坏,或者出现路由表失控,其后果可能是非常严重。Internet 骨干网并不健全,其很容易被攻击,同时一些重要的光纤线路被切断时服务很容易遭受影响。

二、IPFS 如何解决了这些问题

IPFS 从根本上改变了用户搜索的方式。通过 IPFS,用户搜索的是内容。通过 HTTP 浏览器搜索文件的时候,首先找到服务器的位置(IP 地址),然后使用路径名称在服务器上查找文件。按照这个设计,只有文件所有者可以判断这是否是用户要找的文件。此时,必须保证托管者不会通过移除文件或者关闭服务器而对文件做任何更改。

当文件被添加到 IPFS 节点上,它得到一个新的名字。这个名字实际上是一个加密哈希,它是从文件内容中被计算出来。通过加密保证该哈希始终只表示该文件的内容。哪怕只在文件中修改一个比特的数据,哈希都会完全不同。

当下一步向IPFS 分布式网络询问哈希的时候,它通过使用一个分布式哈希表,可以快速(在一个拥有10,000,000 个节点的网络中只需要20 跳)地找到拥有数据的节点,从而检索该数据,并使用哈希验证这是否是正确的数据。

IPFS 是通用的,并且存储限制很少。它服务的文件可大可小,对于一些大的文件,它会自动将其切割为一些小块,使 IPFS 节点不仅仅可以像 HTTP 一样从一台服务器上下载文件,而且可以从数百台服务器上进行同步下载。IPFS 网络是一个细粒度的、不可靠的、分布式的、易联合的内容分发网络(Content Delivery Network , CDN)。对于所有数据类型都是很有用的,包括图像、视频流、分布式数据库、操作系统、blockchains 等,而对于 IPFS 来说,最重要的是静态 web 网站。

IPFS 文件也可以是特殊的 IPFS 目录对象,它允许用户使用人类可读的文件名,透明地链接到其他 IPFS 哈希。用户可以通过默认方式加载目录中的 index.html,这也是标准的 HTTP 服务器采用的方式。使用目录对象,IPFS 可允许用户采用完全相同的方式生成静态网站。将 web 网站添加到 IPFS 节点中只需要一个简单的命令:ipfs add -r yoursitedirectory。在此之后,用户可以从任何 IPFS 节点访问,而不需要链接到 HTML 上的任何哈希。

与 IPFS 建立联盟的数据

IPFS 不需要每个节点存储所有发布到 IPFS 上的内容。相反,每个节点只存储自己想要的数据。如果每个节点托管一点数据,所有数据通过累积就提供了比任何集中式 HTTP 更多的空间、带宽和可用性。分布式网络将很快成为世界上最快、最可用、以及最大的数据存储。没有人有能力关闭所有的节点,所以数据永远不会丢失。

从其他 IPFS 节点复制、存储 web 网站很容易。它只需要一条命令以及网站的哈希值:ipfs pin add -r QmcKi2ae3uGb1kBg1yBpsuwoVqfmcByNdMiZ2pukxyLWD8。IPFS 负责剩下的所有工作。

IPNS

IPFS 哈希代表不可变的数据,这意味着它们是不能被更改的,否则会导致哈希值的变更。这是一件好事,因为它鼓励数据的持久性,但我们仍然需要一种方法来找到最新的 IPFS 哈希以表示你的网站。IPFS 通过一种特殊的功能来实现,即 IPNS。

IPNS 允许用户使用一个私有密钥来对 IPFS 哈希附加一个引用,使用一个公共密钥哈希(简称 pubkeyhash)表示你的网站的最新版本。如果用户使用过比特币,可能会对此比较熟悉,一个比特币地址也是一个 pubkeyhash。

如果该链接不起作用,不用担心。能够通过更改 pubkeyhash 所指向的内容,而 pubkeyhash 却永远保持不变。这样,网站的更新问题就得到了解决。

接下来,只需要保证这些网站的位置是人类可读的,所有问题就解决了。

人类可读的可变地址

IPFS/ IPNS 哈希是一些很大的、难看的字符串,而且不容易记住。所以 IPFS 允许用户使用现有的域名系统(Domain Name System, DNS)来为 IPFS/IPNS 内容提供人类可读的链接。它允许用户通过在域名服务器上将哈希插入 TXT 记录来实现这一点(如果你方便使用一个命令行,运行如下命令:dig TXT ipfs.git.sexy)。具体可以参考这里

未来,IPFS 已计划支持 Namecoin ,它理论上可以用来创建一个完全去中心化的、分布式的 web,整个环境中不需要一个中心控制。没有 ICANN,没有中央服务器,没有“权威”证书,也没有瓶颈。这听起来很疯狂。可现实的确疯狂。因为使用今天的技术这是完全可以实现的!

IPFS HTTP 网关:新旧网络之间的桥梁

通过一个 HTTP 网关,IPFS 可以实现从 HTTP 到 IPFS 的过度,浏览器可以完全实现 IPFS 之前,现在已经允许当前的 web 浏览器访问 IPFS。用户很快就可以切换到 IPFS,完成 web 网站的存储、分发和服务。

到目前为止,IPFS 还处于实验阶段。当网站更新的时候,Neocities 将每天发布一个哈希 IPFS。这个哈希将指向该网站的最新版本,并通过 IPFS HTTP 网关可以访问。因为每次更新 IPFS 哈希都会变更,这也能够为所有网站提供一个存档历史记录。

从长期来看,如果一切顺利的话,Neocities 希望使用 IPFS 存储所有的网站,并为每个网站发布 IPNS 键。这将让用户可以不依赖于 Neocities 而进行内容发布。如果构建得当,即使 Neocities 不存在了,用户仍然可以更新自己的网站。通过有效地去除网站对 Neocities 中央服务器的依赖,这种集中控制环境将被永久性打破。

IPFS 真正能够替代 HTTP 可能还需要一段时间,而且也有很多工作要做。

通过与协议实验室(Protocol Labs)合作, Neocities 已经成为产业界实施 IPFS 第一大网站。从 9 月 8 日开始,所有 Neocities 站点可以为世界上任何 IPFS 节点提供查看、存档和托管功能。当一个 IPFS 节点选择从 Neocities 上托管一个网站的时候,即使 Neocities 关闭了或停止对它托管,网站的原始版本仍继续可用。使用 Neocities 网站的 IPFS 节点越多,Neocities 网站越容易访问。

目前,IPFS 仍处于 alpha 开发阶段。它还没有取代现有的网站存储系统。如同任何复杂的新技术,它还存在很多需要的改进地方。但 IPFS 不是雾件,现在已经可以开始工作,感兴趣的用户可以下载软件安装到电脑上。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-10-14 18:3428385
用户头像

发布了 268 篇内容, 共 117.7 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

携手腾竞体育后,英特尔IMC如何加速电竞生态正循环?

科技之家

重新认识WorkPlus,不止IM即时通讯,是企业移动应用管理专家

WorkPlus

AIOps落地五大原则(二):价值路线

BizSeer必示科技

CRM快速开发平台:破解管理困局

力软低代码开发平台

如何把企业内部碎片信息系统化?

小炮

对讲功能在远程办公中的应用 | 社区征文

Changing Lin

初夏征文

A/B测试助力游戏业务增长

字节跳动数据平台

游戏开发 游戏 ab测试 游戏运营

解密抖音春节红包背后的技术设计与实践

JackJiang

架构设计 短视频 社交产品

云上弹性高性能计算,支持生命科学产业高速发展、降本增效

阿里云弹性计算

HPC 高性能计算 生命科学 药物设计

我的远程办公经验 | 社区征文

坚果

初夏征文

力扣每日一练之数组中篇Day2

京与旧铺

6月月更

客户案例|观测云助力合思信息升级新一代可观测平台

观测云

8种桌面IDE CodeArts智能代码补全类型

华为云开发者联盟

云计算 代码 华为云

数商云X日本高化学,共同打造跨境化学品B2B平台新范式

数商云

数字化转型 b2b

2022华为全球校园AI算法精英大赛即将升级启航,等你来战,开拓未来边界

最新动态

毕业回馈!Apache Doris 社区所有贡献者来领礼品啦!

SelectDB

数据库 数据湖 开源项目 apache doris 社区活动

浅谈融云即时通讯服务「日志优化」

融云 RongCloud

flutter系列之:flutter中的builder

程序那些事

flutter 程序那些事 6月月更

稳住了,别抖!—— 看GetX 的Worker如何防抖

岛上码农

flutter ios 前端 安卓开发 6月月更

东方甄选双语直播火爆出圈,新东方转型初见端倪

易观分析

农业发展

LP流动性质押挖矿分红dapp系统开发合约定制

开发微hkkf5566

2021年4季度全国网络零售发展指数同比增长0.6%

易观分析

网络零售

前后端如何并行开发,云端mock了解一下

Liam

前端 前端开发 Mock Mock 服务 前端工具

链上智能合约Dapp系统开发部署搭建

薇電13242772558

区块链 智能合约

从华为WeAutomate数字机器人论坛,看政企领域的“政务新智理”

王吉伟频道

RPA 数字化转型 华为WeAutomate 政务新智理 数字政府

父亲节特辑丨童年经典蓝精灵之百变蓝爸爸数字藏品,限量发售!

百度开发者中心

多任务视频推荐方案,百度工程师实战经验分享

百度开发者中心

覆盖接入2w+交通监测设备,EMQ为深圳市打造交通全要素数字化新引擎

EMQ映云科技

物联网 IoT 智慧交通 实践案例 6月月更

喜讯!云效度量能力获信通院先进级评估

阿里云云效

云计算 阿里云 DevOps 研发效能 研发

2022淘宝天猫618背后的技术秘密

阿里巴巴大淘宝技术

异步容灾,AntDB的业务不间断数据恢复方案

亚信AntDB数据库

数据库 高可用 容灾 数据恢复

IPFS:替代HTTP的分布式网络协议_语言 & 开发_张天雷_InfoQ精选文章