Redis 笔记

本贴最后更新于 3018 天前,其中的信息可能已经事过景迁

数据结构

  • SortedSet zunionstore 方法可以对一个或者多个有序集合(sortedset)进行并集计算,如果目标集合是set,而不是sorted set,也可以进行合并
  • SortedSet zunionstore 方法,当目标存储集合已经存在时,会进行值的覆盖
  • Hash
    • 这种结构,其内容实现其实是一个HashMap,即key对应一个字符串,而value是使用HashMap实现的。如图

hashredis

    • 只需要通过key+field既可以获取到value值。redis是单线程模型,如果map中的数据过大,遍历需要很长时间的话,就会阻塞客户端其他对redis的操作,这点需要注意。
    • 另外,当hash成员数量较少时,其内部实现是使用类似一维数组的方式(ziplist)来紧凑存储,以节约内存空间,而当成员数量较大时,才会使用hashmap的方式存储。
  • key
    • 必须是一个字符串类型,不能包含边界字符,比如包括空格和换行\n等是被认为非法的,也不能包括redis协议中认定的特殊字符,如\r\n
    • 推荐key的写法是object-type:id:field,同时key不能太长,明显占内存
  • List 内部实现是使用一个双向链表,方便正向和反向进行查找
  • Set
    • 内部实现也是一个HashMap,只是HashMap的value值永远为null
    • set是不会有重复元素的,就是根据计算value的hash值进行快速排重
    • set是无序的,不过可以通过sort命令进行二次排序,而且可以参照第三方的进行排序
  • SortedSet
    • 内部使用HashMap和SkipList实现,skiplist用来存储value,其特点是查找快,节约存储空间。HashMap中存储的是value和score的映射关系
    • 自动排序,即放入其中后,根据score值自动排序,当你需要一个有序且不重复的集合的时候考虑使用sortedset

性能

  • SortedSet 性能取决于其中存储的元素个数

性能

持久化

  • 定时快照方式(snapshot)
    • 内部使用一个定时器,定期检查数据发生的改变次数和时间是否满足配置的持久化触发条件,如果满足就由操作系统fork一个子进程来执行持久化操作,即子进程就可以遍历整个内存空间进行存储,而此时父进程仍然提供正常的服务
    • 该方案的缺点是,存储的定时快照只是一段时间内的内存映像,重启后,上次快照存储后到重启这段时间内的内存数据会丢失
    • 每次做快照方式存储数据时,都会将整个内存数据重新保存一次,而不是增量存储
  • 基于语句追加文件的方式(aof)
    • 即append of file 方式,将每次使redis数据发生变化的语句都会被追加到一个log文件中,这个log文件即是持久化的数据
    • 缺点是数据量大的时侯,log文件体积过大,从而重启时,加载数据进入内存会非常缓慢,几十G的数据需要几个小时,因为每个命令都要执行一遍,另外,每个命令都要写log,redis读写性能也会下降
  • 虚拟内存(vm) — 放弃
  • disk store  — 实践中
  • 在持久化方案中,磁盘IO带来的问题
    • 当使用的物理内存将要达到上限时,会发生redis崩溃的现象,这种情况原因是在读写持久化文件时会将该文件加载到内存中,从而内存中就会有2份重复的数据,导致操作系统让你的进程进行swap操作,此时开始不稳定甚至崩溃(现在已经有maxmemory-policy选项了)
    • 经验是 redis使用的物理内存达到内存总容量的3/5时就比较危险了

事务

  • 提供事务支持,可以保证一串命令操作的原子性,中间不会被其他命令打断,其实质是开启事务后(multi),所有操作命令会放在一个队列中,然后一起执行,保证执行过程中不会被其他命令打断
  • 当这一串命令中某个命令发生错误时,事务终止,同时已经执行的命令不能进行回滚
  • watch命令可以监视某个key,在调用watch命令后到exec执行,这段时间内如果这个key的值发生了变化,那么整个事务就会失败(乐观锁)
  • 在事务中,2个操作存在依赖关系,就要注意了,不能让一个写操作依赖一个读操作,因为事务中的操作并没有立即执行,在事务将操作命令加入队列过程中,有可能其他的客户端会操作这个key,也就是这个key并没有做任何的同步,所以我们需要使用watch来监视此key
  • 关于事务的应用请参考这篇文章

适用场景

  • 朋友最近活动
  • leader board 排行榜功能,在线游戏时,可以随时获取新的排行数据,通过ZRANG
  • 猜测可能认识的人,结合使用ZRANK和ZRANGE方法,可以查出与指定对象相似的对象出来
  • 关注数与被关注数
  • 计数:最近用户在页面间停顿时间不超过60秒的页面浏览量
  • 作为索引数据存储的结构,score存储为数值,value为对象id,使用ZRANGEBYSCORE检索一个确切的范围

用作缓存

  • 2种方式可以把redis当做缓存来使用
    • 给每个键设置一个固定的过期时间,但是这样内存也需要额外的空间来存储这些过期时间
    • 通过设置内存使用上限和指定内存策略算法
maxmemory 2mb
maxmemory-policy allkeys-lru
  • 相比使用额外内存空间存储多个键的过期时间,使用缓存设置是一种更加有效利用内存的方式。而且相比每个键固定的 过期时间,使用LRU也是一种更加推荐的方式,因为这样能使应用的热数据(更频繁使用的键) 在内存中停留时间更久。
  • 基本上这么配置下的Redis可以当成memcached使用。当我们把Redis当成缓存来使用的时候,如果应用程序同时也需要把Redis当成存储系统来使用,那么强烈建议 使用两个Redis实例。一个是缓存,使用上述方法进行配置,另一个是存储,根据应用的持久化需求进行配置,并且 只存储那些不需要被缓存的数据。 

Master Slave复制

  • 一个master可以有多个slave,而一个slave也可以连接其他的slave,形成图状结构
  • master在与slave进行通信时,是可以继续处理客户端请求的;而slave在与master进行通信时,就会阻塞客户端的请求
  • 主从复制的场景,用于提高系统的伸缩性,即让slave负责读取操作,master负责写操作;或者也可以仅仅让slave作为冗余存储
  • 主从复制主要是分为2个步骤,第一个是同步数据,从master中把snapshot发送给slave,第二个是命令传播,master中的写操作都会传递给slave
  • 没有增量复制功能,只是用snapshot重建slave内存结构,新浪微薄版本的redis已经实现了增量复制功能
  • 每次slave重连master,master都会把shapshot重新发送给slave,重建内存数据结构(使用2.8版本+以上的psync命令,可以实现增量复制)
  • 可以通过主动复制来避免redis自身主从复制的缺点,既从客户端对存储的数据进行双写或者多写,数据的多份复制机制,可以避免单点失效故障
  • 这种主动复制功能的缺陷就是如何保证多个节点数据的一致性?需要引入一致性算法,但是这样也会降低写性能
  • 如果有多个slave发来同步命令,master后台只会启动一个进程来写snapshot,然后发送给所有的slave
  • 关于主从复制实现的详细步骤,可以参考黄健宏的视频ppt
  • master最好不要写snapshot,数据量大时会阻塞主线程运行

可扩展集群

  • 100g的业务数据量,假设服务器内存是50g,那么根据磁盘io问题考虑,需要3-4台服务器存储
  • 当数据量达到这个级别时就需要考虑动态在线扩容的问题了
  • 拆分过程(presharding方案)
    • 在新机器上启动好对应端口的Redis实例
    • 配置新端口为待迁移端口的从库
    • 待复制完成,与主库完成同步后,切换所有客户端配置到新的从库的端口
    • 配置从库为新的主库
    • 移除老的端口实例
    • 重复上述过程迁移好所有的端口到指定服务器上

使用总结

  • 根据业务需要选择合适的数据结构,为不同的使用场景设定不同的紧凑型存储参数
  • 当业务场景不需要进行数据持久化时,关闭所有的持久化参数,以获得最大的性能和内存使用量
  • 需要使用持久化时,根据业务特性,是否容忍数据丢失,从而选择aof或者snapshot方式中的一种,不要使用vm和diskstore
  • 不要使得redis实际内存使用量达到最大物理内存的3/5
  • 基于实际项目的一些建议
  • 持久化方案首选AOF方式

改进思路

  • 可以做到按照AOF文件大小自动分割滚动
  • 实际项目可以采取与Mysql结合的方式,即mysql作为主库,Redis作为高速查询从库的异构读写分离的方案

redismysql

客户端、二次开发相关

  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    286 引用 • 248 回帖 • 62 关注
  • slave
    2 引用 • 2 回帖
  • 持久化
    3 引用 • 8 回帖

相关帖子

2 回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • relyn

    不错支持

  • 其他回帖
  • someone

    谢谢

推荐标签 标签

  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 8 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 552 关注
  • abitmean

    有点意思就行了

    29 关注
  • 导航

    各种网址链接、内容导航。

    40 引用 • 173 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 167 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    83 引用 • 37 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 618 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 477 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 724 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 114 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 51 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 607 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3453 回帖 • 203 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 463 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 672 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 3 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 71 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 633 关注
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 681 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖