说实话,真的别不信,80%的中小团队在业务初期都会犯这个懒——单节点Redis性能撑住了就觉得万事大吉,根本没考虑可用性,直到出了事才拍大腿。今天这篇2026年最新的服务器Redis集群搭建教程,就是为了帮入行1-3年的新手运维和补位的后端开发解决这个痛点,用的是中小团队最常用的三主三从Redis Cluster模式,成本不高、性能足够、自动故障转移快,能切实提升业务缓存的可用性。
先给你们理一理我这边用的测试环境,你们直接对应自己的业务调整就行:三台2核4G的云服务器CentOS Stream 9系统,每台分别装一主一从,都用16379(主)和16380(从)端口,避免和可能存在的单节点Redis冲突。首先得确保三台服务器之间的网络是通的,防火墙也得提前打开相关端口,别像之前教另一个实习生那样,防火墙规则漏写跨节点的16379-16380和总线端口16379+10000=26379,26380,集群创建命令敲了半天全是“CLUSTERDOWN Hash slot not served”的报错,查日志查了快一小时才找到问题。这里一定要敲黑板,新手很容易漏总线端口!
接下来就是每台服务器都要下载安装2026年稳定版的Redis——现在Redis官方稳定版已经到Redis 8.0了吧?我个人 中小团队用稳定版的前两个小版本,比如现在用Redis 8.0.2就行,太新的版本可能有小bug,太老的版本功能又不全。安装命令很简单,直接用yum源或者编译安装都可以,我习惯用编译安装,更可控。编译安装完成后,别着急启动,先修改配置文件。三台服务器的配置文件要统一改几个核心参数,比如把bind改成0.0.0.0或者三台服务器的内网IP,把protected-mode改成no(生产环境记得后续通过防火墙和密码双重保护,别一直开着no),把cluster-enabled改成yes,把cluster-config-file改成一个自己能记住的名字,比如nodes_16379.conf和nodes_16380.conf,把appendonly改成yes开启AOF持久化,最后加上masterauth和requireauth,密码要一致,别又是实习生犯的错,主从密码不一样,同步直接失败。配置文件改好后,就可以分别启动两台Redis实例了,启动命令就是redis-server加上配置文件的路径。

所有实例都启动成功后,就可以用Redis Cluster的创建命令了。创建命令要用到redis-cli工具,记得加上cluster-replicas 1参数,意思是每个主节点配一个从节点。命令敲完后,系统会自动分配哈希槽,大概需要10秒左右,然后会问你是否接受分配方案,输入yes就行。分配成功后,可以用redis-cli -c -p 16379 cluster nodes命令检查一下集群状态,看看每个节点的角色是不是对的,哈希槽是不是都覆盖了,从节点是不是都成功连接到主节点了。如果没问题,那集群就基本搭建好了。
搭建好之后,别直接就把业务流量切过来,记得先做个压力测试和故障转移测试。压力测试可以用redis-benchmark工具,看看集群的性能是不是符合业务需求;故障转移测试更重要,可以直接kill掉其中一个主节点的进程,然后用cluster nodes命令检查一下是不是对应的从节点自动升为主节点了,业务流量有没有自动切换过去,等原来的主节点恢复后,是不是自动变成了新主节点的从节点。如果这两项测试都通过了,那再慢慢把业务流量切过来,别一次性切全量,万一还有问题可以及时回滚。
还有几个新手专属的避坑提醒想跟你们说一下。第一个是哈希槽的问题,别自己手动修改哈希槽的分配,很容易导致哈希槽冲突;第二个是密码的问题,主从节点和总线端口的密码都必须一致,而且生产环境一定要定期更换密码;第三个是扩容缩容的问题,扩容缩容的时候记得用官方推荐的redis-cli cluster工具,别自己手动操作。
你们在运维工作中有没有遇到过类似的Redis集群踩坑经历?欢迎在评论区分享你的排查经验。

评论列表 (0条):
加载更多评论 Loading...