Redis除了提供了强大的5种数据结构外,还提供了慢查询分析、Redis Shell、Pipeline、事务与Lua脚本、Bitmaps、HyperLogLog、发布订阅、GEO等附加功能。本章节主要说Pipeline。
Pipeline 概念
Redis提供了批量操作命令(如mget、mset等),有效地节约RTT(Round Trip Time,往返时间)。但大部分命令是不支持批量操作的,如要执行n次hgetall命令,并没有mhgetall命令存在,需要消耗n次RTT。
Pipeline机制能改善n次RTT问题,它能将一组Redis命令进行组装,通过一次RTT传输给Redis,再将这组Redis命令的执行结果按顺序返回给客户端。而且RTT在不同网络环境下会有不同,如同机房和同机器会比较快,跨机房跨区域会比较慢。Redis命令真正执行的时间通常在微秒级别,所以才会有Redis性能瓶颈是网络这样的说法。
redis-cli的--pipe选项实际上就是使用Pipeline机制,例如下面操作将set hello world和incr counter两条命令组装:
echo '*3\r\n$3\r\nSET\r\n$5\r\nhello\r\n$5\r\nworld\r\n*2\r\n$4\r\nincr\r\n$7\r\ncounter\r\n' | ./redis-cli --pipe
# *3 表示有3个命令
# \r\n 换行回车
# $3 表示set字符长度为3,也就是我们的命令
# $5 表示hello长度为5,也就是我们的key
# $5 表示world长度为5,也就是我们的value
# 不同的字符直接 需要用换行隔开
最佳实践
Pipeline虽然好用,但是每次Pipeline组装的命令个数不能没有节制,否则一次组装Pipeline数据量过大,一方面会增加客户端的等待时间,另一方面会造成一定的网络阻塞,可以将一次包含大量命令的Pipeline拆分成多次较小的Pipeline来完成。Pipeline只能操作一个Redis实例,但是即使在分布式Redis场景中,也可以作为批量操作的重要优化手段,具体细节会在后面的缓存设计中说明。