• ADADADADAD

    如何高效的在Mysql百万级数据量级下迁移到Redis[ mysql数据库 ]

    mysql数据库 时间:2024-11-28 13:02:22

    作者:文/会员上传

    简介:

    redis协议学习协议的格式为:*<参数数量> \r\n$<参数 1 的字节数量> \r\n<参数 1 的数据> \r\n...$<参数 N 的字节数量> \r\n<参数 N 的数据> \r\n比如:插入一条hash类型的数据

    以下为本文的正文内容,内容仅供参考!本站为公益性网站,复制本文以及下载DOC文档全部免费。

    redis协议学习

    协议的格式为:

    *<参数数量> \r\n
    $<参数 1 的字节数量> \r\n
    <参数 1 的数据> \r\n
    ...
    $<参数 N 的字节数量> \r\n
    <参数 N 的数据> \r\n

    比如:插入一条hash类型的数据。

    HSETidbook1book_description1

    根据Redis协议,总共有4个部分,所以开头为*4,其余内容解释如下:

    内容长度协议命令HSET4$4id2$2book15$5book_description117$17

    注意一下:HSET命令本身也作为协议的其中一个参数来发送。

    构造出来的协议数据结构:

    *4\r\n$4\r\nHSET\r\n$2\r\nid\r\n$5\r\nbook1\r\n$17\r\nbook_description1\r\n

    格式化一下:

    *4\r\n
    $4\r\n
    HSET\r\n
    $2\r\n
    idvvvv\r\n
    $5\r\n
    book1\r\n
    $17\r\n
    book_description1\r\n

    RESP协议 bulk

    Redis客户机使用一种称为RESP (Redis序列化协议)的协议与Redis服务器通信。

    redis-cli pipe模式需要和nc命令一样快,并且解决了nc命令不知道何时命令结束的问题。

    在发送数据的同时,它同样会去读取响应,尝试去解析。

    一旦输入流中没有读取到更多的数据之后,它就会发送一个特殊的20比特的echo命令,标识最后一个命令已经发送完毕如果在响应结果中匹配到这个相同数据后,说明本次批量发送是成功的。

    使用这个技巧,我们不需要解析发送给服务器的协议来了解我们发送了多少命令,只需要解析应答即可。

    在解析应答时,redis会对解析的应答进行一个计数,在最后能够告诉用户大量插入会话向服务器传输的命令的数量。也就是上面我们使用pipe模式实际操作的响应结果。

    将输入数据源换成mysql

    上面的例子中,我们以一个txt文本为输入数据源,使用了pipe模式导入数据。

    基于上述协议的学习和理解,我们只需要将mysql中的数据按照既定的协议通过pipe模式导入Redis即可。

    实际案例--从Mysql导入百万级数据到Redis

    首先造数据

    由于环境限制,所以这里没有用真实数据来实现导入,那么我们就先使用一个存储过程来造一百万条数据把。使用存储过程如下:

    DELIMITER $$
    USE `cb_mon`$$

    DROP PROCEDURE IF EXISTS `test_insert`$$
    CREATE DEFINER=`root`@`%` PROCEDURE `test_insert`()
    BEGIN

    DECLARE i INT DEFAULT 1;
    WHILE i<= 1000000
    DO
    INSERT INTO t_book(id,number,NAME,descrition)
    VALUES (i, CONCAT("00000",i) , CONCAT('book',i)
    , CONCAT('book_description',i));
    SET i=i+1;
    END WHILE ;
    COMMIT;
    END$$

    DELIMITER ;

    调用存储过程:

    CALLtest_insert();

    查看表数据:

    按协议构造查询语句

    按照上述redis协议,我们使用如下sql来构造协议数据

    SELECT
    CONCAT(
    "*4\r\n",
    "$",
    LENGTH(redis_cmd),
    "\r\n",
    redis_cmd,
    "\r\n",
    "$",
    LENGTH(redis_key),
    "\r\n",
    redis_key,
    "\r\n",
    "$",
    LENGTH(hkey),
    "\r\n",
    hkey,
    "\r\n",
    "$",
    LENGTH(hval),
    "\r\n",
    hval,
    "\r"
    )
    FROM
    (SELECT
    "HSET" AS redis_cmd,
    id AS redis_key,
    NAME AS hkey,
    descrition AS hval
    FROM
    cb_mon.t_book
    ) AS t limit 1000000

    并将内容保存至redis.sql 文件中。

    编写脚本使用pipe模式导入redis

    编写shell脚本。由于我在主机上是通过docker安装的redis和mysql,以下脚本供参考:

    #!/bin/bash
    starttime=`date +'%Y-%m-%d %H:%M:%S'`

    docker exec -i 899fe01d4dbc mysql --default-character-set=utf8
    --skip-column-names --raw < ./redis.sql
    | docker exec -i 4c90ef506acd redis-cli --pipe

    endtime=`date +'%Y-%m-%d %H:%M:%S'`
    start_seconds=$(date --date="$starttime" +%s);
    end_seconds=$(date --date="$endtime" +%s);

    echo "脚本执行耗时: "$((end_seconds-start_seconds))"s"

    执行截图:

    可以看到百万级的数据导入redis,只花费了7秒,效率非常高。

    注意事项

    如果mysql表特别大,可以考虑分批导入,或者将表拆分,否则在导入过程中可能会发生

    lostconnectiontomysqlserverduringquery

    由于max_allowed_packed和超时时间限制,查询数据的过程中,可能会造成连接断开,所以在数据表的数据量特别大的时候,需要分页或者将表拆分导入。

    小结

      redis单线程执行命令,避免了线程切换所消耗的时间,但是在超大数据量级下,其发送、响应接收的时延不可忽视。

      网络nc命令的应用场景,及在数据导入时存在的缺点。

      redis RESP协议的理解和应用。

      百万量级Mysql数据的Redis快速导入案例。

    如何高效的在Mysql百万级数据量级下迁移到Redis.docx

    将本文的Word文档下载到电脑

    推荐度:

    下载
    热门标签: mysqlredis