古道长亭

Contact me with ixiaoqiang0011@gmail.com


  • 首页

  • 归档

  • 分类

  • 关于

  • Book

  • 搜索

数据分片剖析

时间: 2022-12-26   |   分类: mysql高级   sharding-sphere   | 字数: 4365 字 | 阅读约: 9分钟 | 阅读次数:

数据分片剖析

1. 核心概念

  • 表概念

    • 真实表: 数据库中真实存在的物理表

    • 逻辑表: 在分片之后,同一类表结构的名称(总成)。例如b_order。

    • 数据节点: 在分片之后,由数据源和数据表组成。例如ds0.b_order1

    • 绑定表

      指的是分片规则一致的关系表(主表、子表),例如b_order和b_order_item,均按照order_id分片,则此两个表互为绑定表关系。绑定表之间的多表关联查询不会出现笛卡尔积关联,可以提升关联查询效率。

      b_order:b_order0、b_order1 
      b_order_item:b_order_item0、b_order_item1 
      select * from b_order o join b_order_item i on(o.order_id=i.order_id) where o.order_id in (10,11);
      

      如果不配置绑定表关系,采用笛卡尔积关联,会生成4个SQL

      select * from b_order0 o join b_order_item0 i on(o.order_id=i.order_id) where o.order_id in (10,11); 
      select * from b_order0 o join b_order_item1 i on(o.order_id=i.order_id) where o.order_id in (10,11); 
      select * from b_order1 o join b_order_item0 i on(o.order_id=i.order_id) where o.order_id in (10,11); 
      select * from b_order1 o join b_order_item1 i on(o.order_id=i.order_id) where o.order_id in (10,11);
      
    • 广播表

      在使用中,有些表没必要做分片,例如字典表、省份信息等,因为他们数据量不大,而且这种表可能需要与海量数据的表进行关联查询。广播表会在不同的数据节点上进行存储,存储的表结构和数据完全相同。

  • 分片算法

    由于分片算法和业务实现紧密相关,因此并未提供内置分片算法,而是通过分片策略将各种场景提炼出来,提供更高层级的抽象,并提供接口让应用开发者自行实现分片算法。目前提供4种分片算法。

    • 精确分片算法PreciseShardingAlgorithm

      用于处理使用单一键作为分片键的=与IN进行分片的场景。

    • 范围分片算法RangeShardingAlgorithm

      用于处理使用单一键作为分片键的BETWEEN AND、>、<、>=、<=进行分片的场景。

    • 复合分片算法ComplexKeysShardingAlgorithm

      用于处理使用多键作为分片键进行分片的场景,多个分片键的逻辑较复杂,需要应用开发者自行处理其中的复杂度。

    • Hint分片算法HintShardingAlgorithm

      用于处理使用Hint行分片的场景。对于分片字段非SQL决定,而由其他外置条件决定的场景,可使用SQL Hint灵活的注入分片字段。例:内部系统,按照员工登录主键分库,而数据库中并无此字段。SQLHint支持通过JavaAPI和SQL注释两种方式使用。

  • 分片策略

    分片策略包含分片键和分片算法,真正可用于分片操作的是分片键+分片算法,也就是分片策略。目前提供5种分片策略。

    • 标准分片策略StandardShardingStrategy

      只支持单分片键,提供对SQL语句中的=,>,<,>=,<=,IN和BETWEEN AND的分片操作支持。提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法。

      PreciseShardingAlgorithm是必选的,RangeShardingAlgorithm是可选的。但是SQL中使用了范围操作,如果不配置RangeShardingAlgorithm会采用全库路由扫描,效率低。

    • 复合分片策略ComplexShardingStrategy

      支持多分片键。提供对SQL语句中的=,>,<,>=,<=,IN和BETWEEN AND的分片操作支持。由于多分片键之间的关系复杂,因此并未进行过多的封装,而是直接将分片键值组合以及分片操作符透传至分片算法,完全由应用开发者实现,提供最大的灵活度。

    • 行表达式分片策略InlineShardingStrategy

      只支持单分片键。使用Groovy的表达式,提供对SQL语句中的=和IN的分片操作支持,对于简单的分片算法,可以通过简单的配置使用,从而避免繁琐的Java代码开发。如:t_user_$->{u_id%8}表示t_user表根据u_id模8,而分成8张表,表名称为t_user_0到t_user_7。

    • Hint分片策略HintShardingStrategy

      通过Hint指定分片值而非从SQL中提取分片值的方式进行分片的策略。

    • 不分片策略NoneShardingStrategy

      不分片的策略。

  • 分片策略配置

    对于分片策略存有数据源分片策略和表分片策略两种维度,两种策略的API完全相同

    • 数据源分片策略

      用于配置数据被分配的目标数据源。

    • 表分片策略

      用于配置数据被分配的目标表,由于表存在与数据源内,所以表分片策略是依赖数据源分片策略结果的。

2. 流程剖析

ShardingSphere3个产品的数据分片功能主要流程是完全一致的,如下图所示。

  • SQL解析

    SQL解析分为词法解析和语法解析。先通过词法解析器将SQL拆分为一个个不可再分的单词。再使用语法解析器对SQL进行理解,并最终提炼出解析上下文。

    Sharding-JDBC采用不同的解析器对SQL进行解析,解析器类型如下:

    • MySQL解析器 默认
    • Oracle解析器
    • SQLServer解析器
    • PostgreSQL解析器
  • 查询优化

    负责合并和优化分片条件,如OR等。

  • SQL路由

    根据解析上下文匹配用户配置的分片策略,并生成路由路径。目前支持分片路由和广播路由。

  • SQL改写

    将SQL改写为在真实数据库中可以正确执行的语句。SQL改写分为正确性改写和优化改写。

  • SQL执行

    通过多线程执行器异步执行SQL。

  • 结果归并

    将多个执行结果集归并以便于通过统一的JDBC接口输出。结果归并包括流式归并、内存归并和使用装饰者模式的追加归并这几种方式。

3. sql使用规范

  • 支持项

    • 路由至单数据节点时,目前MySQL数据库100%全兼容,其他数据库完善中。

    • 路由至多数据节点时,全面支持DQL、DML、DDL、DCL、TCL。支持分页、去重、排序、分组、聚合、关联查询(不支持跨库关联)。以下用最为复杂的查询为例:

      SELECT select_expr [, select_expr ...] 
      FROM table_reference [, table_reference ...] 
      	[WHERE predicates] 
      [GROUP BY {col_name | position} [ASC | DESC], ...] 
      [ORDER BY {col_name | position} [ASC | DESC], ...] 
      [LIMIT {[offset,] row_count | row_count OFFSET offset}]
      
  • 不支持项

    不支持CASE WHEN、HAVING、UNION (ALL)

  • 支持分页子查询,但其他子查询有限支持,无论嵌套多少层,只能解析至第一个包含数据表的子查询,一旦在下层嵌套中再次找到包含数据表的子查询将直接抛出解析异常。

    如支持以下:

    SELECT COUNT(*) FROM (SELECT * FROM b_order o)
    

    不支持以下:

    SELECT COUNT(*) FROM (SELECT * FROM b_order o WHERE o.id IN (SELECT id FROM b_order WHERE status = ?))
    

    简单来说,通过子查询进行非功能需求,在大部分情况下是可以支持的。比如分页、统计总数等;而通过子查询实现业务查询当前并不能支持。

  • 由于归并的限制,子查询中包含聚合函数目前无法支持。

  • 不支持包含schema的SQL。因为ShardingSphere的理念是像使用一个数据源一样使用多数据源,因此对SQL的访问都是在同一个逻辑schema之上。

  • 当分片键处于运算表达式或函数中的SQL时,将采用全路由的形式获取结果。

    例如下面SQL,create_time为分片键:

    SELECT * FROM b_order WHERE to_date(create_time, 'yyyy-mm-dd') = '2020- 05-05';
    

    由于ShardingSphere只能通过SQL字面提取用于分片的值,因此当分片键处于运算表达式或函数中时,ShardingSphere无法提前获取分片键位于数据库中的值,从而无法计算出真正的分片值。

  • 不支持的sql示例

    -- VALUES语句不支持运算 表达式 
    INSERT INTO tbl_name (col1, col2, …) VALUES(1+2, ?, …)
    -- INSERT .. SELECT
    INSERT INTO tbl_name (col1, col2, …) SELECT col1, col2, … FROM tbl_name WHERE col3 = ? 
    -- HAVING 
    SELECT COUNT(col1) as count_alias FROM tbl_name GROUP BY col1 HAVING count_alias > ? 
    -- UNION 
    SELECT * FROM tbl_name1 UNION SELECT * FROM tbl_name2 
    -- UNION ALL 
    SELECT * FROM tbl_name1 UNION ALL SELECT * FROM tbl_name2 
    -- 包含schema
    SELECT * FROM ds.tbl_name1 
    -- 同时使用普通聚合函数 和DISTINCT
    SELECT SUM(DISTINCT col1), SUM(col1) FROM tbl_name 
    -- 会导致 全路由
    SELECT * FROM tbl_name WHERE to_date(create_time, ‘yyyy-mm-dd’) = ? 
    
  • 分页查询

    完全支持MySQL和Oracle的分页查询,SQLServer由于分页查询较为复杂,仅部分支持.

    • 性能瓶颈

      查询偏移量过大的分页会导致数据库获取数据性能低下,以MySQL为例

      SELECT * FROM b_order ORDER BY id LIMIT 1000000, 10
      

      这句SQL会使得MySQL在无法利用索引的情况下跳过1000000条记录后,再获取10条记录,其性能可想而知。 而在分库分表的情况下(假设分为2个库),为了保证数据的正确性,SQL会改写为:

      SELECT * FROM b_order ORDER BY id LIMIT 0, 1000010
      

      即将偏移量前的记录全部取出,并仅获取排序后的最后10条记录。这会在数据库本身就执行很慢的情况下,进一步加剧性能瓶颈。 因为原SQL仅需要传输10条记录至客户端,而改写之后的SQL则会传输1,000,010 * 2的记录至客户端。

    • ShardingSphere的优化

      ShardingSphere进行了以下2个方面的优化。

      • 首先,采用流式处理 + 归并排序的方式来避免内存的过量占用。

      • 其次,ShardingSphere对仅落至单节点的查询进行进一步优化。

    • 分页方案优化

      由于LIMIT并不能通过索引查询数据,因此如果可以保证ID的连续性,通过ID进行分页是比较好的解决方案

      SELECT * FROM b_order WHERE id > 1000000 AND id <= 1000010 ORDER BY id
      

      或通过记录上次查询结果的最后一条记录的ID进行下一页的查询:

      SELECT * FROM b_order WHERE id > 1000000 LIMIT 10
      

4. 其他功能

  • Inline行表达式

    InlineShardingStrategy:采用Inline行表达式进行分片的配置。

    Inline是可以简化数据节点和分片算法配置信息。主要是解决配置简化、配置一体化。

    • 语法格式:

      行表达式的使用非常直观,只需要在配置中使用${expression}或$->{expression}标识行表达式即可。例如:

      ${begin..end} 表示范围区间 
      ${[unit1, unit2, unit_x]} 表示枚举值
      

      行表达式中如果出现多个${}或$->{}表达式,整个表达式结果会将每个子表达式结果进行笛卡尔(积)组合。例如,以下行表达式:

      ${['online', 'offline']}_table${1..3} 
      $->{['online', 'offline']}_table$->{1..3}
      

      最终会解析为:

      online_table1, online_table2, online_table3, 
      offline_table1, offline_table2, offline_table3
      
    • 数据节点配置

      对于均匀分布的数据节点,如果数据结构如下:

      db0
      	├── b_order2 
      	└── b_order1 
      db1
      	├── b_order2 
      	└── b_order1
      

      用行表达式可以简化为:

      db${0..1}.b_order${1..2}
      或者
      db$->{0..1}.b_order$->{1..2}
      

      对于自定义的数据节点,如果数据结构如下:

      db0
      	├── b_order0 
      	└── b_order1 
      db1
      	├── b_order2 
      	├── b_order3 
      	└── b_order4
      

      用行表达式可以简化为:

      db0.b_order${0..1},db1.b_order${2..4}
      
    • 分片算法配置

      行表达式内部的表达式本质上是一段Groovy代码,可以根据分片键进行计算的方式,返回相应的真实数据源或真实表名称。

      ds${id % 10} 
      或者
      ds$->{id % 10}
      
  • 分布式主键

    ShardingSphere不仅提供了内置的分布式主键生成器,例如UUID、SNOWFLAKE,还抽离出分布式主键生成器的接口,方便用户自行实现自定义的自增主键生成器

    • 内置

      UUID, SNOWFLAKE

    • 自定义

      • 自定义主键类,实现ShardingKeyGenerator接口

      • 按SPI规范配置自定义主键类

        在ApacheShardingSphere中,很多功能实现类的加载方式是通过SPI注入的方式完成的。

        注意:在resources目录下新建META-INF文件夹,再新建services文件夹,然后新建文件的名字为org.apache.shardingsphere.spi.keygen.ShardingKeyGenerator,打开文件,复制自定义主键类全路径到文件中保存。

      • 自定义主键类应用配置

        #对应主键字段名 
        spring.shardingsphere.sharding.tables.t_book.key-generator.column=id 
        #对应主键类getType返回内容 
        spring.shardingsphere.sharding.tables.t_book.key- generator.type=LAGOUKEY
        

#mysql# #分库分表# #sharding-sphere#
QQ扫一扫交流

标题:数据分片剖析

作者:古道长亭

声明: 欢迎加群交流!

如有帮助,欢迎多多交流 ^_^

微信打赏

支付宝打赏

Tomcat 简单手写实现
Sharding Sphere 介绍
  • 文章目录
  • 站点概览
古道长亭

古道长亭

Always remember that your present situation is not your final destination. The best is yet to come.

226 日志
57 分类
104 标签
GitHub Gitee
友情链接
  • 古道长亭的BOOK
  • JAVA学习
标签云
  • Mysql
  • 搜索引擎
  • Mybatis
  • 容器
  • 架构
  • 消息队列
  • Flink
  • Sharding sphere
  • 流处理
  • 缓存
  • 1. 核心概念
  • 2. 流程剖析
  • 3. sql使用规范
  • 4. 其他功能
© 2019 - 2024 京ICP备19012088号-1
0%