MBA智库文档管理信息化管理电子商务阿里分布式数据库服务.pdf

阿里分布式数据库服务.pdf

下载

Paulmath

39页 | 1.54MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

2014中华架构师大会中华数据库行业协会阿里分布式数据库服务实践沈询中间件自我介绍 • 花名沈询 •  阿里分布式数据库DRDS，TDDL负责人 •  参与过阿里集团大部分的Oracle到MySQL 的迁移工作 •  在分布式存储领域经验比较丰富 Agenda •  DRDS 简介 •  DRDS 功能特性 •  DRDS 原理剖析 •  DRDS 实战 DRDS 简介 DRDS简介-起源 •  起源 –  DRDS 脱胎于 alibaba的cobra 分布式数据库引擎 •  06年上线使用 •  在alibaba有近百应用在使用，目前已经开源 •  DRDS的40%的代码出自cobra proxy –  Server协议层 –  Sql解析器 DRDS简介-起源 •  起源 –  DRDS吸收了taobao TDDL分布式数据库引擎的大量优秀经验和解决方案 •  08年上线使用 •  目前在使用的应用近千个 •  大量实际应用解决方案支持 –  分布式join –  分布式aggregation (group sum max min) –  异步索引构建 –  Auto sharding ,自动扩容缩容 DRDS简介-起源 •  从TDDL到DRDS –  DRDS专门针对外部用户进行了配置的重新设计 •  简化了配置操作规范与流程 •  尽可能使得应用像操作一个数据库一样的操作DRDS •  用户的专业化指导 –  场景广泛 •  互联网应用 •  企业内大数据应用 •  政务类应用 •  物联网应用 DRDS简介-应用场景 •  应用的业务需求单机已经无法满足 – 面对全中国13亿用户，以及全世界50亿的用户 – 单个数据库的最大实例也会出现瓶颈 •  容量瓶颈 •  事务数瓶颈 •  读取瓶颈 DRDS简介-应用场景 •  Scale out（多机水平扩展） – 使用廉价数据库阵列来满足用户需求--DRDS – 优势 •  更轻量的使用数据库，未来更换的成本小 •  一次重构，以后基本再无需担心系统瓶颈 – 劣势 •  重构迁移需要付出成本 •  分布式环境下一些查询会被限制不允许执行 •  完成相同功能需要比单机扩展付出更多成本 DRDS简介-应用场景 •  理想状态 –  Scale out 与scale up结合 •  让系统架构具备scale out的能力 •  尽可能提升单机利用率 – 但不要过早过度设计 0 1 2 单机垂直扩展成本多机水平扩展成本 DRDS简介-应用场景 •  何时应该选择Sharding方案？单机存储是否能满足未来1年的要求？使用PC server存储使用商业共享存储数据库共享存储是否能满足未来1年要求？兜儿里的钱够么？使用分布式存储(DRDS) 是否是是否否 DRDS 简介 DRDS功能介绍 •  分布式MySQL执行引擎 •  弹性扩展 •  小表异步广播 DRDS功能介绍-执行引擎 •  高兼容性 –  MySQL 的各类复杂查询 •  Join •  嵌套 •  函数 •  智能下推 – 减少网络传输 – 减少计算量 – 充分发挥下层存储的全部能力 DRDS功能介绍-执行引擎 •  智能下推 – 表A 分库分表3个 –  select avg(id) from A Merge avg（id) subQuery Q1:select count(id),sum(id) A_0 Q2:select count(id),sum(id) A_1 Q3:select count(id),sum(id) A_2 avg(id) Query sum(id),count (id) from A_0 Query sum(id),count (id) from A_1 Query sum(id),count (id) from A_2 •  智能下推 – 全表distinct groupby的执行计划 –  Select id from A order by id limit 1000,10 Merge distinct id , group by id subQuery Q1:select id from A_0 order by id limit 0,1010 Q2:select id from A_1 order by id limit 0,1010 Q2:select id from A_2 order by id limit 0,1010 Distinct id Order by id Query id from A_0 order by id limit 0,1010 Query id from A_1 order by id limit 0,1010 Query id from A_2 order by id limit 0,1010 DRDS功能介绍-执行引擎 •  自动扩容、缩容 DRDS功能介绍-弹性扩展新购 RDS 购买RDS实例加入DRDS 集群 DRDS 集群使用新机器 DRDS 集群新购 RDS 迁移数据新购 RDS DRDS 集群 DRDS功能介绍-小表异步广播 •  跨机JOIN – 优势： • 一致性 • 空间比较节省 – 劣势 • 网络消耗 • 延迟增加 DRDS功能介绍-小表异步广播 •  小表广播JOIN – 优势 •  性能高 •  延迟低 •  网络消耗小 – 劣势 •  最终一致性 •  小表更新量不能太巨大 DRDS 实践 DRDS 实践 •  分布式查询优化 •  事务的分布式优化 •  从单机存储到DRDS迁移流程 DRDS 实践-分布式查询优化 •  让请求可以水平扩展 – 原则1：选择的shardingKey要能够让所有存储节点均衡的负载读写请求 •  系统可以简单加机器来扩展 •  没有系统瓶颈 – 原则2：查询尽可能带上shardingKey •  将跨网络请求尽可能减少 •  减少并行查询时的机器消耗，从而节省成本 DRDS 实践-分布式查询优化 •  CASE1: – 应该选择哪个列作为切分条件？ •  按照买家ID的查询（买家查看自己买了哪些商品） bizOrderID buyerID sellerID content 0 0 1 床上用品 1 0 2 路上用品 2 0 3 销售路由器 3 0 4 中文书籍 4 0 5 电脑 5 1 0 ipad 6 2 0 笔记本 7 3 0 铅笔 8 4 0 桌面 DRDS 实践-分布式查询优化 •  CASE2: – 应该选择哪个列作为切分条件？ •  按照买家ID的查询（买家查看自己买了哪些商品） •  按照卖家ID的查询（卖家查看自己卖了哪些商品） Table_bid buyerID % 4 bizOrderID buyerID sellerID content 5 1 0 ipad bizOrderID buyerID sellerID content 0 0 1 床上用品 1 0 2 路上用品 2 0 3 销售路由器 3 0 4 中文书籍 4 0 5 电脑 8 4 0 桌面 bizOrderID buyerID sellerID content 6 2 0 笔记本 bizOrderID buyerID sellerID content 7 3 0 铅笔 DRDS 实践-分布式查询优化 •  异构复制 Table_bid buyerID % 4 Table_sid sellerID % 4 异构复制 bizOrderID buyerID sellerID content 5 1 0 ipad bizOrderID buyerID sellerID content 0 0 1 床上用品 1 0 2 路上用品 2 0 3 销售路由器 3 0 4 中文书籍 4 0 5 电脑 8 4 0 桌面 bizOrderID buyerID sellerID content 6 2 0 笔记本 bizOrderID buyerID sellerID content 7 3 0 铅笔 bizOrderID buyerID sellerID content 5 1 0 ipad 6 2 0 笔记本 7 3 0 铅笔 8 4 0 桌面 3 0 4 中文书籍 bizOrderID buyerID sellerID content 0 0 1 床上用品 4 0 5 电脑 bizOrderID buyerID sellerID content 1 0 2 路上用品 bizOrderID buyerID sellerID content 2 0 3 销售路由器 DRDS 实践-分布式查询优化 •  CASE3: – 卖家在商城销售的所有商品 bizOrderID buyerID sellerID type content 5 1 0 1 ipad bizOrderID buyerID sellerID type content 0 0 1 0 床上用品 1 0 2 1 路上用品 2 0 3 0 销售路由器 3 0 4 1 中文书籍 4 0 5 0 电脑 8 4 0 0 桌面 bizOrderID buyerID sellerID type content 6 2 0 0 笔记本 bizOrderID buyerID sellerID type content 7 3 0 1 铅笔 Table_bid buyerID % 4 type 平台名 0 商城 1 专卖店 DRDS 实践-分布式查询优化 •  小表异步广播 bizOrderID buyerID sellerID type content 5 1 0 1 ipad bizOrderID buyerID sellerID type content 0 0 1 0 床上用品 1 0 2 1 路上用品 2 0 3 0 销售路由器 3 0 4 1 中文书籍 4 0 5 0 电脑 8 4 0 0 桌面 bizOrderID buyerID sellerID type content 6 2 0 0 笔记本 bizOrderID buyerID sellerID type content 7 3 0 1 铅笔 Table_bid buyerID % 4 type 平台名 0 商城 1 专卖店 type 平台名 0 商城 1 专卖店 type 平台名 0 商城 1 专卖店 type 平台名 0 商城 1 专卖店 DRDS 实践-分布式查询优化 •  CASE4: – 应该选择哪个列作为切分条件？ •  最近1周内所有卖家销售的商品量？ bizOrderID buyerID sellerID content GMT_MODIFIED 0 0 1 床上用品 2014-09-01 1 0 2 路上用品 2014-09-01 2 0 3 销售路由器 2014-09-01 3 0 4 中文书籍 2014-09-01 4 0 5 电脑 2014-09-02 5 1 0 ipad 2014-09-02 6 2 0 笔记本 2014-09-04 7 3 0 铅笔 2014-09-03 8 4 0 桌面 2014-09-05 DRDS 实践-分布式查询优化 •  让请求可以水平扩展 – 原则1：选择的shardingKey要能够让所有存储节点均衡的负载读写请求 •  系统可以简单加机器来扩展 •  没有系统瓶颈 – 原则2：查询尽可能都带上shardingKey •  将跨网络请求尽可能减少 •  减少并行查询时的机器消耗，从而节省成本 DRDS 实践-事务的分布式优化 DRDS 实践-事务的分布式优化 DRDS 实践-事务的分布式优化 DRDS 实践-事务的分布式优化 DRDS 实践-事务的分布式优化 DRDS 实践-DRDS迁移流程 •  目标： – 保证业务线上正常运转 – 平滑过渡 – 减少运维 DRDS 实践-DRDS迁移流程 •  SETP1： –  读写在原来的单机数据库 –  数据通过“愚公数据迁移平台”写入云上DRDS •  SETP2： –  验证云上数据是否正确 –  验证云上DRDS是否能够很好的应对读流量压力 •  SETP3： –  夜间，停写几分钟 –  读写切换到DRDS –  数据通过“愚公数据迁移平台”写回到云下单机数据库小结小结

联系我们

智库文档公众号

客服微信

阿里分布式数据库服务.pdf

下载

标签

相关专题更多

联系我们

意见反馈

标签

相关专题 更多

联系我们

意见反馈

相关专题更多