美团数据库运维平台介绍
@曾经的阿飞
大纲
自动化运维平台
慢查询系统
备份系统
统计分析报表
Percona使用经验
自动化运维平台
自助DDL
授权申请
慢查询系统
DBA Weekly Report
CPU IO 慢查询 监控
历史Processlist查询
历史Innodb Status查询
元信息
DBManager
工具
报表
开发报表
废弃表 废弃索引 冗余索引
容量管理
3
自助DDL
任务类型
直接执行
备份
Drop
使用OSC变更
Too big
并发
执行
create
alter、drop
drop
alter
delay
pt-online-schema-change
New Data
Old
Data
New Table
触发器
Insert ignore into newtable
select from oldtable where pk between ()
lock in share mode
踩的一些坑
MDL锁:长时间运行的事务
添加唯一索引,丢数据:replace into
主从表结构异构:create new table
变更时间非常长
较差从库延迟
Thread_running一直超过阈值
慢查询
慢查询
pt-query-digest
Box Anemometer
MySQL
Slow Log
Pt-query-digest
MySQL
Anemometer
MySQL
Slow Log
Pt-query-digest
MySQL
Slow Log
Pt-query-digest
备份系统
Xtrabackup
自动扩容
坑
bug,已经修复
备份session:flush tables with read lock
sql thread:waiting for commit lock
备份session : Show slave status死锁
自动化运维平台
自助DDL
授权申请
慢查询系统
DBA Weekly Report
CPU IO 慢查询 监控
历史Processlist查询
历史Innodb Status查询
元信息
DBManager
工具
报表
开发报表
废弃表 废弃索引 冗余索引
容量管理
16
DBA Weekly Report
慢查询TOP10
磁盘消耗速度TOP10
Innodb_pages_read TOP10
Innodb_row_lock_time TOP10
监控被disable的主机
自增ID溢出检测
开发的DB Weekly Report
包含内容
持续一周不在访问表
持续一周不在使用的索引
冗余的索引
实现方式
percona user stat
pt-duplicate-key-checker
历史processlist查询
历史的show engine innodb status查询
容量管理
美团
很多人对美团的印象还停留在团购网站的阶段
O2O平台,包含了很多的业务线,而且各个业务线都以火箭般的增长速度在增长,包括团购、外卖、电影、酒店等
22
容量管理
Benchmark
Tcpcopy
挖掘历史数据估算节假日峰值
监控数据:max(avg(15m))
Percona使用经验
Percona Server
User Statistics
Response Time Distrub
Thread pool
innodb_deadlocks
max_binlog_files
Percona Toolkit
pt-query-digest
pt-kill
pt-online-schema-change
pt-duplicate-key-checker
因为时间的缘故,我这里就详细展开了
24
User Statistics
set global userstat=on
Response Time Distrub
have_response_time_distribution
query_reponse_time_range_base
pt-query-digest
pt-query-digest --order-by="Bytes_sent:sum"
pt-query-digest --processlist -h=xxx --iterations=1 --run-time=2s
tcpdump -s 65535 -x -nn -q -tttt -i any -c 50000 port 3306 >
pt-query-digest --type tcpdump
谢谢大家!
招聘:DBA/自动化运维开发
微博@曾经的阿飞
中国MySQL用户组