MBA智库文档行业 IT互联网 IT 从Borg到Kubernetes，PaaS产品设计.ppt

从Borg到Kubernetes，PaaS产品设计.ppt

下载

Ppfoo

30页 | 1.49MB | 1次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

从Borg到Kubernetes PaaS产品设计探讨钟成.难易@ 2. Kubernetes的不同之处和发展方向 1. Borg解决了什么问题？ 3.未来的云需要什么？目录 CONTENTS PATR 1 Borg 解决了什么问题？？ What is Borg？ ——We are the Borg. Lower your shields and surrender your ships. We will add your biological and technological distinctiveness to our own. Your culture will adapt to service us. Resistance is futile. What is Borg？ The cluster management system we internally call Borg admits, schedules, starts, restarts, and monitors the full range of applications that Google runs. Work Flow 用户使用Borgcfg或者Web UI提交需要跑的应用（Task）：例如一个跑100个副本的web服务，或一个批处理任务 Borgmaster接受这个请求，放入队列内 Scheduler扫描队列，查看这个应用的资源需求，在集群中寻找匹配的机器 Borgmaster通知Borglet，在相应机器上启动应用提交应用 → 应用启动 25秒 Schedule Policy 实际使用资源(actual) 保留资源(reservation) 回收资源( reclamation) 限制资源(limit) Machine task 在task启动300s后，进行资源回收工作，逐渐把保留资源设置为实际使用资源+安全红线资源，并每过几秒再重新计计算一次。所以图中的红线是随着时间而波动的。 Schedule Policy prod task 永不停止，面向用户（Gmail，Google Search，Google Docs）几微秒到几百毫秒短期性能波动敏感 non-prod task 批处理任务，不面向用户（Map Reduce）几秒到几天短期性能波动不敏感 Schedule Policy 使用限制资源计算prod task的可用性 prod task可以抢占non-prod task的资源，从而导致non-prod task被杀死而重调度 prod task不能互相抢占资源而驱逐对方 Machine prod task non-prod task prod prod prod 20%的工作负载跑在回收资源上 Effect 即使Borgmaster或Borglet挂了，task继续运行 %可用性 10k 机器/Cell 10k task/分钟 99% UI < 1s 95% borglet poll < 10s Utilization == Money 如何去定义一个异构集群的效率？把多个用户、prod和non-prod的task混合会提升还是降低效率？资源回收和调度策略怎么样才是最佳的？如何划分资源粒度？ Cell是越大越好吗？ Utilization 压缩率，给定一个负载，部署到可以运行这个负载的最小Cell里面去 prod和non-prod task混合运行，会降低3%-20%的CPU速度，但会节省20%-50%的机器 task请求的资源粒度小(核,byte计数内存)能提升压缩率详见论文《Google使用Borg进行大规模集群的管理》 Benefits 隐藏资源管理和故障处理细节，使用户可以专注于应用开发本身提供高可靠性和高可用性的操作，并支持应用程序做到高可靠高可用在数以万计的机器上高资源利用率运行 PATR 2 Kubernetes的不同之处和方向 Architecture replication controller scheduler kubectl etcd Web UI master kubelet kube proxy Pod container Pod container node api server node node node fire wall 用户通过kubectl提交需要运行的docker container(pod) api server把请求存储在etcd里面 scheduler扫描，分配机器 kubelet找到自己需要跑的container，在本机上运行用户提交RC描述，replication controller监视集群中的容器并保持数量用户提交service描述文件，由kube proxy负责具体的工作流量转发 Internet Difference Borg Kubernetes 在Google的数以百万计的集群上运行超过十年使用lxc容器 C++编写对集群调度性能要求非常苛刻单集群能调度超过上万台机器开始有提交记录，发展较快使用Docker容器 Go语言编写目前还没有做很多性能优化目前单集群只支持几百台机器 Workload Borg Kubernetes 静态编译，包括可执行程序和数据文件接受SIGTERM信号，用于清理保存状态被kill之后能够在其他机器上重启，无状态一般内置http服务，用于获取健康信息数据和日志一般都存储在分布式存储上 Docker容器，自带干粮支持挂载外部的各种持久层(GCEPersistentDisk, AWSElasticBlockStore, NFS, iSCSI…..) 从容器中读取监控信息，从多个层面检查应用性能支持在Pod中包含日志处理容器应用在设计期就是分布式的假定容器能在其他机器上重启，但实际上还需应用做一定改造 Workload Borg Kubernetes 静态编译，包括可执行程序和数据文件接受SIGTERM信号，用于清理保存状态被kill之后能够在其他机器上重启，无状态一般内置http服务，用于获取健康信息数据和日志一般都存储在分布式存储上 Docker容器，自带干粮支持挂载外部的各种持久层(GCEPersistentDisk, AWSElasticBlockStore, NFS, iSCSI…..) 从容器中读取监控信息，从多个层面检查应用性能支持在Pod中包含日志处理容器应用在设计期就是分布式的假定容器能在其他机器上重启，但实际上还需应用做一定改造 Design 机器/IP vs Pod/IP 允许应用自由选择端口，不必考虑冲突保证外部的其他的服务发现/命名也不用操心端口 Jobs分组 vs Selector/Label分组提供更灵活的组合搭配对资深用户优化 vs 对初级用户友好 Borg有230个多参数 Kubernetes Special 插件化 rc, scheduler,persist volume… 用户可以按照plugin接口自定义实现，扩展功能容器化 api server, scheduler, controller, etcd, cadvisor, flannel… kubelet不会被容器化支持多种I层部署和适配 GCE, Vagrant, Microsoft Azure, CoreOS, vSphere, Amazon Web Service… SaltStack部署支持 Summary Borg Kubernetes Future 多租户支持(namespace) 容器持久化提升集群规模，100->1k，模拟器并行共享资源调度(Omega)，提升利用率容器网络层优化，proxy->内核多集群管理单集群跨I层调度 Relate Work @Huawei CentOS baremetal的部署脚本 Heapster standalone 文档和bug提交 Ubuntu k8s升级脚本和文档 Heapster kafka sink Heapster elasticsearch sink Bugfix, cmd….. PATR 3 未来的云需要什么？ Technology Lifecycle IBM PC Linux/Unix C/Java JavaScript PHP Windows Git Cobol Dephi EJB OS/360 Multics DOS Minix Perl Microkernel ………… Kubernetes/Docker Fail of Tower of Babel Technology Lifecycle 三十幅共一毂，当其无，有车之用。埏埴以为器，当其无，有器之用。凿户牖以为室，当其无，有室之用。故有之以为利，无之以为用。 The Long March Gain or Loss？产品是否能减少语言、程序、框架不同带来的复杂性？产品是否能减少设计、编码、测试、部署流程中带来的复杂性？产品是否能减少大规模集群、网络、服务依赖、错误追踪带来的复杂性？下次再见 Make Life Simpler ！

联系我们

智库文档公众号

客服微信

从Borg到Kubernetes，PaaS产品设计.ppt

下载

标签

相关专题更多

联系我们

意见反馈

标签

相关专题 更多

联系我们

意见反馈

相关专题更多