设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 数据 手机
当前位置: 首页 > 大数据 > 正文

【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系(4)

发布时间:2021-03-16 10:47 所属栏目:125 来源:网络整理
导读:这是总体的流程图。刚才提到配置是支持Docker,大数据kit和数据传输系统提交的是Clotho,Clotho去仓库里铺到registry。如果你的Clotho集群越来越大,Docker仓库会成为性能瓶颈,解决这个问题我们引入了registry,原

【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系


这是总体的流程图。刚才提到配置是支持Docker,大数据kit和数据传输系统提交的是Clotho,Clotho去仓库里铺到registry。如果你的Clotho集群越来越大,Docker仓库会成为性能瓶颈,解决这个问题我们引入了registry,原理很简单,两次原子操作,解决负载均衡的问题。


【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系

???

这是我们Clotho2.0框架图,与现在的YARN系统结合在一起。

???

向客户端提交一个兆,客户端通过调度把兆分配给管理者,启动是app master,启动docker,dockerContainer,主要功能,客户端与app master一致。app master检查版本,获取日志,获取周期,docker container提交Hadoop,我们与环境无关的隔离的Hadoop集群。


因此我们引入了YARN,


第一,支持HA。

第二,指定label调度。

???

【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系

总结一下我们主要的功能, Docker Daemon监控Container的状态。

???

Clotho Master。

???

检查image版本。

???

启动Docker Container。

?

【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系

??

对于2.0一些优点其实可以看到:


第一,与Dockek和YARN的开发,对于用户而言接入或使用的成本是相对比较低的。

???

第二,它有一个很重要的问题,集群的环境对用户是透明,数据分析师不需要关心他的环境部署问题,他的环境的版本更新问题,如果我的集群进行升级或者调整,对于数据分析师不需要关心这个事情。

??

第三,形成了统一的提交集群。用户不需要单独申请自己的提交机,我们只需要去统一集群上提交自己的job就可以了。

???

第四,我们支持label调度,资源利用率是非常高的,所有的集群所有机器都可以去机动任务一个Dockecontainer。

???

极大的降低运维成本,上线后故障率基本为0。

???

【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系

我们的TODO:


第一,希望做的是长服务。像MYSQL数据库希望通过方案希望长服务支持系统里面。这种情况下能够比较好做到长服务,像MySQL的环境隔离,减少部署代价。

???

第二,Registry服务器方案需要改进。不支持Docker生存状态的展示,我们希望跟开源框架结合到一起,可以更好的监控和Docker registry仓库的情况。

???

第三,OM-Killer导致重复job。后续要做的工作动态调整内内存阈值,尽最大可能减少OM-Kille发生。

???

第四,我们与Docker Container Executeor的结合。最大限度的去挖掘我们集群的价值。

???

这是我今天分享的内容,谢谢大家。


◆ ?◆ ?◆

About 互联网技术联盟 ITA1024


互联网技术联盟(ITA1024)是由京东、美团点评、小米、滴滴、携程、网易、搜狐、乐视、当当、途牛、饿了么、58、猎豹等TOP100的互联网服务和七牛、青云、听云、DaoCloud、UCloud、有云等技术服务联合发起的国内最大的企业间技术交流组织,专注于互联网+技术与创新。

联盟精心组织的1024系列技术峰会,由每周一期的线上万人课堂和每月一次的技术大会组成。每月一个技术主题,由联盟成员企业推荐的国内一流技术专家联手打造,分享如何通过一线技术应用案例和最佳实践,支撑和驱动业务成长。

联盟还通过官方网站(www.ita1024.com),官方微信公众(ita1024k),ITA1024技术月刊等多种形式,将精品技术内容精准推送给细分领域专业人群。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读