阿里云里面弹性怎么设置触发条件?

简介:弹性伸缩作为Kubernetes的核心能力之一,但它一直是围绕这无状态的应用负载展开。而Fluid提供了分布式缓存的弹性伸缩能力,可以灵活扩充和收缩数据缓存。 它基于Runtime提供了缓存空间、现有缓存比例等性能指标, 结合自身对于Runtime资源的扩缩容能力,提供数据缓存按需伸缩能力。

随着越来越多的大数据和AI等数据密集应用开始部署和运行在Kubernetes环境下,数据密集型应用计算框架的设计理念和云原生灵活的应用编排的分歧,导致了数据访问和计算瓶颈。云原生数据编排引擎Fluid通过数据集的抽象,利用分布式缓存技术,结合调度器,为应用提供了数据访问加速的能力。

弹性伸缩作为Kubernetes的核心能力之一,但它一直是围绕这无状态的应用负载展开。而Fluid提供了分布式缓存的弹性伸缩能力,可以灵活扩充和收缩数据缓存。 它基于Runtime提供了缓存空间、现有缓存比例等性能指标, 结合自身对于Runtime资源的扩缩容能力,提供数据缓存按需伸缩能力。

这个能力对于互联网场景下大数据应用非常重要,由于多数的大数据应用都是通过端到端流水线来实现的。而这个流水线包含以下几个步骤:

  1. 数据提取,利用Spark,MapReduce等大数据技术对于原始数据进行预处理
  2. 模型训练,利用第一阶段生成特征数据进行机器学习模型训练,并且生成相应的模型
  3. 模型评估,通过测试集或者验证集对于第二阶段生成模型进行评估和测试
  4. 模型推理,第三阶段验证后的模型最终推送到线上为业务提供推理服务

可以看到端到端的流水线会包含多种不同类型的计算任务,针对每一个计算任务,实践中会有合适的专业系统来处理(TensorFlow,PyTorch,Spark, Presto);但是这些系统彼此独立,通常要借助外部文件系统来实现把数据从一个阶段传递到下一个阶段。但是频繁的使用文件系统实现数据交换,会带来大量的 I/O 开销,经常会成为整个工作流的瓶颈。

而Fluid对于这个场景非常适合,用户可以创建一个Dataset对象,这个对象有能力将数据分散缓存到Kubernetes计算节点中,作为数据交换的介质,这样避免了数据的远程写入和读取,提升了数据使用的效率。但是这里的问题是临时数据缓存的资源预估和预留。由于在数据生产消费之前,精确的数据量预估是比较难满足,过高的预估会导致资源预留浪费,过低的预估会导致数据写入失败可能性增高。还是按需扩缩容对于使用者更加友好。我们希望能够达成类似page cache的使用效果,对于最终用户来说这一层是透明的但是它带来的缓存加速效果是实实在在的。

我们通过自定义HPA机制,通过Fluid引入了缓存弹性伸缩能力。弹性伸缩的条件是当已有缓存数据量达到一定比例时,就会触发弹性扩容,扩容缓存空间。例如将触发条件设置为缓存空间占比超过75%,此时总的缓存空间为10G,当数据已经占满到8G缓存空间的时候,就会触发扩容机制。

下面我们通过一个例子帮助您体验Fluid的自动扩缩容能力。

8.查看这个Dataset是否处于可用状态, 可以看到该数据集的数据总量为2.71GiB, 目前Fluid提供的缓存节点数为1,可以提供的最大缓存能力为1GiB。此时数据量是无法满足全量数据缓存的需求。

首先,我们解读一下从样例配置,这里主要有两部分一个是扩缩容的规则,另一个是扩缩容的灵敏度:

  • 策略: 可以K8s 1.18以上的版本,可以分别针对扩容和缩容场景设置稳定时间和一次扩缩容步长比例。比如在本例子, 一次扩容周期为10分钟(periodSeconds),扩容时新增2个副本数,当然这也不可以超过 maxReplicas 的限制;而完成一次扩容后, 冷却时间(stabilizationWindowSeconds)为20分钟; 而缩容策略可以选择直接关闭。

11.查看HPA配置, 当前缓存空间的数据占比为0。远远低于触发扩容的条件

12.创建数据预热任务

13.此时可以发现缓存的数据量接近了Fluid可以提供的缓存能力(1GiB)同时触发了弹性伸缩的条件

从HPA的监控,可以看到Alluxio Runtime的扩容已经开始, 可以发现扩容的步长为2

14.在等待一段时间之后发现数据集的缓存空间由1GiB提升到了3GiB,数据缓存已经接近完成

Fluid提供了结合Prometheous,Kubernetes HPA和Custom Metrics能力,根据占用缓存空间的比例触发自动弹性伸缩的能力,实现缓存能力的按需使用。这样能够帮助用户更加灵活的使用通过分布式缓存提升数据访问加速能力,后续我们会提供定时扩缩的能力,为扩缩容提供更强的确定性。

Fluid的代码仓库: , 欢迎大家关注、贡献代码和star。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
}

您好,目前考勤打卡支持设置弹性时间,可设置为:允许晚到晚走、早到早走;晚到、早走几分钟不记录为异常;下班晚走,第二天可晚到。管理员设置路径如下:【手机钉钉】-【工作台】-【考勤打卡】-【设置】-【更多 ...

您好,弹性考勤是指上下班时间不再固定为一个时间点,而是在一段时间内都允许上下班的一种人性化考勤。钉钉有三种弹性考勤方式满足不同企业的需要:1、允许晚到晚走,早到早走:这种方式是指确保固定的工作时长下, ...

您好,请问您想问的是不是:考勤打卡时定位不准怎么办?正常打卡为什么没有记录? ...

您好,请问你想了解的是不是:考勤机如何购买?考勤机如何安装?考勤机如何使用考勤机权限考勤机使用常见问题若以上无法解决你的问题,请用简洁的文字提问哦。 ...

您好,钉钉官方应用中还没有考勤确认单;建议企业管理员在钉钉应用中心搜索第三方应用【考勤确认】并开通使用,该应用支持考勤确认单功能。路径:【手机端钉钉/电脑端钉钉】-【工作台】-右上角【应用中心】-【搜 ...

您好,弹性考勤打开后,严重迟到和旷工迟到设置仍会生效,但会根据弹性设置从弹性后的最晚上班时间开始计算。例如,如果您的正常上班时间是9点,弹性后的最晚打卡时间是10点,严重迟到时间设置为30分钟,那么1 ...

您好,弹性打卡中不同的设置方式对请假和调休的影响也不同,以【OA后台】中的【班次设置】为例分别说明如下:1、若管理员勾选了【允许晚到晚走、早到早走】,则下班时间会参照上班时间动态变化。该规则会同步影响 ...

您好,弹性打卡中不同的设置方式对加班的影响也不同,以【OA后台】中的【班次设置】为例分别说明如下:1、管理员勾选【允许晚到晚走、早到早退】后,应下班时间会根据上班打卡时间动态变化。如果您提前上班了1小 ...

}

我要回帖

更多关于 阿里云弹性伸缩和LBS之间的关系 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信