一、云服务器容灾服务(CSDR)技术问题
1.1 V3异构接管友商存储后,能部署云服务器容灾服务吗?
不支持。异构接管的存储LUN不是openstack存储管理模块cinder所创建,无法针对这个LUN进行复制等命令的触发。云服务器容灾中的主、从LUN都是通过cinder调用创建的。
在华为云Stack场景下:
ManageOne SC:提供云数据中心解决方案所有服务的服务目录,以及用户、项目管理等运营功能;提供容灾基础资源的创建,包括租户容灾虚拟机,容灾VPC的创建,以及容灾管理员角色的申请、创建。
IaaS+云服务:包括ECS、EVS、VPC等基础计算、存储、网络服务,是云数据中心解决方案的必备组件。每个云服务的Console独立部署,并注册到MangeOne
SC及公共的框架中,实现服务的跳转和统一纳管。申请云服务器容灾所需的基础计算、存储、网络资源创建由每个云服务独立提供。包括容灾占位云服务器,容灾端VPC、网络业务的创建,以及容灾管理员角色的申请、创建等;
CSDR Console安装到公共框架中,向租户提供云服务器容灾服务实例的增删改查、资源管理界面;提供容灾测试、清理操作。
BCManager提供容灾管理员的操作界面,提供保护组的计划性迁移、重保护、故障切换操作。
1.3 当前方案可否实现云服务器容灾服务的自动化发放?
2. 云服务器容灾服务实例的容灾计划性迁移/回迁、容灾故障切换/回迁,由管理员登录eReplication执行一键式切换操作。这是由于企业私有云场景下,保护组的切换、演练、回切对业务有影响,通常由管理员演练、切换规划,统一实施操作。
1.4 云服务器容灾支持哪个层面的复制技术?
云服务器容灾服务,只支持存储层面的阵列远程复制技术。不支持主机层和应用层的容灾。
1.5 原有的大LUN部署的局点,如何做云服务器容灾?
当前方案仅支持基于小LUN部署的云服务器容灾服务,不支持大LUN环境。当前只能提供割接的思路进行切换。即新建一套小LUN环境,然后通过手工完成数据、服务的迁移或重新申请,因此还需要逐项目因地制宜的进行分析。
1.6 如果在主、备中心部署完全独立的region,使用独立的ManageOne、IAM后追加CSDR服务是否可以实现?
不可以,CSDR只能在一朵云下的多个Region之间容灾,要求生产和灾备的资源在同一个ManageOne管理之下,并且对接共享的IAM,具有相同的用户权限。多朵独立的云管理、鉴权数据没有同步,无法创建CSDR容灾保护。
已完成部署生产region的场景下部署CSDR服务有标准方案支持,首先需要在生产region新增CSDR服务,容灾站点和生产站点网络三层打通后,部署容灾region的同时勾选CSDR服务,此时容灾region会同生产region进行关联并建立容灾关系。
1.8 云服务器容灾是否必须跨越两个Region?同一个Reigon内的两个AZ是否可以实现?
云服务器容灾容灾只能在两个Region间部署、配置。当前版本不支持在Region内的两个AZ间配置云服务器容灾。在项目中,如果客户需要Region内的两个AZ间配置容灾,建议客户采用云服务器高可用服务。
1.9 云服务器容灾容灾方案中,哪些管理系统节点需要主备部署?
Global层组件,其管理范围为全局多region,因此需要跨异地主备部署,包括:
Region层组件,其管理范围为单个Region,因此只需要在Region内部署,不需要跨异地主备部署,包括:
1.10 云服务器容灾容灾方案中,管理系统节点的主备容灾与业务云服务器的主备容灾是什么关系?
指在生产中心故障后,如果CSDR要将服务实例中的云服务器切换到灾备中心,所必须具备的强依赖组件。当强依赖的组件切换之后再执行CSDR的云服务器故障切换。云服务器故障切换完成后,租户可以通过业务平面直接登录容灾VM。因此本方案,这些组件必须先完成主备容灾切换
指的生产中心故障后,如果租户需要登录SC、云服务器容灾服务、其他任何云服务界面,进行增删改查等运营操作;或由管理员登录OC,进行运维操作所依赖的组件。
如果需要在云服务器完成故障切换后,继续执行这些运营、运维功能,或登录其他云服务,则这些组件需要完成主备容灾切换。否则可不必切换。
|
租户登录任何IaaS+服务、CSDR服务界面进行增删改查,均需要SC提供服务目录界面;云服务的配额、计量等功能,同样依赖SC的服务模块。
管理员查询任何IaaS+服务、CSDR服务的告警、日志等运维功能,均需要登录OC
|
公共服务组件(LVS、Ngnix)
|
租户登录访问服务Console时提供负载均衡,提高访问效率。
|
租户登录任何IaaS+服务进行增删改查的运营功能,均需要各个云服务的前端Console组件完成主备容灾切换。
|
云服务器容灾服务的前端Console
|
租户登录CSDR服务进行增删改查的运营功能,需要CSDR服务的前端Console组件完成主备容灾切换。
|
所以主站点发生故障,从快速恢复的角度出发,整个华为云Stack切换的流程如下:
目前6.5版本已经支持一键式容灾切换,无需手工操作。
1.11 容灾云服务器可否与生产云服务器IP地址相同?
容灾云服务器由用户创建,租户可自由选择接入租户自己创建的VPC和VPC内的subnet网段,接入方式与生产云服务器配置过程无差别。生产和容灾region可以在VPC内创建相同网段的Subnet,生产云服务器、容灾云服务器分别接入生产VPC、容灾VPC时,容灾云服务器可选择与生产云服务器网段相同的subnet接入,从而保证生产云服务器和容灾云服务器的内网IP相同。
支持部署。部署CSDR的两个region,主推网络类型相同的场景。由于历史版本原因,个别局点可能存在新增region网络类型不同的场景,由于CSDR服务和网络是解耦的,若有CSDR容灾需求,可以部署。
CSDR服务的N:1容灾是一个多数据中心容灾解决方案,适用于客户有三个或三个以上数据中心需要进行容灾的场景。CSDR
N:1容灾首先需要在生产region和容灾region之间建立CSDR容灾关系,实现互为容灾。其他region采用新增region的方式由生产region已有的Manageone纳管,可以选择同生产或容灾region建立单向CSDR关系。容灾形式可以参考下图。
1、按照标准方案在生产站点A和容灾站点B建立主备容灾关系。
2、部署第三方备站点C,部署时在FCD界面中选择从region,FCD会完成从region部署。
3、需要手工配置容灾关系。
注意上述部署顺序不能颠倒或互换。
2、 生产站点管理面主Manageone发生故障时,可通过一键式将灾备站点备Manageone拉起,完成对三个或多个region的接管。
4、 Global管理组件依然为一主一备容灾方式,不支持一主多备等其他方式。
在管理面容灾标准方案中,需要将生产region管理面数据通过FTP协议备份到灾备端FTP服务器,当生产region发生灾难导致异常时,可以通过FTP服务器上的管理面备份数据,将管理面恢复到灾备端,保证管理面正常运行。
6.5版本后可以做到CSDR管理面一键式切换,只需要在Manageone运维面中依次点击“系统管理>备份恢复>数据恢复>管理面容灾故障恢复”,确认后启动灾备端管理面恢复。灾备端管理面恢复过程持续时间约45分钟,完成以后Manageone运维面/运营面IP地址等会发生变化,修改客户端DNS后可以正常登陆。
切换后,灾备端管理面数据需要重新启用FTP备份,以便下次切换。更多详细切换步骤请参考support网站中《华为云Stack 6.5.x 容灾管理指南》。
1.17 CSDR是否可以叠加其他灾备高级云服务?
当前6.5.1版本HCS具备的灾备服务为:CSHA/CSDR/VHA/CSBS/VBS,CSDR不能与CSHA同时部署,可以和VHA、CSBS/VBS同时部署。其中CSDR+VHA是6.5版本主推的本地存储双活加异地容灾解决方案,可以实现对同一个ECS实现本地存储双活,同时部署异地容灾,实现对数据的三重保护。
CSDR服务没有强制要求生产站点和容灾站点的型号和版本号保持一致,允许不同型号的存储如V3/V5建立容灾关系。不同型号存储建立容灾关系需要遵循存储之间的配套关系,具体请查阅对应存储类型相关配套表。
当前已基于现网项目输出CSDR最佳实践,可供现网局点参考,详见》和》。
1.20 CSDR场景下是否支持双站点同时部署业务,双向复制?
CSDR场景下生产和容灾站点为两个独立的region,可以同时发虚拟机,对外提供业务。租户可以选择对生产或容灾的某些虚拟机使用CSDR保护,支持双向容灾恢复;
1.21 云服务器容灾带宽如何估算?
云服务器容灾容灾的带宽计算主要是基于云服务器上的应用系统的带宽要求,云服务器操作系统需要计算首次初始同步的带宽要求。
1)存储同步远程复制,建议采用FC链路互联。
带宽计算方式(举例):
某应用的峰值写带宽为10MB/s,平均写带宽为200KB/s,平均写IO大小为4KB(私有信息的开销约为11%,带宽利用率为70%)。
某应用的峰值写带宽为10MB/s,平均写带宽为200KB/s,平均写IO大小为4KB(私有信息的开销约为11%,带宽利用率为70%)。
采用IP组网,且设置为异步复制模式(可忽略私有信息的开销),则要求:网络带宽 >= 200*8/ = 2.23Mbps。
二、 云硬盘高可用(VHA)技术问题
云平台可以有友商存储,但不支持给源自友商存储的虚拟机和卷做VHA保护。VHA特性当前支持的华为存储为OceanStor V3/V5/Dorado V3,存储的版本信息请查看对应的兼容性列表。
2.2 V3异构接管友商存储后,能做VHA容灾服务吗?
不支持。异构接管的存储LUN不是openstack存储管理模块cinder下发给华为存储而创建的,无法针对这个LUN下发配置存储双活等命令。
2.3 VHA特性支持两个数据中心拉远部署吗?
不支持。VHA特性是为单数据中心AZ内虚拟机的各卷提供存储双活保护的,为存储层双活保护方案,并非双活数据中心方案,而双活数据中心方案需从管理面、网络、应用层端到端考虑。
2.4 部署华为云Stack后,起先没有VHA特性,后期是否可以平滑演进到支持VHA特性呢?对于不支持VHA特性的老版本,是否支持此演进呢?
对于华为云Stack 6.3及以后版本,VHA特性支持从无到有的平滑演进,请参考具体的操作指导书。除了购买用于改造的双活存储设备外,还需保障如下组件和license配置,若当前不满足,则需新增配置:
2、 存储仲裁需要的iSCSI卡需额外配置,存储仲裁OS及部署需要的资源(管理节点)。
4、 需预留网络资源(存储数据网络及管理网络)给新接入的存储,以及双活链路,仲裁链路等占用的网络端口。
对前期已申请在用的ECS、EVS也需追加配置VHA保护的,有技术限制。主要限制有如下几点:
1、 EVS已完成挂载,ECS的所有系统卷和数据卷均源自同一套存储,且该存储在后期会配置本地存储双活,并基于此升级改造支持VHA容灾服务。对于不满足该要求的ECS、EVS,需要先迁移到满足要求的存储上。
2、 ECS、EVS所在的存储SLA,在注册配置时,需填写存储SN信息。若前期注册时未配置存储SN信息。需在ServiceOM配置界面上追加配置该信息。操作方法如下:a)使用管理员账户密码登陆ServiceOM管理界面。b)依次进入:“首页” à “云硬盘” à “磁盘类型”操作页面,选择需要配置的存储SLA,在“操作”栏中,点击“修改”按钮。c)在弹出页面的“存储标识”栏,填入正确的存储SN号,并点击“保存”按钮。
2、 对于现网的KVM小LUN老版本,要求必须支持升级到华为云Stack6.3及以后版本,不支持版本升级的则不支持演进。升级到华为云Stack6.3及以后版本后,可参考前文的描述演进支持VHA特性。
3、 特殊场景说明:个别特殊老版本局点,可能存在不注册存储SLA的情况。如此在申请ECS、EVS时,存储SLA为空,创建出来的系统卷和数据卷没有存储SLA信息。此种情况则需追加存储SLA信息,请在做版本升级前联系研发获取处理方法。
支持,HCDeploy工具支持部署一套VHA,若要在相同AZ中新增存储并使用VHA服务,需要手工对接存储,并进行双活配置。
不支持,VHA是本地存储高可用的简称,单台存储故障时,上层操作系统和应用不感知。FusionStorage是分布式存储,数据存储于以服务器本地盘构建的存储池,当个别物理机故障时,不会影响FusionStorage继续使用。因此,FusionStorage本身已经具备存储高可用的能力,不需要也不会支持VHA。