srm5.0介绍 为虚拟平台上的应用打造一个可靠, 易用...
TRANSCRIPT
1
© 2010 VMware Inc. All rights reserved
Tao Zhou,R&D Manager,VMware, Inc.
2011年10月26日
SRM5.0介绍:为虚拟平台上的应用打造一个可靠,易用的灾难恢复系统
2
VMware对业务连续性的支持
3
vSphere对关键业务的支持
客户对运行在vSphere上的虚拟应用的可用性需求在持续提高
RTO需求从原来的>24小时下降到<12小时
38%
43%
53%
25% 25%
18%
% of Application Instances Running on VMware in Customer Base
MS
Exchange
MS
SQL
MS
SharePoint
Oracle
Middleware
Oracle
DBSAP
Source: VMware customer survey, Jan 2010 and April 2011 interim results,
Data: Total number of instances of that workload deployed in your organization and the percentage of those instances that are virtualized
2010
2011
42%
47%
67%
34%28% 28%
4
传统的BC方案的一些缺陷
Middleware /
Java
Oracle RAC
Oracle
DataGuard DB Mirroring
MS
ClusteringDB Access
Groups
CCR / SCR
App Server
Cluster
Session State
Replication
备份 数据复制
应用层面的高可用性解决方案形成竖五管理复杂而且成本高昂
数据保护服务:Longer RTOs and RPOs
5
Vmware在不同层面上对BC的支持
系统高可用
vSphere High Availability
vSphere Fault Tolerance
vMotion and Storage vMotion
数据保护
vSphere Data Recovery
Storage APIs for Data Protection
本地 跨站点
灾难恢复
vCenter Site Recovery Manager
Includes vSphere Replication
Newin 2011
Improved in 2011
Improved in 2011
Improved in 2011
6
降低成本与复杂度
Continuous
Hours
Days
RTO /
RPO
Cost Efficiency ($ per app)
$1,000
Minutes
$10,000$100,000 $100
MSCS
RAC
Replication
Backup
VMware business
continuity
(HA, FT, vMotion,
SRM, VDR)
Traditional
Solutions
7
简单,易用的灾难恢复系统Site Recovery Manager
8
vSphere为灾难恢复打下了良好的基础
灵活的架构
• 不需要主备站点的硬件具有相同的结构
• 主站点虚拟化后多余的设备可复用到备份站点
业务保护Simple Application Protection
• 整套系统—包括应用服务,操作系统,数据等等,都以虚机文件的形式存储起来
• 系统可以被数据保护工具来保护
低成本的架构
• 降低了对备份站点的硬件需求
• 备份站点的硬件可以运行非关键业务
业务封装
服务器整合
硬件无关
vSphere
vSphere vSphere
9
SRM提供了简单,可靠的灾难恢复
提供低成本复制
• 内置的vSphere Replication
• 支持第三方的存储备份方案
简化灾难恢复及故障移植管理
• 集中化的管理灾难恢复方案
• 设置一套灾难恢复方案只需要几分钟
故障恢复的流程自动化
• 提供不中断业务的测试
• 提供自动化的故障迁移
• 提供自动化的故障恢复
SRM为所有的应用提供了简单,可靠的灾难保护和站点间移植功能
VMware vSphere
VMware
vCenter Server
Site Recovery
Manager
VMware
vCenter Server
Site Recovery
Manager
VMware vSphere
Site A (Primary) Site B (Recovery)
Servers Servers
10
客户对SRM的评价
2008 Q2推出
> 5,000 客户
年增长率 ~50%
如果你所在的公司已经将业务移植到虚拟化平台上,那么,不采用SRM来做灾难恢复系统的管理员就是个大傻瓜。
― Jerry Wilkin
Senior Systems Administrator, Dayton Superior Corp
11
SRM5.0的新特性
Automated failback
Planned migration
扩大灾难恢复的覆盖范围扩展到非关键业务及更小的站点
事先规划好的系统移植(有利于灾难预防及系统维护 …)
vSphere Replication
Others
更精细化的控制力度,如VM的启动顺序等应用开发接口 IPv6支持
12
SRM 5.0的关键组件
vCenter ServerSite
Recovery Manager
Protected Site Recovery Site
Storage
vCenter ServerSite
Recovery Manager
vSpherevSphere
Storage
Replication Options
vSphere Replication
• Bundled with SRM
Storage-Based Replication (3rd party)
Site Recovery Manager 5
• 1 per site
vCenter Server 5
• 1 per site
• 标准版或基本版
vSphere 3.5, 4.x or 5
• 标准版,企业版或是增强企业版
13
SRM 支持多种形式的灾难恢复
Active-Passive
Failover
Active-Active
Failover
Bi-directional
Failover
Shared
Recovery Sites
Production
Recovery
Production
Recovery
Production
Production
•最普通,最传统的方案
•成本高且需要专门资源的支持
•支持备份系统的资源复用,节省成本
•可将其用于测试、开发、培训等非关键业务
•两个站点都运行生产系统
•两个站点互为备份
•多对一的故障保护
•适用于ROBO
14
灾难预防及系统维护
突然发生的站点故障
• 全站或部分系统故障
最关键但是最不常见的情形
• 站点的故障不会经常发生
• 一旦发生,需要快速恢复
可预测的潜在危险
• 例如:台风,洪水,强制疏散等等
启动故障预案,将业务平稳转移
• Planned migration 功能可以保证没有数据丢失
• Automated failback 功能保证平稳的恢复系统
最常见的用户使用情形
• 预先规划好的数据中心的维护
• 全局负载均衡
在站点之间的平稳迁移
• 不中断业务的测试
• 可以测试 partial failovers
• Planned migration 功能可以保证没有数据丢失
• Automated failback 保证双向的平稳迁移
Disaster Failover Disaster Avoidance Planned Migration
SRM的三个典型用户使用实例
15
Public Cloud – Shared Recovery Site
vSphere
Replication
vCenter 5Site Recovery Manager 5
vSphere 5 vSphere 5
Site Recovery Manager 5
DR在云中
Protected Site
16
低成本的业务复制扩大了DR的覆盖范围
17
因成本问题,DR的保护范围经常受到限制
Tier 1 Apps - Protected
Tier 2 / 3 Apps – Backup only
Corporate Datacenter
Small Sites – Backup only
Small BusinessRemote Office / Branch Office
DR的保护范围可以扩展到
• 数据中心里非关键性的应用
• 中小企业
• 远程办公室 / 分支机构
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
18
SRM提供了多样的备份方案
vSphere Replication
简单,低成本的备份方案,适用于非关键业务及中小型企业
Storage-based Replication
高效的备份方案,适用于关键业务
vCenter ServerSite
Recovery Manager
vSphere
vCenter ServerSite
Recovery Manager
vSphere
vSphere Replication
Storage-based replication
Site A (Primary) Site B (Recovery)
19
ESXi
Recovery SiteProtected Site
ESXESXESXi
VSR AgentvSphere
Replication Server
与SRM, vCenter 和ESX紧密结合
Site Recovery Manager
Site Recovery Manager
vSphere Replication Management Server
vSphere Replication Management Server
Any storage supported by
vSphere
Any storage supported by
vSphere
vCenter Server vCenter Server
vSphere Replication 的架构
20
vSphere Replication 与 Storage-Based Replication的比较
Replication
ProviderCost Management Performance
vSphere
ReplicationVMware
• Low-end storage supported
• No additional replication software
• VM’ granularity
• Managed directly in vCenter
• 15 min RPOs
• Scales to 500 VMs
• File-level consistency
• No automated failback, FT, linked clones, physical RDM
Storage-based
Replication
• Higher-end replicating storage
• Additional replication software
• LUN – VM layout
• Storage team coordination
• Synchronous replication
• High data volumes
• Application consistency possible
21
Storage Replication
将DR保护扩展到非关键应用和中小企业
Tier 1 Apps
Tier 2 / 3 Apps
Corporate Datacenter
Small Sites
Small BusinessRemote Office / Branch Office
vSphere Replication
vSphere Replication
vSphere
$1,000
$2,000$2,000/VM
Tier 1 Storage
Failover Site
Replication SW
SRM
Enterprise
$600/VM
Tier 2 Storage
Failover Site
SRM Standard
Storage, Replication, and SRM Costs per Protected VM
Storage ReplicationLarge site
vSphere ReplicationSmall site
22
vSphere Replication简化了备份管理
简介
优势
vSphere Replication 简化了备份管理
在vCenter中直接管理
可以针对单个VM进行管理
可以由vSphere管理员进行配置管理,不需要存储管理员的介入
不需要调整VM的存储位置去适应第三方的存储备份方案
Hub
LUN 1
LUN 2
VMFS A
Datastore Group
Web
SharePoint
SQL
App
vSphere Replication
Web
SharePoint
SQL
App
vSphere
AdminStorage Admin
vSphere
Admin
Storage-based Replication
Datastore
VMFS BDatastore
23
简单的恢复及迁移配置
24
简单的设置与管理恢复及及迁移方案
需要几周甚至几个月才能完成设置
易出错
当业务应用或系统架构发生改变以后,主从站点很容易变得不同步
几分钟就可以设置完成
步骤简单,不易出错
发生变化后很容易同步
…to Simple Recovery PlansFrom Complex Runbooks…
25
Step 2
Step 3
Step 4
Step 5
亓个简单的步骤
亓步配置恢复方案…
Step 1
将生产系统的资源映射到备份系统• Resource pools• vSwitches• VM folders
设定VM保护组
配置备份VM的启动顺序
配置备份VM的IP
配置备份系统中的低优先级VM
…不需要手工干涉
重新设置存储及复制流程• 停止复制• 恢复数据• 恢复应用
重新配置主机
重新配置物理网络
恢复整个系统,包括操作系统和应用
添加消息和定制脚本Optional
26
设置多重恢复方案
简介
优势
支持多重恢复方案的设置例如: 为每一个应用设置一个恢复方案
为整个数据中心设置一个恢复方案
恢复方案的最小单元是“保护组” 等同于在一个LUN/datastore上所有的VM
支持局部故障恢复和迁移
单个应用的迁移不影响整个系统
Recovery Plans
SQLWeb /
App
CAS Hub Mailbox
Recovery Plan 1
Datacenter
Recovery Plan 2
Exchange
Recovery Plan 3
SharePoint
27
全自动化的管理
28
SRM 通过经常性的测试降低业务恢复的风险
SRM provides assurance that DR objectives will be met.
Lack of confidence
in DR process
Time
DR Test DR Test
TESTING GAP
Recovery
Risk
传统的灾难恢复
Recovery
Risk
DR Test DR TestTime
Site Recovery Manager
Frequent
DR Testing
29
SRM支持非破坏性测试
简介
优势
自动执行
• 执行故障恢复计划
• 自由设置断点
• 输出测试记录
隔离的测试环境
• 支持快照
• 网络隔离
• 测试完成后可重新复位
使用户对自己定义的DR方案更有信心
迅速发现和修复隐藏问题
降低DR测试的成本与资源需求
• 不需要“周末维护”
非破坏性测试Recovery Site
Isolated test environment
LUN snapshot
vSphere
Replication
30
自动的灾难恢复流程
简介
优势
自动检测站点故障
需要用户手动启用故障迁移计划
自动恢复流程
停止复制
执行用户定义的恢复计划
保证快速及可预期的故障迁移
满足业务需求
降低用户介入的风险
Site BSite A
Replication
1 心跳失效后,发出警报
2 用户手动启用故障迁移计划
3
停止复制
4 恢复VMs
DR Failover
vSphere vSphere
31
测试和执行Recovery Plan
Steps in
recovery plan Status and time
stamps
When to execute
User
confirmation
message
32
预先设置的迁移计划
简介
优势
Recovery Plan 支持两种工作流程
DR failover
Planned migration
Planned migration 保证业务的一致性和数据的完整性
关闭生产系统上的VMs
将数据同步到备份站点
启动备份站点上的VMs
Better support for planned migrations
迁移过程不会出现数据丢失现象
保证业务的一致性
Planned Migration
Site BSite A
Replication
1 关闭生产系统上的VMs
2
同步数据
3 启动备份系统上的VMs
vSphere vSphere
33
简单的自动恢复流程
自动的复制管理
不需要重新设置新的恢复计划
简单、自动的双向复制,移植
Automated Failback To Streamline Bi-Directional Migrations
SiteB 到Site A的反向VM保护
反向复制
反向资源映射
从Site B到Site A的自动恢复
反向恢复计划
使用限制
Site A必须完全复原后才可执行
不适用于vSphere Replication
简介
优势
自动恢复
Site BSite A
Reverse
Replication
Reverse original recovery plan
vSphere vSphere
34
示例
35
A2
灾难恢复
SRM
SRM UI SRM UI
SRMVC
Protected Site Recovery Site
VMA VMB VMC
A1
a.vmx b.vmx c.vmx
Recovery
RP1
Replication
PG1
Storage Provider
VC
VMA VMB VMC
PG2
Placeholder
Datastore
a.vmx b.vmx c.vmx
Recovery
RP1
Replication
PG1
Storage Provider
PG2
Failo
ver(
RP
1)
Recover
(PG
1,
PG
2)
A2A1
a.vmx b.vmx c.vmx
PowerOn(A, B, C)
36
A2
预先规划好的迁移
SRM
SRM UI SRM UI
SRMVC
Protected Site Recovery Site
VMA VMB VMC
A1
a.vmx b.vmx c.vmx
Recovery
RP1
Replication
PG1
Storage Provider
VC
VMA VMB VMC
PG2
Placeholder
Datastore
a.vmx b.vmx c.vmx
Recovery
RP1
Replication
PG1
Storage Provider
PG2
Failo
ver(
RP
1)
Recover
(PG
1,
PG
2)
A2A1
a.vmx b.vmx c.vmx
PowerOn(A, B, C)
Onlin
eS
ync
(PG
1,
PG
2)
PowerOff(A,B,C)
Offlin
eS
ync
(PG
1,
PG
2)
© 2011 VMware Inc. All rights reserved
Thank You