oracle 白皮书 · 云)就是这样一种公有云实现。oracle 云以软件即服务 (saas)...

29
Oracle 白皮书 2013 1 Enterprise Manager 12cOracle 云之神经中枢

Upload: others

Post on 05-Sep-2020

22 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

Oracle 白皮书

2013 年 1 月

Enterprise Manager 12c:Oracle 云之神经中枢

Page 2: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

Enterprise Manager 12c:Oracle 云之神经中枢

执行概要 .................................................................................................. 1

Oracle 云:迎合企业生态系统的需要 .............................................. 2

管理 Oracle 云 ......................................................................................... 4

管理和监视 ............................................................................................... 6

Java 云服务控制台(自助式管理).................................................. 8

基础架构性能和可用性监视 .............................................................. 9

服务信息板和事件管理 ................................................................... 13

支持控制台 ..................................................................................... 14

Oracle 云运营生命周期管理 .................................................................. 16

总结 ........................................................................................................ 18

附录 ........................................................................................................ 20

云中的空间管理 .............................................................................. 20

云服务合规性规则 .......................................................................... 22

EM 蕴涵的云运营责任 .................................................................... 23

Page 3: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

Enterprise Manager 12c:Oracle 云之神经中枢

1

执行概要

云计算是信息技术与服务交付领域的一个重大进步。由于云计算能够以自助、动态伸缩、可计量的方

式提供对共享计算资源池的按需访问,因此它在成本、速度和效率方面具有无与伦比的优势。

传统部署需要将应用程序绑定到特定的基础架构。这不仅导致利用率和效率低下,而且还造成灵活性

不足。云所具备的能力使应用程序能够在运行时动态部署到合适的基础架构。云计算的这种弹性使

得应用程序无需传统的打补丁或升级即可按需伸缩和扩展。

IT 部门和基础架构提供商正承受着日益沉重的压力 — 企业要求他们以尽可能最低的成本提供计算基

础架构。为此,他们可以利用公有云中的资源池化、虚拟化、动态供应、公用计算和商用计算等理念,

或者创建能满足这些要求的私有云。但是,由于担心安全性、合规性、服务质量 (QoS) 控制和长期成

本,许多客户倾向于构建内部私有云。私有云让内部 IT 提供者和应用程序开发团队能够更有力地控制数

据安全性以符合他们的治理合规要求。另一方面,越来越多的公有云提供商正在设法构建通用的云基

础架构以支持他们的客户。不过,随着技术的日臻成熟以及这些顾虑的消除,我们会看到更多的客

户将采用混合云模式,该模式能够通过最合适的混合战略来同时利用私有云和公有云。

Oracle 允许客户选择在公有云或内部私有云中部署自己的应用程序。Oracle 云(以前称为 Oracle 公有

云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多

种服务。 HCM 和 CRM 是主要的 SaaS 服务,而 Java 和数据库则作为平台服务来提供。云管理既复杂又

具有多面性,它涉及数万个 IT 资产上的五花八门的流程,需要为可能数以千计的租户提供服务。管理这

类云要达到的主要目标是:经济高效地为租户提供不间断的灵活服务,从而确保提供较高的服务水平。

本白皮书介绍如何使用 Oracle 的旗舰系统管理产品 Enterprise Manager 12c 为 Oracle 云提供 24x7 全天候

的管理。这里所述的架构和原则适用于使用 Oracle 技术构建的任何私有云或公有云。

Page 4: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

Enterprise Manager 12c:Oracle 云之神经中枢

2

Oracle 云:迎合企业生态系统的需要

为什么云对企业很重要?云如何支持企业应用程序?图 1 显示了云战略如何通过提供额外的部署选择

来实现业务敏捷性和灵活的成本结构,而使自身适合并支持企业生态系统。

云计算已成为企业最重要的一个新计算战略。新技术与流程的相互结合,已让挖掘计算能力并向最终

用户提供计算能力的方式方法发生了重大变革。这预示着企业将能够以更低的成本提供应用程序。

成功的云采用需要企业在以下方案中做出正确的选择:

• 用于构建软件即服务 (SaaS)、平台即服务 (PaaS) 和基础架构即服务 (IaaS) 的广泛、全面和集

成的产品系列。

• 用于构建云管理层以提供自动化、安全性和可靠性的云产品系列。

• 用于支持业务需求和简化部署模式间迁移的各种部署选择。

• 对可帮助企业以适合业务需要的步伐逐步采用云计算的解决方案的支持。 客户在希望以何种速

度、何种程度迁移到云环境方面差异很大。云管理面临的挑战是,如何有效地支持客户以适合业

务需要的步伐发展转变为云。

企业采用云计算时,需要制定与自身业务驱动因素相吻合的发展规划,并明确当前和未来提供 IT 服

务的能力。在云解决方案组合中,应确定各种云服务和管理功能及其轻重缓急。ITSO Oracle 从业者

指南“实用云采用方法”定义了一种云采用方法,并且描述了“云候选项目选择工具 (CCST)”,在规划过程

中可以参考这些内容。

图 1 定义了一个云解决方案组合,该组合展现出以下特征:

• 用来支持核心业务流程和业务运营的各种业务应用程序。例如销售、营销、财务、人力资本管

理和供应链管理。

• 用来开发和运行自定义流程、应用程序和集成组件的平台和框架。

• 用来支持业务的服务质量要求的可靠、高度可用的基础架构组件。

• 用来支持构建时和运行时云管理操作的功能,包括业务管理、运营管理、模型管理、编排、供

应、安全和策略管理。

Page 5: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

Enterprise Manager 12c:Oracle 云之神经中枢

3

• 在部署和设计方面的架构选择。部署选择应包括内部部署模式和外部部署模式。设计选择涵盖了

同类最佳的基础架构、优化的最佳实践解决方案以及集成设计系统。

图 1 — 云解决方案组合

Oracle 云的架构设计旨在满足以下功能性特征和运营性特征:

• 数以千计的并发自助服务用户

• 数万个租户,2500 万用户

• 几十万个服务实例

• 50 万到 100 万个基础架构目标

• 每天一万多个自动作业

• 每秒数万次页面浏览

• 五个九 (99.999%) 的可用性

• 完全灾难恢复

• 滴水不漏的安全性

• 对任何问题在两分钟内给予答复的承诺

因此,管理 Oracle 云的任何管理解决方案在架构设计上都需要能够确保实现上述目标。

Page 6: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

4

管理 Oracle 云

Oracle 云的主要设计目标是使其具有高度自动化的管理和监视功能,从而确保最佳服务质量,并最大

程度地降低运营成本。Oracle Enterprise Manager Cloud Control 12c (EM) 是管理和监视 Oracle 云的基

本工具。它为 Oracle 云运营团队提供了一个单一控制台以便管理 Oracle 云上部署的全部基础架构和

应用程序。 此外,EM 还可以自动化执行大量日常操作,从而实现了对 Oracle 云环境的高度自动

化、高效和有效的管理。EM 还配备了自助式 Java 服务控制台,云用户(租方 Java 服务管理员)可

以使用它来部署和管理应用程序。Oracle 云支持分析师使用 EM 作为其调试和解决服务请求的主要界

面。EM 例行监视 Oracle 云组件的运行情况并与 My Oracle Support 和租户管理系统(Tenant

Administration System 即TAS)无缝对接,在检测到潜在问题时它会自动创建服务请求,在问题解决

后会自动关闭这些请求。Oracle Enterprise Manager 是 Oracle 的集成式企业 IT 管理解决方案,是业内

唯一的全面、集成式业务驱动型企业云管理解决方案。

Enterprise Manager 的主要功能包括:

• 一个全面的云生命周期管理解决方案,可以快速建立、管理和支持企业云

• 对整个云体系(从应用程序到中间件、数据库、操作系统、虚拟机管理程序再到硬件组件)

进行全面、深入和一体化的管理

• 通过业务驱动的应用程序管理,为传统应用程序和云应用程序提供最佳服务级别

EM 产品架构包括下列主要组件:

• Oracle 管理代理 (OMA):这是一个基于 Java 的轻型组件,部署在每个被监视的主机上。它

负责管理和监视这些主机上运行的所有服务组件,进而向 Oracle 管理服务传达和上载服务运

行情况及其他关键度量数据。 Oracle 云运营人员还通过代理对服务组件(目标)执行像修复

作业、计划作业或计划任务这样的操作。

• 目标:这些是服务组件(硬件基础架构、软件基础架构、SOA 应用程序、J2EE 应用程序)。

目标是一个可以被单独监视和管理的单元。 Cloud Control 可以管理许种不同类型的目标。例

如,主机、数据库、监听器、ASM、WebLogic Server、Service Bus、SOA 应用程序、J2EE 应

用程序、E-Business suite、Seibel、Exadata、Exalogic、VM、OVM 和融合应用程序。

Page 7: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

5

• Oracle 管理服务 (OMS): 这是一个基于 Web 的应用程序,它负责编排管理代理和管理插件,以

便发现服务组件(也称作目标)、监视和管理这些组件,并将收集到的信息存储在信息库中供以

后进行参考和分析。OMS 还呈现 Enterprise Manager Cloud Control 的用户界面和 Java 控制台。

• Oracle 管理信息库(信息库,OMR) — Oracle 管理信息库用作持久性数据存储。信息库中存储

的信息包括:用户信息、作业定义、监视和警报设置,以及与目标有关的所有配置数据和监视数

据。计划的数据库作业将汇总和分析管理代理收集的信息并将这些信息上载到信息库。

• Oracle 软件库 — 软件库是一个文件系统信息库,它存储诸如软件补丁、虚拟软件设备映像、参

考黄金映像、应用程序软件,及其相关指令脚本等软件实体。OMS 可以访问该软件库,并且,

Cloud Control 框架广泛使用该软件库来实现类似自更新和代理推送等特性。

• 控制台 — 控制台是一个基于浏览器的 web 应用程序,它是 Cloud Control 的主要用户界面。管理

员可以使用该控制台监视、管理和报告已经建立的 Cloud Control 目标。

• 自助式控制台 — 自助式控制台是一个基于浏览器的 web 应用程序,租户可以使用它来供应、管

理和维护自己的应用程序/基础架构,查看使用情况/配额,验证可用性和计费信息。该控制台可

以用于基础架构即服务 (IaaS) 和平台即服务 (PaaS)。平台即服务又可以进一步分为 Java 即服务

(JaaS) 和数据库即服务 (DaaS)。

• Enterprise Manager 命令行界面 (EMCLI) — 利用 EMCLI,用户可以从命令行以交互方式访问

Cloud Control 功能,也可以以脚本的形式访问 Cloud Control 功能。这可以将 Cloud Control 操作

与复杂的业务流程相集成,而无需用户交互。

EM 以安全、可伸缩和容错的架构形式部署在 Oracle 云中,在 OMR、Oracle 管理服务和代理层之间设置

有防火墙。 多个 OMS 实例均衡地加载流量,从而提供高可用性。每个 OMS 实例都运行在一个 Exalogic

计算节点上。Exadata 上运行的高可用 RAC 数据库充当 EM 信息库。 所有 Oracle 云基础架构(Exadata

服务器、Exalogic 服务器、Oracle VM、ZFS 存储、Infiniband、网络、BigIP、Linux 和 Solaris 服务器、

IDM、OAM 和 OHS 服务器)上的代理负责监视基础架构和所有服务组件。EM 还会通过嗅探流入

Oracle 云的流量来收集监视数据。该功能使用网络分流器实现数据收集,不会对用户事务带来任何额外

开销。如果客户体验性能发生异常,则实际用户流量分析功能会使 EM 生成主动警报。

Page 8: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

6

在 Oracle 云中,监视框架要管理数千个服务器、数据库和中间件实例,并且还要与云生态系统相集

成。在 Oracle 云中,EM 的架构设计支持云级扩展以满足以下 Oracle 云需求:

• 扩展至数十万个受管理的服务

• 容纳数百个并发用户,这些用户由多个管理角色管理

• 在云中运行数百个并发作业

• 与 Oracle Access Manager (OAM) 和身份管理 (IDM) 系统相集成以实现安全性

• 提供富自动化命令行界面和云 API

图 2 — Oracle 云中的 Enterprise Manager 拓扑

管理和监视

对 Oracle 云来说,有两个主要的云管理和监视界面。这两个界面分别是:

• Java 云服务控制台,租方管理员可以通过该控制台在 Oracle 云中部署/取消部署自己的 Java

应用程序,并监视它们的可用性和关键性能量度。

• 企业管理控制台,云运营和支持人员可以通过该控制台监视和管理包括云

服务和云管理组件在内的整个云基础架构。

这两个角色截然不同(尽管是由同一个管理系统来执行角色任务并且使用共享信息库以实现持久

性)。下图描绘了云管理基础架构中为应对这些用例所需要的主要功能。

Page 9: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

7

图 3 — 云运营管理功能

在 Oracle 云中,使用 EM 的管理组特性通过模板来定义监视设置、合规性标准和云策略,并使用该

特性以多种层级结构(如位置、业务线和生命周期状态)组织服务组件。使用 Enterprise Manager 12c

的事件管理系统根据异常情况对服务的 SLA 进行管理。Oracle 云管理员使用该系统根据业务需要检

查、抑制、上报和解决各种事件,并且还将该系统与记录系统相集成以便对关键事件生成服务请

求。日常有三类不同的用户使用 EM 执行自己的任务,他们分别是 Oracle 云运营人员、Java 租方管

理员和 Oracle 支持分析师。Oracle 云运营团队使用 EM 来监视和管理云。 与 Oracle 云运营人员不

同,支持分析师不会 24x7 全天候地监视云,他们使用 EM 确定服务和服务组件的运行情况,并且对

Oracle 云客户报告的问题进行调试。EM 捕获服务级/资产级的客户 CSI 号,帮助支持分析师快速确

定客户问题。下面图 4 显示了上述三个角色各自的职责:

图 4 — Oracle 云环境中角色特定的 EM 职责

Page 10: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

8

为了有效地为上述各种角色提供服务,会为不同的“角色”分配不同的 OMS 实例。一些 OMS 实例

(以硬件负载均衡器作为前端)归 Oracle 云运营团队和支持分析师使用,而其他 OMS 实例则为租方

管理员提供服务。

Java 云服务控制台(自助式管理)

Enterprise Manager 配备有 Java 云服务控制台(JCS 控制台),Oracle 云租户可以使用该控制台监视

和管理自己的 Java 云服务 (JCS) 实例和 J2EE 应用程序。该控制台为云租户提供了与 JCS 实例交互以

及管理这些实例上所部署应用程序的生命周期的所有工具。EM 可以同时处理数百个这样的请求。实

际上,EM 集成了许多 Oracle 云生态系统,例如,Oracle Identity Management、My Oracle Support、

Oracle E-Business Suite(ERP 全球单一实例)、租户管理系统和服务交付界面,以便执行应用程序生

命周期管理及监视数据收集所需的所有编排任务。

租方管理员一旦开通了一个 JCS 服务并指定了一个或多个服务管理员,租方服务管理员就可以监视

其 J2EE 应用程序及托管该应用程序的 WebLogic 服务器/集群的可用性和性能。通过 JCS 控制台,租

方服务管理员可以执行以下任务:

• 部署/取消部署应用程序

• 启动/停止应用程序

• 监视应用程序和服务实例的运行情况和关键性能指标

• 查看日志

• 接收有关影响其服务的当前事件的通知

图 5 — Enterprise Manager Java 控制台

Page 11: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

9

这些功能通过 JCS 控制台和可编程访问的 Oracle 云 API(REST 式 API、EMCLI)提供。

基础架构性能和可用性监视

在 Oracle 云中,使用 EM 自动发现功能来发现 Oracle 云的服务组件、硬件和软件基础架构。 每个

Oracle 云基础架构组件(Exadata、Exalogic、VM 服务器、ZFS 存储)上都部署有一个代理,通过这些

代理 EM 可以发现这些基础架构组件并对这些组件进行深入监视和全面管理控制。 代理部署过程通

过部署在已充备服务组合件(PaaS、SaaS)上的临时黄金代理映像得到了简化。这些黄金代理映像

是打上了最新补丁的代理二进制文件。 代理作为服务实例供应的一部分进行部署和配置,因此能够

提供有关所有基础架构和应用程序组件及其相互关系和关联性的完整的端到端可见性。使用该功

能,Oracle 云团队可以准确地辨别特定的服务实例托管于哪些基础架构组件上。该信息也可用于进行

维护影响分析,例如,某个特定服务器或存储子系统因维护而处于脱机状态,那么会影响哪个服务

实例。可以通过拓扑图查看这些目标的相关性关系(例如,该主机上运行哪些服务?)和使用情况

(例如,哪个服务使用哪个数据库)。对每个受管理的目标来说,EM 会捕获详细的性能量度和可用

性量度,以及计量所需的使用情况量度。

Oracle 云还利用 EM 的功能从最终用户角度来监视应用程序性能。作为对基础架构监视的补充,实际

用户监视提供对最终用户可以体验到的实际应用程序使用情况和响应能力的度量。该数据可用于以

下几种情形:

• 提供可以报告给最终用户(通过 TAS 系统和云 UI,参见下图)的、有关 SaaS 应用程序使

用情况(登录数量、每角色使用、使用最多的功能、传输的字节数等)和性能(响应时

间、可用性)的量度。

• 为 Oracle 云运营团队提供对应用程序性能的深入洞察,从而使他们可以迅速检测、隔离和分

析任何应用程序性能问题。图表报告清楚地指出了错误最多和延迟最大的页面以及受影响最

大的用户。

该数据还提供了有关 SaaS 应用程序及其使用情况的报告以便用于容量规划、性能提高、使用情况跟

踪等。可以利用这些可配置的报告对应用程序性能进行全面分析。图 6 提供了这些报告所包含的图

形的示例说明:

Page 12: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

10

2

图 6 — 实际用户体验报告

借助额外的客户端 JavaScript 工具,可以在 Oracle 云客户与 Oracle 云运营商之间的协作中,使用实

际用户监视来诊断性能问题及确定问题的根源(客户端、CDN、第三方站点、Oracle 云基础架

构),而无需客户端进行任何额外的软件下载和配置。

此外,还可以使用 EM 信标通过复合事务来主动监视网络和业务事务流。信标位于 Oracle 云防火墙

之外,用于模拟用户对 PaaS 服务(Oracle WebLogic Server)的访问。 对 SaaS 服务而言,可以定义

信标来模拟关键业务事务,以便验证可用性和性能延迟。这些信标将按计划的频率运行并在服务可

用性报告中进行报告。

Page 13: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

11

系统对每个受监视的 Oracle 云组件应用包含度量阈值和度量频率的标准化监视模板。管理员可以

通过这些阈值来衡量业务 SLA 以确保最佳性能。EM 捕获的量度会通过 REST 式 Web 服务发布给

TAS(租户管理系统)。云 UI 将会呈现这些信息,这样租户可以透明地洞察其 Oracle 云服务的使用

情况、统计信息和可用性。所发布的量度随服务类型而不同。例如:

• 对于 Java 服务 — 活动会话的数量、每个服务器的堆和 CPU 使用情况、部署的应用程序

数量、磁盘使用等。

• 对于数据库服务 — 空间使用、对象的总数、传输的数据量等。

• 对于融合 HCM 服务 — 业务量度,如目标数量、绩效文档数量、全面的 360 度反馈的数

量等。

图 7 — TAS 中发布的 EM 量度

EM 的 Web 服务还为 TAS 提供最近 90 天的历史可用性信息。利用 EM 中断功能,可以通过云 UI 向

Oracle 云租户传达计划维护时段安排。在对客户的服务实例执行任何变更管理(打补丁、升级、配置

变更)之前,对环境应用中断功能。中断期排除在服务可用性定义之外。

Oracle 云广泛地使用 Oracle 的集成式系统来实现冗余、可靠性和卓越性能。Exadata 用于数据库服

务,而 Exalogic 则用于 SaaS(Oracle 融合管理软件)和 PaaS (Java) 服务。集成式系统的管理确实特

殊,因为它们作为一个单元由在管理多体系组件方面具有专业技能的管理员进行垂直管理。对于

Page 14: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

12

Exadata,EM 提供数据库云服务器的硬件组件的示意性视图,例如计算节点、Exadata 存储单元、

Infiniband 交换机、ILOM(无人值守监视)等组件。Oracle 云运营人员可以监视关键硬件量度并且

在单个信息板上可以看到来自所有 Exadata 组件的汇总的警报和故障。 对于 Exalogic,EM 与

Exalogic Control 集成以提供对基础架构层的深度管理。

图 8 — Exadata 数据库云服务器示意图

Page 15: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

13

图 9 — Exalogic 示意图

服务信息板和事件管理

云计算改变了理解、建模和监视服务的关注焦点,云计算系统不同于传统 IT 系统。 服务级别管理是

任何云服务的一个关键需求。为了云的不间断运行,需要不断地监视服务。Oracle 云管理员需要使用

EM 服务和系统信息板 24x7 全天候地主动监视所有 Oracle 云服务(SaaS 和 PaaS)。这些信息板提供

了服务的全方位视图,其中包括服务的状态和正常运行时间、构建服务的系统上的关键事件,以及

关键性能指标。 可用性状况、量度检索、服务维护状态(中断启动/停止)和一些关键性能量度、使

用情况量度和业务量度,这些提供给 TAS 以便用于 Oracle 云 SaaS 和 PaaS 服务的计量和容量规划。

Page 16: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

14

图 10 — 事件信息板

从服务信息板下钻到事件的能力有助于加快调试和问题解决。 EM 检测到那些影响任何 Oracle 云服

务的正常运行和可用性的事件后,提交 My Oracle Support 服务请求 (SR),以便通知运营人员和该问

题的支持团队。(使用 EM 的自动诊断信息库 (ADR) 功能得到的)有关底层系统的详细诊断和配置

信息(包括应用程序到基础架构的相关性映射)经过打包后附加到该服务请求中,以便支持问题诊

断。此外,EM 还将这一中断情况通知 TAS,该信息通过云 UI 通知到租户。

支持控制台

EM 是 Oracle 云支持分析师用于诊断和解决云租户所报告问题的主要控制台。为了加速问题的诊断和

解决,EM 提供受管理目标(云服务组件)、服务组件所属的 Oracle 云服务类型(如融合 CRM、

Java 服务或数据库服务)、服务实例所有者,以及租户的客户支持标识 (CSI) 之间的完整映射。使用

该信息以及云支持主页,支持分析师可以迅速确定属于指定租户的服务实例。EM 支持下钻到各个服

务组件,从而便于确定事件的根本原因并且可以帮助纠正问题。在 Enterprise Manager、支持分析师

和租户之间的信息流动如下图所示:

Page 17: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

15

图 10 — Oracle 云的支持流程

云支持控制台旨在促进对云环境的支持。在上图中,我们可以看到:

• 在步骤 1 中,EM 自动提交 SR,该 SR 对应于特定的 CSI。

• 在步骤 2 中,支持分析师处理该 SR。为支持分析师提供的特性包括:

• 支持分析师使用的定制的视图

• 使用业务参数(如客户名称、订用 id)搜索服务及其事件

• 所有服务类型(如融合应用程序、Java 服务和数据库服务)的服务实例运

行情况和事件

• 常用操作和诊断的启动点

• 将诊断、配置、相关性数据打包后附加到 SR

• 下钻到拓扑视图以便进行影响分析

• 在步骤 3 中,租户不时地跟踪、查看和验证 SR,直到它关闭为止。

• 下面的支持控制台快照显示了这一信息充实过程:

Page 18: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

16

图 11 — 支持控制台

Oracle 云运营生命周期管理 在日常运营中,Oracle 云管理员需要执行诸如备份、打补丁、日志清理等重复性任务。通常这些任务

既单调乏味又非常耗时,因此需要尽可能多地采用无需人工参与的自动化流程。

如果没有自动化工具,那么云管理的大部分时间将花在单调乏味、重复性的管理任务(如打补丁)

上。 例如,客户经验表明,如果不使用 Enterprise Manager,管理员要花费数百个工时为数据库应用

季度性补丁。

而管理员采用 EM 后就可以使一些云运营管理任务实现自动化,例如这些任务:

• 云库存和资产的自动化管理

• 计划备份和定期清除

• 通过中断功能实现计划停机管理

• 从测试实例到生产实例的数据提升

• 合规性和安全性策略管理

• 补丁自动化和管理

Enterprise Manager 随带有一个含有作业和部署过程(前述)的自动化框架,管理员可以通过该框架

根据需要定义这些重复性操作并对其制定时间计划。 EM 的任务自动化框架是一个可伸缩的框架,

它提供了诸如支持调度、恢复、重试等功能,这些功能对在企业级云中执行大量操作来说极为重

Page 19: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

17

要。Oracle 云运营团队广泛使用该框架来自动化执行大量定期操作(如备份、日志循环和清除等)。

任务自动化也可用于即席管理和维护操作。通过使用 EM 的任务管理框架执行云伸缩环境的变更管

理,可以实现将多个对象作为一个(组/系统)进行管理的功能。任务自动化谓词也可以通过 EMCLI

界面公开。Oracle 云管理员广泛使用 EMCLI 来管理具有数千租户服务的大规模运营。

EM 的中断功能广泛用于安排和管理有计划的管理操作。Oracle 云运营团队在 EM 中(针对定期操作

或即席操作)对受影响的服务组件定义中断,该功能日后会通知 TAS,以便受影响的租户/用户能够

获得即将发生的计划维护的警报。

配置合规性是云管理的另一个非常重要的方面。我们经常会看到某些云的安全性如何受到侵犯的新

闻报道。安全侵犯的发生通常是因为不合适的配置,如默认口令、宽松的文件权限或开放端口。合

规性本身需要某些纪律,而这些纪律可能会淹没在云的混乱无序之中。 为了管理合规性,Oracle 云

管理员建立了黄金基准,并在 EM 中收集了所有 Oracle 云系统的配置集合。与基准的任何偏离都会

触发合规性违规通知,从而提醒管理员在问题给环境造成风险前就解决它。从顶层设计开始,层次

结构应依次包含合规性框架、合规性标准和合规性规则。这些合规性框架汇总了可能适用于不同目

标类型的合规性标准的合规性评分。每个合规性标准包含一个或多个合规性规则,但这些规则专门

针对单个目标类型。 合规性规则负责执行一个单一的特定目标验证并报告合规性。

Page 20: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

18

图 12 — 合规性框架

EM 为管理员提供了一个综合工具集,帮助他们了解配置偏差实质、偏差原因及补救措施,并向合规

性官员和审计人员提供整合报告。融合应用程序体系是一个包含众多组件的复杂体系。如果存在微

小的配置偏差,那么对该偏差的检测可能犹如大海捞针。成熟的配置比较功能能够比较多个应用程

序 pod 文件(横跨测试、开发和生产生命周期),从而帮助您轻松检测出偏差。

最后,Enterprise Manager 与 My Oracle Support (MOS) 的内置集成可以使 Oracle 云管理员获得作为

Oracle 云组成部分而部署的所有 Oracle 软件的补丁建议,并确保 CPU(重要补丁更新)应用于所有

Oracle 云系统。

总结

Oracle 云是一种在可伸缩性、安全性和敏捷性方面要求极高的环境。在这种环境中,Enterprise

Manager 12c 的应用程序到磁盘管理功能经受了真正的考验。 截至 2012 年 9 月的如下 Oracle 云统计

信息,充分证明了 Enterprise Manager 是一个具有真正企业级特征的云管理平台:

■ 5,622 个并发的自助服务用户

■ 31,518 个租户,2500 万个用户

■ 506,947 个服务实例

■ 598,810 个目标

■ 每天 9,243 个自动化作业

Page 21: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

19

■ 每天 125,983,703 次页面浏览

随着云计算的日益普及,可以预计将有更多具有类似 SLA 要求的云不断涌出。实施者们可以由此

获得丰富的经验,从而以最小的成本获得最大的投资回报。

Page 22: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

20

附录 本部分将详细介绍一些 Oracle 云 EM 用例。

云中的空间管理

云计算要求更好地了解所部署应用程序、负载和云平台的弹性特征。Wikipedia 对云计算的定义是,

“以细粒度的、自助的方式近乎实时地动态(“按需”)供应资源 [32],用户不必针对峰值负载进行工

程设计”。云计算的定义表明,资源可以按需进行动态伸缩。因为云平台不具备无限的资源,因此为

瞬时弹性高效地提供和供应资源的方法是利用 EM 来管理库存、执行自动供应、执行持续容量管理

并报告服务使用情况。

在 Oracle 云中,以下空间管理流程是使用 EM 自动执行的。

纵向扩展

Oracle 云使用 EM 通过服务组件(目标)(如数据库、FMW、融合应用程序、J2EE 应用程序等)的

各种量度来监视每个服务的空间使用。每小时、每天、每周、每月汇总一次(每 15 分钟)收集的信

息。通过 Oracle 云 UI 将这些汇总数据呈送给租户。 租户可以根据利用率数据和业务需求来决定从

小规模纵向扩展为中等规模,或者从小规模纵向扩展为企业规模。

横向扩展

Oracle 云支持客户进行横向扩展,向现有服务集群添加主机和 web 服务器之类的更多硬件/软件基础

架构。这使得租户可以管理自己的用户增长和业务需要。EM 具有自动化供应工作流和作业,可以自

动向租户服务供应额外的 WebLogic 服务器和 VM,因此可保证瞬时弹性。

容量规划

Oracle 云的规模、弹性需求以及即时供应时间要求,这些都需要 Oracle 云运营团队具备步进式容量

提供能力和持续容量规划流程。 开始时,充备和保留 SaaS 和 PaaS 组合件池。租户请求一个服务

时,其中一个预先充备的槽位获得了“个性化”分配。 然后评估充备的组合件的数量,并创建一个新

组合件填充到最近刚供应给租户的组合件槽位中。需要从业务、服务和服务组件的角度对容量进行

审核和规划。 EM 将收集库存、配额、服务级别性能度量数据、负载度量数据、处理器、I/O 和内存

Page 23: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

21

分析及实时页面点击信息。可以挖掘所有这些数据来生成旨在预测峰值使用需求的容量报告,从而

确保云基础架构组件能够满足峰值使用需求。其目标是优化容量并确保提供足够的容量。

图 13 — 库存及使用情况报告

Page 24: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

22

图 14 — 云容量发展趋势

因为 Oracle 云服务使用多租户模式运行于共享基础架构上,因此容量建模和规划要复杂得多。自动供应

使得容量规划在某些方面更加错综复杂,这是因为充备的组合件池是预先准备和步进式供应的(与应用

程序软件一起安装 VM 和存储)。考虑到成本问题是促使租户利用云计算的一个核心驱动因素,那么最

重要的就是只购买、部署和锁定必需的资源。

云服务合规性规则 将根据预先定义的安全性标准和配置标准对所有云服务进行主动的合规性检查。这些标准都是在 EM 中

作为合规性规则定义的,并且所有环境都要进行定期检查。合规性检查所发现的违规可以作为警报/事件

提出。 可以设置事件通知规则以便通知相应的目标所有者。 例如,对 SaaS(融合应用程序服务),启用

了以下安全性和配置合规性检查:

• Oracle 产品的安全建议

• 融合应用程序的 Java 虚拟机配置标准

• 融合应用程序的 Java 平台安全配置标准

• 融合应用程序的 Oracle HTTP 服务器配置标准

• 融合应用程序的 WebLogic Server 配置标准

• 融合应用程序的证书验证标准

Page 25: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

23

在“融合应用程序的 Java 虚拟机配置标准”和“融合应用程序的 Oracle HTTP 服务器配置标准”中将确保

SaaS 实例最佳执行的关键配置设置值设置为标准。 下图是定义用于验证的一些 JVM 配置示例。

图 15 — JVM 配置详细信息

如果由于任何变更/打补丁活动而使任何融合应用程序实例偏离了作为标准而定义的配置,则会以某个

EM 事件立即通知目标所有者。此时,云运营团队可以有两个选择:a) 请求更改为符合合规性标准,b)

更新实例并纠正违规。

如针对融合应用程序所介绍的,也需要类似地为其他服务(即 PaaS(Java 即服务)和 DaaS(数据库即服

务))定义标准。所有 Oracle 云基础架构也都需要经过安全性和配置合规性检查的验证。

EM 蕴涵的云运营责任

云运营企业管理团队由遍布于全球各地的成员组成。这样就可以按地区随着太阳提供每年 365 天,每天

24 小时全天候的服务。 每个地区的团队成员在其工作日期间均处于随叫随到的值班状态,他们负责受理

1 级严重 (S1) 的 EM 警报并解决问题(通过标准支持队列)。 与任何运营团队一样,平日和周末的工作

职责也都是以每月运营花名册的形式安排的。

Page 26: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

24

值班责任:值班人员负责执行以下专门任务以确保其值班期间 Enterprise Manager 能正常运行并始终可用:

• 量度收集清理

• 删除弃用目标

• 将应用/审计模板应用于生产目标

• 清除安全策略违规

• 通过 SR 请求上报新目标(数据库、Exadata、Exalogic 等)

• 审核和处理控制台中的警报并与目标所有者相互协作来清除警报

• 对所有中断的作业进行审核并与作业所有者相互协作来清理这些作业(如果可以则删除之)

• 确保所有代理正常工作并上载数据

• 确保所有 EM DBMS 进程成功运行并且处于阈值范围之内

• 创建用于云运营和云支持的帐户

• 管理 EM 站点备份

• 确保云 EM 执行信息板可以访问

• 确保云 EM 和其他云生态系统(如 TAS、SDI、MOS)的接口正常运行

从值班队列的角度讲,EM 团队成员需要确保清理该队列,确保及时更新和关闭所有 SR。

Oracle 云 EM 团队的责任:Oracle 云 Enterprise Manager 团队管理和维护下列项目:

• Oracle 管理服务器 — 云 EM 团队独自承担为 OMR 数据库和 OMS 中间层应用补丁。 同样,不允许

EM 团队之外的其他团队成员启动或停止任何 EM 基础架构组件。 这也包括 OMS 参数的调整。

• Oracle 管理代理 — 云 EM 团队独立承担企业中所有目标的代理的安装、打补丁、启动或停止。

因为代理是监视解决方案最重要的组成部分,因此由 EM 团队拥有代理的 OS 用户凭证。EM 团

队负责为代理打补丁并维护代理黄金映像以供新代理部署使用。 这也包括对用于所有代理的

“emd.properties”文件中的任何设置的调整。 云 EM 团队在控制台中接收代理中断/不可达警报的

P1 警报通知,从而确保主动监视。

• 目标发现 — 对于 PaaS 和 SaaS 服务,目标发现通常是自动的。只发现新的基础架构(Exadata、

Exalogic、ZFS 过滤器等)。 目标发现是由云容量团队在 EM 服务队列中打开的 SR 所发起的。

一旦发现了目标,就会更新目标属性、自动应用标准模板,之后 EM 团队成员会将发现的目标添

加到合适的通知组和服务管理组。

• 管理员组管理 — 云 EM 团队负责使用 7 个首要目标属性为自己的每个 EM 站点定义管理员组层

级结构。只有云 EM 团队可以执行对管理员组树的更新。EM 团队每周生成一份报告,其中报告

了不属于任何管理组的目标的排除清单。

Page 27: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

25

• 模板收集 — 因为模板会推动所有标准量度和量度扩展 (ME) 的实施,因此有必要对模板进行正确

的管理和维护。 模板的创建是由标准量度驱动的,而标准量度则由云运营目标所有者(即数据

库管理员和融合应用程序管理员、WebLogic Server 管理员、系统管理员、存储管理员)审核和

签发。目标所有者认可的模板由 EM 管理员上载到模板集合并附加到管理员组叶节点。因此,发

现新目标时,新目标将接收目标所有者需要和认可的“基准”量度。

• 事件通知规则集 — 这些是用于向云 EM 和云运营团队成员通知他们所管理的目标上的事件(严

重/非严重)的核心规则。 云 EM 团队管理这些规则,以确保所有需要的警报都能传送到相应的

目标所有者/团队邮件列表。目标所有者(云运营人员)可以创建自己的通知规则,但是不能编

辑或管理由 EM 管理员定义的事件通知规则。

• 主通知组 — 这些通知组将所有通知推送到 SaaS(FA HCM、FA CRM)、JaaS(Java 即服务)、

DaaS(数据库即服务)和基础架构(物理/虚拟服务器、存储、网络)目标的所有者。 向这些组

添加目标或从这些组删除目标决定了向哪些目标推送通知。 因此,对这些组的管理仅限于云 EM

团队。 在供应服务/基础架构组件时,运行由 EM 团队编写的 EMCLI 脚本,将目标添加到相应的

组。云运营团队成员(目标所有者)可以创建自己的组,但是不允许他们更新或编辑主通知组。

主通知组也用来对云 EM 团队中的值班人员的模板使用进行审计。

• 组信息板 — 云 EM 团队负责为 SaaS、PaaS、DaaS 和其他系统创建组信息板。云运营团队(服务

目标所有者)通过 EM 事件管理控制台使用这些信息板来处理事件。

• 服务 SLA 和报告 — 云 PM 定义服务及其 SLA。云 EM 团队负责 EM 中的所有云服务的设置(组

件、关键组件、关键性能指标和 SLA 的定义)。 云 EM 团队还负责管理显示 Oracle 云的服务及

基础架构的运行情况/性能/SLA 的服务信息板和 IP 报告。

Oracle 云运营团队(也就是目标所有者)的责任(即 PaaS、DaaS 和 SaaS 管理员):

• 目标发现 — Oracle 云中大部分目标的发现是在供应服务时自动完成的。只有基础架构组件需要

使用 EM 发现屏幕来发现。基础架构团队成员通知 EM 团队需要发现新目标。这是通过发往云

Enterprise Manager 队列的 P2 SR 实现的。 该 SR 由云 EM 团队成员处理,于是在目标所有者的帮

助下发现目标。

• 量度扩展 (ME) 创建/管理 — 所有 ME 均由目标所有者创建和维护。 这包括代码的编写和给定目

标上 ME 的实施。目标所有者一旦确信 ME 工作正常,他们将向云 EM 服务队列开启一个 SR,

Page 28: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

26

请求将该 ME 添加到标准模板,并在需要时应用于所有适用的目标类型。 某些情况下,某个 ME

是专用于某个目标的,因此,无需将其添加到主模板。EM 团队还会编写 ME 来满足自己的一些

监视需求。 例如,监视 SaaS 和 PaaS 临时实例的证书逾期情况、监视 LDAP 绑定检查、监视

NFS 可用性、监视 SaaS 实例帐户的帐户逾期情况、监视发送邮件队列等。

• 信息板 — Oracle 云运营团队负责为管理组(SaaS、PaaS、DaaS)信息板配备 24X7 的监视人

员,确保所有发生的事件得到及时的分配和处理。事件分为关键、严重或警告三种严重程度。团

队以最高优先级来响应严重事件,因为这类事件通常是可用性问题。

• 作业队列 — 所有自定义作业以及这类作业的代码创建都由目标所有者承担。 这也包括在作业损

坏时对其进行故障排除。 云运营团队还承担了几项对服务或服务组件的修复作业以便解决事件

和可用性问题。可以通过 EM 服务队列请求云 EM 团队给予支持。云 EM 团队也可以编写作业。

• 库存错误 — 在有些目标上,代理读取 oraInventory 文件时存在问题。

造成这一问题的原因大多是因为权限问题,这是由目标所有者管理的。 确保 EM 代理 OS 用户能

够读取库存文件的文件/目录权限的审核和设置是由目标所有者承担的。 这对确保正确的配置管

理至关重要。

• 报告创建 — 云运营团队成员(目标所有者)所需的全部报告都由该团队的成员创建和维护。 这

包括代码的维护以及解决报告中出现的错误。 有些报告由 EM 团队管理,但是大部分报告是由

目标所有者创建的。

所有专职管理 EM 的团队成员以及目标所有者都应了解自己的责任并认真承担这些责任,这是非常重要

的。这对满足服务 SLA 和主动处理问题,进而简化和标准化流程并降低云管理的运营成本至关重要。

Page 29: Oracle 白皮书 · 云)就是这样一种公有云实现。Oracle 云以软件即服务 (SaaS) 和平台即服务 (PaaS) 形式提供了一系列多 种服务。 HCM 和 CRM 是主要的

27