oracle r enterprise介绍
Post on 02-Jan-2017
255 Views
Preview:
TRANSCRIPT
<Insert Picture Here>
©2012 Oracle – All Rights Reserved
Oracle R Enterprise介绍
杨雷 甲骨文公司资深咨询顾问
2
Rexer Analytics Survey 2011
3
R语言介绍
• R是统计领域广泛使用的诞生于 1980年左右的S语言的一个分支。 R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS
• R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具
• R是一套完整的数据处理、计算和制图软件系统。其功能包括:
– 数据存储和处理系统;
– 数组运算工具(其向量、矩阵运算方面功能尤其强大);
– 完整连贯的统计分析工具;
– 优秀的统计制图功能;
– 简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。
• R是一种统计软件,也是一种数学计算的环境,因为R并不仅仅提供若干统计程序;使用者只需指定数据库和若干参数便可进行一个统计分析
4
R语言核心
• 提供一些集成的统计工具
• 更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析
• 提供可以创造出符合需要的新的统计计算方法。
• 语法表面上类似 C,但在语义上是函数设计语言的(functional programming
language)的变种并且和Lisp 以及 APL有很强的兼容性。
5
R相关的Package 序号 包(Package) 描述
1 base 基本R函数
2 datasets 基本R数据集
3 grDevices 基本的或grid图形的设备函数
4 graphics 基本图形函数
5 grid grid函数
6 methods 用于R对象和编程工具的方法和类的定义
7 splines 样条回归函数和类
8 stats 统计函数
9 stats4 基于S4标准定义的统计函数
10 tcltk R和Tcl/Tk图形接口元素的交互函数
11 tools 包开发和管理的工具
12 utils R工具函数
13 boot 抽样和bootstraping方法
6
R相关的Package - 续 序号 包(Package) 描述
14 class 分类方法
15 cluster 聚类方法
16 foreign 读取各种格式(S3,Stata,SAS,Minitab,SPSS,Epi Info)的外部数据
17 KernSmooth 核密度拟合方法(包括双变量核)
18 lattice grid图
19 MASS Venables & Ripley著的“Modern Applied Statistics with S”中的配套库,包含很多有用的函数,工具和数据集
20 mgcv 广义的可加模型
21 nlme 线性和非线性混合效应模型
22 nnet 神经网络和多项对数线性模型
23 npart 递归分割
24 spatial 空间分析(“kriging”,空间协方差,…)
25 survival 生存分析
... ... ...
7
Oracle R Enterprise的优势
• 在数据库中运行模型
• 可处理大型数据集
• 发挥 Oracle Database 11g 和 Exadata 的强大能力
• 代码相同,而速度更快
• Oracle Advance Analytics
• 与OBIEE集成
• SAS与SPSS之外很好的选择
• 3500+可用的开源R packages
8
缺省的R GUI
9
RStudio – Third Party, Open Source IDE
10
Data Visualization with R
11
ORE图型示例…
12
SQL
Oracle Advanced Analytics Option
Data Analysts
Data Scientists
Statisticians
Database
Statistics
Data Mining
Spatial
OLAP
Text
… Query
data parallelism
Database Developers
DBAs
SQL
©2012 Oracle – All Rights Reserved
13
主题 SAS产品线 SPSS产品线 R语言相关包
高级模块 SAS/STAT® SPSS Advanced Models™ stat, MASS及众多扩展包
基础模块 SAS® SPSS Base™ R
联合分析 SAS/STAT®: Transreg SPSS Conjoint™ homals, psychoR , bayesm
对应分析 SAS/STAT®: Corresp SPSS Categories™ homals, MASS, FactoMineR, ade4, PTAk,
cocorresp, vegan, made4, PsychoR
自定义表格 SAS Base® Report、SQL, Tabulate SPSS Custom Tables™ reshape
数据接口 SAS/ACCESS® SPSS Data Access Pack™ DBI, foreign, RODBC
数据挖掘 Enterprise Miner™ Clementine® rattle, arules, FactoMineR
数据校验 Various procedures Various procedures, SPSS Data
Preparation™ dprep, various functions
Exact Tests SAS/STAT®: various SPSS Exact Tests™
coin, elrm, exactLoglinTest,
exactmaxsel, exactRankTests,及其他许多包
基因分析 SAS/Genetics®, SAS/Microarray®
Solution®, JMP Genomics® 无 Bioconductor
GIS SAS/GIS®,
SAS/Graph® SPSS Maps™
maps, mapdata, mapproj,
GRASS via spgrass6,
RColorBrewer及其他包的部分功能
交互图 Enterprise Guide® SPSS Base™ JGR, R Commander, pmg, Sciviews
SAS/INSIGHT® 无 GGobi via rggobi iPlots, Mondrian via Rserve
统计图 SAS/GRAPH® SPSS Base™
ggplot, gplots, graphics, grid, gridBase,
hexbin, lattice, plotrix, scatterplot3d, vcd,
lot, geneplotter, Rgraphics
分析向导 SAS/LAB® 无 无
R与SAS, SPSS详细比较
14
主题 SAS产品线 SPSS产品线 R语言相关包
分析向导 SAS/LAB® 无 无
矩阵数学 SAS/IML®, SAS/IML SPSS Matrix™ R, matlab, Matrix, sparseM
缺省值分析 SAS/STAT®: MI SPSS Missing Values Analysis™ aregImpute (Hmisc), EMV,
fit.mult.impute (Design), mice,mitools, mvnmle
统筹研究 SAS/OR® 无 glpk, linprog, LowRankQP, TSP
统计效力检验
SAS® Power and
Sample Size
Application,
SAS/STAT: Power,
GLM Power
SamplePower™ asypow, powerpkg, pwr,
MBESS
品质控制 SAS/QC® SPSS Base™ qcc, spc
回归模型 SAS/BASE® SPSS Regression
Models™ R, Hmisc, Design, lasso, VGAM, pda
抽样及调查 SAS/STAT®:
surveymeans,等 SPSS Complex Samples™
pps, sampfling, sampling,
spsurvey, survey
结构方程模型 SAS/STAT®: Calis Amos™ sem
文本分析 Text Miner SPSS Text Analysis for Surveys™,
Text Miner for Clementine® Rstem, lsa, tm
时间序列 SAS/ETS® SPSS Trends™ Expert Modeler 大量的包可完成
时间序列分析预测 SAS Forecast Studio® SPSS Trends, DecisionTime/WhatIf™ 无
决策树 Enterprise Miner™ SPSS Classification
Trees™, AnswerTree™
ada, adabag, BayesTree, boost, GAMboost,
gbev, gbm, maptree, mboost, mvpart, party,
pinktoe, quantregForest, rpart, part.permutation,
randomForest, randomForests, tree
R与SAS, SPSS详细比较 – 续
15
Oracle R Enterprise – 关键信息
• 绝大部分或者完全集成到现有市场上的企业级高级分析软件套
件中
• 从现有的平台实现了实质性的飞跃
– 数据量 – 利用SQL和现有的数据库功能
– 数据的异构行– Oracle DB + BDA
– 分析的广度– Oracle DB + R packages
– 用户的种类– R+SQL+BI report developers, DBAs
• 通过与Oracle Exalytics集成,能够使得共享企业级的高级分析
模型
©2012 Oracle – All Rights Reserved
16
Oracle R Enterprise
Function push-down – data transformation & statistics
R workspace console
Oracle statistics engine
OBIEE, Web Services
No changes to the user
experience
Scale to large data sets
Embed in operational
systems
©2012 Oracle – All Rights Reserved
17
Oracle R Enterprise
Transparently leverage Hadoop for High Performance Analytics to Oracle Big Data Appliance
Function push-down – data transformation & statistics
R workspace console
Oracle statistics engine
OBIEE, Web Services
©2012 Oracle – All Rights Reserved
18
Enabling ORE Results in OBIEE Approaches
OBIEE
Oracle Database
Dashboards
ORE
R Script
Table
Independent R script execution
©2012 Oracle – All Rights Reserved
OBIEE
Oracle Database
Dashboards
ORE
R Script
Graphics / Table Result Generation
BIP
MS Word BIP Template Builder
R script execution from dashboard / document
R Script
Repository
.rtf Template
RPD
Table Result
Generation
19
OBIEE中使用ORE示例
©2012 Oracle – All Rights Reserved
20
Oracle R Enterprise的资源
• R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。
– R 官网地址:http://www.r-project.org/
– R 中国官网:http://www.rproject.cn/
• Oracle R Enterprise资源:
– 安装介质下载(Windows 32-bit, 64-bit,Linux 64-bit ):
http://www.oracle.com/technetwork/cn/database/options/advanced-analytics/r-enterprise/r-enterprise-doc-1510100-zhs.html
– 参考资料下载:http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/index.html
21
ORE Demo演示
Getting Started
top related