大数据关键技术 专利态势报告 -...
TRANSCRIPT
1http://www.caict.ac.cn/中国信息通信研究院
大数据关键技术
专利态势报告
中国信息通信研究院
知识产权中心
2016年4月
2未经许可,不得用于商业目的 http://www.caict.ac.cn/ 2未经许可,不得用于商业目的
了解:分析产业
进展情况,透视
产业竞争格局
指引:掌握技术
发展路线,选择
技术突破方向
启迪:有效配置
创新资源,提高
科技创新起点
预警:掌握竞争
对手布局,规避
专利侵权风险
专利态势分析的意义
保密期带来的滞后性;专利只是知识产权的一种表现形式,不能代表全部的创新活动;技术市场与产品市场存在一定脱节
专利文献广泛、真实、详尽,可获得性好,因此, 专利分析是战略与竞争分析中一
种实用的分析方法。
3未经许可,不得用于商业目的
本报告涉及的检索分析范围
大数据涉及众多技术分支,本报告围绕实现大数据的关键热点技术展开专利态势分析
数据资源管理(ETL;数据交换中间件;分布式消息系统;pub-sub发布订阅模式)
数据源
大数据应用
资源管理与调度(分布式资源调度系统、集群调度、YARN、
Mesos)
非关系数据库(文档数据库,k-v数据库,图数据库、xml数据库、列簇数
据库)
分布式计算/批量计算
(任务调度、数据/代码互定位、系统优
化、出错处理)
内存计算引擎
(体系结构、系统软件、编程模型、并行处理)
流计算(流式计算架构、数据传输、高可
用技术)大数据平台
大规模并行数据库MPP
(数据分布式存储、横向扩
展、share nothing架构、与开源系统的
技术融合)
数据可视化(文本可视化、网络(图)可视化、时空数据可视化、多维数据
可视化、可视分析的交互)
智能BI(大数据化的BI,与典型行业应用相结合
分析)
安全与隐私保护(访问控制、匿名技术、数据挖掘过程中的隐私保护、云存储审计、数据存储加密)
数据挖掘(机器学习、人工
智能、模式识别聚类分析、知识探
索,关联关系)
关系型数据库(SQL优化器、索引设计、存储引擎、事务管理与并发控制、)文件系统
(分布式文件系统HDFS、)
4未经许可,不得用于商业目的未经许可,不得用于商业目的
大数据领域专利总体申请态势
0
1000
2000
3000
2010201120122013201420152016
大数据关键技术知识产权发展态势
数据资源管理层
大数据平台层
大数据应用层
50%44%
4%
2%
0%
大数据领域近6年专利公开量
US
CN
EP
JP
KR
大数据领域专利公开量在近六年间
处于持续爆发增长阶段;
随着产业化的推进和技术发展成熟
度的逐渐提高,除传统IT企业以
外,互联网、电商和各传统行业申
请人的不断加入,应用层和平台处
理层的专利占比不断提升;
从专利申请的地域分布统计,90%以上的专利分布在美国和中国,
欧洲、日本和韩国等地区的公开量很小
美国位居专利原创地区的首位,IBM、微软、Oracle、EMC等领先
企业在该领域的技术优势显著。
我国成为第二大受理国,一方面反映出我国重要的市场地位,大数
据企业纷纷来华布局;另一方面在我国重视发展大数据的政策环境
下,国内企业踊跃参与技术创新和专利布局,华为、浪潮、华三、
国电等已经拥有持有一定数量的大数据专利,以通信背景的华三公
司为例,在大数据领域的专利申请量已经超过200件以上。
5未经许可,不得用于商业目的未经许可,不得用于商业目的
大数据全球领域重点申请人专利布局地图
数据挖掘
非关系数据库 批量计算 内存计算 流式计算
关系数据库 MPP
资源管理与调度 文件系统
ETL
数据可视化 安全与隐私智能BI
6未经许可,不得用于商业目的未经许可,不得用于商业目的
第一篇:大数据分析应用层关键技术专利分析
7未经许可,不得用于商业目的未经许可,不得用于商业目的
可视化:大数据为可视化带来挑战,专利呈爆发式增长,传统IT和互联网企业占据优势地位,国内初创公司专利布局亟待加强
0
100
200
大数据可视化专利趋势
CN US
可视化技术专利在2010-2016年间共计685件,(632个专
利族),其中,中国专利申请量最多(361件)美国第二
(243件)
大数据可视化技术专利申请呈爆发式增长,未来将产生更多
的专利;
专利权人来自IT巨头、互联网巨头、初创公司、高校以及为
大型企业提供分析的第三方公司
大数据的可视化正成为未来大数据时代一个重要的研究方向,同时也是企业专利布局的热点。
专利申请趋势
美国:IT企业、互联网企业占据强势地位,专注于可视化领域的新锐公司,如splunk、platfora、tableau、ayasdi企业除了产品在市场上占据优势地位外,积极布局数据可视化专利技术中国:除传统IT企业和互联网企业外,国家电网以电力行业为视角有较多的可视化技术专利申请,此外,中科院、天津大学、北航等一批中国高校也非常关注可视化技术。中美对比:相比国外,国内初创公司(永洪、数字冰雹、帆软软件、润乾等)在数据可视化方面专利申请量尚有加强空间。
中美地区申请人状况
8未经许可,不得用于商业目的未经许可,不得用于商业目的
可视化:海量多维数据的实时展示和交互处理是研究热点
实时展示• 浪潮• 鲁能软件• 国家电网• splunk• zoomdata• Basen corp
交互性• Platfora• Beyondcore• IBM• Splunk• 百度• Microsoft
多维数据分析• Oculus• Microsoft• 百度• 国双科技• 上海云数• 北航/天津大学
多屏互动• 威创视讯• 奇虎360• 融创天下• 中电启明星
从专利分布来看,国内外软件企业、互联网企业
非常关注大数据可视化技术中的交互性、多维数
据分析能力、实时展示和多屏互动技术。
以上细分领域专利占比分别达到20%,11%,
18%和2%
研发方向:
数据可视化工具必须适应大数据时代数据量的
爆炸式增长需求,必须快速的收集分析数据、
并对数据信息进行实时更新
关注现有数据处理量大、数据模型复杂、缺乏
用户交互的技术问题
针对文本、网络、关联关系、流式地图、时空
关系数据、地理位置和时间标签的多维数据集
的可视化分析是企业专利布局热点
通过多屏互动操作,实现对数据流的分发呈现
处理,能提高大数据的易读性
重点申请人
重点申请人
9未经许可,不得用于商业目的未经许可,不得用于商业目的
可视化:各行业与大数据融合创新, VR/AR企业关注数据可视化
System and
method for
interactive multi-
dimensional visual
representation of
information
content and
properties
信息内容和属性的多维视觉交互技术
US8131779
System and
method for large
scale information
analysis using
data visualization
techniques
使用数据可视化技术分析的大型信息系统和方法
US7940271
著名的虚拟现实/增强现实公司oculus(被
Facebook20亿美元收购)和Magic leap同样非常关
注大数据可视化技术的专利申请。包括多维并提供可
视化分析解决方案,VR是非常被看好的未来的数据
计算平台,是大数据可视化前端呈现的一个重要方面。
传统数据分析平台难以支撑行业应用发展,大数据平
台分析和可视化技术成为行业创新的驱动,中小企业
和高校在交通、电力、社交、物流运输、政务、地图
信息、精准营销、卫生医疗等领域均有专利申请,其
中国家电网专利申请量非常突出。
大数据可视化
电力
交通
• 北交大/深圳凯达尔/上海电科/浙工大/香港科大/杭州交通卫星定位应用有限公司
• 一种针对大规模交通数据的高效可视监测分析系统
• …..
• 国家电网/华电电力科学研究院
• 用于支撑智慧城市运行管理的智能电网大数据挖掘系统及方法
• ……
物流运输
• 北京华油信通/惠龙易通国际物流
• 基于全息地图数据分析技术确定最佳物流方案的方法…..
社交
• 四川长虹/南京路特/广州工业大学/腾讯
• 基于Hadoop的大规模社
交网络分析方法及其分析平台
• …..
地图
• 百度/中国搜索信息科技/武汉大学
• …..
10未经许可,不得用于商业目的未经许可,不得用于商业目的
安全和隐私保护:护航大数据产业发展,专利申请热度持续上升,电力电信等行业申请活跃
安全和隐私保护技术专利在2010-2016年期间共计764件
(615个专利族)其中美国专利申请量最多(320件)中国
排第二(290件),日韩地区专利量较少。
从专利申请趋势来看,在华申请的专利从2013年开始接近
于美国的专利申请量,2015年首度超过美国专利数量,大
数据的安全问题已引起国内产业界的广泛关注
专利申请态势
0
20
40
60
80
100
120
140
2010 2011 2012 2013 2014 2015
大数据安全和隐私技术专利趋势
CN US
38%
42%
9%8%
3% 0%
大数据安全和隐私技术专利国别
中国
美国
WO
EP
日本
印度
美国:微软和IBM在安全加密认证领域具有深厚的研究基
础,专利优势显著,专利数量上形成很大优势;电信设备商
和运营商非常关注大数据安全技术,包括NEC、AT&T、
NOKIA都有专利申请。
中国:国内申请主要来自浪潮、华为、360、墨芋电子等企
业,同时,中科院、国家电网、北邮、西电和电子科大等高
校和科研单位在安全领域也有深厚的研究和专利布局。
中美专利申请人分析
11未经许可,不得用于商业目的未经许可,不得用于商业目的
安全和隐私保护:差分隐私/同态加密/访问控制是专利布局热点;巨头企业布局优势突显,专利运营机构已然介入
访问控制• Hitachi• Dataguise• Fujitsu• Microsoft • 阿里巴巴• 浪潮• 南邮/北邮• 奇虎360
隐私保护(差分隐私)• IBM/Microsoft• Google• SAS/Oracle• AT&T• 南邮 /上交/北邮/中科院• 奇虎360• 阿里巴巴• 华为• 浪潮
加密存储(同态加密)• SAP• THOMSON 许可公司• Microsoft • IBM • Fujitsu• 南邮/东南大学/ 西电/电子科大• 华为• 中国电子
大数据审计• DATAGUISE• IntertrustTechnologies• 浪潮• 墨芋电子• 电子科大• 公安部一所
需要重视以专利授权为主营业务的
公司手中的专利:
THOMSON licensing
Microsoft Technology
Licensing
主要申请人
主要申请人
12未经许可,不得用于商业目的未经许可,不得用于商业目的
安全和隐私保护:差异化优势明显,高校专利侧重算法设计,企业专利注重保护整体策略
差分隐私:关注差分隐私在数据
发布与数据挖掘中的应用和研
究:
• 浪潮(应用差分隐私保护
策略来保护用户隐私)
• 南邮(不损害隐私的情况
下计算出发布数据的可用
性)
• 中科大(基于差分隐私的
直方图发布方法)
• 上海交大(结合小波变换
和指数机制协同加噪的差
分隐私方法)
安全审计:关注云存储/云主机
下的审计,包括数据审计,日志
审计
专利布局特点
同态加密:关注同态加密结合其他技术
解决数据加密问题
• 南邮(云计算环境下的可并行计
算同态加密方法)
• 南邮(将生物特征加密技术和同
态算法应用到身份认证系统)
• 华为(对多个加密数据集进行重
加密及同态加密方案)
访问控制:关注控制策略设计,角色访
问控制具有很大发展空间
• 浪潮(网络访问控制策略,实现
虚拟机之间访问控制,安全防护
引擎设计)
• 北邮(基于角色和数据项的访问
控制)
专利布局特点
13未经许可,不得用于商业目的未经许可,不得用于商业目的
智能BI:大数据扩展了BI的外延,吸引更多行业企业的关注,专利量持续上升;BI产品解决方案商是专利主导者,SAP/MS/Oracle优势显著
大数据BI技术专利在2010-2016年期间共计703件(529个专利族),其
中,美国专利申请量最多(442件)中国排第二(135件)
专利申请人主要来自提供整体智能商业解决方案的IT厂商和各个应用活
跃领域的企业
从专利申请趋势来看,在华申请的专利数量小于在美申请的专利量,但
近2年来申请量均呈稳步上升态势。
专利申请趋势
0
100
200
大数据BI技术专利趋势
CN US
19%
63%
11%6%
1%
大数据BI专利国别
中国
美国
WO
EP
英国
美国:提供整体智能商业解决方案的著名IT厂商如SAP、
Microsoft、Oracle、Microstrategy、IBM等占据强势地位,其中
IBM、Microsoft、Oracle专利申请优势显著,还包括做数据分析
的的splunk和标签管理供应商Tealium有专利布局。
中国:浪潮、用友等IT企业企业专利量位于前列,同时国家电网、
京东等行业应用企业也在自身传统业务基础上布局大数据BI专利,
部分创业型中小企业如安徽华贞信息、上海云数也有部分中国专利
申请。
中美专利人分析
14未经许可,不得用于商业目的未经许可,不得用于商业目的
大数据BI:提升BI终端用户视觉体验受到关注,朝着云端迁移是BI系统发展趋势,部分企业已有专利布局
某专利系统实现框图
数据可视化分析工具(如Tableau)对商务
智能终端用户体验来说可以说是一种全新的
标准,这些工具让用户对数据集有了更多的
视觉感受,可视化是大数据BI最重要的前端
呈现需求和专利创新方向,包括
Microstrategy、SAP、Microsoft、
Tableau均在专利中有布局
BI系统向云端迁移,并将其视为一种处理有
关大数据分析等事务的使能器,包括
Microsoft、HP、Rockwell、Digital
Doors、南京云创存储科技有限公司、上海
福理信息科技有限公司等不同规模的公司均
有专利涉及
15未经许可,不得用于商业目的未经许可,不得用于商业目的
第二篇:大数据处理平台关键技术专利分析
16未经许可,不得用于商业目的未经许可,不得用于商业目的
非关系型数据库:中美布局数量遥遥领先,NOSQL研发热度还将持续
• 近五年来NoSQL全球布局达1500+个专利族,从态势曲线趋势
看NOSQL研发热度还将持续;
• 中美布局数量遥遥领先。其中,中国申请占59.9%,排名第一;
美国申请占35.94%,排名第二;中国超过美国成为该领域专
利第一大受理国,侧面反应出全球企业对中国大数据市场的重
视;
• 对比中美的授权率,美国授权率39.1%,中国授权率10.8%,
我国专利质量还需继续加强。
CN
59.90%
US
35.94%
EP
2.28%
JP
1.82%
非关系型数据库全球申请占比
0
100
200
300
400
2010 2011 2012 2013 2014 2015 2016
非关系型数据库中美申请态势
中国 美国
全球专利申请态势
全球:前十位中传统IT厂商IBM、浪潮、Microsoft专利量排名
前三, 合占NoSQL专利总数的11.2%,持有专利的技术基础性
强,占据主导地位;互联网企业阿里、腾讯TOP10榜上有名;
在华:国内布局TOP10均为本土企业,浪潮和华为数量优势显
著,统IT厂商、互联网企业均有参与布局
中美专利人分析
17未经许可,不得用于商业目的未经许可,不得用于商业目的
非关系型数据库:与关系型数据库优势融合成为趋势主导;基于WEB同步为创新热点,在华布局意图明显;
融合途径1:NoSQL对复杂查询的支持;SQL提供JSON等非关系型的数据字段
单独布署
向对方优化
NOSQL支持
SQL查询
SQL实现可
缩放性
NOSQL支持复
杂查询
SQL实现对
NOSQL结构数
据存储
融合途径2:关注热点:适合数据结构和规模复杂而又庞大场景
联合布署,优势互补
SQL与NOSQL结合
SQL与NOSQL融合接
口
• 文档存储数据库申请量120+ ,在华申请为主,占比达89%
• 近5年来在华机构布局较多,奇虎科技
长虹电器、浪潮、南京大学、国家电网
申请量排名前五;
重视中国市场,在华布局意图明显
在华
89%
国外
11%
文档存储数据库国内外占比
•CN201510129427.6
•CN201410418403.8
•CN201510241908.6
•CN201510229300.1
•CN201510634866.2
•CN201410797462.0
创新热点-同步
18未经许可,不得用于商业目的未经许可,不得用于商业目的
商业友好的Apache2.0/GPLV3成文档存储数据库开源主流协议,开发者积极埋伏专利
数据库首次发行时间
开发者 许可开发者是否有专利
布局Mongo
DB2009 MongoDB
开源:AGPL V3商业许可可用
是
CouchBase
2011 Couchbase 开源:Apache V2 否
CouchDB
2005Apache软件
基金会开源:Apache V2 否
SequoiaDB
2013 巨杉开源:
AGPL(Server) ApacheV2(Client)
是
主流产品
键值数据
库
22%
列簇存
储
22%
图数据库
10%文档存储
8%
其他
38%
非关系型数据库类型占比
Apache V2是商业应用友好的许可。使用者也可以在需要的时候修改代码来满足需要并作为开源或商业产品发布/销售Apache专利许可的条款,每个奉献者授权您一个永久性、全球的、非排他性的、不收费、免版税的、不可
撤销的专利实施许可,可以创建、使用、许诺销售、销售、引进及转换作品,其中这样的许可只适用于因其奉献者单独或者与其奉献者与提交的作品结合而受到侵犯的这些奉献者授权的那些专利声明。如果您针对任何实体提起诉讼,主张作品或者纳入到作品中的奉献构成直接或间接的侵犯,那么按本许可授权您该作品的任何专利许可在提起诉讼之时终止。
GPL v3特点:商业软件或者对代码有保密要求的部门就不适合集成/采用作为类库和二次开发的基础。沉淀在互联网上绝大多数知识产权是属于开源的。如果持有隐性专利的组织或个人要状告开源软件发行者专利侵权,那后者也有可能反告前者在互联网上 “开源”的侵权,从而达到权利公平、法律平衡的制约效果
19未经许可,不得用于商业目的未经许可,不得用于商业目的
分布式计算:中美专利布局数量实力相当,均以本土企业为主
• 分布式批量计算技术在2010-2016年全球布局达400+个专利族。
• 中美布局数量遥遥领先:中国申请占48.97%,美国申
请占47.14%,两局专利布局数量相当
• 分布式批量计算技术,近五年来申请量随年呈快速增
长趋势,未来批量计算专利布局热度还将持续
• 全球:传统IT厂商IBM、浪潮、Microsoft专利量排名前三, 互联网企业百度、运营商中国移动TOP10榜上有名
• 在华:是IT厂商、运营商、互联网巨头、高校及各研究院;国际IT巨头IBM重视国内布局,跻身国内排名TOP10;
• 美国:美国布局TOP10以本土企业为主,IBM中美市场并重,在美申请量位居榜首,专注于大数据硬件的Cognitive Electronics对专利重视有加
全球布局概况
0
20
40
60
80
2010 2011 2012 2013 2014 2015 2016
批量计算领域中美申请态势
中国 美国
CN
48.97%US
47.14%
EP
3.20%
JP
0.46%
KR
0.23%
批量计算全球申请占比
申请人分析
20未经许可,不得用于商业目的未经许可,不得用于商业目的
分布式计算:任务调度创新热度高,中美布局数量相当,在华高校为主要创新基
地,在美NPE已然出现
CN
46.94
%
US
53.06
%
任务调度中美申请占比任务调度整体分析
• 任务调度是批量计算热度最
高的技术领域
• 在华专利占比46.94%;美
国专利占比53.06%,中美
实力势均力敌
在华高校为主要创新基地
西安交通大学
浪潮电子
电子科技大学
中国移动
北京大学
华中科技大学
• IBM、HP、Alcatel-Lucent等巨头在任务调度技术领域均有专利布
局
• 广告技术领域新锐Adometry、Turn Inc.纷纷涉足大数据平台创
新,其中Adometry于2014年被互联网巨头Google收购
• 频发诉讼的知名NPE-Thomson LICENSING亦关注大数据批量计
算,在任务调度领域持有专利
THOMSON…
HP
INFOSYS
Turn Inc.
Adometry
Alcatel-Lucent
AT&T
IBM
美国主要申请人排名在美申请分析
21未经许可,不得用于商业目的未经许可,不得用于商业目的
内存计算:申请呈增长趋势,我国成第二大受理国,占据重要市场地位;国外内存计算巨头重视在华专利布局值得关注
• 2010-2016年内存计算技术专利共公开643件
(509个同族)。其中,美国专利申请量最多,占
比51.87%;其次是中国,占比44.01%;
• 内存计算技术专利申请爆发式增长,未来内存计算
技术研发热度还将持续
专利申请态势
0
50
100
150
200
2010 2011 2012 2013 2014 2015 2016
内存计算申请态势
中国 美国
51.87%44.01%
3.14%0.59% 0.39%
内存计算全球申请占比
US
CN
EP
JP
IB
• 全球:SAP专利数量绝对优势,中兴、华为、浪潮布局
数量全球靠前
• 中国:国内企业中兴华为浪潮申请榜上前三优势明显,
内存计算巨头SAP重视中国市场,申请量排名TOP10以
内。
• 美国:IBM、Oracle、SAP(Sybase)位居内存数据库
主流之列,同时产品专利保护重视有加,排名TOP10
中美专利申请趋势
22未经许可,不得用于商业目的未经许可,不得用于商业目的
国家…
华南…
星环
浪潮
SAP
内存计算异构内存体系申请人占比
多级存储体系
• 多级存储体系是解决传统计算平台
面临的包括内存容量不够大、能耗
高等方面问题。
• 国内外企业在此领域均有积极布局
ApacheV2
ApacheV2专利许可的条款:每个奉献者授权您一个永久性、全球的、非排他性的、不收费、免版税的、不可撤销的专利实施许可,可以创建、使用、许诺销售、销售、引进及转换作品,其中这样的许可只适用于因其奉献者单独或者与其奉献者与提交的作品结合而受到侵犯的这些奉献者授权的那些专利声明。如果您针对任何实体提起诉讼,主张作品或者纳入到作品中的奉献构成直接或间接的侵犯,那么按本许可授权您该作品的任何专利许可在提起诉讼之时终止。
• Spark 提供了基于内存的计算集群,在分析数据时将数据导入内存以实现快速查询,速度比基于磁盘的系统(如Hadoop)快很多。
• Tachyon(现Alluxio)是一款分布式内存文件系统,是包括血统层和持久层的两层体系架构,可以在集群里以访问内存的速度来访问存在Tachyon里的文件。
• Spark和Tachyon均是基于ApacheV2开源协议
开源产品Spark&Tachyon
内存计算:多级存储体系是内存计算关注焦点,商业友好的ApacheV2成内存计算企业用户追捧开源协议
Apache V2是商业应用友好的许可,使用者可以在需要的时候修改代码来满足需要并作为开源或商业产品发布/销售
23未经许可,不得用于商业目的未经许可,不得用于商业目的
流式计算:随社交、电子商务等产业潮流兴起,流式计算专利开始升温,企业和NPE争相布局,专利竞争暗流涌动
0
50
100
150
2010 2011 2012 2013 2014 2015 2016
美国和中国地区流式计算专利公开量趋势
CN US
社交和电子商务等实时性要求高的互联网业务规模的不
断扩大是推动流式计算技术创新发展的重要因素。相关
的专利申请也随之开展,在美国的公开起始于2010年
前后,2012年开始出现在华专利公开。
流式计算技术应产业发展需求而生,专利申请处于上升
期,但相比于以MapReduce为代表的批量计算,专利
申请量少,布局空间大,技术成熟度相对较低。
0
500
1000
2010 2011 2012 2013 2014 2015 2016
全球批量计算 VS 流量计算专利公开量
流式 批量
专利申请态势
IBM在美国地区和在华专利数量优势遥遥领先;
国内企业华为百度腾讯阿里360等互联网企业纷纷参与
流式计算专利申请,虽然数量不多,但同时在海外开展
布局;
专利竞争暗流涌动,美国地区大量专利采用不公开申请
人的方式,专利运营机构已掌握少量该领域专利;
申请人分析
24未经许可,不得用于商业目的未经许可,不得用于商业目的
国内关键技术分支专利分布
架构类
数据传输类
高可用技术类
流式计算:开源流式计算架构spark、storm等创新活跃;互联网、金融和IoT三大应用场景需求牵引拉动数据传输与处理技术创新
数据传输类申请量最大,80%以上的专利主要涉及具体业务应用
中的数据交互实时性改进;
其次是架构类,面向具体应用场景需求的架构外围功能改进和处
理能力、稳定性等性能调优;STORM和SPARK相关技术创新活
跃;
高可用类专利数量相对少,持久化队列、回滚等技术点最受关
注。
互联网:技术发展的重要推手——申请专利数量最多、增量最大、技术创新最为活跃。关注数据
处理的实时性,引擎提供商介入最早,应用形式主要涉及基于流式计算的实时推送实时广告插入
等。
金融:大数据复杂事件实时处理研究的起步——技术研究和专利申请起步最早,技术创新主要聚
焦在高容错性,应用形式主要涉及基于流式计算技术的实时监控、实时决策系统类居多。
IoT:流式计算技术创新的重要机遇——流式计算技术创新的热点,数据规模最大,专利申请主要
关注海量非结构化数据处理,专利创新主要关注高吞吐量高可靠性要求下的实时性提升。
25未经许可,不得用于商业目的未经许可,不得用于商业目的
MPP:国外研究起步早,技术成熟度高,专利布局完善,垄断局面已经形成,技术创新空间有限。
0
20
40
60
2010 2011 2012 2013 2014 2015 2016
美国和中国地区MPP技术专利公开量
趋势
US CN
总体情况
美国地区专利态势
中国专利申请态势
MPP技术专利在2010-2016期间共计288项专利公开,其
中美国专利192项,中国专利52项,其他地区30余项
美国MPP技术相关专利在2013年之前已经进入平稳阶段,
技术成熟度较高,2013之后呈现上扬趋势主要与传统
MPP技术和开源分布式系统融合创新技术相关。
在华专利总体公开量小,与美国地区差距显著,国内申请
人以外围跟随为主。在传统MPP与开源分布式系统融合创
新的机遇下具有潜在的突破潜力。
新型MPP
14%
12%
11%
9%
4%
50%
美国地区专利权人持有量占比分析
IBM
EMC及其合资公司
Teradata
HP
其他
IT巨头IBM以及主流厂商EMC、Teradata、HP、
Google等持有的专利量已经超过美国地区总量的50%左
右,垄断局势明显。
26未经许可,不得用于商业目的未经许可,不得用于商业目的
MPP:在华专利以外围和改进类为主,少量企业值得关注,MPP与Hadoop技术融合创新类专利异军突起成布局热点。
MPP技术在华关键技术分支专利分布
存储
横向扩展
share nothing架构
与Hadoop融合创新
存储类:主要申请人为电力企业以及EMC和IBM等外
企;
横向扩展类:金融电力等特定行业应用场景下的改进类
为主;
Share nothing架构:申请数量少,外围改进和应用类
为主;
融合创新:数量最多,MPP领域新的技术创新的热点;
在华MPP相关专利主要集中在华为、南大通用、华
三和多家电力企业手中
MPP与Hadoop的技术融合创新:国内外市场核心竞争者已纷纷参与布局,专利量不多,客观上存有很大创新空间
技术路线1:SQL on Hadoop 专利申请主要集中在2013年和2014
年; 美国地区参与者HP, FACEBOOK,数
据库厂商Actian、Wolfram Alpha; 国内主要参与企业有华为和星环科
技,申请内容涉及改善灵活性、性能、兼容性等。前者已开展海外布局。
技术路线2:shared everything特性向MPP渗透 研究最早起步,专利较多。近年除主
流一体机厂商Teradata, HSBC和Diebold等,金融行业申请人较为活跃;
专利申请较多关注从Oracle产品到MPP的技术融合,涉及扩展性改进等。
技术路线3:混搭,联合部署 专利成果主要集中在近三四年间; 美国地区参与专利布局的:IBM、
EMC、Rackspace;国内主要参与者:南大通用、浪潮;
专利申请较多关注混合场景下的任务调度和数据共享机制的完善等
27未经许可,不得用于商业目的未经许可,不得用于商业目的
资源管理与调度平台:国外领先企业掌握核心重要专利,布局全面;国内专利持有情况分散,多数国内企业对底层平台技术关注度低
总体情况
美国地区专利态势
中国专利申请态势
大数据资源管理与调度平台相关专利在2010-2016期间共计639项
专利公开,其中美国372项,中国专利213项,其他地区50余项
美国地区相关专利在2010年前后开始有持续稳定数量的公开,
2013年之后专利公开量一直处于快速上升阶段。
在华专利公开的起步和上升时间与美国地区基本同步。总体数量上
远超欧洲和日韩地区的总和,为美国之后的第二大专利受理国,体
现出我国在大数据产业中较为重要的市场地位。
0
20
40
60
80
100
120
140
160
180
200
2010 2011 2012 2013 2014 2015 2016
美国和中国地区大数据资源管理与
调度平台相关专利公开量趋势
CN US
申请人分析
美国:前十名均为IT巨头企业、主流数据库厂商和电商等,掌握核心重要专
利;
在华:在华申请人较为分散,参与热度高,没有形成布局规模;
28未经许可,不得用于商业目的未经许可,不得用于商业目的
HDFS/GFS 文件管理系统:
浪潮华为申请活跃,研究机构参与广泛,Oracle等国外企业已有少量专利进入我国。
专利申请主要围绕基于数字城市、地震数据、物联网等行业数据相关的文件存储。
呈现两大热点:1、海量小文件存储 2 、安全性的考虑
资源管理与调度:
专利申请主流趋势:集群调度、计算资源的调度。
容器相关、Mesos轻量级、Yarn与hadoop生态结合等;
浪潮电子申请最为活跃
产学联合:华为和中科大,异构平台上的任务调度等。
资源管理与调度类近年申请活跃,热点频现;文件管理系统技术创新方向偏行业应用
29未经许可,不得用于商业目的未经许可,不得用于商业目的
第三篇:数据源关键技术专利分析
30未经许可,不得用于商业目的未经许可,不得用于商业目的
ETL:专利申请持续增长,在华申请首超美国
45%
48%
4%1%
0%
1% 1%
ETL技术专利地域分布
中国
美国
WO
EP
日本
英国
印度
0
50
100
150
2010 2011 2012 2013 2014 2015 2016
ETL技术专利趋势
CN US
ETL技术专利在2010-2016年期间共计982件(612
个专利族),其中,美国专利申请量最多,中国排
第二。
专利申请人来自IT和互联网企业,包括传统巨头和
应用领域的初创公司
从专利申请趋势来看,在华申请的专利从2015年开
始超过在美国申请的专利数量,中国市场是ETL企业
关注的重点
专利申请趋势
美国:IT企业、互联网企业占据强势地位,IBM专
利申请优势显著,其余Microsoft、oracle、sap、
HP等等传统巨头企业的专利申请量较多。
中国:浪潮、百度、阿里巴巴、南大通用、久其软
件等传统IT企业和互联网企业专利申请量位于前
列,此外,国家电网以电力行业为视角有较多关于
ETL数据挖掘的专利申请,中国移动是最关注ETL
技术的运营商。
中美专利申请趋势
31未经许可,不得用于商业目的未经许可,不得用于商业目的
创新热点集中:ETL工具、软件维护测试和异常处理是专利关注的热点
ETL工具实现• IBM• 浪潮• 百度• 阿里巴巴• 天津南大通• 久其软件等
ETL软件测试和代码更新
• 阿里巴巴• IBM• SAS• Oracle• Delphix• Platform
异常处理• 国家电网• IBM• 航天信息股份有限公司• Aigle• knowledge dynamics
任务管理• IBM• HP• Microsoft• 阿里巴巴
从专利分布来看,国内外软件企业、互联
网企业非常关注ETL软件测试和代码更新、
异常处理、ETL工具和任务管理:
ETL软件测试和代码更新,包括阿里巴
巴和IBM、SAS等传统互联网企业围绕
冒烟测试、测试流程方法等领域有专利
布局
异常处理,包括异常管理、异常分析、
异常日志、异常监控过程,国家电网,
航天信息等行业企业非常关注电力、航
空领域的ETL异常处理问题,但专利多
数还在审查中,并未授权
ETL任务管理、任务调度、任务配置参
数和任务状态等过程也得到很多企业关
注,包括IBM、阿里巴巴、HP等有专利
布局
32未经许可,不得用于商业目的未经许可,不得用于商业目的 http://www.caict.ac.cn/
国家高端专业智库 行业创新发展平台
关注官微可下载ppt全文
联系人信息:张俊霞
联系电话:010-62304283
微信号:中国信息通信研究院知识产权中心