محقق کننده امنیت خصوصی سازی برای query ها
DESCRIPTION
محقق کننده امنیت خصوصی سازی برای QUERY ها. درس: مباحث ویژه در پایگاه داده ها استاد راهنما: جناب آقای دکتر رهگذر ارائه دهنده: امین رسولی. بهترین پارتیشن بندی برتی داده های اهداف و سنجش های امنیت اطلاعات شخصی تنظیم امنیت و آزادی عمل در یک نقطه مشخص تجارب و نتیجه گیری. - PowerPoint PPT PresentationTRANSCRIPT
1
ها: داده پایگاه در ویژه مباحث درس : رهگذر دکتر آقای جناب راهنما استاد
: رسولی امین دهنده ارائه
های داده برتی بندی پارتیشن بهترین
شخصی اطالعات امنیت های سنجش و اهداف
مشخص نقطه یک در عمل آزادی و امنیت تنظیم
گیری نتیجه و تجارب
2
برای سازی خصوصی امنیت کننده ها QUERYمحقق کند اطمینان سرور به تواند نمی اما
: آنها ذخیره و های داده کردن کد ها حل راه دهیم؟ انجام را آنهای اجرای و کردن کد چگونه
3
Encrypted & Indexed
Client Data
Server
Untrusted
Service Provider
Query Post Processor
Query Translator
True Results
Original Query
Query over Encrypted Data
Encrypted Results
Trusted
Client
User
4
etuple sharesA ageA salA
X@#$^&FJ X1 Y2 Z1
CH$^*(G#!
X2 Y1 Z1
^$*D%L*# X3 Y2 Z2
*%GH%&)$ X3 Y3 Z3
Original Table (plain text) R
Server side Table (encrypted + indexed) RA
Bucket-tags
eid name
addr shares age sal
345 Tom Maple 5400 32 390K
876 Mary Main 5800 22 423K
234 John River 6000 34 598K
780 Jerry Ocean
6200 48 632K
0 200 450 600 650 700
Z0 Z1 Z2 Z3 Z4
buckets
Meta data
Server side data
Client side storage
5
etuple sharesA ageA salA
X@#$^&FJ X1 Y2 Z1
CH$^*(G#!
X2 Y1 Z1
^$*D%L*# X3 Y2 Z2
*%GH%&)$ X3 Y3 Z3
Client side Table (plain text) R
Server side Table (encrypted + indexed) RA
Bucket-tags
Client-side query
Server-side query
Select etuple from RA where RA.salA = z1 ∨ z2
Select * from R where R.sal [400K, 600K]
eid name
addr shares age sal
345 Tom Maple 5400 32 390K
876 Mary Main 5800 22 426K
234 John River 6000 34 598K
780 Jerry Ocean
6200 48 634K
Client side Table (plain text) R
کنیم استفاده خواهیم می قسمت تعداد چه
کنیم؟ بندی پارتیشن را ها داده چگونه
6
AdversaryAccess to sever-side data +Malicious Intentions
Privacy issue in partitioned dataSmall range of a bucket B +1 sample value from B
Privacy goal of clientTo hide all useful information from A
بده قرار قسمت یک را منفرد ویژگی هر
7
Adversary (A)
“Almost total” disclosure of all
elements in B
8
1 2 3 4 5 6 7 8 9 10Salary(100K’s)
4
B1
44 4 4
10
2
6
2
10
B2 B3 B4
Frequency
Optimal cost = ∑NB*FB = 12*3 + 20*2 + 10*2 + 8*3 = 1101
4
Time complexity = O(n2M), Space = O(nM)
n = # distinct values in dataset; M = # buckets
بندی تقسیم برای مدلها یادگیری
حساس های ارزش
مدل
A’s Domain knowledge+
Sample values from buckets
فرض بدترین
شده توزیع های داده برای شده توزیع دانش یک9
برای یادگیری مدل یکتوزیعی اطالعاتی بانک
25.12
12*2*
|f(CB)|
|f(B)|K
5.124
50)( CBf
10
1 2 3 4 5 6 7 8 9 10
Freq
Values
4 44 4 4
10 10
6
2 2
B1 B2 B3 B4
2 2 2
2 4 2
4 2 2 3
3 4 2 3
2 2 2 3 4
CB1
CB3
CB2
CB4
CB1
CB2
CB3
CB4
بهینه های qureyقسمت
1 2 3 4 5 6 7 8 9 10
10
Degradation factor k = 2
Composite Buckets
Final set of buckets on
server
Metadata size increases from
O(M) to O(KM)
ای داده های مجموعه : اعداد مصنوعی های یکسان integerداده تصادفی تولید در
شوند می تولید کاوی داده های مجموعه در واقعی های داده
Query چگونه شوند؟ Loadها شوند می تولید تصادفی نقاط از نهایی های نقطه
11
12
Histogram
0102030405060708090
100
1510
4.4
193.
828
3.2
372.
646
255
1.4
640.
873
0.2
819.
6M
ore
BinF
req
ue
nc
y
FrequencyHistogram
0102030405060708090
100
Bin
Fre
qu
ency
Frequency
K = 6, M = 350 K = 10, M = 250
برای شده بندی قسمت های داده برای بهینه الگوریتم یکQuery رنج
آماری های داده از آماری های سنجشمتغیرهآنتروپی
کارا بطور بندی باکت های الگوریتم آنها بین حرکت و بندی تقسیم فواصل رود می باال اطالعات امنیت در ها مجموعه زیر
13
Hacigumus et. al, SIGMOD 2002, “Executing SQL over Encrypted Data in the Database Service Provider Model”.
Damiani et. al, ACM CCS 2003, “Balancing Confidentiality and Efficiency in Untrusted Relation DBMS”.
Bouganim et. al, VLDB 2002 “Chip-Secured Data Access: Confidential Data on Untrusted Servers”.
14
15
تشکر !با