ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و...

23
اﻧﺒﺎرﻩ دادﻩ اراﺋﮫ: اﻣﯾد ﻣﯾﻼﻧﯽ ﻓرد

Upload: others

Post on 11-Sep-2019

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

انباره داده

امید میالنی فرد: ارائھ

Page 2: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

2

سر فصل مطالبمقدمھ و معرفی انباره داده معماری انباره داده جمع آوری نیازمندی ھا طراحی انباره داده

Page 3: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

3

انواع سسیستمھای کامپیوتری در سازمانھا سیستمھای عملیاتیOLTP سیستمھای اطالعاتیDSS, DW/BI, OLAP

OLTP: Online Transaction Processing OLAP: Online Analytic Processing DSS: Decision Support Systems BI: Business Intelligence

Make the Wheels of Business Turns Watching the Wheels of Business Turns

Page 4: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

4

..داده ھا در ھمھ جا ھستندنمی توانم داده ھای مورد نیاز را پیدا کنم

اند پراکندهداده ھا در سطح شبکھ ھای زیادی دارند کھ تفاوت اندکی با ھم دارند نسخھ

نمی توانم داده ھای مورد نیاز را بھ دست آورم

خبرهبرای بھ دست آوردن داده ھا نیازمند یک ھستم

نمی توانم داده ھایی کھ پیدا کرده ام، درک کنم داده ھای موجود بسیار ضعیف انجام مستند سازی

شده است

نمی توانم داده ھایی کھ پیدا کرده ام استفاده کنم

از شکلی بھ شکل دیگر ھستند تبدیلداده ھا نیازمند

Page 5: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

5

...از دید کاربران داده باید در سراسر سازمان یکپارچھ باشد داده خالصھ سازی شده ارزشی واقعی در سازمان دارد داده ھای تاریخی کلید فھم داده در طی زمان را در خود دارند

Page 6: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

6

انباره داده چیست؟

منابع از که هایــی داده از یکپارچه و کامل یکـتا، مخزن یک

گرفته قرار نهایــی کاربر دسترس در شکلی به و شده گرفته گوناگون

نها بتواند که اندٓ مورد و کرده درک تجاری، ی زمینه یک در را ا

.دهد قرار استفاده

Page 7: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

7

پیدایش .نامیده شد Information Warehouseتحقیقاتی انجام و IBM، توسط ۸۰اواسط دھھ

را Building the Datawarehouse، کتاب )DWپدر ( Inmon، ۸۰اواخر دھھ )Top-Downدیدگاه . (منتشر ساخت

Kimbal کتاب ۹۶در سالThe Data Warehouse Toolkit او . را منتشر کردرا ارائھ داد Dimensional Modelingیکی از اساسی ترین مفاھیم طراحی یعنی

)Bottom-Upدیدگاه . (نامیده می شود Cubeکھ اساس چیزی است کھ امروزه

Page 8: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

8

انباره داده

خصوصیات اصلی: موضوع گرا جامع، یکپارچھ

زمان گراtime-varying فقط خواندنی non-volatile

و بیش از اینھا: منابع داخلی و خارجی با سیستمھای عملیاتی غیر یکپارچھ(جمع آوری داده از منابع مختلف( چرا؟(مجزا از تمام سامانھ ھای عملیاتی( داده ھای عملیاتی بھ قالب قابل استفاده در تصمیم گیری نگاشت می شوند: خالصھ سازی شده

Page 9: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

9

معماری انباره داده

Data Warehouse Engine

Optimized Loader

Extraction Cleansing

Analyze Query

Metadata Repository

Relational Databases

Purchased Data

ERP Systems

Legacy Data

Page 10: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

معماری انباره داده

Page 11: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

Data Mart & Data Warehouse

11

بھ سوی دپارتمان ھا جریان DWداده ھا از . دارند DWکاربران دپارتمانھا انتظارات متفاوتی از کوچکتری است کھ مربوط بھ DWدر واقع Data Mart. می یابد تا نیازھای آنھا را برطرف سازد

یک دپارتمان می باشد

Departmentally Structured

Individually Structured

Data Warehouse Organizationally Structured

Page 12: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

چرخھ عمر توسعھ ی سیستم انباره داده

12

Page 13: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

رویکردھای تحلیل نیازمندی ھا

13

مستخرج از داده(Data Driven) مستخرج از کاربر(User Driven) مستخرج از ھدف(Goal Driven) ترکیبی

Page 14: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

رویکردھای ترکیبی

14

(triple-driven)رویکرد استخراج از سھ گانھ بھ عنوان راھنمای مدیر پروژه برای تعیین اھداف تجاری goal-drivenاستفاده از

توسعھ ی استراتژی سازمان و شناسایی زمینھ ی اصلی کسب و کار )جھت رسیدن بھ اھداف(توسط مدیران ارشد (KPI)شناسایی شاخصھای کلیدی کارایی

و تحلیل آنھا برای ساخت شمای داده موضوع گرا توسط مدیر پایگاه داده DWھمزمان، شناسایی داده ھای مرتبط با استخراج نیازمندی ھا با مصاحبھ با کاربران نھایی و تحلیل گزارشات تجاری

ادغام اسناد حاصل از تمام این مراحل برای رسیدن بھ مدل منطقی

Page 15: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

مدلسازی/ رویکردھای طراحی

15

نرمال سازی چند بعدی

Page 16: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

16

.پیاده سازی می شود Top-Down، با روش )۹۰اوایل دھھ ( Bill Inmonارائھ شده توسط • )اطالعات کلیدی در جداول جداگانھ(3N داده ھای ذخیره شده در قالب نرمال نوع سوم • )ھر قطعھ کلیدی از اطالعات جداگانھ نگھداری می شود(شدیدا قابل گسترش است • JOINبھ صورت قابل مالحظھ ای بزرگ شده و کوئری زدن در آن مستلزم DWاندازه ی •

. کردن جداول زیادی خواھد بود، کلیدھای آن، روابط و جداول DWنرمال شده باید شمای DWبرای دسترسی بھ داده ھا در •

.موجود را شناخت

رویکرد نرمال سازی

Page 17: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

17

جنبھ ھای مثبت و منفی رویکرد نرمال سازی :جنبھ ھای مثبت

3داده در قالب اتمیک رابطھ ایN است بھ راحتی با تغییرات منطبق می شود 3قالبN افزونگی داده را از بین می برد مستقل از برنامھ کاربردی است

:جنبھ ھای منفی 3انباره داده ھایN نمی توانند کوئری ھای کارا تولید کنند، برخی اوقات کند بوده و باید

توسط چندین کوئری اجرا شوند ابزارOLAP بر خالفOLTP برای باال بردن کارایی ترجیح می دھند با داده ھای غیر

.نرمال کار کنند از آنجا کھ بھ دلیل نرمال بودن داده ھا و نداشتن افزونگی تعداد بسیار زیادی جدول و رابطھ

ایجاد می شود، ممکن است این اطالعات روی سرورھای مجزا پخش شوند کھ تاثیر منفی در .کارایی کوئری ھا خواھد گذاشت

بیشتر برای پایگاه داده ھای غیرDW مناسب است.

Page 18: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

18

.پیاده سازی می شود Bottom-Upارائھ شده و بیشتر با روش Kimballتوسط • .ابعاد، اطالعات مرجع برای واقعیتھا ھستند، واقعیتھا، اعداد موجود در داده ھای تراکنشی ھستند•چند بعدی، می تواند شامل یک جدول حاوی واقعیتھا و تعداد زیادی DWاطالعات ذخیره شده در یک •

.)بھ عنوان شمای ستاره ای نیز مورد اشاره قرار می گیرد. (ُبعد متصل باشداز آنجا کھ واقعیتھا و ابعاد از نظر درک کاربری آسان ھستند، مدیران و متخصصان کسب و کار •

.بدون دانش زیاد کامپیوتری ھم می توانند آنھا را بھ کار برند

(Dimensional)رویکرد ُبعدی

Page 19: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

19

در رویکرد چند ُبعدی Schemaطراحی

انواعSchema ستاره ای صورت فلکیConstellation دانھ برفیSnowflake

Page 20: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

20

Star Schema

یکfact table تک و برای ھر بعد یکdimension table

T i m e

p r o d

c u s t

c i t y

f a c t

date, custno, prodno, cityname, ...

Page 21: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

21

Snowflake schema

نشان دادن سلسلھ مراتب بعدی بصورت مستقیم بھ وسیلھ جداول .نرمال شده

نگھداری و ذخیره سازی انبار آسان است. T i m e

p r o d

c u s t

c i t y

f a c t

date, custno, prodno, cityname, ...

r e g i o n

Page 22: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

22

Fact Constellation

Fact Constellation چندین fact table کھ تعداد زیادیdimension

table را بھ اشتراک می گذارند. رزروکردن وپرداخت نھایی ممکن است تعداد زیادی

dimension tables را درصنعت ھتل بھ اشتراک گذارد

ھتل ھا

آژانس ھای مسافرتی

توسعھ

نوع اتاق مشتری

رزرو کردن

پرداخت نھایی

Page 23: ﻩداد ﻩرﺎﺒﻧا - irandoc.ac.ir · رﺎﮐ و بﺳﮐ نﺎﺻﺻﺧﺗﻣ و نارﯾدﻣ ،دﻧﺗﺳھ نﺎﺳآ یرﺑرﺎﮐ کرد رظﻧ زا دﺎﻌﺑا

23

..سپاس از همراهی شما