descriptive statistics الإحصاء الوصفي§لتوزيع التكراري...
TRANSCRIPT
Descriptive statistics اإلحصاء الوصفي
Grouped data and perform the frequency distribution
تجميع البيانات وعمل التوزيع التكراري
Measures of central tendency
قياس النزعة المركزية
Measures of dispersion (dispersion, variation, spread, scatter)
(الخ....التباين، المدي)قياس التشتت
Measures of position
قياس التموضع
Exploratory data analysis (EDA)
التحليل التوضيحي للبيانات
Measures of shape of distribution: graphs, skewness, kurtosis
الرسم البياني، الكرتوسيس، اإلنحناء: قياس شكل التوزيع
A frequency distribution is a tabular summary of data showing the frequency (or number) of items in each of several non overlapping classes. التوزيع التكراري هو جدولة للبيانات تظهر فيها التكرارات للبيانات أو عددها في فترات غير متداخلة
The objective is to provide insights about the data that cannot be quickly obtained by looking only at the original data. الهدف منها هوالتزويد بفكرة عن البيانات التي اليمكن الحصول عليها بنظرة سريعة للبيانات األصلية
Frequency Distribution
التوزيع التكراري
Taste Panelists were asked to rate the quality of a certain food product as being
excellent, above average, average, below average, or poor
منتج غذائي ما يراد تقيمه بواسطة متذوقين من حيث الجودة
:كان مقياس الجودة هي فإذا
فوق الوسط، وسط، دون الوسط و ضعيف ممتاز،
Example: Food Product
منتج غذائي: مثال
Average وسط
Below Average دون الوسط
Poor ضعيف
Above Average فوق الوسط
Above Average فوق الوسط
Above Average فوق الوسط
Above Average فوق الوسط
Average وسط
Below Average دون الوسط
Below Average دون الوسط
Poor ضعيف
Above Average فوق الوسط
Above Average فوق الوسط
Excellent ممتاز
Above Average فوق الوسط
Average وسط
Above Average فوق الوسط
Average وسط
Above Average فوق الوسط
Average وسط
The ratings provided by a sample of 20 Panelists are: :متذوق كاآلتي 20كانت النتائج التي تم الحصول عليها من عينة من
Poor ضعيف
Below Average دون الوسط
Average وسط
Above Average فوق الوسط
Excellent ممتاز
2
3
5
9
1
Total 20
Rating التكرار التقدير Frequency
of a class is the fraction or relative frequencyThe proportion of the total number of data items
belonging to the class
للصنف هو الجزء أو النسبة للعدد الكلي للبيانات التي تنتمي التكرار النسبي للفئة تحت الدراسة
is a tabular relative frequency distributionA summary of a set of data showing the relative
frequency for each class
هو الملخص الجدولي للبيانات التي تبرز التكرار التوزيع التكراري النسبي النسبي لكل فئة
Relative Frequency Distribution التوزيع التكراري النسبي
The percent frequency of a class is the relative frequency multiplied by 100
100للفئة هو التكرار النسبي مضروباً في التكرار المئوي
A percent frequency distribution is a tabular summary of a set of data showing the percent frequency for each class
هو التلخيص الجدولي للبيانات التي تبرز التكرار التوزيع التكراري المئوي المئوي لكل فئة
Percent Frequency Distribution التوزيع التكراري المئوي
Relative Frequency and Percent Frequency Distributions
التوزيع التكراري النسبي والمئوي
ضعيف
دون الوسط
وسط
فوق الوسط
ممتاز
.10
.15
.25
.45
.05
1.00 المحموع
10
15
25
45
5
100
التكرار المئوي التكرار النسبي الرتبة
.10(100) = 10
1/20 = .05
Bar Graph الرسم البياني
- A bar graph is a graphical device for depicting qualitative data
الرسم البياني هو أداة تخطيطية لتصوير البيانات النوعية
- On one axis (usually the horizontal axis), we specify the labels that are used for each of the classes
تحدد المسميات التي تستخدم لكل فئة( األفقي غالبا )في أحد المحورين - A frequency, relative frequency, or percent frequency scale can be used for the other axis (usually the vertical axis)
للتكرار، التكرار النسبي والتكرار المئوي( الراسي)بينما يستخدم المحمور اآلخر
drawn above each class bar of fixed widtha Using - label, we extend the height appropriately
إستخدام رسم بياني بعرض ثابت لكل فئة ويمكن تمديد اإلرتفاع بشكل مالئم
to emphasize the fact that each bars are separatedThe - class is a separate category
تفصل األعمدة لتأكيد حقيقة ان كل فئة عبارة عن صنف منفصل
ممتاز فوق الوسط وسط دون الوسط ضعيف
Fre
qu
en
cy
ر راتك ال
التقديرات
Bar Graph الرسم البياني
1
2
3
4
5
6
7
8
9
10 Food Product Quality Ratings
تقديرات المنتج الغذائي
Pie Chart الرسم البياني الدائري
- The pie chart is a commonly used graphical device for presenting relative frequency distributions for qualitative data
الرسم البياني الدائري يعتبر من األدوات التخطيطية الشائعة اإلستعمال لتمثيل البيانات النوعية للتوزيع التكراري النسبي
- First draw a circle; then use the relative
frequencies to subdivide the circle
into sectors that correspond to the
relative frequency for each class
حيث ترسم دائرة ثم تستخدم التكرارت النسبية لتقسيم الدائرة الى قطاعات
بحيث أن كل قطاع يمثل التكرار النسبي لكل فئة
- Since there are 360 degrees in a circle,
a class with a relative frequency of .25 would
consume .25(360) = 90 degrees of the circle
فإن كل فئة تحتل بما يماثل قيمة التكرار النسبي لها 360بما أن درجات الدائرة
فإن قطاعها يكون 0.24=فمثالً إذا كان التكرار النسبي للفئة
درجة من الدائرة 90=360*0.25
%15دون الوسط
%25وسط
%45فوق الوسط
%10ضعيف
%5ممتاز
تقديرات المنتج الغذائي
Pie Chart الرسم البياني الدائري
ما يستفاد من الرسم البياني الدائري
Example: Food Product المنتج الغذائي: مثال
- One-half of the customers surveyed gave the food product a quality rating of “above average” or “excellent”
(looking at the left side of the pie). This might please the processor
نصف العمالء المستطلعين أعطو المنتج الغذائي تقدير فوق الوسط أو ممتاز وهذا يعطي متخذ القرار إنطباعا حسناً
- For each customer who gave an “excellent” rating, there were two customers who gave a “poor” rating (looking at the top of the pie). This should displease the processor لكل عميل أعطي تقدير ممتاز هناك عميل آخر أعطي المنتج الغذائي تقدير
ضعيف، وهذه نتيجةغيرمفضل لدي متخذ القرار
Summarizing Quantitative Data ملخص البيانات الكمية
• Frequency Distribution
التوزيع التكراري•
• Relative Frequency and Percent Frequency
التوزيع التكراري النسبي والمئوي•
• Dot Plot
الرسم البياني النقطي•
• Histogram
المدرج اإلحصائي•
• Cumulative Distributions
التوزيعات التراكمية•
مثال عطاءات توريد مدخالت أعالف مركزة
طرح مدير مزرعة ما عطاءاً لشراء مدخالت أعالف مركزة،
مورداً بعطاءاتهم وفقاً للفواتير المبدئية التالية باللاير 50تقدم :السعودي
عينة من قيمة عطاءات توريد باللاير السعودي -
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
مثال عطاءات توريد مدخالت أعالف مركزة
Frequency Distribution التوزيع التكراري
خطوات إختيار عدد الفئات•
فئة 20الى 5يتم إختيار بين -
تتطلب البيانات ذات األعداد الكبيرة عادة عدد كبير من الفئات -
بينما تتطلب البيانات ذات األعداد الصغيرة فئات قليلة -
Frequency Distribution التوزيع التكراري
• Guidelines for Selecting Width of Classes
خطوات إختيار عرض الفئة•
Largest Data Value Smallest Data Value
Number of Classes
-Use classes of equal width
إستخدم فئات ذات عرض متساوي --Approximate Class Width =
=العرض التقريبي للفئة -
عدد الفئات( / أصغر قيمة –أعلي قيمة )
:فئات 6للمثال المذكور إذا تم إختيار
50-59
60-69
70-79
80-89
90-99
100-109
2
13
16
7
7
5
Total 50
التكرار قيمة العطاء باللاير
Approximate Class Width = (109 - 52)/6 = 9.5 10
10 9.5 = 6(/ 52 – 109= )العرض التقريبي للفئة
Frequency Distribution التوزيع التكراري
التوزيع التكراري النسبي والمئوي
50-59
60-69
70-79
80-89
90-99
100-109
.04
.26
.32
.14
.14
.10
Total 1.00
التكرار النسبي
4
26
32
14
14
10
100
التكرار المئوي
2/50 .04(100)
قيمة العطاء باللاير
لاير 59-50من قيمة العطاءات تقع في فئة % 4فقط -
من قيمة العطاءات تقع ضمن فئة( تقريباً 2/3أو % 32)أكبر نسبة - لاير 79-70 -
لاير 70من قيمة العطاءات تقع تحت الـ % 30 -
لاير أو أكثر 100من قيمة العطاءات تساوي % 10 -
ما يستفاد من التكرار النسبي والمئوي -
التوزيع التكراري النسبي والمئوي
Dot Plot اإلحداثيات النقطية
• One of the simplest graphical summaries of data is a dot plot
واحد من أبسط انواع الرسم البياني•
• A horizontal axis shows the range of data values
يظهر المحور األفقي مدي قيم البيانات•
• Then each data value is represented by a dot placed above the axis
ثم يمثل كل قيمة بيان بشكل نقاط على المحور الرأسي•
50 60 70 80 90 100 110
القيمة باللاير
. . . ..... .......... .. . .. . . ... . .. .
. . .. . . . . .. .. .. .. . .
قيمة العطاءات
Dot Plot اإلحداثيات النقطية
Histogram المدرج اإلحصائي
- A common graphical presentation of quantitative data is a histogram
أحد األنواع الشائعة لتمثيل البيانات الكمية -- The variable of interest is placed on the horizontal axis
يكون المتغير المعني في المحور األفقي -- A rectangle is drawn above each class interval with its height corresponding to the interval’s frequency, relative frequency, or percent frequency
ويماثل طولها لفترات التكرار، التكرار النسبي ( فترة)يرسم مستطيل لكل فئة - أو التكرار المئوي -
- Unlike a bar graph, a histogram has no natural separation between rectangles of adjacent classes
بعكس الرسم البياني فإن المدرج اإلحصائي ليست له فاصل طبيعي بين - المستطيالت المتجاورة
2
4
6
8
10
12
14
16
18
قيمة العطاء باللاير
Fre
qu
en
cy
اركرلت ا
50-59 60-69 70-79 80-89 90-99 100-110
قيمة العطاءات
Histogram المدرج اإلحصائي
• Symmetric متماثل
– Left Back is the mirror image of the right Back
الخلفي هو صورة مرآة للجانب األيمن الخلفي الجانب اليسار–
– Examples: heights and weights of people
أطوال وأوزان الناس: مثال–
Histogram (Common categories) األقسام العامة للمدرج اإلحصائي
Re
lati
ve F
req
ue
ncy
.05
.10
.15
.20
.25
.30
.35
0
• Moderately Skewed Left اإللتواء لليسار متوسط
– A longer Back to the left
يكون الجانب األيسر متوسط الطول–
– Example: exam scores
درجات اإلختبارات: مثال–
Re
lati
ve F
req
ue
ncy
.05
.10
.15
.20
.25
.30
.35
0
Histogram (Common categories) األقسام العامة للمدرج اإلحصائي
• Moderately Right Skewed متوسط اإللتواء للجاني األيمن
– A Longer Back to the right
يكون الجانب األيمن متوسط الطول–
– Example: housing values
قيم المنازل: مثال
Re
lati
ve F
req
ue
ncy
.05
.10
.15
.20
.25
.30
.35
0
Histogram (Common categories) األقسام العامة للمدرج اإلحصائي
• Highly Skewed Right اإللتواء نحو اليمين شديد
– A very long Back to the right
يكون الجانب األيمن أكثر طوالً –
– Example: executive salaries
رواتب التنفيذيين: مثال–
Re
lati
ve F
req
ue
ncy
.05
.10
.15
.20
.25
.30
.35
0
Histogram (Common categories) األقسام العامة للمدرج اإلحصائي
Cumulative frequency distribution - shows the number of items with values less than or equal to the upper limit of each class
يوضح عدد العناصر ذات القيمة أقل من التوزيع التكراري التراكمي أو تساوي الحد األعلي لكل فئة
Cumulative relative frequency distribution – shows the proportion of items with values less than or equal to the upper limit of each class
كذلك نسبة العناصر ذات القيمة أقل من التوزيع التكراري التراكمييوضح أو تساوي الحد األعلى لكل فئة
Cumulative Distributions التوزيعات التراكمية
Cumulative percent frequency distribution – shows the percentage of items with values less than or equal to the upper limit of each class
يوضح النسبة المئوية للعناصر التي تكون قيمتها التوزيع التكراري التركمي أقل من أو مساوية للحد األعلي لكل فئة
عطاءات العلف المركز •
< 59
< 69
< 79
< 89
< 99
< 109
التكرار التراكمي المئوي نسبة التكرار التراكمي التكرار التراكمي (لاير) التكلفة
2
15
31
38
45
50
.04
.30
.62
.76
.90
1.00
4
30
62
76
90
100
2 + 13 15/50 .30(100)
Ogive - An ogive is a graph of a cumulative distribution
عبارة عن رسم بياني للتوزيع التراكمي-
- The data values are shown on the horizontal axis
تمثل قيمة البيانات على المحمر األفقي -
- Shown on the vertical axis are the:
cumulative frequencies, or
cumulative relative frequencies, or
cumulative percent frequencies
:بينما يمثل على المحور الرأسي -
التكرارات التراكمية، أو
نسبة التكرارت التراكمية، أو
التكرارات التراكمية المئوية
- The frequency (one of the above) of each class is plotted as a point
تمثل التقديرات المذكورة لكل فئة كنقاط-
- The plotted points are connected by straight lines
يتم إيصال نقاط التخطيط بخط مستقيم -
- Because the class limits for the ration-cost data are 50-59, 60-69, and so on, there appear to be one-unit gaps from 59 to 60, 69 to 70, and so on
الخ فيظهر ان هناك وحدة ....69-60، 59-50الن حدود كل فئة هي -
واحدة بين الحد األعلي للفئة والحد األدني للفئة التي تليها
- These gaps are eliminated by plotting points halfway between the class limits
يتم التخلص منها بتخطيط النقاط في ( الفجوات)مثل هذه الفروقات -
منتصف كل فئة
- Thus, 59.5 is used for the 50-59 class, 69.5 is used for the 60-69 class, and so on
69.5تصبح 69-60، 59.5مساوية لـ 59-50وبالتالي تصبح الفئة -
وهكذا
عطاءات العلف المركز
Ogive with
Cumulative Percent Frequencies Ration Cost
Ration Cost (SAR)
20
40
60
80
100
Cu
mu
lati
ve P
erc
en
t Fr
eq
ue
ncy
50 60 70 80 90 100 110
(89.5, 76)