deĞerlendİrme - balikesirkpss.com · test-tekrar test yöntemi: test aynı gruba belirli bir...
TRANSCRIPT
ÖLÇME
VE
DEĞERLENDİRME
Ölçme ve değerlendirme süreci olmadan
planlı bir eğitim süreci söz konusu
olamaz.
Cevap aranan soru Ortaya çıkan eğitim boyutu
1. Niçin eğiteceğiz? 1. Eğitimin amacı
2. Ne öğreteceğiz? 2. Eğitimin içeriği
3. Nasıl kazandıracağız? 3. Eğitimin yöntemi
4.Nerede eğiteceğiz? 4. Eğitimin ortamı
? 5. Ne kadar öğrenildi? 5. Ölçme ve değerlendirme
Planlı eğitim sürecinde cevap verilmesi gereken bazı sorular
Ölçme ve Değerlendirme ile
İlgili Temel Kavramlar
Değişken: Kişiden kişiye, durumdan duruma, nesneden nesneye değişen özelliklerdir, boy, zeka, not, sıcaklık, başarı…
Sabit: Kişiden kişiye, durumdan duruma, nesneden nesneye değişmeyen özelliklerdir.
• Sadece tek bir değer alabilen özelliklere sabit adı verilir.
• “Sabit” özellikler fen bilimlerinde sosyal bilimlerinden daha fazla yer almaktadır.
• Örneğin; Einstein’ın enerji denklemindeki (E=mc2 ) “c” değeri sabittir (c: ışık hızını göstermektedir), pi (π) sayısı bir sabittir.
Nicel Değişken: Sayısal değişkenler (boy uzunluğu,
zeka düzeyi…)
Nitel Değişken: Sıfat ya da sembollerle ifade
edilebilirler. (medeni durumun evli/bekar olması,
cinsiyetin bayan erkek olması…) Örneğin;
cinsiyet
renkler
medeni durum
Bu özellikler sayılarla ifade edilse bile bu sayısal gösterimler matematiksel anlamda bir büyüklük, nicelik ifade etmezler (kız:1, erkek:2)
Sürekli Değişken: İki değer arasında
sonsuz sayıda başka bir değerin yer
alabildiği değişkenlerdir.(uzunluk,
ağırlık, zeka, sıcaklık…)
Süreksiz Değişken: Tam sayılarla
ifade edilir. (cinsiyet, medeni durum,
mezuniyet durumu…)
Bağımsız Değişken: Etki değişkenidir, bir
Deneysel bir araştırmada ETKİLEYEN
konumunda olan değişkendir.
Sigaranın sağlığa etkisi…
Bağımlı Değişken: Deneysel bir araştırmada
ETKİLENEN konumunda olan değişkendir.
Kontrol Değişkeni: Araştırmaya
etkisi olması istenmeyen değişken
Karıştırıcı (ara) Değişken:
Araştırmada etkisi olabilen, kontrol
altına alınamayan değişken
(özellikle sosyal bilimlerde)
Bir özelliğin gözlenip, gözlem
sonuçlarının sayı ve sembollerle ifade
edilmesidir.
Ölçme
ÖLÇME KAVRAMI VE ÖLÇME YÖNTEMLERİ
Varlıkların
Olayların
özellikleri
Sayı veya
Sembolle
İfade ediş
ÖLÇME GÖZLEM
11
Ölçme; herhangi bir niteliği gözlemek ve gözlem
sonucunu sayılarla ya da başka sembollerle ifade
etmektir.
Ölçme, varlık veya olayların belli bir
özelliğe sahip oluş derecelerini belirleme
işlemidir.
12
-Bir kumaşın boyunun cetvel ile ölçülmesi
-Bir odanın boyunun bir ip ile ölçülmesi
-Bir kova suyun sıcaklığının termometre ile ölçülmesi
-Bir çocuğun zekasının renkli küpler ile ölçülmesi
Doğrudan Ölçme
Ölçülen nitelik ile ölçmede kullanılan aracın niteliği
aynı ise bu tür ölçmelere doğrudan ölçme denir.
Örneğin: Bir bahçenin enini metre ile
ölçmek, bir kütleyi terazi ile ölçmek,
öğrencileri boy sırasına dizmek gibi…
13
ÖLÇME YÖNTEMLERİ
Dolaylı Ölçme
Ölçülen özellik ile ölçmede kullanılan
aracın özelliği birbirinden farklı ise bu tür
ölçmelere dolaylı ölçme denir.
Örneğin,
ZEKA-BAŞARI-YETENEK-İLGİ-TUTUM
dolaylı olarak ölçülür.
14
15
Türetilmiş Ölçme
Ölçülmek istenen özellik matematiksel
bir bağıntıyla ölçülebiliyorsa türetilmiş
ölçmedir
Örneğin, aritmetik ortalama“Hız= Yol / Zaman” Burada hız özelliği kendisinden farklı yol ve
zaman gibi iki özelliğin matematiksel bir bağıntısı olan bölme işlemi
yardımıyla ölçülebilmektedir. Yani hız ölçülürken türetilmiş ölçme
işlemi yapılmaktadır.
ÖLÇEK
Ölçme araçlarına verilen isimdir.
Nesnelere sayılar vermede ve bu
sayıların kullanılmasında uyulması gerekli
kurallar ve kısıtlamaları belirtmek için
kullanılır.
Cetvel ve metre gibi ölçme araçları
üzerindeki bölmeleri belirtmek için
kullanılır.
16
Belli bir obje ya da olayın, belli bir özelliğe
sahip oluş derecesini belirlemek için kullanılan
ölçme araçlarıdır. (metre, cetvel, termometre,
başarı testi, tutum ölçeği…)
Ölçek, ölçme sonuçlarının matematiksel
nitelikleri olarak da tanımlanır.
Ölçek
ÖLÇEK TÜRLERİ
• Sınıflama Ölçekleri
• Sıralama Ölçekleri
• Eşit Aralıklı Ölçekler
• Oranlı Ölçekler
18
Sınıflama Ölçekleri Belli bir gruba ait olup olmamayı gösteren
ölçüler veren ölçeklere sınıflama ölçekleri
denir.
İnsanların cinsiyet (kadın-erkek), medeni hal
(evli-bekar-boşanmış),göz rengi (mavi-yeşil-ela)
ten rengi gibi kategorilere ayrılması, illere kod
numarası verilmesi ve her ile ait arabaların aynı
numara ile belirtilmesi sınıflamaya iyi bir
örnektir.
Bu ölçekte nesnelere verilen sayıların sayısal
anlamları yoktur, onlar miktar belirtmezler.
Sınıflama ölçekleri eğitimde pek kullanılmaz19
Sıralama Ölçekleri
Bu ölçekte nesneler, bir özelliğe sahip olma durumuna göre sıralanır.
Bir gruptaki boy sırası, bir koşuda alınan dereceler, bir sınıftaki başarı sırası bu türdendir.
Eğitimdeki ölçmelerde elde edilen ölçme sonuçlarının pek çoğu sıralama ölçeğindedir.
20
Eşit Aralıklı Ölçek Eşit aralıklı ölçeklerde göreceli bir
başlangıç noktası ve tanımlanmış, değişmez (tüm ölçek boyunca eşittir) bir birim vardır.
Eşit aralıklı ölçeklerdeki sıfır, o noktada ölçülen özelliğin gerçekten hiç bulunmadığı anlamına gelmez yani yokluk ifade etmez.
Bu tür ölçeklerdeki sıfır noktası, sayısallaştırmayı kolaylaştıran bir başlangıç noktasıdır, doğal ya da mutlak sıfır noktası değildir.
21
Eşit Oranlı Ölçek
• Eşit oranlı ölçeklerde gerçek bir sıfır noktası bulunduğu ve ölçek eşit aralıklara bölümlendiği için bu ölçekte elde edilen veriler üzerinde her türlü matematiksel işlem yapılabilir.
• Ağırlık ve uzunluk ölçüleri bu tür ölçek esasına uygun olarak geliştirilmiştir.
22
ÖLÇME HATALARI
Ölçülen nesnenin gerçek değeri ile gözlem ya da
ölçme sonucunda elde edilen değer arasındaki
farka “ÖLÇME HATASI” denir.
Eğitimdeki ölçmelerin genellikle dolaylı olması,
eğitimdeki ölçme sonuçlarında daha çok hata
çıkmasına neden olabilmektedir.
23
HATA TÜRLERİ
1. Sabit Hata Ölçüm aracındaki bir hatanın tüm
ölçümleri aynı şekilde etkilemesidir. (cetveldeki bir santimlik kısalık)
2. Sistematik Hata Miktarı; ölçülen büyüklüğe, ölçme
koşullarına ve ölçmeciye bağlı olarak değişen hatalardır. (yazı güzelliğinin tarih sınav puanını etkilemesi)
3. Tesadüfi (Rastgele) Hata Kaynakları, miktarı ve yönü önceden
bilinemeyen, yönü eş olasılıklı hatalardır.
24
Ölçmeyi yapan kişiden kaynaklanan
hatalar.
Ölçme aracından kaynaklanan
hatalar.
Ölçmenin yapıldığı ortamdan
kaynaklanan hatalar.
Ölçülen özellikten kaynaklanan
hatalar.
Ölçmenin yönteminden kaynaklanan
hatalar.25
HATA KAYNAKLARI
DEĞERLENDİRME NEDİR?
Değerlendirme, ölçme sonucunu bir ölçüt ile karşılaştırarak ölçülen özellik hakkında bir karara varma işlemidir.
26
27
Ölçme sonucu
Ölçüt Karşılaştırma
Karar
(değer yargısı)
DEĞERLENDİRME NEDİR?
Amaca Göre Değerlendirme Türleri
28
1. Tanıma ve yerleştirmeye yönelik
2. Biçimlendirme - yetiştirme (süreç)
3. Düzey belirleme (sonuca yönelik)
olmak üzere üç temel değerlendirme türü vardır.
Tanıma ve yerleştirmeye yönelik
değerlendirme
Eğitim sürecinin başında
yapılır,amaç öğrenciyi tanımak ve
uygun programa, işe yerleştirmektir
29
Örnek:
-Üniversite sınavı,
-Seviye belirleme sınavları
-KPSS
Biçimlendirme yetiştirmeye yönelik
değerlendirme
Öğrenme eksiklerini belirlemek ve öğretimi
yönlendirmek amacıyla kullanılır. Ünite ya da
bölüm sonlarında yapılır.
30
Örnek:
-Öğrencilerin çalışmalarını yönlendirmek
amacıyla kullanılan izleme testleri,
-Çalışmaları esnasında öğrencilerin yaptıklarına
yönelik gözlemler,
-Ev ödevleri ve ders esnasında sorulan sorular
Düzey belirlemeye yönelik değerlendirme
Öğrencilerin öğrenme düzeylerine ilişkin bir
yargıda bulunma çalışması olup genelde
öğrenci notlarının tespitinde kullanılmaktadır
31
Örnek:
-Ünite sonrasında yapılan sınavlar,
-Nota dahil edileceği söylenen ev ödevleri,
-Proje notları
-Standartlaştırılmış başarı sınavları
Ölçüte Göre Değerlendirme Türleri
32
1. Mutlak değerlendirme
2. Bağıl değerlendirme
Bu yaklaşımda yeterlikler (ölçütler) önceden belli
ve kesindir.
Yeterlikler (genellikler hedefler) öğrencilerin
durumlarını belirlemek amacıyla kullanılırlar.
Değerlendirmenin temel işlevi öğrencinin belli
bir yeterlikte uzmanlaşıp, uzmanlaşmadığını ya
da performans standartlarına ulaşıp, ulaşmadığını
belirlemektir.
Mutlak Değerlendirme
Öğrenci grubunun başarısından çıkarılacak norma
göre yapılan değerlendirmedir.
Bu tür değerlendirmelerde norm önceden belli
değildir, grubun başarı dağılımından ve aritmetik
ortalamasından ortaya çıkar, izafidir.
Bu yaklaşımda belli bir testteki öğrenci performansı,
aynı testin uygulandığı diğer öğrencilerin
performansıyla karşılaştırılır.
Bağıl değerlendirme
ÖLÇME ARACINDA ARANAN NİTELİKLER
Yapısal NiteliklerÖlçme araçlarının nitelikleri değişik
kaynaklarda farklı biçimlerde ele
alınmasına rağmen, nitelikler başlıca üç
başlık altında ele alınmaktadır.
Geçerlik
Güvenirlik
Kullanışlılık
Test
Güvenirlik
Geçerlik
İlkay Hoca Merdiveni
Güvenilir mi? Geçerli mi?
1.Şekil 2.Şekil
3.Şekil
Geçerlik Bir ölçme aracının her şeyden önce,
ölçülecek özellik ya da özellikleri tam ve doğru olarak ölçmesidir.
Ölçülmesi söz konusu olmayan başka özelliklerle karıştırılmadan ölçülebilmesidir.
Bu nitelik aynı zamanda aracın amacına hizmet etmesi demektir
Geçerlik türleriKapsam geçerliği: Bir ölçme aracının
yoklanması gereken tüm davranışları
kapsayıp kapsamadığı ile ilgilidir. “NE
İŞLEDİYSEN ONU SOR ”
Yapı Geçerliği: Ölçme aracının ölçülmek
istenen özelliği, başka değişkenlerle
karıştırmadan ölçebilmesiyle ilgilidir.
Yordama geçerliği: Puanların ileri
performanslara ilişkin tahminlerde
dayanak olarak kullanıldığı durumlarda
kullanılır. Gelecekteki başarıyı doğru
tahmin etme işidir.
Görünüş geçerliği: Testin hangi
davranışları ölçtüğünün görülmesi ile
ilgilidir.
Güvenirlik Ölçümlerin hatasızlık derecesi ya da gerçeği
yansıtma derecesi olarak algılayabiliriz.
Belli bir özellik, bir ölçme aracı ile değişik
zamanlarda ölçüldüğü zaman aynı ya da hiç
olmazsa yaklaşık olarak aynı ölçümleri
vermelidir. Yani güvenirlik, ölçtüğü şeyi tutarlı
bir biçimde ölçmesidir.
Güvenirliğin ölçütleri• Duyarlılık: Hatası az olan ölçmedir. Birim
küçüldükçe duyarlılık artar.
• Tutarlılık: Farklı ölçme araçlarıyla yapılan ölçmelerde benzer sonuçların alınmasıdır.
• Kararlılık: Aynı ölçme araçlarıyla yapılan ölçmelerde benzer sonuçların alınmasıdır.
• İç tutarlılık: Ölçme aracında yer alan soruların birbiriyle ilişkili olmasıdır.
• Objektiflik: Kim tarafından puanlanırsa puanlansın aynı sonuçları vermesidir.
Güvenirliği Belirleme Yöntemleri
Test-tekrar Test Yöntemi:
Test aynı gruba belirli bir aralıkla
iki kez uygulanır. Birinci uygulama
ile ikinci uygulama puanları
arasındaki ilişki/korelasyon
hesaplanır.
Eşdeğer (Paralel) testler yöntemi:
Testin iki kez uygulanmasından
kaynaklanan olumsuzlukları
gidermek için eşdeğer formlar
geliştirip uygulanır. Geliştirilen iki
form aynı gruba aynı anda uygulanır.
İki testten elde edilen puanlar
arasındaki korelasyon katsayısı
hesaplanır.
Testi yarılama yöntemi:
Testin iki yarısı arasındaki tutarlılık
araştırılır. Tek numaralı sorular bir
yarı, çift numaralı sorular bir yarı
oluşturur. Elde edilen iki yarı; iki ayrı
testmiş gibi kabul edilip aralarındaki
korelasyon hesaplanır. Bu yöntem,
testin bir kez uygulanmasına
dayandığından kullanışlıdır.
KR-20 / KR-21 formülleri ve
Cronbach_Alfa Katsayısı
• Kuder-Richardson 20 ve 21
formülü, sadece 1-0 testlerinde
kullanılabilir.
•Testteki tüm maddelerin güçlük
dereceleri eşit olduğu düşünülürse, o
testin güvenirliğini tahmin için Kuder-
Richardson 21 formülü kullanılabilir.
• KR-21 ile hesaplanan güvenirlik KR-20 ile
hesaplanan güvenirlik katsayısından her
zaman KÜÇÜKTÜR.
• KR-21 ile hesaplanan güvenirlik katsayısı
ALT SINIRDIR.
• Likert tipi dereceleme ölçeklerinde
güvenirlik belirlemek için Cronbach – Alfa
kullanınlır.
KR-20 / KR-21 veya Cronbach-Alfa
yüksek ise şu yorumlar yapılır;
Uygulanan test hatalardan arınıktır.
Sorular aynı özelliği ölçmüştür (sorular
homojendir)
Grup heterojendir (Test grubu birbirinden
iyi ayırmıştır. Madde ayırt edicidir.)
Testin (Büyük olasılıkla) yapı geçerliği
yüksektir.
Ölçülen değişken tek boyutludur.
Güvenirliği Etkileyen Faktörler
Testin uzunluğu: Soru sayısı arttıkça
güvenirlik artar.
Ölçülen niteliğin genişliği (Ranj):
Gruptaki değişiklik ne kadar fazla ise
güvenirlik o kadar yüksek olur.
Test uygulama şartları: Sınav süresi,
öğrencileri güdülenme düzeyleri, dikkatsizlik,
gürültü, ölçmeyi yapan kişinin sınav anındaki
davranışları
Bir test deki soru sayısını arttırmak,
Açık anlaşılır ve kesin cevaplı sorular
sormak,
Öğrencilerin seviyelerine uygun sorular
sormak.
Sınav süresinin gereğinden kısa veya uzun
olmamasına dikkat etmek.
Öğrencilerin sınav öncesi motivasyonunu
sağlamak.
Ölçmenin hatalardan arındırılması.
Puanlamanın objektifliği.
Güvenirliği Arttırmak İçin;
Kullanışlılık
Ekonomiklik
Hazırlama süresi
Uygulama süresi
Hazırlayıcı ve uygulayıcının nitelikleri
Cevaplayıcının nitelikleri
Uygulama kolaylığı
Puanlama kolaylığı
Puanların yorumlama kolaylığı
ÖLÇME ARAÇLARI
VE
ÖZELLİKLERİ
Eğitim yoluyla öğrencilere kazandırılabilecek
davranışları üçe ayırmıştır.
Bunlar bilişsel, duyuşsal ve psikomotor
davranışlardır.
Farklı alanlara ait davranışların kazandırılması
için farklı yöntemlerin kullanılması, farklı
biçimlerde ölçme değerlendirmelerin yapılması
gerekir.
Öğretmenlerin hazırlayabilecekleri bazı
ölçme araçlarıBilişsel
Davranışları
Ölçme Araçları
Duyuşsal
Davranışları
Ölçme Araçları
Psikomotor
Davranışları
Ölçme Araçları
1. Sözlü Testler
2. Yazılı Testler
a) Kısa Cevaplı
b) Uzun Cevaplı
3. Objektif (işaretlemeli)
Testler
a) Çoktan Seçmeli
Sorular
b) Doğru-yanlış
Sorular
c) Eşleştirmeli Sorular
d) Tamamlamalı
Sorular
4. Araştırmaya Dayalı
Projeler
1. Anket Formlu Ölçekler
2. Gözlem Fişleri
1. Süreç Ölçmeye Yönelik
Performans Testleri
2. Ürün Ölçmeye Yönelik
Performans Testleri
Portfolyo Değerlendirme
1. Testin Amacı
2. Kapsamının ve Ölçülecek Davranışların Belirlenmesi
3. Soru Yazımı
4. Soru Düzeltme Çalışmaları (Redaksiyon)
5. Ön Test Formunun Oluşturulması ve Çoğaltma
6. Uygulama
7. Puanlama
8. Ön Uygulama Test İstatistiklerinin Hesaplanması
9. Madde analizi
10. Nihai Teste Madde Seçimi
11. Nihai Test İstatistiklerinin Kestirilmesi
12. Raporlaştırma
Test Geliştirmenin Basamakları
Geleneksel Ölçme Araçları
Sözlü
Testler
Çoktan Seçmeli
TestlerO
B
J
E
K
T
İ
F
T
E
S
T
L
E
R
Doğru-Yanlış Testleri
Tamamlamalı Testler
Eşleştirmeli Testler
Y
A
Z
I
L
I
T
E
S
T
L
E
R
Uzun
Cevaplı
Testler
Kısa
Cevaplı
Testler
Eğitimde Kullanılan Ölçme Araç ve
Yöntemleri
Çoklu Değerlendirme Araçları
Proje Ödevleri
Performans Ödevleri
Öğrenci Ürün Dosyaları
Anekdot Kayıtları
Akran ve Öz
DeğerlendirmeGörüşme (Mülakat)
Dereceleme Ölçekleri
P
E
R
F
O
R
M
A
N
S
D
E
Ğ
E
R
L
E
N
D
İ
R
M
E
Sözlü Sunum
Sergileme
Gözlemler
Bilişsel Davranışları Ölçme
Araçları
Yazılı yoklamalar
Sözlü yoklamalar
Çoktan seçmeli testler
Kısa cevaplı testler
Eşleştirmeli testler
Doğru yanlış testleri
Uzmanlar tarafından geliştirilmiş (ilgi ve tutum
ölçekleri gibi) ölçekleri uygulamak,
Kişileri gözlemleyerek, onların belirli
durumlardaki davranışlarını kaydetmek,
Örencilerin kendi duyuşsal davranışlarını sözlü
veya yazılı olarak rapor etmelerini sağlamak,
anketler kullanmak.
Duyuşsal Davranışları Ölçme
Araçları
Psikomotor davranışların ölçülmesinde kullanılan
ölçme araçlarına performans testleri denir.
Performans testleri ya bir davranış yapılırken (süreç)
gözlenir veya belli işlemler sonunda ortaya çıkan
ürünün niteliklerine bakılır. Performans testi beceri
testi ile eş anlamlı olarak kullanılır. Bu testlerde,
öğrencinin işi bizzat yapıp, yapmadığına bakılır.
Psikomotor Davranışları Ölçme
Araçları
Bir öğrenme süreci içerisindeki
öğrenciyi bilişsel, duyuşsal ve
psikomotor davranışlarıyla bir
bütün olarak (performansa dayalı)
değerlendirme yaklaşımlarından
biri ve belki de en önemlisi
portfoliyo değerlendirmedir.
Portfolyo Değerlendirme
Öğrencinin kazanımlarına ilişkin kanıtları
içeren belgelerin incelenmesiyle öğrencinin
başarısı hakkında karar verme sürecidir.
Portfolyo değerlendirme
Öğrencinin gelişimini izleyebilmek,
Öğrencideki öz disiplin ve sorumluluk bilincini geliştirmek ve kendi
kendini değerlendirme becerisine ulaşmasını sağlamak,
Öğrencinin gerçekte ve öğrendiğinin açık resmini çizebilmek,
Öğretim programına bağlı olarak yapılan yazılı ve sözlü
değerlendirmelerin dışına çıkıp, alternatif ölçme-değerlendirme
yöntemi geliştirmek,
Portfolyoların genel amaçları
Gelecekteki öğretmenlerine bilgi sunmak,
Öğrencinin gelişimini daha sağlıklı izleyebilmek,
Öğrencilerin yeteneklerini sergilemek ve ilgi alanlarını çoğaltmak,
Öğrencinin gerçekte ne öğrendiğini ortaya koymak,
Öğrencilerin diğer arkadaşlarının yaptığı portfolyoları izleyip, yardımcı olarak gelecekteki takım çalışmasına zemin hazırlamaktır.
Portfolyoların genel amaçları
Herhangi bir dersle ilgili proje veya araştırma ödevi verilen bir öğrenciye ait “performans değerlendirme” ölçütleri, bir “dereceli puanlama anahtarı” (rubric) ile daha önceden belirlenmiş izleme ve görüşme yöntemleriyle yapılır. Değerlendirme ölçütlerini öğretmen öğrencilerle birlikte hazırlayabilir.
Öğrencilerin yaptığı çalışmalarda, süreci değerlendirirken (problem çözme becerileri, proje, ürün dosyası vb) bu teknikleri kullanabilirsiniz.
Performans Değerlendirme:
Otantik Değerlendirme
Öğrencileri günlük hayatlarında her gün yaşadıkları veya yaşayabilecekleri ya da bunları temsil eden durumlarla karşı karşıya bırakarak yapılan değerlendirmedir.
Değerlendirmede yapılacak iş ya da çözülecek soru, bir şekilde gerçek hayatla bağlantılı olmalıdır.
Doğrudan gerçek yaşamla ilişkili bir değerlendirmedir.
RUBRİK DEĞERLENDİRME
“Dereceli Puanlama Anahtarı”
Dereceli puanlama anahtarı, performansı
tanımlayan ölçütleri içeren puanlama
rehberidir.
Herhangi bir çalışmanın puanlanması için
geliştirilmiş ölçütleri içeren bir araçtır.
İkiye ayrılır:
Bütüncül dereceli puanlama
anahtarı, öğrenmenin genel sureci veya
urunu bir bütün olarak parçalarını dikkate
almadan puanlamasını,
Analitik dereceli puanlama anahtarı,
ise önce performans veya ürünün
parçalarını ayrı ayrı puanlamasını sonra da
bu kısmi puanları toplayarak toplam puanı
hesaplamasını gerektirir.
Dereceleme Ölçekleri
Dereceleme ölçeği; davranışların ne kadar ne
kadar kaliteli yapıldığını gösteren bir ölçme
aracıdır.
Likert tipi ölçme aracı olarak da geçmektedir.
Kontrol listelerinden daha duyarlı olan bu
ölçekler davranışın gösterilme veya
gösterilmeme düzeylerini belirtir.
Kontrol Listesi
- İşin yapılması sırasında nelerin, hangi
sırada ve nasıl yapılacağını gösterir.
- Ölçülecek performansın en önemli
özelliklerini içerir.
- Öğretimin etkililiğini artırmayı hedefler.
- Gözlenecek veya ölçülecek davranışın var
olup olmadığını “evet/hayır”,
“yeterli/yetersiz” veya “geçer/kalır”
seçenekleriyle belirlemek için kullanılır.
İSTATİSTİKİ İŞLEMLER
Ölçmenin Standart Hatası• Ölçme sonuçlarında daha çok tesadüfi
hatadan kaynaklı bir miktar hata bulunabilir.
• Buradan kaynaklı olarak ölçmede yapılan standart hata miktarını bulmak için;
formülü kullanılır.
• Standart hata; standart sapma ile doğru orantılı, testin güvenirlik katsayısı ile ters orantılıdır. Yani güvenirlik arttıkça hata azalır, Ss artıkça hata artar.
Se = Sx . √1-rx
Ölçme Sonuçlarının Güven Aralığı
• Ölçme sonuçlarında daha çok tesadüfi hatadan kaynaklı bir miktar hata bulunabilir ve bu hata + veya – yönde olabilir. Öğrencilerin puanlarının bu hata miktarı dikkate alınarak hesaplandığında ortaya çıkan değer güven aralığıdır.
• Güven aralığını bulmak için;
• %68 olasılıkla= Puan-1se, puan+1se
• %95 olasılıkla= Puan-2se, puan+2se
• %99 olasılıkla= Puan-3se, puan+3se
Örnek
İpek matematik sınavından 80 almıştır. Testin
standart hatası 4 olsa;
İpeğin aldığı puanın güven aralıkları nedir?.
%68 olasılıkla :80-4; 80+4= (76,84)
%95 olasılıkla :80-8; 80+8= (72,88)
%99 olasılıkla :80-12; 80+12= (68,92)
Basit frekans dağılımı (f):
Her bir puan değerinin kaç sefer
tekrarlandığını gösterir.
FREKANS DAĞILIMLARI
Basit frekans dağılımı (f):
Gruplandırılmış frekans dağılımı :
İstatistiki işlemler ve grafiklerde
kolaylık sağlanması için, belirli
puan kategorilerinin oluşturulması
için puanlar arasındaki ranjlar ya
da aralıklar dikkate alınarak
yapılan dağılımdır.
MERKEZİ EĞİLİM (YIĞILMA) ÖLÇÜLERİ
Puanların bir merkezde toplanma durumunu gösterir
Merkezi Yığılma Ölçüleri
mod medyan Aritmetik ortalama
Normal Dağılımda; mod = medyan = aritmetik ortalama bir birine
eşittir
Öğrenci Test Puanı
1 70
2 70
3 71
4 75
5 75
6 76
ARİTMETİK ORTALAMA
En çok kullanılan merkezi yığılma ölçüsüdür ( x ) ile gösterilirÖlçümlerin toplamının, ölçüm sayısına bölümünü ifade ederDağılımın uç değerlerinden etkilenir Bütün ölçümlerin kullanılmasıyla elde edilirDağılım simetrikse, yani çarpık değilse ve üst düzey istatistiksel işlemler yapılacaksa kullanılır
A.O.= (70+70+71+75+75+76) / 6
A.O.= 72.83
Aşağıdaki tabloda mod kaçtır?
MOD (TEPE DEĞER)
Bir puan dağılımının en çok tekrar eden, yani frekansı en fazla olan
puan ya da ölçümüdür.
Gruplandırılmış verilerde mod, frekansı en yüksek olan puan aralığının
orta noktasıdır.
MOD: 68, 71, 71, 74, 80, 80, 80, 80, 82, 88, 88
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde
verilmiştir:
68, 71, 71, 74, 80, 80, 80, 80, 82, 88, 88
-Dağılımda en çok tekrar eden değerdir-Sınıflama türü ölçekler için uygundur-Ortalama ve ortancanın hesaplanmadığı durumlarda kullanılır-En tipik ölçümler bilinmek isteniyorsa, kabaca hesaplanmak gerekiyorsa moda bakılır-Bir dağılımın birden fazla modu olabilir-Ardışık eşit sayıda tekrarlanan varsa orta noktasıdır-Dağılımdaki ölçümlerin hepsi aynı ise mod yoktur-Uç noktalardan etkilenmez-En az güvenilen merkezi eğilim ölçüsüdür-Az sayıdaki ölçümler için uygun değildir.
MEDYAN (ORTANCA)
-Dağılımı iki eşit parçaya bölen değerdir (%50 - %50)
-Sıralama türü ölçekler için uygundur
-Ham puanların sayısından etkilenir.
-Uç değerlerden etkilenmez
-Dağılımın tam ortası isteniyorsa, uç değerler ortalamayı
etkiliyorsa, ortalamayı hesaplamak için süre yoksa kullanılır
-Medyan bulunurken puanlar sıraya konulur.
Bir puan dizisini, puanlar küçükten
büyüğe ya da büyükten küçüğe doğru
sıralandıktan sonra, ortadan tam iki eşit
yarıya bölen puandır.
Bir dağılımda medyanın altında ve
üstünde kalan ölçümlerin sayısı eşittir.
Örnek:
4,7,8,11,12,15,19 şeklindeki bir dağılımın medyanını bulmak için;
Önce sayıların büyükten küçüğe ya da küçükten büyüğe sıralanıp sıralanmadığı kontrol edilir.
Daha sonra dağılımdaki ölçüm (puan) sayısı bulunur. (örnekte 7 tane puan var).
Dağılımdaki ölçüm sayısı tekse, ölçüm sayısına bir eklenir (7+1=8) ve elde edilen sonuç 2 ye bölünür (8:2=4)
Bulunan sonuç kadar baştan itibaren sayılır. Elde edilen sonuç medyanı verir. (örnekte, baştan 4 puan sayılınca 11 bulunur.)
Gruplandırılmış verilerde medyanı bulmak için;
Sola Çarpık / Negatif Kayışlı / Pozitif
Yığılmalı / Sağa Yığılmalı
Sorular kolay olabilirÖğretim yeterlidirGrup kopya çekmiş olabilirSon test sonuçlarıdırGrup kendi içerisinde başarılıdır
Sorular zor olabilir
Öğretim yetersiz olabilir
İşlenmemiş yerlerden soru olabilir
Süre yetersiz olabilir
Ön test sonuçları olabilir
Sınıf kendi içerisinde başarısız
Sağa Çarpık / Pozitif Kayışlı / Negatif
Yığılmalı / Sola Yığılmalı
MERKEZİ DEĞİŞİM (YAYILMA) ÖLÇÜLERİ
Puanların bir merkezde etrafındaki dağılımını gösterir
Merkezi Dağılım Ölçüleri
Ranj Çeyrek Sapma Standart Sapma
RANJ (DİZİ GENİŞLİĞİ)
Dağılımdaki en yüksek puan ile en düşük
puan arasındaki farktır.
Ranj arttıkça öğrencilerin aldıkları puanlar
birbirinden uzaklaşır.
Ayırt edici bir testte hesaplanan ranj, o testten
elde edilmesi mümkün olan en yüksek puanın
yarısına yakın olmalıdır.
ÇEYREK SAPMA (KAYMA)
•Q Sembolüyle gösterilir
•Puanların Ortanca’dan ne kadar saptığını gösterir.
• 1. çeyrek ile 3. çeyrek arasındaki farkın yarısıdır
•Dağılımların yalnızca % 50’si dikkate alındığı için güvenilir değildir
Puanlar büyükten küçüğe doğru sıralanır ve aşağıdaki formülle hesaplanır:
Q = (Q3 – Q1)
2
Cevap: Q1 (25. Yüzdelik) = 19 (25/100) = 4.75 yani 5. puan = 68
Q3 (75. Yüzdelik) = 19 (75/100) = 14.25 yani 14. puan =88
Q3 = (88-68) / 2
Q3= 20 / 2 = 10
Örnek: Öğrencilerin finalden aldığı notlar şu şekilde verilmiştir:
30, 41, 46, 56, 68, 71, 71, 74, 80, 80, 80, 80, 82, 88, 88, 91, 93, 98, 99
STANDART SAPMA (KAYMA)
• Sx sembolüyle gösterilir
• Ölçme sonuçlarının ortalamadan farklarının
kareleri ortalamasının kare köküdür.
• Standart kaymanın karesine varyans denir.
• Aritmetik ortalama ile birlikte kullanılır
•Standart sapmanın küçük olması grubun homojen
•olduğunu gösterir
Formülü: S = √(X – X)2
N
Bir Dağılımda Standart Sapma KÜÇÜKSE
→ Öğrencilerin öğrenme düzeyi birbirine yakın,
→ Öğrenciler arası farklılaşma az
→ Homojen yapı vardır yorumları yapılabilir.
Eğer bir dağılımda Standart Sapma BÜYÜKSE
→ Öğrencilerin öğrenme düzeyleri birbirinden uzak,
→ Öğrenciler arası farklılaşma fazla,
→ Heterojen yapı vardır yorumları yapılır.
Bir testin aritmetik ortalamasını soru sayısına
bölerek testin ortalama güçlük düzeyi bulunabilir.
(p = x / testten alınabilecek en yüksek puan)
P=0,50 den küçük ise, test öğrencilere güç gelmiş,
zor sorular hazırlanmış, sınıfta yapılan öğretim
yetersiz, zayıf öğrenciler çoğunlukta gibi yorumlar
çıkarılabilir.
P=0,50’den büyükse, öğrenciler konuları öğrenmiş,
öğretim yeterli ya da test kolaymış gibi yorumlar
çıkarılabilir.
TESTİN ORTALAMA GÜÇLÜĞÜNÜ HESAPLAMA
Bir testte herhangi bir maddeye verilen doğru cevaplar
sayısının, toplam kişi sayısına oranıdır.
Örneğin bir testin 12. maddesine 40 öğrenci doğru, 10
öğrenci yanlış cevap vermiş olsun. Bu durumda
maddenin güçlüğü
p = 40 / 50 = 0.8 ’dir.
Madde güçlük indisi 0.0 ile 1.0 arasında değerler alır.
Değer sıfıra yaklaştıkça maddenin zorluk derecesi
artmıştır. Genellikle başarı testlerinde bu değerin 0.50
civarında olması arzu edilir.
TEST MADDELERİNİN ANALİZİ
Madde Güçlüğü
MADDE AYIRT EDİCİLİK İNDEKSİ
Bir maddenin bilenle bilmeyeni ayırt etme
derecesidir.
0,40 ve daha büyükse, çok iyi bir maddedir
0,30-0,39 arası iyi bir maddedir.
0,20-0,29 arası düzeltilmesi gereken bir
maddedir.
0,19 ve daha küçükse veya (-) değer almışsa çok
zayıf bir maddedir, testten çıkarılması gerekir.
TEST MADDELERİNİN ANALİZİ
Alt Üst Gruplar Farkına Göre Madde Analizi
(Basit Yöntem)
Bu yöntemde öncelikle ölçme
sonuçları en yüksekten en düşüğe
doğru sıralanır.
Ardından üst %27’lik ve alt %27’lik
gruplar belirlenir.
Alt üst gruplar farkına göre yapılan madde analizinde madde güçlük indeksi şu şekilde hesaplanır:
pj = (n(Dü) + n(Da) ) / N
Pj : Maddenin güçlük indeksi
n(Dü) : Üst gruptaki doğru yanıt sayısı
n(Da) : Alt gruptaki doğru yanıt sayısı
N : Alt ve üst gruptaki bireylerin sayısı
Basit yönteme göre madde ayırıcılık gücü indeksi şu
formülle hesaplanır:
rjx= ((n(Dü) - n(Da) ) / n
rjx : Maddenin ayırıcılık gücü indeksi
n(Dü) : Üst gruptaki doğru yanıt sayısı
n(Da) : Alt gruptaki doğru yanıt sayısı
n : Alt ya da üst gruptaki bireylerin sayısı
Madde Güçlük ve Ayırt Edicilik İndekslerinin
Birlikte Yorumlanması
Çeldiricilerin Özellikleri
Çeldiricilerin her birinin bilmeyen
öğrencileri eşit oranda kendilerine
çekmeleri beklenir.
Çeldiricilerin özellikle başarısız alt grup
tarafından çok üst grup tarafından az
işaretlenmesi beklenir.
Alt-üst grup yöntemi ile madde analizi
yapılıyorsa üst grubun büyük kısmının
maddeyi doğru yanıtlaması, alt grubun ise
büyük kısmının maddeyi yanlış yanıtlaması
ve seçeneklere yaklaşık olarak eşit
dağılması beklenir.
Bir öğrencinin A dersinden 45, B dersinden 55 puan
aldığını düşünelim.
Bu öğrencinin hangi dersten daha başarılı olduğuna
nasıl karar veririz?
Öğrencinin başarısına karar vermek için ham puanların
standart puanlara dönüştürülmesi gerekmektedir.
Ham Puanların Standart Puanlara Çevrilmesi
Standart puanlardan ilki Z puanı, diğeri T puanıdır.
Z puanı bir puanın standart sapma açısından ortalamaya
göre farklılığının ne olduğunu gösterir.
Z puanının hesaplanmasında Z = (x - a.o.) / s.s.
kullanılır.
HAM PUANLARIN STANDART PUANLARA ÇEVRİLMESİ
Bir öğrencinin A dersinden 45, B dersinden 55 puan aldığını düşünelim.
A dersi için a.o= 25, ss = 5 , B dersi için a.o = 40, ss = 10 olsun. Şimdi bu
ham puanları standart puanlara çevirelim
A dersi için z= (45-25)/5=4
B dersi için z= (55-40)/10=1,5 dir.
Bu durumda başlangıçta öğrencinin B dersinde daha başarılı olduğu
düşünülmüşken, A dersinden daha başarılı olduğu görülmüştür.
HAM PUANLARIN STANDART PUANLARA ÇEVRİLMESİ
T puanlarının aritmetik ortalaması 50, standart sapması 10 olarak kabul edilir. (Z de a.o=0, Ss=1’di).
T puanının hesaplanmasında T=(10.Z)+50 formülü kullanılır.
HAM PUANLARIN STANDART PUANLARA ÇEVRİLMESİ
HAZIRLAYAN: BİROL AY