gİrİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistiki_2015_2016/1_ giriş.pdf · hukuk,...

18
İstatistik 1 GİRİŞ 1.1. Bilgi çağı ve istatistik okur yazarlık 1.2. İstatistik Nedir ? 1.3. İstatistik kelimesinin anlamı 1.4. İstatistik ve Kitle Verileri 1.5. İstatistiğin Metodolojisi 1.6. İstatistik’in Tarihçesi 1.7. İstatistik nerede vardır? Nerede yoktur? 1.8. İstatistiğin temel unsurları 1.9. Dedüktif ve Indüktif Yargılama 1.10. İstatistiğin Ekonomi ve İş Hayatındaki Yeri 1.11. İstatistik Araştırmalarda Aşamalar

Upload: others

Post on 07-Sep-2019

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

İstatistik

1

GİRİŞ

1.1. Bilgi çağı ve istatistik okur yazarlık

1.2. İstatistik Nedir ?

1.3. İstatistik kelimesinin anlamı

1.4. İstatistik ve Kitle Verileri

1.5. İstatistiğin Metodolojisi

1.6. İstatistik’in Tarihçesi

1.7. İstatistik nerede vardır? Nerede yoktur?

1.8. İstatistiğin temel unsurları

1.9. Dedüktif ve Indüktif Yargılama

1.10. İstatistiğin Ekonomi ve İş Hayatındaki Yeri

1.11. İstatistik Araştırmalarda Aşamalar

Page 2: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

2

1.1. Bilgi çağı ve istatistik okur yazarlık

Bilginin çok farklı araçlarla, kolay, hızlı ve ucuz yayınlanma ve dolayısı ile

izlenme olanakları bilgi çağına geçişi kolaylaştırdı. Özellikle televizyon ve daha sonra internet olanakları, kablolu, kablosuz iletişim ve haberleşme ağları, uydu sistemleri, bilgisayar ve bilgi teknolojilerindeki gelişmeler son yirmi yıl içinde baş döndürücü değişim hızını oluşturdu. Bu teknolojik gelişmeler ve bunların sanayileşmesi sonucu 0elektronik yayıncılık hakkında hukuksal gelişmelerden tutun, modern ailelerin harcama bütçesindeki yapısal değişme kadar hayatımızı etkilemeye başladı. Diğer bir deyişle bilgi tüketimi arttı, dolayısı ile üretimi de teşvik edildi. Bilinen insanlık tarihi içerisinde bilgi üretim ve tüketim hızının ve çokluğunun en yüksek seviyelerine gelindi. Matbaanın icadı bilinen insanlık tarihi içerisinde bilginin yayılmasında nasıl bir dönüm noktası oldu ise, günümüzdeki gelişmeler de benzer önemde bir tarihsel değişimi oluşturacak niteliktedir. Bu gelişmelerle beraber yanlış veya eksik ya da değersiz bilgilerin de yayımlanması ve bunların çok önemliymiş gibi algılanmasını sağlayan önemsenme ve önemsetme gibi bilgi kirlilikleri de doğal olarak arttırdı.

Veri ve bilgilerin kolay ulaşılabilir ve tüketilebilir olması, medya gücünü toplumlar üzerinde neredeyse silah kadar güçlü hale getirmiştir. Bir araç ne kadar güçlü ise, kontrolsüz ya da yanlış kullanımı da o kadar tehlikelidir. Bu gelişmeler bilgi üretme ve bu üretimden kazanç elde etmeyi de o kadar önemli hale getirmiştir. Son dönemim dünya zenginleri içerisinde sanayicilikten çok hizmet sektöründeki iş adamları giderek artan hızla yerlerini almış olması bu sonucu desteklemektedir. Gelişen sektörler içerisinde bilgi ve bilgiye dayalı yeni iş alanları giderek artmaktadır. Örneğin bunlardan biri bilgi güvenliği alanıdır ve gelecek dönemin en önemli iş alanlarından biri olacaktır.

Değişik amaçlarla topluma istatistiksel bilgi üreten uluslararası ve ulusal kamu

kurumları, sivil toplum örgütleri ve bazı özel kuruluşlar ürettikleri bilgileri zaman zaman toplum ile paylaşmaktadırlar. Bu kurumların bağımsız, güvenilir ve doğru bilgi üretmeleri de toplumun bilgiye olan güveni açısından oldukça önemlidir. Diğer taraftan gelecek toplumların istatistik okur yazarlığını geliştirmesi de muhtemel bilgi kirliliklerinden korunmanın zorunlu bir önlemi olacaktır.

İstatistik denilince aklımıza ilk gelen rakamlar yığını veya bu sayı veya benzeri

veri yığınlarının özeti gelir. Bu rakam yığınlarına nasıl baktığımız çok önemlidir, ya da nasıl özetlediğimiz ve hangi özet bilgiyi nasıl yorumladığımız. Her özet, asıl kaynaktaki bazı verilerin ya da bilgilerin kaybolması anlamına gelir. Bu kayıpları biliyor ve fark ediyorsanız gerekli düşünsel tedbirlerinizi de alırsınız ve bu şekilde yorumlarız. Ancak bu farkındalıktan yoksunsak, işte o zaman, bu bilgi bizim için tehlikeli sonuçlar da yaratabilir. Medya da yanlış yönlendirici ya da yanlı yer alan veri ve bilgilerden korunmak için başka bilgi kaynaklarını kullanma ve eleştirel bilgilerin değerlendirilmesi gibi becerilerin geliştirilmesi ile nasıl olanaklı oluyorsa, istatistiksel kirli bilgilerden de korunmak için özel bilgilere ihtiyaç vardır.

Günümüz toplumu giderek rakam yığınları ile daha çok ilgilenir ve hayatına ilişkin önemli kararlarını bu rakam özetlerine bakarak karar veriyor olmuştur, bu durum giderek artarak gelişecektir. Paramızı nasıl değerlendireceğimizi, evimizi satarak mı yatırım yapmış oluruz yoksa satın alarak mı? Döviz kuru? Çapraz döviz kuru?, bu kurlar neyi? ne kadar? Hangi durumlarda etkiler?, borsa ne oldu?, faizler ne durumda?, işsizlik artıyor mu?, dış borç ne durumda?, bu gibi indeksleri, göstergeler ve nicel bir takım bilgileri sayfalarca çoğaltabiliriz. Sadece ekonomide değil, siyaset alanında, hukuk alanında, sağlık alanında, yerel veya kamu hizmetlerinde, diğer bir deyişle

İstatistik Bilgi

Bilgi Çağı

Page 3: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

3

hemen hemen hayatımızın her yerinde bu tür istatisriksel bilgiler hayatımızı ciddi bir şekilde etkilemektedir. Modern toplumun büyük bir kesimi bu gibi verileri yorumlamaya başladı bile. Yukarıda örneklenenlerin her biri bir çeşit istatistiksel bilgi olan ortalamadır ve bu farklı ortalama bilgiler nasıl yorumlanmalıdır? Örneğin yaşları 19 ve 21 olan iki kişinin yaş ortalaması 20 dir, ancak bu örnekte gerçek yaşı 20 olan kimse bulunmamaktadır. Diğer bir deyişle 20 yaşında gerçek bir kişi olmadığı halde, ortalama olarak bilinen ve bir istatistiksel bilgi olan 20 sayısı bu iki kişinin yaşlarını özetleyen en iyi bir bilgidir. Diğer taraftan yaşları 10 ile 30 olan iki kişinin de yaşlarının ortalaması 20 dir, ancak buradaki ortalama bir önceki örnekte olduğu gibi bu iki kişiyi yeterince temsil etmez. İşte buna benzer yorumlamaları çok farklı yerlerde kullanırken buna benzer hatalara düştüğümüzü farkına bile varamayabiliriz, eğer yeterince istatistik okur yazarı değilsek. Yani istatistiksel bir bilgi gerçekte gözlemlenen hiçbir veri ile aynı olmayabilir ama buna rağmen doğru olabilir veya yanlış olabilir. Diğer taraftan hata içine düştüğümüz durumlarda yukarıdaki örnekte olduğu kadar basit anlaşılır bir konumda olmayabilir. Burada istatistik bilimin yetersizliğinden söz edilemez, sadece bilimi kullananın kasıtlı hatası veya bilgi yetersizliği söz konusu olabilir.

Çeşitli basın kaynaklarında zaman zaman belli bazı gıda maddelerinin insan sağlığına zararlı ya da yararlı olduğuna ilişkin araştırmalar olduğunu okuruz. Eğer istatistik okur yazarlığımız yeterince gelişmemiş ise bu bilgileri sorgulamada yetersiz kalırsak yanlış olmasa da abartılı yorumlamaları da yapabiliriz ve bu haberler bazen sağlığımız için tehlikeli olabilecek davranışları yapmamıza bile sebep olabilir. Sonuçları yorumlarken bu çalışmanın nerede yapıldığı, varsa deneklerin ne olduğu, kaç denek kullanıldığı, bunların bizim yorumlama kapsamına almak istediğimiz bütünü temsil etmede ne kadar yeterli olduğu, deneyin tüm varsayım ve kısıtlarının neler olduğu gibi soruların tatminkar cevapları bilindiği taktirde sonuçlar da hatasız ve abartısız yorumlanabilecektir.

İstatistik okur yazarlığının doğuşu ve önem kazanması istatistik bilgisinin üreticisinden çok tüketicisi olacağı düşüncesinden doğmaktadır. Günlük hayatımızı kuşatan istatistiksel bilgiler bunları doğru anlama ve doğru yorumlama ve değerlendirme yetisini geliştirmeyi bir anlamda mecbur kılmaktadır. İstatistiksel verilere olan güven, bir sonucun rastlantısal olmasının yorumlanması gibi diğer bir okur yazarlık kavramını önemli hale getirmektedir.

İstatistik okur yazarlık ihtiyaç duyulan bilginin karmaşık düzendeki verilerine erişme, tanımlama ve filitreleme becerilerini de kapsar. Bu bilgilerin müşterileri bu bilgilerin içeriğine aşina olma, basın başlıkları, özetler, raporlar, göstergeler, kitle verileri, örnek verileri gibi kavramları ve bunlar arasındaki farklılıkları bilmek tablo, grafik ve çizelge okuma becerilerini geliştirmek zorundadır. Bu amaçla politikacıların, yöneticilerin ve halkın anlayabileceği seviyede anlatım kolaylıkları geliştirmek gerekmektedir. Geleceğin modern toplumlarında istatistik okur yazarlığı, kendi dilimizi kullanmak kadar hayatımızı kolaylaştıracak önemde ve gereklikler içerisinde olacaktır.

1.2.İstatistik Nedir ? İstatistik verileri bir araya getirmek, düzenlemek ve analiz edip onlar hakkında sonuçlar çıkartma süreçlerini kapsayan bir bilimdir. İstatistik sonuçlar çıkartmak ve karar vermek amacıyla verilerin analiz edilmesidir. Ancak istatistik, karar yerine geçmez İstatistik çoğu kişi için “sayısal tanımlama”dır. Sermaye piyasası, borsa endeksi, aylık işsizlik şekilleri, belirli bir endüstride çalışan kadınların oranı bunların

İstatistik Okur

Yazarlık

Page 4: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

4

hepsi büyük veri setlerinin istatistiksel tanımlanmalarıdır. Sık sık, bu sayıları hesaplamak belirli veri setlerinin tanımlanmasının ötesine geçen çoğunlukla, veri karakteristiklerini tahmin etmek istediğimiz büyük veri setlerinden seçilen örnek olarak ele alınır. Örneğin; seçimler öncesi tahminler, laboratuar kan sayımı sonuçları birer istatistik uygulamalardır.

İstatistik bilimi diğer tüm bilimler gibi hayatın içinde var olan gerçekleri metodolojik bir biçimde ortaya çıkarmayı amaçlayan sistematik bir yaklaşımlar metodolojisi sunar. Kendi içerisinde çok güçlü teorileri üretmesinin yanında, uygulamalı yönü ile diğer hemen hemen tüm bilimlerin, özellikle stokastik bulgulara dayalı bilimlerin gelişimlerine doğrudan katkı sağlayan bir bilimdir.

İstatistik verilerin toplanması ve sınıflandırılması ile işe başlar. Ancak verileri

sadece biriktirmek bir işe yaramaz, bu nedenle istatistik toplanan verilerin analizini yapar. Bu analizin amacı bütünü daha iyi anlamak veya bütünün bilinmeyen bazı özelliklerini ortaya çıkartmak ya da şüpheli bazı sonuçları doğrulamak amacıyla yapılır..

İstatistikte bazen bütünün tamamı gözlenir çoğunlukla ise bütünden alınan

örnekler alınarak incelenir ve bu örneklerden elde edilen sonuçlar bütün için genellenmeye çalışılır. Ancak bütünden alınan tek bir örnek elemanı kullanılarak ve bu örneğe dayanılarak bütün hakkında sonuçlar çıkartmak istatistik metotları içerisinde yer almaz.

İstatistik aynı koşullar altında ve aynı varsayımlarla tekrarlanan olayların

sonuçları aynı oluyorsa, bu tür yerlerde ve bu tür konuları içeren bilimlerin yanında yer almaz. Matematik, fizik, kimya bilimine konu olanlar çoğunlukla bu tür kesin-deterministik sonuçlu olaylardır. Aynı koşullar altında tekrarlandığında aynı sonuçların alınmadığı her yerde ve bu konuları içeren bilimlerin yanında istatistik bilimine daima ihtiyaç duyulur. Tüm sosyal bilimler (iktisat, işletme, pazarlama, psikoloji, sosyoloji, hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan ve hayvan sağlığı, farmakoloji gibi), girdi ya da süreç kararlılığı bulunmayan olaylar içeren mühendislik bilimlerinin bazı konuları (endüstri mühendisliği, elektrik mühendisliği, bilgisayar mühendisliği, inşaat mühendisliği, jeoloji mühendisliği, petrol mühendisliği, çevre mühendisliği, trafik mühendisliği gibi), doğal tabiatla ilgilenen bilimler (meteoroloji, deniz bilimleri, coğrafya ve uzay bilimleri) istatistikten çok yoğun bir şekilde yararlanırlar.

1.3. İstatistik kelimesinin anlamı Bu kelimenin anlamı son iki yüz yıl boyunca büyük değişikliğe uğramıştır. İstatistik kelimesi devlet kelimesiyle aynı orijinden gelmekte olup hükümet etme sanat ve ilmini göstermekteydi. On sekizinci yüzyılda Alman üniversitelerindeki ilk istatistik profesörlerine bugün politik bilginler veya siyasal bilim adamları denilebilir. Hükümetin aldığı kararlar bir dereceye kadar nüfus, ticaret, tarım ve başka konularla ilgili verilere dayandığından, istatistikçiler bu çeşit verilerle doğal olarak ilgilendiler ve yavaş yavaş istatistik ilmi devlet hakkında veriler toplanması anlamına, sonraları da verilerin genel olarak toplanması ve manipulasyonu anlamına geldi. Kelimenin genel anlamı bugün için bu olmakla beraber, değişme durmuş değildir. Kullanılmayacak olduktan sonra verilerin koleksiyonunun yararlı bir tarafı olamaz, bu nedenle istatistikçi verilerin açıklanmasıyla doğal olarak ilgilenmeye başladı. Modern istatistikçi populasyondan (bütün topluluktan veya kitleden) örnek(ler)den elde

Page 5: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

5

edilmiş verilere dayanarak, populasyon hakkında sonuçlar çıkartma metodlarıyla uğraşan bir bilimdir. Burada belirtilmesi yerinde olur ki, istatistik ve olasılık teorisi birbirinden ayrı yönlerde iş görmektedir. Ancak her iki teori birbirine ihtiyacı vardır ve kullanır. Olasılık teorisi populasyondan alınan örneğe ilişkin dağılımlarını elde etmek için bilinen bir populasyondan harekete geçer, halbuki istatistik populasyonun bilinmeyen özellikleri hakkındaki sonuçlar ya da yargılar çıkartmak için gözlemlenmiş örnekten işe başlar. ‘İstatistik’ kelimesi ilerideki sayfalarda, örneğe ait bir özellik anlamında da kullanılacaktır, örnek ortalaması, örnek varyansı, v.b. öte yandan, populasyona ilişkin bir özellik için ‘parametre’ terimi yer alacaktır. ‘İstatistik’ örnekten örneğe değişebileceği halde ‘parametre’ bütün topluma ait tek bir değer olduğundan sabit kalacaktır. Bu bakımdan, istatistik, parametrenin bir çeşit temsilcisi olacaktır.

1.4. İstatistik ve Kitle Verileri

İstatistik hiçbir zaman tek bir gözlem ile uğraşmaz, kitlesel olaylarla ilgilenir. İstatistiğin amacı verilerden sonuçlar çıkartmak ve bu verilere dayanan tahminlerde bulunmaktır. Tahminler, bir çok sayıda bireyin birlikte gözlemlendiğinde, çoğu zaman kararlı bir davranış örneği ortaya çıkar ve güvenilir bir tahmin elde edilir. Örneğin, sigorta şirketleri bugün yetmiş yaşında olan kişilerin hangilerinin altmışlı yaşlarda ölecekleri asla bilemezlerse de, kaç tanesinin öleceğini büyük bir doğrulukla tahmin edebilirler. Kitle davranışındaki kararlılık nedeniyle istatistiğin başlıca fonksiyonu, böyle kitle olaylarının kendilerine özel davranışını çıkartmaktır; yoksa, ayrı ayrı alınmış bireyleri açıklamak değildir. Karışık görünüşlü şeyler veya kişiler ya da kitlelerin sayısı ne kadar büyükse, istatistiğin bunlara uygulanmasıyla kendilerinin davranışını tahmindeki doğruluk derecesi de o kadar yüksek olma eğilimindedir. Bu açıklamalardan görüldüğü gibi, kitle olaylarıyla ilgili, ister doğal bilimlerde, ister sosyal bilimlerde olsun, herhangi bir konunun incelenmesinde istatistik ideal bir araçtır. Bu bilim dalı sürekli bir gelişim içindedir. Hemen hemen her yıl yepyeni fikirler ve bulgular ortaya çıkmaktadır. İstatistik matamatik ve öbür bilim dallarıyla yakından ilişkili olup, birçok bilimsel disiplinlerdeki yeni ilerlemelerde katkısı bulunmaktadır.

1.5. İstatistiğin Metodolojisi İstatistik metod tanımlayıcı (açıklayıcı/betimsel) istatistik ve yorumlayıcı (genelleştirici) istatistik olmak üzere sınıflandırılabilir. Aralarındaki ayırım kullanılan belli bir formül ya da hesaplanan belli bir istatistik (örneğe ait bir özellik) ile ilgili olmayıp, istatistiğin yerine getirdiği fonksiyonun tipine bağlıdır. Açıklayıcı istatistiğin fonksiyonu kitle verilerinin doğasında bulunan karakteristiklerin portresini sunmaktır. Burada bu terim, genelleştirme yapmayan sayısal veriler işlemi olarak düşünülmektedir. Tanımlayıcı istatistik modelleme, özetleme, ve bir veri setindeki bilgiyi sunmak için sayısal ve grafiksel metodlardan yararlanır. Aksine olarak, genelleştirici (= tüme varımcı; indüktif) istatistiğin fonksiyonu büyük sayıda nümerik veriler topluluğunun özelliklerini (= parametreleri), onun ufak bir kısmına ait sınırlı sayıda gözlemlerine dayanarak, genelleştirme veya tahmin ya da yorumdur.

Page 6: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

6

Yorumlayıcı istatistik büyük veri setleri hakkındaki tahminlerde karar, kestirim ve genellemeler yapmak için örnek verilerinden yararlanır. Bu ayrımı aydınlatmak amacıyla hayat sigortası istatistikleri örnek verilebilir. Son birkaç yıl içinde Türkiye’de ki değişik yaşlardaki bir milyon kişinin ölüm oranları hakkında veriler toplanması, yaş guruplarına göre ölüm oranlarının sınıflandırılması, mortalite tabloları biçiminde bu verilerin sunulması ve bu incelemede, örneğin, on beş yaşındakilerin yüzde yarımının on altıya varmadan öldüklerinin gözlemlenmesi…, hep açıklayıcı istatistiğe örnektirler, çünkü eldeki verilerin dışına çıkılmamaktadırlar. Diğer yandan, aynı veriler hayat sigorta şirketleri tarafında kapsamlı, uzatılmış olarak kullanılmaktadır. Bir milyon insanın ölüm haddi üzerine kurulan mortalite tablosu bütün Türklerin ölüm haddi hakkında genelleştirmede ve değişik yaşlardaki ölüm oranlarının olasılığını tahminde kullanılmaktadır. Sigorta şirketleri pirim maliyetlerini bu gibi genelleştirmeler ve tahminlere dayandırmaktadırlar. Bu, genelleştirici istatistiğe bir örnek sayılabilir. Sunulan bu örnekten aynı istatistiğin (burada örneğe ilişkin özellik) birbirinden ayrı fonksiyonlar için kullanıldığını gözlemlemek ilginçtir. Açıklayıcı istatistik durumunda, sadece bir milyon kişinin koleksiyonunu açıklama amacı ile hesaplanmıştır. Genelleştirici istatistik durumunda ise, son amaç olan Türkiye’ de ki bütün insanlar hakkında tahminler veya genelleştirmeler yapmada kullanılmıştır.

1.6. İstatistik’in Tarihçesi

İstatistik sözcüğü devlet (state) kelimesi ile aynı kökten türetilmiştir. 18. yüzyılda devlet ile ilgili nüfus, ticaret, tarım gibi verilerin toplanması anlamına gelen bu kelime daha sonra bu verilerden elde edilen bilgilere dayalı hükümet kararlarında kullanılmaya başlanmış ve böylece verilerin işlenmesi anlamına da gelmeye başlamıştır. Bugün için de istatistik dar anlamda verilerin toplanması, düzenlenmesi, işlenmesi ve sunulması anlamlarına gelmektedir, ancak tüm kapsamı daha geniş bir çerçeve içermektedir. İstatistik bilgilerin (verilerin ) toplanması çok eski uygarlıklar ile birlikte başlamıştır. Mısırlılar, Romalılar, Eski Yunanlılar ve Çinliler zaman zaman nüfus ve varlık sayımları yapmışlardır. Orta çağların sonuna doğru Batı Avrupa hükümetlerinden bir kısmı vaftiz merasimleri, evlenmeler, doğumlar ve ölümler üzerinde veriler toplamışlardır. Birkaç yüz yıl önce de, tacirler için çok önemi bulunan, dış ticareti etkileyen olaylar, gerçekler bir araya toplanmıştır. Bu gibi verilerden daha fazla sonuçlar sağlama çabasıyla devirler boyunca koleksiyon, sınıflama, anlam verme, sayısal verilerin sunulması sonunda yavaş yavaş hassas metodlar geliştirildi. On yedinci yüzyılın ortalarında, tamamen raslantısal olarak, istatistik metod bilimsel temele dayandırıldı: 1654 de Chevalier de Mere adında kumarbaz bir Fransız, oyun sona ermeden kumar oyunu terk edildiğinde ‘pot’un (ortada toplanan para) nasıl bölüşülmesi gerektiği sorunuyla ilgilendi. Bu problemin matematik bir formülle çözümlenebileceği kanısına vararak, Fransa da devrin başta gelen matematisyen ve filozofu olan Blaise Pascal’a başvurdu. Pascal sezinleme prensibinden ziyade, sayısal yoldan risklerin ve avantajların (kazanç ve kayıpları) işleme tabi tutabilme olanağını hemen gördü. Bu görüş onu ‘Olasılık Teorisi’ni formüle etmeye sevk etti. Aynı yüzyılda bir İtalyan kumarbazlar gurubu bahis kurallarını tespit konusunda tavsiyede bulunması için büyük Galileo’ ye müracaat ettiler; bunun sonucu olarak zar oyunlarındaki klasik ihtimal işlemleri doğdu. On sekizinci ve on dokuzuncu yüzyıllarda Pascal ve Galileo’nin teorileri daha da geliştirilerek Bernoulli, Gauss, Laplace, Bacon ve Galton gibi dünyanın ilk dev istatistikçileri tarafından uygulandı.

Page 7: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

7

Bugünkü anlamda 19. Yüzyıl ortalarında bir bilim olma özelliğini kazanmıştır. On dokuzuncu yüzyılın sonuna doğru olasılık teorisi olağan üstü geliştirildi ve istatistik bilimi sağlam temeller üzerine kuruldu ve uygumlalar için tamamen teste bağlı tutuldu. Gerek olasılık ve gerek istatistikte üzerinde en önemle durulan husus, bir davranışta bulunulurken işe karışan risk ve avantajlardır. İstatistik biliminin ortaya çıkışında 3 ayrı bağımsız fen alanında gelişimi ana etken olarak ele alaına bilir. Bunlar,

1. Alman’ların staatenkunde adını verdikleri bilim dalı, devlet tarihi, devlet kaynakları, askeri güçleri gibi bilgileri biriktirip karşılaştıran bir bilim dalı.

2. İngiltere’de 17. Yüzyılda nüfus tahminleri, yaşam-ölüm (mortality) tablo9ları ile gelişen demogeafi bilimi.

3. 17. Yüzyılda Fransa’da kumar problemlerine yanıt arayan olasılık matematiğinin gelişimi ve zamanla bu gelişimin veri analizine de etkisi olmuştur.

İstatistik gittikçe artan hızla hassas sonuçlarla ilgilendikçe, kullanıldığı alanlar da genişledi ve günümüzdeki beşeri faaliyetlerin hemen hemen her evresinde etki edecek biçimde kabul görmeye başladı. İstatistik veriler ve onların kullanışlarıyla heryerde ve her gün karşılaşılmaktadır. Örneklerden bazılar: politikaların birçoğunu formüle etmek ve aldıkları kararları desteklemek için hükümetler istatistiği temel almaktadır. Politikacılar halkı ikna etmek için, pozisyonlarının halkın iradesine uygun olduğunu gösterme konusunda istatistik kullanırlar. Rakip firmalar kendi ürünlerinin iddia ettikleri üstün kalitesini ispat etme hususunda yine istatistikleri sunarlar. İstatistik çağda yaşadığımızı gösteren ortamların başında istatistik verileri ve istatistik anlamları ve bunların analizleri daimi olarak bize sunan günlük gazeteler, radyo, televizyon ve internet reytingleri gelmektedir. Yetenekli vatandaşlar düzeyine yükselmek için kişilerin genel eğitimin bir parçası olarak istatistik bilgisi edinmelerinin çok değerli bir nokta olduğu açıktır. Ancak istatistik öğreniminin başlıca nedeni onun bilimsel araştırmalarda kullanılan önemli bir metod olmasıdır. İstatistik metod sosyal bilimler dışındaki olayların incelenmesinde de kullanılır. Örneğin; fizikte elektron ve atom çekirdeklerinin hareketlerini incelemede kullanılır. Tıbbi araştırmada hastalıkların teşhisinde ve yeni ilaçların yan etkileri olduğu kadar verimliliğini teste bağlı tutmada kullanılır. Doğal bilimlerde kendisine onurlu bir yer sağlamıştır. Sosyal bilimlerin bütün dallarında hemen hemen biricik pratik çalışma aracıdır. İstatistik olmaksızın psikoloji, politik etütler, ekonomi ilmi ve işletme konuları çok zayıf olur ve tahmin ve kontrolde kullanılmaları verimsizleşir.

İddia mı yoksa karşı iddia mı istatistik yönden yerindedir? Yaşayışımızın her evresinde etki etmesi olanaklı olduğu için, bu sorulara verilecek cevapların yaşamsal önemi bulunmaktadır. Fakat temel istatistik prensipleri hakkında bilgi edinmedikçe doğru cevapların elde dilmesi olanaklı görülmemektedir. İşte, bu gerçeğin ışığı altındadır ki, bir seferinde H.G Wells, ‘günün birinde yeterli bir vatandaş için istatistik düşünüş okuma yazma yeteneği kadar gerekli olacaktır’ demiştir.

1.7. İstatistik nerelerde kullanılır? Bir olay veya deney aynı koşullar altında tekrarlanabiliyor ve daima aynı (benzer) sonuçlar alınıyorsa, bu tür olaylar sonuçları kesin olarak bilinebilen

Page 8: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

8

deterministik sonuçlar üreten bilimlere aittir ve burada istatistiğin yapabileceği bir şey yoktur. Ancak, aynı koşullar altında bir deney/olay tekrarlandığında sürekli aynı sonucu vermiyorsa, bununla ilgili yerlerde ve bunu kapsayan tüm bilimlerde istatistik kullanılır ve gereklidir. Bu gibi durumlarda ilgilenilen olayda değişkenlik vardır ve istatistik bu tür yerlerde çok işe yarar. Bu kapsamda yer alan tüm stokastik sonuçlar üreten bilimlerin gelişimine katkı sağlar. İşletme araştırmaları, kalite kontrol, her türlü denetim, Pazar analizi, sosyal araştırmalar, davranış bilimleri, ekonomi, ekonometri, sağlık bilimleri, mühendislik, hukuk, doğa ve yer bilimleri, meteoroloji, biyoloji ve bu bilimlerin sonuçlarından yararlanan diğer bir çok bilim istatistiği etkin bir şekilde kullanmaktadır. Tanım : İstatistik Populasyondan alınmış bir örnekten elde edilen verilere dayanılarak populasyon hakkında sonuç çıkartma metotlarıdır. Sayılar çoğu kez bir çok sözel ifadeden fazlasını kapsar. Saylar belli bir bilgi eksikliği içerisinde özet bilgi içerir.

İstatistik ve olasılık teorisi birbirinden farklı şeylerdir. Olasılık teorisi; populasyondan alınan örneğe ilişkin dağılımlar elde etmek için bilinen bir populasyondan harekete geçer. Halbuki İstatistik Teorisi, populasyonun bilinmeyen özellikleri hakkında sonuçlar ya da yargılar çıkarmak için gözlemlenmiş örnekten işe başlar.

1.8. İstatistiğin temel unsurları Tüm istatistik problemlerinde var olan ortak elemanlar aşağıda sıralanmıştır. Populasyon Örnek Değişken İstatistiksel Yorumlama Güvenilirlik

Örnek

Populasyon

anakitle

İstatistiksel yorum ve

güvenilirlik değerleri

E(x) Tahmin

örnek istatistiği (örnek özelliği)

Örnekleme

süreci

µ Parametre (populasyon özelliği) X değişken

Page 9: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

9

Tanım : Populasyon/anakitle: Tüm bireyler sayılırsa bu populasyondur. Değişkenlerin aldığı değerlerin tümü populasyonu oluşturur. İlgilenilen değişkene ait birimlerin tümünün oluşturduğu veri seti. i-) Sınırlı populasyon : Örneğin; zar atma, sınıfaki öğrenciler ii-) Sınırsız (sonsuz) populasyon : Yeterli derecede elde edilen gözlemlerin en az 20 katı gözleme sahip ise sınırsız popülasyona yaklaşım oluşur. Populasyon var olan birimler setidir.( genellikle insanlar, nesneler, işlemler veya olaylardır.) Populasyon kavramına örnek verirsek 1-) Telefon rehberinde kayıtlı tüm kişiler 2-) Geçen yıl üretilmiş tüm arabalar 3-) THY hava yollarındaki bakımdaki tüm yedek parçalar. 4-) Verilen bir yılda arabaya servis yapan fast-food restaurandlarının satışları. 5-) Bir tatil süresi boyunca meydana gelen kaza sayısı İlk populasyon örneği insan(grup) setleri, 2 ve 3 numaralı örnekler nesne setleri, 4 numaralı örnek işlem seti, 5 numaralı örnek de olay setidir. Populasyon çalışmasında, populasyondaki birimlerin bir veya daha fazla karakteristiği veya özelliği üzerine odaklanabilir. Böyle karakteristikler değişken olarak adlandırılır. Tanım : Örnek: Populasyon içinde bulunan elemanlardan analize alınan kısmına verilen addır. Gerçekleşen gözlemleri içeren populasyonun bir alt setidir. Örnek populasyondaki birimlerin bir alt setidir. Tanım : Parametre: Populasyon özelliğini ifade eder. Sabit tek bir değerdir. Her değişkene ait bir gerçek parametre değeri vardır. Yunan harfleri ile sembolize edilir. Tanım : İstatistik: Örnek özellikleridir, örnekten örneğe değişir, parametrenin temsilcisidir, Türk ve Romen harfleri ile simgelenir. Parametre tahmini için kullanılan örneğin bir sayısal fonksiyonudur. Örneğin seçilme metodu Örnekleme prosedürü veya Örnekleme planı olarak adlandırılır. En önemli örnekleme prosedürlerinden biri tesadüfi (rastgele) örneklemedir, burada populasyondaki her birimin örneğe seçilme şansı eşittir. Her örneklem birim için örneğin seçilmesi ve değişkenlerin ölçülmesinden sonra, örnekten elde edilen bilgi ile populasyon hakkında sonuç çıkarılır. Tanım : Değişken bir bağımsız populasyon biriminin bir özelliği veya karakteristiğidir.

Populasyon özelliği ( µ ,σ ,ρ ) : parametre

sabittir)

Örnek özelliği ( x , s, r ) : istatistik

(değişir)

Page 10: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

10

Değişken kelimesi populasyondaki birimler arasında belirli bazı karakteristiklerin değişmesi gerçeğine dayanır. Değişken, gözlemlere veri olan sayısal karakterlere verilen addır. X, Y, Z… gibi alfebenin son harfleri ile genellikle sembolize edilir. Değişkenin tüm olanaklı değerler setine tanım aralığı (domain) denir. Değişken tanım aralığı içindeki değerleri belli bir olasılık ile alıyorsa buna şans değişkeni denir. Değişkenler kesikli ve sürekli tipte olabilir.

Eğer çalışmak istediğimiz populasyon küçük hacimli ise, o zaman populasyondaki her birim için değişkeni ölçmek olasıdır. Populasyonun her birimi için değişkeni ölçersek bu populasyonun sayımı olarak adlandırılır. Bununla birlikte, işletme problemlerinde ilgilenilen populasyonlar tipik olarak daha geniştir, belki de binlerce birim içerirler. Bu tip populasyonlarla çalışırken bir sayım yapmak çok fazla zaman birimlerin bir alt setini seçmek ve çalışmaktır.

Tanım : Ölçüm: Ölçme varlık veya olayların belli nitel veya nicel özelliklerini sembollerle (sayı veya değer) belirleme işlemidir. Ölçümlerde genel olarak 4 ölçek (ölçme düzeyi) kullanılır.

a) Sınıflandırıcı (Nominal) ölçek, bu grupta kullanılan değişkenler sınıflayıcı veya kategorik veya kalitatif-niteliksel değişkenlerdir.

b) Sıra-derece gösteren (ordinal) ölçek, bu grupta ölçülen değerler için kullanılan değişkenler ile aritmetiksel işlemler yapılamaz.

c) Basit sayısal eşit aralıklı (interval-cardinal) ölçek, bu gruptaki ölçekte sıralama ve aralık ölçme işlemi birlikte kullanılır. Bu grupta kullanılan değişkenler ile aritmetiksel işlemler yapılabilir.

d) Oran (ratio) ölçek, bu gruptaki ölçümler arasında oransallık vardır.

Ölçümün iki ayrı özelliği vardır.

1. Ölçümün doğruluğu (acurracy) ; ölçümün doğruluğu sapma miktarı ile belirlenir.

2. Ölçümün hassasiyeti (sensitivity); ölçümün hassasiyeti tekrarlanabilirlik (repeadibility) ve tekrar üretilebilirlik (reproducibility) şeklinde iki bileşenden etkilenir. Tekrarlanabilirlik, ölçüm cihazı-aracı kaynaklı oluşur, tekrar üretilebilirlik ise ölçümü yapan kişi kaynaklıdır.

Hassas Hassas değil

Şekil . Ölçümün doğruluk ve hassasiyeti

Page 11: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

11

Tanım : Hassasiyet (precision), bir parametre tahminleyicisinin istatistiksel dağılımını belirtir. Tanım 7: Doğruluk (accuracy), tahminleyicinin gerçek değere ne kadar yakın/uzak olduğunu belirtir. Tanım 8: Sapma (bias), tahmin ile gerçek değer arasındaki sistematik aralıktır. Tanım : Veri: Örnek ya da populasyondaki bireylerin ölçüm sonuçlarıdır. Populasyon içindeki elemanlar, örneğin; yaş, ağırlık, uzunluk. Verileri kullanılan ölçek türüne göre dört ana grupta sınıflandırmak mümkündür.

a) Kategorik Veriler (Nominal data): belli bir sıra düzeni olmayan veriler. cinsiyet v.b.

b) Sıra/Derece Gösteren Veriler (Ordinal data ): Sayısal veya sayısal olmayan türde ancak sıra düzeni olan veriler. Bu veriler arasındaki farklar anlamlıdır. Ancak bu fark eşit olmayabilir. örneğin iyi-orta kötü gibi.

c) Basit sayısal veriler (Interval data): (bir sıra düzeni içinde olan veriler, seviyeler arası farklar eşittir. Örneğin, yaş, sıcaklık vb.

d) Oran Verileri (Ratio data): iki basit sayısal verinin birinin diğerine bölümü ile elde edilen veriler. Sayı seviyeleri bir sıra düzeni içerir, seviyeler arasındaki farklar eşittir.

Verilerin ölçeklerine göre diğer bir sınıflandırma şekli ise aşağıdaki gibi yapılabilir; ii. Kalitatif/Niteliksel/sayısal olmayan/kategorik veriler: Sayısal ifade

edilemez, ancak frekans cinsinden ifadesi sayısal değer alır.

Kategorik veriler örneğin sına/aralık, binary/ikili, E/H şeklindedir

Ordinal veriler de bir kısmı bu gruba girer. örneğin sıra, derece, sıfat, kızgın, iyi çok iyi gibi verilerdir

iii. Kantitatif/Niceliksel/sayısal veriler: Sayısal değerlerle ifade edilen interval

ve ratio veriler bu gruba girer. Bu verlerde ölçüm şekli ve matematiksel operatörlerin kullanımı açısından iki grubda ele alınır;

a. Kesikli veriler

Aralıklandırılabilir (yaş)

Aralıklandırılamaz (telefon numarası) b. Sürekli sayısal veriler

Aralık verileri, örneğin uzaklık, zaman, sıcaklık Oran verileri, örneğin seçim sonuçları

Tanım : Bilgi : Veri sayısal olabileceği gibi sayısal olmayan nota, harf veya işret gibi karışık ve anlamsız halde olabilir. Veriler bir araya getirilerek düzenlenir ve bilgiye dönüşürler. Biz kelimeyi ya da notayı bir veri olarak kabul edersek, kelimelerin bir araya gelip oluşturduğu cümleler ve paragraflar bilgi olur, notaların bir araya gelmesi bir müzik bilgisini oluşturur. Büyük veri tabanlarının içerisindeki gizlenmiş bilgi ve yapıları ortaya çıkartmaya çalışan bir veri analiz sürecine ise günümüzde veri madenciliği (data mining) denilmektedir. Bilgi = f(veri) +hata Her istatistiksel bilgi kendi içinde bir hata da içerir. Buradaki hatanın kaynakları;

Page 12: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

12

o Populasynun tümü inceleme kapsamında olmaması o Veriyi bilgiye dönüştürecek fonksiyon tam olarak bilinememesi o Gözlem ve ölçüm hataları o İlgilenilen sonuç değişken bir varyasyon içermesi (aynı veri; aynı fonksiyon

olsa bile) sebeplerine dayanabilir.

Tanım : İstatistiksel sonuç (yorumlama) örnekten elde edilen bilgiye dayandırılan populasyon hakkında yapılan tahminleme, kestirim veya genellemedir. Örneğin içerdiği bilgiyi daha büyük populasyon hakkında bilgi edinmek için kullanırız. Yöneticiler istatistiksel sonucu, kararlarına yol göstermesi ve desteklemesi için kullanırlar. Örneğin piyasaya yeni sunulacak bir ürünü müşterilerden oluşan örnek üzerinde test eder ve bu ürünü müşterilerden oluşan örnek üzerinde test eder ve istatistiksel sonuç bu testin sonuçlarına dayanır. Güvenilirlik

İstatistik, kullanılan örnek verileri ve değişkenlerin sonuçları için, bunların güvenilirliğini ölçmek ister. Önceki bölümlerde sonucu örnekte bulunan bilgilerle populasyon hakkında genelleme yapmak olarak tanımlamıştık. Fakat sonuç çıkarmak bu hikayenin sadece bir parçasıdır. Bizim öyleyse sonucun ne kadar iyi olduğunu bilmeye ihtiyacımız vardır. Bir populasyon hakkındaki sonucun kesin doğru olduğuna karar verebilmenin tek yolu, örneğimizin bütün populasyonu kapsamasıdır. Fakat kaynak kıtlığından dolayı bu metod çok fazla tercih edilmez. Genellikle küçük örnek hacmi sonuç hakkında daha az kesinlik demektir. Örnek hacmi 5 olan bir duruma dayanan sonuç, örnek hacmi 100 olana göre daha az güvenilirdir. Sonuçlarda güvenirliğe karar vermek çok önemli ve istatistiksel problemin bir elemanıdır. İstatistiksel metodları kullanırken tahmninlenen hatanın sınırlarına karar veririz. Bu sınır tahminlenen hatamızın geçmemesi istenen bir sayıdır. Bu sınır kesin olmayan sınırımızın bir ölçüsüdür. Bir sonuç güvenirliliği ölçülmeden tamamlanmıştır.

Örnek

sayısı

Veri değerinin

marjinal faydası

Optimum örnek büyüklüğü

Veri

Değeri Veri değerinin

Marjinal maliyeti

Page 13: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

13

1.9. Dedüktif ve Indüktif Yargılama Indüktif (Tüme varımlı) istatistiğe çoğunlukla `istatistik tahmin` denir ve sonuçlar çıkarma ve kararlar verme işi ile uğraşır. Bu gerçek bir bilimsel problem olup, Aristotle (Aristo) zamanından beri idrak olunmuş bulunmaktadır. Dedüktif mantık ise populasyona ait önermelerden özel axiyomlarin tahmin olunabileceği durumlarda meşgul olur. Bunun tersine olarak, indüktif mantıktan anlaşılması gereken özelliklerden genellikle doğru bir muhakemenin izleneceğidir. Bu zıddiyete rağmen, bu iki işlem birbirini ancak tamamlar. Sadece genel aksiyomlardan özel sonuçlar çıkarmak daima olanaklı olmayabilir. Dedüksiyonun temeli önermelerde mutlaka ima edilen sonuçların çıkarılmasıdır. Önermelerden hiç değilse bir ferdi (özel) olmadıkça dedüktif istidlalin (inference, yorumlama, çıkarsama; iki önermeden üçüncüsünü elde etme) sonucu da ferdi olamaz. Büyük önermeler çoğunlukla ari hipotezlerdir. Hiç bir hipotez kendi başına kesinlikle mevcut bir gerçeği bize veremez. Büyük önermelerden keyfiyete ait, fizik kanunları gibi, sonuçlar çıkarılabileceği yaygın kanısı yanlıştır. Büyük önermeleri ancak gerçek verilere uyguladığımız zaman onlardan gerçek sonuçlar çıkarmak olanaklıdır. Örneğin, benzin motoruna ait teori bir dizi genel önermelerden meydana gelmiş olup, otomobil hakkında bir bilgi veremez, yeter ki önermelere otomobilin bir benzin motoruna sahip olduğu özel önermesi eklensin. Tipik bir tüme varım sekli olarak genel bir sonucu hakli çıkarmak için birçok olay kullanılması acık bir uslamlama olup indüktif istidlale bir örnektir. A, B, C, D ve E gibi, ciğer kanserinden rahatsız kimselerin hepsinin X ilacı ile iyileştirilmiş bulunduğu gözlemlenmiş ise, ciğer kanserine tutulmuş herkesin X ilacı ile tedavi olunabileceğine hükmetmek doğru bir istidlal midir? Elbette değil, zira “A, B, C, D ve E için doğru olan ciğer kanserinden muzdarip bütün hastalar için de doğrudur” ek önermesinin de gerçekliğinin bilinmesi gerekir. Bu husus da belirtildiği takdirde muhakemenin aşağıdaki şekilde tam kıyası ifade edilebilir:

A, B, C, D ve E için bir deva bütün ciğer hastaları için bir devadır. X ilacı A, B, C, D ve E için bir devadır. O halde X ilacı bütün ciğer kanseri hastalar için bir devadır. Görüldüğü gibi böyle bir muhakemenin bütün önermeleri açıkça belirtildiğinde, sekli mantık bakımından dedüksiyon ve indüksiyon birbirinin zıttı terimler değil, gerçekte birbirinden ayırt edilemez terimlerdir. Dikkat edilecek husus, indüktif istidlalin geçerli olabilmesi için bütün geçerli istidlale uyması gerektiğidir. Herhangi bir kıyaslamada, ister dedüktif ister indüktif olsun hükümler (sonuçlar) önermelerin kombinasyonu kadar özel veya onlar kadar genel olmalıdır. On yedinci yüzyılın büyük filozofu Leibnitz (1646–1716) `in “Kıyasın keşfini insan zekâsının en güzel, hatta göz alici buluşlarından biri sayarım. Kıyas, genel olarak matematiğin önemi yeteri kadar tanınmamış kültürüdür. Kullanılması bilinir ve iyi kullanılabilirse kıyasta yanlış yapmamak sanatının gizli olduğu görülür.” Sözünden anlaşılır ki, kıyas, direkt olarak hakikati bulduran bir alet olmaktan ziyade zihni kontrol etmeye yarayan ve yanlıştan koruyan bir araçtır. Zayıf bir delil ileri sürüldüğünde, onun kıyas sekline sokulmasıyla, yanlış tarafları hemen görülebilir. Örneğin, ya tarafımızca kabul edilmeyen bir büyük Önerme`den hareket edilmiştir veya sunulan küçük önerme, Büyük`ü sonuç`a bağlamamaktadır: yahut ta öncüller doğru olduğu halde onlardan sonuç çıkarmada hata edilmiştir.

Page 14: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

14

Özet olarak, dedüksiyonun dayanağı, Bütünsel bir ifade ve ancak ona uyarak yapılan bir istidlaldir. Hâlbuki asil dayanak, öncül ve indüksiyon yolu ile toplanıp bütünsel önerme haline getirilen tek tek olaylardır. Indüktif delilde mantıken gerekli öncüller (= Büyük ve Küçük Önermeler) in hepsinin doğruluğu bilinmemektedir. Bütünsel hükmü hakli çıkaran gözlemlenmiş olayların örnek olarak alındığı populasyonu temsil edip etmediği bilinmemektedir. Indüktif kıyaslamada önem verilen baslıca husus örneğin ne dereceye kadar sapmasız (eğilimsiz, tarafsız) olduğunun tespitidir. Dedüksiyon ile İndüksiyon arasındaki ayırım buradadır. Dedüksiyon öncüllerinin doğruluğu veya yanlışlığı ile ilgilenmediği halde indüksiyonun özelliği odur. Böylece, gerçek zıtlık dedüktif veya indüktif sonuçlar arasında değil, fakat gerekli olan sonuçlar ile muhtemel olan sonuçlar arasındadır. Yukarıda yapılan tartışmalar indüktif (tümevarımlı) uslamlamaya dayanan istatistik istidlalin doğasına da ışık tutmaktadır. Örnek verilerine göre populasyon hakkında genelleştirme (genel bir sonuç bulma) işlemi yaparken bir risk göze almaktayız. Çünkü bu genelleştirme “Örneğin populasyonu temsil ettiği” varsayımı altında yapılmaktadır ki, doğru olduğu genellikle bilinmemektedir. Ancak bu husus görüldüğü kadar yenilmez güçte değildir. Her ne kadar istatistik sonuçta mutlak kesinlik elde etmek mümkün değil ise de, bu gibi yorumlarda risk içeren sonuç lar mümkündür. Bu nokta, istatistik yorumlamalarda olasılık teorisi ile aşılmaktadır Probobilistik olan tüm birimlerde istatistik söz konusudur. Sosyal bilimlerde olayları aynı koşullar altında bilme olanağı yoktur kaldı ki olsa bile aynı sonuca her zaman varılacağı söylenemez, o halde deterministik olmayan bu bilimlerde istatistikten söz edilebilir. 20. yüzyılın son çeyreğinden bu yana tüm sosyal bilimler kantitatifleşme arzusu içine girmişlerdir. Bunun en iyi yolu istatistik aracılığıyla gerçekleşebilmektedir. Günümüzde artık tüm stokastik kökenli bilimler, başta sosyal bilimler kantitatifleşme arzusu içinde istatistikten yararlanmaktadır. Günümüzde istatistik bilimi olayları matematiksel modellerde ifade edebilecek düzeye gelmiştir. Doğadaki tüm olaylar tarafımızdan bilinmese dahi bir matematik modelle ifade edilebilir. İstatistikçi stokastik olarak gerçek modele en iyi uyumu sağlayan modeli bulmaya çalışır ve olayların ortaya çıkmasına neden olan varyasyon kaynaklarını açıklamak ve yorumlamaya yardımcı olur. Tüm olayların farklı nedenleri vardır ve her kaynak nedenin, olayın oluşumunda farklı oranda katkısı vardır, bu farklı kaynaklar modele etki eden birer değişken olarak kabul edilirler ve çeşitli nedenlerle bilinmeyen varyasyon kaynaklarının tümü de modelde hata terimi olarak yer alır. O halde bilinmeyene varmada ya da bilinmeme nedenlerini bulmada istatistik çok önemli bir analiz aracıdır. Tanım : Süreç (Proses) Proses girdileri çıktılara dönüştüren olaylar veya operasyonlar serisidir. Proses zaman boyuncu çıktı ortaya koyar veya oluşturur. İstatistiksel metodlar prosesler hakkında karalar vermek ve analiz etmek için de eşit derecede kullanışlıdır. Ölçüm, sayıların bağımsız populasyon birimlerinin değişkenleri üzerine uygulanan bir prosestir. İşletmelerde en çok ilgilenilen prosesler üretim ve imalat prosesleridir. İmalat prosesleri insanlar ve makineler tarafından girdileri çıktılara dönüştüren operasyon serilerini kullanırlar. Aşağıdaki şekilde bir proses ve onun girdi ve çıktılarının genel bir gösterimidir.

Page 15: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

15

Bir imalat prosesinin grafiksel gösterimi

Burada gösterilen bir tüm süreç veya bir alt süreç olabilir. Fiziksel ürünler ve servislere kıyasla, işletmeler ve diğer organizasyonların performanslarını değerlendirmek için sayısal verilerden oluşan sonuçlar oluşturabilirler. Tanım : Kara Kutu Olayları ve operasyonları bilinmeyen veya belirlenmeyen prosesler kara kutu olarak adlandırılırlar. Bir süreç kara kutu gibi varsayılıyorsa ya girdileri tam olarak belirlenmemiş olabilir veya girdiler ile çıktılar arasındaki süreç tam bilinmiyor ve tanımlanamıyor olabilir. Sayısal çıktılarla bir kara kutu projesi

Bir proseste çalışırken genellikle çıktının bir veya daha fazla karakteristiği veya özelliğine odaklanılır. Örneğin; üretilen her birimin ağırlığı veya genişliğiyle ilgilenebiliriz. Bunlar populasyon birimlerinin karakteristikleri yani değişkenleridir. Eğer çıktı sayısal değil ise, değişkenlerin sayısal değerlerini belirlemek için ölçüm proseslerini kullanırız.

1.10. İstatistiğin Ekonomi Ve İş Hayatındaki Yeri 20. yüzyılın son çeyreğinden itibaren istatistik verilerin toplanıp ekonomide, işletmelerde ve kamu yönetiminde kullanılması bilgisayarların ve uygulamalarının artması ile olağanüstü bir gelişme göstermiştir. Bu verilerin toplanması ve kullanılması amacıyla hükümet ve özel araştırma büroları tarafından her yıl büyük rakamlara ulaşan para harcanmaktadır. Gayrisafi Milli Hâsıla, tüketim, artırımlar, yatırım harcamaları ve paranın değerindeki değişiklikleri ölçmek için ekonomistler istatistiğe başvururlar. Ayrıca, ekonomi ve iş âleminde ki gerek araştırmacıların gerekse kamu idarecisi ve işadamının bu tip kitle verilerinden anlam çıkartmaya sık sık zorunluluk duydukları

DÖNÜŞÜM SÜRECİ

OPERASYON OPERASYON

A B

İNSANLAR VE

MAKİNALAR

TARAFINDAN

GERÇEKLEŞTİRİLİR

GİRDİLER

BİLGİ

METODLAR

ENERJİ

MATERYALLER

DÖNÜŞÜM SÜRECİ

GİRDİLER

ÇIKTILAR

ÇIKTILAR

ÜRÜN

Page 16: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

16

açıktır. Veriler etkili ve sistematik bir biçimde düzenlenmedikçe ve tanımları gereği gibi işlenebilecek ölçülere indirilmedikçe, bu veriler çok yararlı olamazlar. Gerekli düzene sokulduktan sonra, bu veriler, istatistikçiler tarafından istatistik metodun ekonomik ve diğer teorileri doğrulamada ve hipotezleri teste bağlı tutmada kullanılabilirler. 20. yüzyılın ortalarından bu yana, sınaî ve ticari işletmeler, ekonomik sorunlarının çözümlenmesinde sadece istatistikten değil, matematiğinde istatistik ile birlikte ekonomiye uygulanmasından doğan ekonometri bilim dalınndan geniş ölçüde yararlanmaktadırlar. Mikro veya makro ekonomilerin bir anlamda ölçümü ile ilgilenen ekonometri bilimini ekonomi biliminden ayıran en temel özellik istatistik bilimini tam anlamıyla kullanıyor olmasıdır. Yönetim ve İdari Kararlarda İstatistiğin Rolü Yöneticiler sık sık istatistiksel analizlerden elde edilen girdilerin karar vermelerinde yardımcı olacağına inanır ve güvenirler. İdari soruları istatistiksel sorulara dönüştürebilir, örnek verileri toplanır, analiz edilir ve istatistiksel sorular cevaplandırılır. Prosesteki diğer adım istatistiksel sorulara verilen cevapları kullanarak idari soruların cevaplarına ulaşmaktır. Karar verme prosesindeki en zor adım idari soruları istatistiksel terimlere dönüştürmektir. Bu soru öyle bir formüle edilmelidir ki cevaplandırıldığında idari sorunun cevabının anahtarını sağlayabilmelidir.

1.11. İstatistik Araştırmalar İstatistiksel çalışmalar dört ana grupta toplanır.

1. Tanımlayısı (descriptive) istatistiksel çalışmalar, bunlar tek drubu içeren alan araştırması (survey) şeklindeki çalışmalardır

2. Karşılaştırma (comparative) istatistiksel çalışmalar, bunlar iki veya daha fazla grup içeren karşılaştırmaya dayalı çalışmalardır.

3. Deneysel (experimental) istatistiksel çalışmalar, bunlar çalışma şartlarını kontrol etmek amacıyla aktif olarak sürecin arasına girilerek yapılan araştırmalardır. Bu çalışmalar açıklayıcı (belirleyici) ve çıktı (cevap) değişkenleri arasındaki ilişkileri incelemek için yapılır.

4. Gözlemsel (observational) istatistiksel çalışmalar, bunlar sürecin içine girmeksizin sadece verileri kayıt ederek yapılan araştırmalardır. Bu çalışmalarda belirleyici değişkenler ile gizli veya bozucu/karıştırıcı (confounding) değişkenlerin etkilerini ayırt etmek güçtür. Bunlar;

a. tek bir zamanda tek bir örneği incelemek, saym, seçim b. geleceğe doğru örneği incelemeye devam etmek, sağlık

çalışmaları c. geriye doğru olayı incelemek (case control study)

Gözlemsel çalışmaların içerisinde genellikle gözlem hataları bulunur. Bu hataların kaynakları

1. Örnekleme hatası, populasyondan alınan örnek farklılıklarından doğar

Page 17: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

17

2. Ölçüm sapması, zayıf anket sorularından doğar 3. Kendi kendine seçim hatası, bu tür hatalar ankete katılımı geri

çevirmek şeklinde oluşur 4. Cevap sapması, anketlerde gerçek olmayan veya doğru olmayan

yanıtlardan kaynaklanır.

Sorunlara istatistik metotların uygulanması yoluyla araştırmaların temel aşamaları ise genellikle aşağıdaki sırada yapılır

1) problemin formulasyonu veya tanımlanması

2) Deney modelinin oluşturulması 3) Verilerin toplanması ya da elde edilmesi 4) Verilerin tasnif edilmesi, veri cetvelleri haline sonuçların açıklanması 5) Genelleştirme veya tahmin.

1. Problemin Tanımlanması

İstatistiksel araştırmalarda öncelikle ne araştırılacağına karar verilmesi gerekir. Aynı bir ürün üretim gibi önce girdiler ve bu girdilerin özellikleri belirlenir. İstatistik analizinin farklı işlenmiş verilerde gizli buluınan sonuçların çıkartılması amaçtır. Sonuç belirlendikten sonra hangi verilerin araştırma için uygun olduğu belirlenir, aynı zamanda bu verilerin uygunluk ve doğruluğu da bir o kadar önemlidir. Aksi halde istatistik metodlarla sadece metod……… araştırması yapılmış ancak yararlı sonuçlar elde edilmemiş olunur.Kullanılacak verilerin toplanabilir uygunluktaki olanlarının tümüne populasyon/anakitle denir.Ve buradan toplanan gözlenen istatistik verileri oluşturulur

2. Deney Modelleri Problemin tanımlama sonrasında araştırmada populasyonun tamamı etüd ediliyorsa buna populasyon sayımı denir veya popülasyonun bir kısmı inceleniyorsa buna da örnekleme denir. Örneklemede en önemli konulardan biri, populasyonu yeterince temsil etme yeteneğini sahip örneği elde etmektir.Bu kapsamda yer alan,örnekleme planı,örnekleme metodu,verileri toplama şekli ve örnek büyüklüğü gibi sorulara cevap vermek/örnekleme teriminin teorisinin içeriğinde yer alır. Örnekleme teorisinde yer alan bir değer önemli kavram ise populasyondaki verilerin örneğe girme olasılıklarının olup olmadığı ve bu olasılığın(basit olması gibi) bilinmesidir. Örneğe girme olasılığı olan örnekleme sonda bağlı terimi kullanılır.Örnekleme terimine gibi bir diğer yol ise deney planlamasıdır.Deney planlaması bir istatistiksel modele ve olasılık dağılış varsayımına dayalı yapılır ve genellikle daha sınırlı ve değerli popülasyon sonuçları için kullanılır. Örnekleme teorisinde ise bir istatistiksel model veya olasılık dağılış varsayımı yoktur. Örneğin, aylık, yıllık vb TUIK tarafından yayınlanan istatistiklerin çoğu örnekleme ilde elde edilmektedir.

3. Verilerin Toplanması Bu aşamada örnekleme planına veya deney planına uygun veriler toplanması sağlanır. Bu aşama çok rutin ve sıradan gibi görünse de en çok zaman alan ve ciddi bir saha organizasyonu gerektiren çaba ve genellikle istatistiksel analizin en pahalı aşamasıdır. Bu aşamada teknolojik ön hazırlık ve verilerin toplanmasında kullanılabilecek personel eğitimi önemli sorunlar oluşturabilir.

Page 18: GİRİ - kisi.deu.edu.trkisi.deu.edu.tr/levent.senyay/istatistikI_2015_2016/1_ giriş.pdf · hukuk, eğitim bilimleri gibi), biyoloji temelini kullanan tüm bilimler (biyoloji, insan

18

4. Verilerin Düzenlenmesi ve Gösterimi

Toplanan verilerin kullanılabilmesi için doğru bir şekilde düzenlenmesi, sınıflandırılması, kodlanması, dönüştürülmesi gibi işlemleri biri veya bir çoğu birlikte yapılır. Bazen de bu verileri ham veya sınıflandırılmış halleri ile tablolar, grafikler veya diyagramlar halinde sunmak gerekebilir. Bundan daha ileri tekniklerin kullanılması ise veri madenciliği olarak adlandırılmaktadır.

5. Sonuçların Genellenmesi ve Tahmini Bu aşamada yapılacak sonuçların değerlendirilmesi ilk aşamada problemi formüle etme ve tanımlama esnasındaki konunun uzmanlarıyla birlikte yapılmaktadır. Bu aşamada istatistik konuları içerisinde yer alan hipotez testleri ve istatistik modelleme metodları da kullanılmaktadır.