verİ gazetecİlİĞİ - İstanbul...
TRANSCRIPT
İSTANBUL ÜNİVERSİTESİ
AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
VERİ GAZETECİLİĞİ
ORTAK DERS (UZAKTAN EĞİTİM)
DR. ÖĞR. ÜYESİ SÜLEYMAN TÜRKOĞLU
İSTANBUL ÜNİVERSİTESİ
AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
İSTANBUL ÜNİVERSİTESİ
AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
ORTAK DERS (UZAKTAN EĞİTİM) LİSANS PROGRAMI
VERİ GAZETECİLİĞİ
Dr. Öğr. Üyesi Süleyman TÜRKOĞLU
I
ÖNSÖZ ......................................................................................................................... V
YAZAR NOTU ........................................................................................................... VI
1. VERİ GAZETECİLİĞİNİN TARİHİ VE KAYNAKLARI ................................. 1
Bu Bölümde Neler Öğreneceğiz? ............................................................................... 2
Bölüm Hakkında İlgi Oluşturan Sorular..................................................................... 3
Anahtar Kavramlar ..................................................................................................... 4
Giriş ............................................................................................................................ 5
1.1. Veri Gazeteciliği Kavramının Ortaya Çıkışı ve Gelişimi .................................... 6
1.2. Değişen Gazetecilik Anlayışı ve Veri Gazeteciliği ........................................... 10
2. BİLGİSAYAR DESTEKLİ HABERCİLİĞİN DÖNÜM NOKTASI:
İNTERNET VE WİKİLEAKS .............................................................................................. 14
2.1. Veri Gazeteciliği Neden Önemli? ..................................................................... 19
Bölüm Soruları ......................................................................................................... 21
3. GAZETECİLİKTE VERİNİN KULLANIMI ..................................................... 22
3.1. Büyük Veri ........................................................................................................ 23
4. VERİ ........................................................................................................................ 32
Ham Veri .................................................................................................................. 33
Veri ........................................................................................................................... 33
Temel Kavramlar ...................................................................................................... 33
Veri Seti .................................................................................................................... 34
Veri Türleri ............................................................................................................... 35
Nitel Veri .................................................................................................................. 35
Nicel Veri ................................................................................................................. 35
Kategorik Veri .......................................................................................................... 36
Yapılandırılmamış Veriye karşı Yapılandırılmış Veri ............................................. 37
Yapılandırılmamış veri ............................................................................................. 37
Yapılandırılmamış Veriye karşı Yapılandırılmış Veri ............................................. 37
4.1. Uluslararası Veri ................................................................................................ 38
Uluslararası Veri Örnekleri ...................................................................................... 39
Uluslararası Veri Kaynakları .................................................................................... 39
Diğer Uluslararası Veri Kaynakları .......................................................................... 40
4.2. Ulusal Veri......................................................................................................... 41
II
Ulusal Veri Örnekleri ............................................................................................... 41
Ulusal Veri Kaynakları ............................................................................................. 42
5. Sivil Veri:Sosyal Medya, Kitle kaynak ................................................................. 44
Sivil Veri Örnekleri .................................................................................................. 45
Sivil Veri Kaynakları ................................................................................................ 47
Kitle kaynak (crowdsourcing) .................................................................................. 47
Kitle Kaynak Örnekleri ............................................................................................ 48
5.1. Türkiye’den Örnek Veri Haberciliği Çalışmaları .............................................. 49
5.2. Veri Arama Araçları .......................................................................................... 50
6. Açık Veri, Açık Toplum, Açık Devlet ve Veri Gazeteciliği ................................. 52
6.1. Neden Açık Veri? .............................................................................................. 53
Okuma Önerileri ....................................................................................................... 56
7. AÇIK VERİ VE TEMELLERİ ............................................................................. 59
7.1. Açık Veri ve Açık Bilgi ..................................................................................... 62
3 Mart Dünya Açık Veri Günü ................................................................................. 63
Veri Neden Açılmalıdır? .......................................................................................... 63
Veri Neden Açılır? ................................................................................................... 63
Veri Hangi Durumda Açık Sayılır? .......................................................................... 64
7.2. Açık Verinin Yapısı ........................................................................................... 64
Veri Nasıl Açılır ? .................................................................................................... 65
7.3. Açık Devlet Verisi, Açık Devlet ve Açık Yönetim Ortaklığı ........................... 66
Açık Devletin Bileşenleri ......................................................................................... 66
7.4. Türkiye’de Açık Devlet Kavramı ...................................................................... 70
7.5. Açık Yönetim Ortaklığı ..................................................................................... 73
7.6. Açık Veri Endeksi ............................................................................................. 78
8. AÇIK VERİ ENDEKSİNDE TÜRKİYE.............................................................. 80
9. VERİ GAZETECİSİ GİBİ DÜŞÜNMEK ............................................................ 94
Dünya Nasıl Tanımlıyor? ......................................................................................... 96
Neden şimdi önem kazanıyor? ................................................................................. 96
Veri Gazeteciliği Yapma Süreci ............................................................................... 97
Veri Gazetecisi / Veri Muhabiri Kimdir? ................................................................. 99
Veri Gazeteciliği Siteleri ve Veri Gazetecileri ......................................................... 99
Veri Gazeteciliği Araçları Nelerdir? ...................................................................... 100
III
Veri İşleme (Temizleme Süreci) ............................................................................ 101
Veri Gazeteciliği Ödülleri ...................................................................................... 101
10. VERİ ANALİZİ VE YORUMLAMA ............................................................... 107
Herkes İçin Temel İstatistik.................................................................................... 111
Veri Tipleri ............................................................................................................. 113
Popülasyon ve Örneklem ........................................................................................ 114
Merkezi Eğilimi Ölçmek ........................................................................................ 115
Aritmetik Ortalama ................................................................................................. 117
Ortanca / Medyan ................................................................................................... 117
Tepe değeri ............................................................................................................. 117
Video destekli örnek ............................................................................................... 118
Çalışma Soruları ..................................................................................................... 119
11. DAĞILIMI / FARKLILAŞMAYI ÖLÇMEK ................................................. 121
Standart Sapma Açık Formülü ............................................................................... 124
Excel & Özet Tablo ile Veri Analizi ...................................................................... 126
PDF'den ve Web'den Veri Kazıma ......................................................................... 131
Tabula ile PDF’den Veri Kazıma ........................................................................... 133
Web Sayfasından Veri Kazıma .............................................................................. 134
Dağınık Veri Temizleme ........................................................................................ 136
12. VERİ GÖRSELLEŞTİRME ............................................................................. 138
Diyagram neyi anlatıyor? ....................................................................................... 139
Veri Görselleştirme Nedir?..................................................................................... 140
Veri Görselleştirmenin Kökleri ve Tipleri ............................................................. 142
Veri Görselleştirme Süreci ..................................................................................... 142
Veri Görselleştirmenin Sınırları ............................................................................. 143
Görsel Etik .............................................................................................................. 143
Okuma Parçaları ve Forum ..................................................................................... 144
Veri Görselleştirme Kuralları ................................................................................. 144
Bazı Temel Veri Görselleştirme Kuralları ............................................................. 145
Veri Nasıl Sunulur .................................................................................................. 146
Veri Görselleştirmeyi Geliştirme Yöntemleri ........................................................ 147
13. VERİ GÖRSELLEŞTİRME ELEMENTLERİ............................................... 151
Füzyon Tablo ile Haritalandırma............................................................................ 157
IV
Coğrafi Bilgi Sistemi Nedir (CBS)......................................................................... 157
14. VERİ İLE HİKAYE ANLATMA ..................................................................... 159
Bulguları Gözden Geçirme ..................................................................................... 161
Araştırma ile ilgili bir ya da iki istatistiki noktaya odaklanma .............................. 162
V
ÖNSÖZ
Teknolojide yaşanan değişimler ve bunun sonucunda bir bilişim devriminin gerçekleşmesi
gazetecilerin haber elde etme yöntemlerini de geliştirmiştir. Bilgisayar ve internet alanında yaşanan
bu gelişmeler gazetecilik mesleğini de etkilemiş ve veri gazeteciliği kavramının ortaya çıkmasına
neden olmuştur. Veri gazeteciliği, açık verilerin kullanıldığı ve haberciliğin temelini oluşturan
hikâyenin kurulmasında çevrimiçi raporlamadan faydalanılan bir sistemi ifade etmektedir. Haber
dağıtım ortamının ve haber tüketim alışkanlarının değişimi, gerek haber kuruluşlarını gerekse
gazetecileri yeni bir alana doğru yöneltmiştir. Bu alan ücretsiz ve sınırsız kaynağı olan
yapılandırılmamış verinin bolca bulunduğu bir yer olan İnternet’tir. Günümüzde neredeyse her şeyin
sayılarla ifade edildiği bir başka deyişle sayısallaştığı ortamda, veri gazeteciliği için İnternet en önemli
mecra olmuştur.
Veri gazeteciliğinin etkili kullanılabilmesi için verinin temiz, analiz edilebilir olması ve
sonunda öyküye dönüştürülebilecek formata getirilmesi gerekmektedir. Bu nedenle veri
gazetecilerinin ilk görevi verinin gereksizlikten arındırılıp çeşitli teknikler ile birleştirilerek öykünün
oluşturulmasıdır. Habercilik alanının yeni bir yönü olan veri gazeteciliği kavramının ve süreçlerinin
açıklanması bu dersin temel amacıdır. Yöntem olarak betimsel araştırma yöntemi kullanılmış ve veri
gazeteciliği haber örnekleri değerlendirilmeleri üzerinden dersin pekiştirilmesine çalışılmıştır. Ders
kapsamında geleneksel gazeteciliğin veri gazeteciliğine dönüşümü ve veri gazeteciliği kavramının
gazetecilik anlayışına etkilerinin detaylıca ele alınması hedeflenmektedir.
Haberin veriler ile hikâyeleştirilerek sunulması yeni bir akım olarak görünmekle birlikte
haberin güvenilirliği ve açık kaynak verilerinin halkın bilgisine nasıl sunulacağı ile alakalı sorunları
da beraberinde getirmektedir. Bilişim sitemlerini kullanarak tutarlı bilgileri halkın anlayışına sunan
bu yeni habercilik anlayışının geleneksel habercilik anlayışında değişime neden olacağı
öngörülmektedir.
VI
YAZAR NOTU
Dünya bugün görülmemiş oranda veriyle sarılı ve bu, haber merkezleri için inanılmaz bir
kaynak anlamına geliyor. Verinin toplanması, işlenmesi, analiz edilmesi ve haberin bir parçası
haline gelmesi artan veri setleri ve geliştirilen araçlarla daha güvenilir içerikler oluşturulmasına
olanak sağlıyor. Haber içeriğinin raf ömrünü uzatan ve içerik üzerinden daha fazla değer
ayıklamayı sağlayan bu alan; 1990’lı yıllarda veritabanı gazeteciliği üzerinden şekillenmiştir.
Teknolojideki gelişmelerle medya endüstrisinde son yıllarda gerçekleşen dönüşüm eğilimleri,
haber merkezlerinde yeni iş tanımlarına ve istihdam yapılarının oluşumuna neden olmuş, çevrimiçi
gazeteciliği, çözüm gazeteciliği, ağ gazeteciliği, veritabanı gazeteciliği, veri gazeteciliği,
multimedya gazeteciliği, İnternet haberciliği, mobil gazetecilik gibi adlarla anılan yeni gazetecilik
uygulamaları ortaya çıkmıştır. Son on yılda, gelişmiş teknoloji ve açık İnternet haberin daha iyi
üretilebilip, dağıtılıp, okuyucuya ulaşmasında devrim yaratmıştır.
Bu dersin ve bu kitabın yeni medya alanının önemli aktöreleri haline gelen ve artık
mesleğini yapabilmek için yeni teknolojileri kullanabilmek, becerilerini arttırmak zorunda olan
gazetecilerin eğitimine katkı sağlayacağına inanıyorum.
1
1. VERİ GAZETECİLİĞİNİN TARİHİ VE KAYNAKLARI
2
Bu Bölümde Neler Öğreneceğiz?
İlk bölümde, veri gazeteciliğinin tanımı ve kavramsal çerçevesine ilişkin temel bilgileri
edinerek, açık verilerin kullanıldığı ve haberciliğin temelini oluşturan hikâyenin kurulmasında
başlangıç noktasını oluşturan bu yeni gazetecilik uygulamalarını irdeleyeceğiz. Haber dağıtım
ortamından haber tüketim alışkanlarına uzanan bir süreçte haber kuruluşları ile gazetecileri yeni
bir alana doğru yönelten, gazeteciliğin değişimine ve beraberinde gündeme gelen tartışmalara
etkisiyle “veri gazeteciliği”ni gözden geçireceğiz.
3
Bölüm Hakkında İlgi Oluşturan Sorular
1) Veri gazeteciliği uygulamalarının kökeni nereye dayanmaktadır?
2) Veri gazeteciliği kavramı ilk kez ne zaman kullanılmaya başlanmıştır?
3) Geleneksel habercilikten modernleşme sürecine geçişte neler etkili olmuştur?
4) Veri gazeteciliğinin ilk örnek çalışmaları nelerdir?
4
Anahtar Kavramlar
veri, veri gazeteciliği, internet, spreadsheet, information, data journalism, wikileaks
5
Giriş
20. yüzyılda hız kazanan bilim ve teknik alanındaki çalışmalar, bölgesel ve küresel
savaşlar gibi pek çok olayın etkisiyle bilgisayar ve iletişim teknolojilerine oldukça önem
verilmiştir. Teknolojik gelişim hemen hemen her alanda ciddi değişikliklere yol açarken,
bilgisayarların giderek ucuzlaması ve iletişim ağlarının daha fazla yaygınlık kazanması
dijitalleşme süreçlerinin başlamasına ve verinin daha hızlı bir şekilde dönüşüme uğrayıp
aktarılmasına yol açmıştır.
Verinin hızlı aktarımı ve dönüşümü bilişim araçları ve internet olgusu ile birleştiğinde
devasa bir veri akışı ortaya çıkmış ve günümüzde veri, başta bilgi ve iş süreçleri ile iletişim
ağlarında sıkça başvurulan bir meta haline gelmiştir.
Gittikçe daha fazla yaygınlık kazanan verinin çeşitli süreçlerden geçerek bilgiye
dönüşmesi, bilgiye olan ihtiyacı artırmış ve zaman içinde oluşan bilgi bolluğu da bilgi
toplumunun oluşmasının önünü açmıştır. Bilgi toplumu ile birlikte iletişim ve haber alma
süreçleri de değişikliğe uğramıştır. Değişen ve dönüşüme uğrayan haber alma, verme ve yayma
süreçleri sonucunda gazete ve gazeteciler de bu dönüşüme ayak uydurmak için geleneksel haber
elde etme ve yayma süreçlerinde değişikliğe gitmek zorunda kalmışlardır.
Geleneksel anlamda gazeteciliğin metaları olan basılı gazetelerden elde edilen haber,
bildiğimiz mecraların dışarısına çıkmış, habere erişim ve haber yaratım aracı olarak kullanılan
bilgisayarlar, yerlerini mobil cihazlara bırakmıştır. İnternetin sağladığı kişiselleştirme,
yöndeşme ve etkileşim kavramları ile haberin okunması ve yorumlanması süreçleri de insanlar
tarafından farklı algılanmıştır. Bu farklı algılanma ve internetin sağladığı avantajlar, okurların
haber alma davranışlarından, gazetecilerin haber verme ve medya kurumlarının da haberleri
sunma teknikleri kadar bütün çalışma şekillerinin farklılaşmasına yol açmıştır.
İnternetin iletişim üzerindeki etkileri konusunda çalışmalarıyla öne çıkan Manuel
Castells şu yorumda bulunmuştur:
İnternet, sahip olduğu çeşitli teknik özellikler sayesinde gazete, radyo ve televizyon gibi artık
geleneksel olarak tanımlanan iletişim araçlarından radikal bir şekilde farklılaşmaktadır. İnternetle
birlikte tarihte ilk defa, çeşitli iletişim biçimleri etkileşimli bir ağ içinde bütünleşmekte; insan
iletişiminin yazılı, sözlü, görsel-işitsel biçimlerini birleştiren bir hipermetin ve meta-dil oluşmaktadır.
Metnin, görüntünün ve sesin, seçilmiş bir zaman diliminde, açık, erişimin mâli bakımdan sorun olmadığı
küresel bir ağ içinde çok farklı noktalardan etkileşim içinde olarak aynı sistem içinde bütünleşme
potansiyeli, iletişimin karakterini de radikal olarak değiştirmektedir.1
Yirminci yüzyılın sonunda öne çıkarak toplumsal yaşamı en çok etkileyen kavramlar
arasında internet özel ilgi konusu olmuş ve beraberinde iletişim teknolojilerindeki gelişmelerin
baş döndürücü hızı sayesinde medya her zamankinden farklı ve güçlü yeni bir alan kazanmıştır.
1 Manuel Castells, Ağ toplumunun Yükselişi, İstanbul: Bilgi Üniversitesi Yayınları, s. 440
6
Bütün bunların sonucunda gazetecilik mesleğini yerine getiren insanların büyük bir
bölümü geleneksel haber elde etme yöntemlerini değiştirerek yeni yüz yıla damgasını vuran
internet mecrasına yönelmişlerdir. Günümüzde gazeteciler internet üzerinde yer alan sınırsız
veri ve veri tabanları üzerinden haber çıkarmaya çalışmakta eski arşivlere ulaşarak ya da diğer
çevrimiçi bilgi ve belgeleri elde ederek bu veriler arasından çıkarım yapma ve bunları
okuyuculara haber olarak aktarmaya çaba göstermektedir.
İnternet üzerinde yer alan sınırsız içerik, gazetecilere, geleneksel olarak yapacakları
haberler için yol gösterici ve kaynak olarak alabilecekleri bir alan olarak görünmektedir.
İnternet aracılığıyla alternatif kaynaklara sahip olan gazeteciler ellerinde olmayan bilgileri
diğer ajans ya da kurumların kaynaklarından elde ederek hızlı bir şekilde karşılaştırma yapma
avantajlarına sahiptir. Bu durum onları belirli kurum ya da görevlilerin bilgileriyle sınırlı
kalmaktan kurtarmıştır. İnternetin sayısız avantajı, sayısallaşma ile verinin iletişim süreçlerinde
kullanımı veri gazeteciliği kavramını doğurmuştur.
1.1. Veri Gazeteciliği Kavramının Ortaya Çıkışı ve Gelişimi
Veri Gazeteciliği El Kitabı’nın (Data Journalism Handbook) açıklama bölümünde
kitabın editörlerinden Liliana Bounegru’nun da belirttiği gibi veriyi haberin kaynağı olarak
görme fikri çok eskilere dayanıyor; gazeteciler haberi zenginleştirmek ve tartışmaya açmak
adına veriyi yüzyıllardır kullanıyor.2
Guardian Datablog’un veri gazeteciliği el kitabında Simon Rogers ilk veri gazeteciliği
örneğinden bahsederken veri gazeteciliğinin kökeninin 18.yüzyıla dayandığını anlatarak o
dönemde öğrencilerin kayıt yaptırma maliyetinin yer aldığı veri güdümlü bir haberden
bahsetmektedir. Bu örnekle aslında veri ve gazetecilik ilişkisinin çok eskilere dayandığını
anlatmaktadır. 3 Türkiye’de Cumhuriyet Gazetesi’nin 1930’lu yıllara dair sayfaları
incelendiğinde de veriye dayalı haberler ve elle hazırlanmış grafikler görülebilmektedir.
Kökü çok eskiye dayansa da veri gazeteciliğinin (data journalism) yapılanması 21.
yüzyıla ait bir tanım olarak karşımıza çıkmakta ve terminolojisi de böyle şekil almaktadır.
Nitekim Simon Rogers veri gazeteciliği terimini ilk olarak Washington Post’un genç yazılımcısı
ve EveryBlock’un kurucusu Adrian Holovaty4’den duyduğunu belirtmiştir. Bugün Avrupalı
gazeteciler, kökeni çok daha eskilere dayanan bu kavramı anlatırken de Holovaty’in ismini
kullanırlar. Holovaty, 2006 yılında yaptığı bir açıklamada gazetelerin web sitelerinin
değişikliğe ihtiyacı olduğundan bahsederek verinin medya kurumları tarafından nasıl
görüldüğüne ve veriye nasıl davranıldığına dikkat çeken açıklamalarda bulunmuştur.
Bu önemli açıklama Bill Adair ve Matt Waite’e “Doğruluk Payı” web sitelerinin
kurulması için ilham vermiş ve bu şekilde kurulan ilk web sitesi PolitiFact5, 2009 yılında
2 Liliana Bounegru, Lucy Chambers, Jonathan Gray, Data Journalism Handbook,
http://www.datajournalismhandbook.org/1.0/en/introduction.html 3 Guardian Blog Data Journalism, www.theguardian.com/data 4 Adrian Holovaty, “Database Journalism or Structured Journalism”,
https://en.wikipedia.org/wiki/Database_journalism 5 PolitiFact, www.politifact.com
7
Pulitzer Ödülü almıştır. Şimdilerde pek çok ülkede rastlanan, siyasetçilerin konuşmalarını ve
iddialarını günlük olarak analiz edip seçim vaatlerinin gerçekleşme oranlarını takip eden
Doğruluk Payı web sitelerinin Türkiye versiyonu “http://www.dogrulukpayi.com” da ilk kez
2014 yılında yayına başlamıştır.6
Küresel ölçekte veri gazeteciliğinin kullanımına ivme katan aşama ise World Wide
Web’in kurucusu Tim Berners-Lee7’nin 2010 yılında, veri analizi için “gazeteciliğin geleceği”
tanımında bulunmasının ardından başlatılan tartışmalar sonucunda devletlerin verilerini daha
fazla açması fikrinin ortaya çıkışı olmuştur. Günümüzde sık duyduğumuz açık veri ve açık
hükümet kavramları da ilk kez bu tartışmalarda kullanılmaya başlanmış ve Açık Hükümet
Ortaklığı (Open Government Partnership) oluşumu da bu sayede 2011 yılında kurulmuştur.
Türkiye’nin de 2012’de imza atan ülkeler arasında yer aldığı bu oluşum, ilerleyen
bölümlerde anlatılacağı üzere veri gazeteciliği ile ilişkili bir süreci de kapsamaktadır.8 Bu resmî
gelişmelerden henüz bir yıl öncesinde ise Guardian veri gazeteciliği olarak bugün şekillenen
ilk çalışmaların yapıldığı Datablog’u kurmuştur. Devletin ve siyasilerin, yapılan harcamaları
düzenli olarak yayımladığı pdf formatındaki verileri, analiz edilir bir hale getirerek
görselleştirmesi ile başlayan Guardian’ın bu girişimi, yerel kamuoyunda kısa sürede gündem
yaratmış ve bu harcamalar günümüzde de güncellenerek daha görünür olmayı sürdürürmüştür.
2014 Aralık ayında düzenlenen Uluslararası Açık Veri Endeksi’nde (Global Open Data Index)
Britanya; temel verilerde yüzde 97 ile en açık ülke konumunda iken Türkiye ise bu endekste
yüzde 53 olarak görülmektedir.9 2013 yılından itibaren İnternet’te online olarak yayınlanan bu
endeks her yıl güncellenmektedir.
2010 Temmuz ayında Guardian, Wikileaks tarafından sızdırılan binlerce Afganistan
savaş kayıtlarını bugün artık veri gazeteciliği araçları olarak kabul ettiğimiz araçları kullanarak
yayımlamaya başlamıştır. Bunu takip eden yılın ardından özellikle medya dünyasında (Batı ve
Amerikan medyası) veri gazeteciliği kavramı hızla yayılmaya başlamıştır.10
Aşağıdaki grafikte de görüleceği gibi “Data Journalism” tanımı 2009 yılının sonlarına
doğru İnternet’te araştırılan kavramlar arasına girmiştir. Bu verilere göre 2009’dan önce böyle
bir kavram bulunmuyor. (19 Şubat 2018 Google Trends, 13:22)
6 Radikal,“Doğruluk Payı'nda siyaset mercek altında”, http://www.radikal.com.tr/politika/dogruluk-
payinda-siyaset-mercek-altinda-1516280/ 7 “Analysing data is the future for journalists, says Tim Berners-Lee”,
https://www.theguardian.com/media/2010/nov/22/data-analysis-tim-berners-lee 8 Open Government Partnership, www.opengovpartnership.org 9 Global Open Data Indeks, http://global.census.okfn.org https://en.wikipedia.org/wiki/WikiLeaks 10 Guardian Datablog, https://www.theguardian.com/news/datablog/2010/jul/27/wikileaks-afghanistan-
data-datajournalism
8
Grafik 1: Google Trends verilerine göre Data Journalism kavramı 2009 yılının son aylarından itibaren
araştırılan popüler konular arasında. 2009’dan öncesine dair ise hiçbir veri yok.11
Veri gazeteciliği kavramının kullanımı Araştırmacı Gazetecilik Ağı tarafından da kabul
görmüş ve 2014 yılında Ulusal Bilgisayar Destekli Habercilik Enstitüsü (NICAR)’ın 20’den
fazla ülkeden binlerce gazetecinin katıldığı NICAR Baltimore toplantılarındaki katılımcıların
pek çoğu kendilerini tanımlarken veri gazetecisi tanımını kullanmıştır.12
Mesleki terminolojide kendine yer edinen ve giderek yaygın olarak kullanılmaya
başlandığı bir süreçte, 2014 yılında, istatistikçi ve yazar Nate Silver’ın günlük veri gazeteciliği
yapacağını belirterek FiveThirtyEight.com’u kurması; bunu Vox Media’nın takip etmesi
medyada büyük yankı yaratmıştır. Ardından New York Times; UpShot’ı, Washington Post veri
bölümü girişimlerini kurmuş ve böylece veri gazeteciliği alanında çalışmalar yapmaya başlayan
medya kurumlarının sayısı da artmıştır. Günümüze kadar giderek artan bu ilgiye zamanla
Asya’dan ve Afrika’dan çeşitli yayın organları da eklenmiştir.13 Bu alanda eğitim vermek için
hayata geçirilen ilk kurumlar arasında yer alan School of Data, Data Driven Journalism gibi,
dünyanın pek çok noktasında farklı dillerde kurulmaya başlanan benzer oluşumlar da
faaliyetlerine devam etmektedir.
Türkiye’de 2012 yılından bu yana hizmet veren www.verigazeteciligi.com da bunlardan
birisidir. Tüm bu gelişmelerin ışığında veri gazeteciliği araçları olarak artık, yer alan açık
kaynak veriyi filtrelemeye, temizlemeye, analiz etmeye, görselleştirmeye yarayan, kod bilgisi
gerektirmeyen araçlar da gelişmeye başlamıştır. Veri gazetecilerinin açık kaynak olarak
kullanımına sunulan ve her geçen gün yenilerinin eklendiği pek çok araca artık, ücretsiz olarak
ulaşmak mümkün. Çevrimiçi araçlar ve açık kaynak yazılımlar aracılığıyla; veriyi toplayabilen,
hızlı analiz eden, temizleyip etkileşimli (interaktif) haber olarak, mobil uygulamada, harita ve
grafik olarak kullanılabilen, sürekli gelişen bir dijital ortam sağlanmıştır. Bu iklimde veri
11 https://trends.google.com/trends/explore?date=2006-01-01%202018-02-19&q="Data%20Journalism" 12 www.ire.org/nicar www.nytimes.com/section/upshot www.washingtonpost.com/blogs/wonkblog 13 Dünya Genelinde Veri Gazeteciliği Siteleri,
www.verigazeteciligi.com/dunyagenelindeverigazeteciligisiteleri
9
gazetecilerinin böylesi bir çalışma disiplininin içine giriyor olması; temel istatistikten yola
çıkan web tabanlı elektronik tabloların (spreadsheet) kullanılarak karışık verilerin analiz
edilerek görselleştirildiği ve nihayetinde de programlamalı, hesaplamalı bir gazeteciliğin
yapılabilirliğini sağlamaktadır. Bu durum aynı zamanda gazetecilerin veri okuryazarlığı (Data
Literacy) alanında da gelişmelerine katkı sağlamaktadır.
International Data Corporation (IDC)’ın 2015 yılının başında yayımladığı raporda on
yıl içinde veri hacminin 40 kattan fazla büyüyeceğini duyurmaktadır. Tüm bu veri sirkülasyonu
ve bağlı ağlar yeni imkânlar doğururken beraberinde hem medyanın hem de veriye dayalı
gelişen her sektörün karşısına zorluklar da çıkarmaktadır.14 Haber akışının durdurulamadığı,
verinin de haberin bir kaynağı olarak giderek daha fazla önem kazanması, akan verinin
teknolojik alt yapıyla toplanıyor, kontrol edilebiliyor, doğrulanabiliyor olması; medya
kurumlarının veriyi habere en hızlı, en doğru şekilde dahil etmelerinin de yolunu açmaktadır.
Bu süreçte tabii ki hem hızlı olmanız, hem akan veride haberiniz ile ilgili olanı bulmanız, işinize
yarayanı ayıklayıp, düzenleyip, analiz edip, haberinizin kalitesinin artmasını sağlamanız
isteniyor.15 Ancak bu alanda çalışan gazetecilerin algoritmayı kullanması ya da bilgisayar
destekli çalışmasından öte, aslında veriyi nasıl, nerede, neden ve kim için kullandığı daha fazla
önem kazanmaktadır.
Grafik 2: Aşağıdaki grafik, Amerikalı gazetecilerin yüzde 28.1'nin veri gazeteciliği eğitimi almak istediğini,
yüzde 26,9'unun ise belge ve kayıtların kullanımına yönelik eğitilmek istediğini gösteriyor. 2013
tarihli bu araştırmanın şimdilerde daha da yükselmiş olacağını belirtebiliriz.16
14 https://dagmedya.net/2015/06/05/idc-verilerine-gore-on-yil-icinde-veri-hacmi-40-kattan-fazla-buyuyecek/ 15 idcverilerinegoreonyilicindeverihacmi40kattanfazlabuyuyecek/
3 Alexander Benjamin Howard, The Art and Science of Data Driven Journalism, http://towcenter.org/wp-
content/uploads/2014/05/Tow-Center-Data-Driven-Journalism.pdf 16 “Interview| Using data to transform journalism”, http://www.verigazeteciligi.com/interview-using-
data-to-transform-journalism/
10
Türkiye için yavaş gelişse de, veri gazetecileri (data journalist) dünyada pek çok haber
merkezinin son dönemlerde en fazla istihdam etmeye çalıştığı meslek grupları arasında. Veri
gazeteciliğine, ‘gazeteciliğin geleceği’ denildiğinde bu aslında ‘gazetecilerin de geleceği’
anlamına gelmektedir.
Veri gazeteciliği / açık veri gazeteciliği / araştırmacı veri gazeteciliği modelleri ile
tanımı sürekli zenginleşen bir alan. Gazeteciler bu alanı veri ile gazetecilik yapmak olarak
tanımlamaktalar. Günümüzde veri tabanlı gazetecilik; bilgisayar tabanlı habercilik ile evrilen
binlerce veri setinin, Wikileaks verilerinde olduğu gibi medyaya sızdırıldığı (bugün buna
Swissleaks, Luxleaks, Afrikaleaks gibi yenilerinin eklendiği), bu büyük sızıntı veriler ile gitgide
daha fazla büyüyen, daha fazla ihtiyaç ve uygulama alanı bulan bir alana uzanmaktadır. Veri
gazeteciliği, veri güdümlü gazetecilik, veriye dayalı gazetecilik olarak anılabilen bu çalışmalar
özellikle Amerikan ve Avrupa medyasında önemli bir yere oturmaktadır.17
Medya artık her şeyden biraz anlayan, veriyi olumlu anlamda maniple edebilen, analiz
edebilen ve yorumlayabilen muhabirleri haber merkezinin bir parçası yapıyor. Propublica’nın
tecrübeli yönetici editörü Scott Klein,“Haber merkezlerinde muhabirler artık veriyi anlamaya
başlamalı, eğer veriyi analiz edemiyor ve yorumlayamıyorsanız sizden daha hızlı olanlar çıkar.”
diyerek bu alanda kendiniz gelişmezseniz işinizi kaptırabileceğinize dair uyarıda bulunuyor.18
Klein açıklamasının devamında ise, “Bir spor muhabirinin temel yüzdelikleri
bilmediğini ya da kendi başına bir hesaplama yapamadığını düşünebiliyor musunuz?” sorusuyla
bu duruma dikkat çekiyor.
Propublica’dan bir başka isim haber uygulamaları ekibinden gazeteci Sisi Wei ise
Kolombiya Gazetecilik Okulu’ndan Alexander Howard’a verdiği röportajda, “Veri ile çalışma
becerileri sizi daha iyi bir gazeteci.” yapar demektedir. 19 Avrupalı veri gazetecileri
Journalism++ ekibi tarafından kurulan dünyanın pek çok bölgesinden veri gazetecilerinin
kendilerini ekledikleri Küresel Veri Gazetecileri Rehberi (Global Data Journalist Directory)
incelendiğinde ise 40 ülkeden 661 kişinin yer aldığı açık rehberde veri gazetecilerinin
profillerinde veri ile ilgili en az üç disiplini yapabildikleri görülüyor. Mesleki tanımlar arasında
veri muhabiri, veri gazetecisi, veritabanı gazetecisi, veri görselleştirme editörü, veri analisti,
açık veri gazetecisi, araştırmacı veri gazetecisi yer alıyor.20
1.2. Değişen Gazetecilik Anlayışı ve Veri Gazeteciliği
Tarih boyunca gazetecilik, teknolojinin çeşitli etkileriyle birçok kez yeniden
şekillenmek zorunda kalmıştır. Gazetecilik anlayışı ve gazetecilik uygulamaları sürekli yeni
17 https://tr.wikipedia.org/wiki/WikiLeaks
https://en.wikipedia.org/wiki/Swiss_Leaks
https://en.wikipedia.org/wiki/Luxembourg_Leaks
https://www.facebook.com/pages/AfrikaLeaksOrganisation/119409644822940 18 Alexander Benjamin Howard, The Art and Science of Data Driven Journalism,
http://towcenter.org/wp-content/uploads/2014/05/Tow-Center-Data-Driven-Journalism.pdf s.8 19 “Data skills make you a better journalist, says ProPublica’s Sisi Wei”
https://towcenter.org/data-skills-make-you-a-better-journalist-says-propublicas-sisi-wei/ 20 Global Data Journalist Directory, http://jplusplus.github.io/globaldirectory/
11
çalışma alanlarıyla etkileşim halindedir. Öyle ki, 20. yüzyılın sonlarında bilgisayar destekli
habercilik, grafik tasarım ile birleşen gazetecilik, dijital fotoğraf gazeteciliği gibi
örneklendirebileceğimiz pek çok yeni çalışma alanları ortaya çıkmıştı.21 Gazeteciliğin yapılış
tarzını değiştiren bu köklü gelişmelerle klasik habercilik anlayışı, 21.yüzyılda da internetin ve
bilgisayar teknolojilerinin sağladığı olanaklar sayesinde yeni bir habercilik formatı olan veri
gazeteciliği ile zenginleşmeye devam etmektedir. 2006 yılından beri kamuoyu gündemine
gelmesine rağmen akademik olarak detaylı şekilde araştırılmadığından, habercilik anlayışına
yeni bir boyut kazandıran “veri gazeteciliği” kavramının tam olarak tanımlanması yakın bir
zamanda yapılmıştır. 2012 yılı içerisinde “Veri Gazeteciliği El Kitabı” isimli kitap yayınlanmış
ve veri gazeteciliğinin ilk kez işlem aşamaları ayrıntılı olarak bu kitapta tasvir edilmiştir.22
İlk yazılan veri gazeteciliği el kitabında da anlam arayışına gidilirken "veri" ve
"gazetecilik" terimlerinin her birini kendi başına tanımlamak kolay olmamıştır. Muhtemelen
"veri"nin sadece bilgisayar ortamındaki tablolarda yer alan sayılardan oluştuğu düşünülecektir.
20 yıl öncesi için belki bu gerçekten de söylenebilirdi; yani gazeteciler için veri ile çalışmanın
tek yöntemi bu olabilirdi o zamanlar. Ama sayısallaşan bir dönemdeyiz ve bu zamanda her şey
sayılarla tarif edilebilir.
Günümüzde çeşitli araştırmacılar ve yazarlar da veri gazeteciliğinin değişik tanımlarını
ortaya koymuşlardır. Bu tanımlamalara geçmeden önce veri kavramının açıklanması önem arz
etmektedir. Veri, tek başına anlam ifade etmeyen ham sembollerdir. Türk Dil Kurumu’nun
sözlüğünde veri şu şekilde tanımlanmaktadır:
Veri: İngilizce; “data”/Osmanlıca; “malumat”/Fransızca “donnée”
1-Bir araştırmanın, bir tartışmanın, bir muhakemenin temeli olan ana öğe, muta, done: İstatistik
veriler.
2-Bir sanat eserine veya bir edebî esere temel olan ana ilkeler: Bir romanın verileri.
3-Bilgi, data.
4-Matematik: Bir problemde bilinen, belirtilmiş anlatımlardan bilinmeyeni bulmaya yarayan şey.
5-Bilişim: Olgu, kavram veya komutların, iletişim, yorum ve işlem için elverişli biçimli
gösterimi.
6-Sonuç çıkarmak, çıkarsama yapmak, ya da bir incelemeyi sürdürmek için gerekli olaylara,
ilişkilere ve sayısal ham bilgilere verilen ad.
7-Bir araştırmada sorunun çözümünü sağlamak amacıyla derlenen bilgiler.23
Verinin tek başına bir anlam ifade etmemesi, verinin ele alınıp işlenmesini,
enformasyona dönüştürülmesini ve son olarak da araştırma, öğrenme ve gözlem sonucu bilginin
ortaya çıkarılması süreçlerini gerektirmektedir. Tüm bu süreçlerin habercilik anlayışı
çerçevesinden işlenmesi bizleri veri gazeteciliği kavramına götürmektedir. Bu bağlamda en
temel tanımıyla veri gazeteciliği; birbirinden bağımsız ya da birbiri ile bağlantılı olan genellikle
21 Matthew Powers,“In forms that are familiar and yet-to-be invented”: American journalism and the
discourse of technologically specific work, January 2012, http://jci.sagepub.com/content/36/1/24.full.pdf 22 Liliana Bounegru, Lucy Chambers, Jonathan Gray, The Data Journalism Handbook (How Journalists
Can Use Data to Improve The News), Sebastopol, CA: O’Reilly Media, 2012. 23 TDK, 2015, http://tdk.gov.tr/index.php?option=com_gts&arama=gts&guid=
TDK.GTS.56600109dae8b2.72351502
12
büyük çapta veri setlerinin incelenmesi, bu setlerde yer alan bağlantılar arasındaki ince
noktaları analiz etme ve okuma, tüm bu işlemlerin sonucu bu verilerden hikâye çıkarma işidir.
Bradshaw (2012) veri gazeteciliğine daha farklı bir bakış açısı ile yaklaşmaktadır. Ona
göre, “Veri gazeteciliği, geleneksel haberin yeni olanaklara sahip olması ve ayrıca çok büyük
ölçekli kitlelere dijital bilgi ile oluşturulmuş hikâyeyi yayma fırsatıdır.” Ayrıca programlama
veri gazeteciliğinin çekirdeğini oluşturmaktadır. Bilginin toplanması ve birleştirilmesi
süreçleri, binlerce doküman arasındaki bağlantıların sağlanması, grafiklerden interaktif
hikâyelerin oluşturulması, hükümetin gündeminde yer tutan verilerin işlenmesi ve bunlar
arasındaki bireysel bağlantıları kullanıp hikâye yaratma işi de bu çekirdeğin süreçleridir.24
Kuzey Carolina Üniversitesi eski öğretim üyesi Philip Meyer, veri gazeteciliğinin
kullanımına yönelik şu tanımlamayı yapar: “Veri gazeteciliği, veri ile ne yapacağını bilen
kişilerin yönettiği yeni hassas gazeteciliğin özüdür.”25 Veri gazeteciliği üzerine çalışmalarını
sürdüren Simon Rogers (2013) ise veri gazeteciliği eğilimine göndermede bulunur:
“Veri gazeteciliği” veya “bilgisayar destekli raporlama” Bunlar nedir? Bunları nasıl tanımlarsın?
Bunlar gerçek gazetecilik midir? Bana göre bunlar son dönemin elektronik habercilik eğilimleridir. Son
iki yıl içerisinde haberlerin raporlanmasında kullanılan elektronik tablolar, grafikler, veri analizlerini
içeren kullanımlar bu tanımlara yöneliktir.26
Tüm bu tanımlamaların ışığında veri gazeteciliği, geliştirilen veri işleme teknikleri,
verinin daha etkili kullanılması ve veriden hikâye çıkarılması üzerine dayanmaktadır. Yakın
gelecekte haber işleyen gazetecilik organizasyonları bu teknikler sayesinde büyük fırsatlar
yakalayacaklardır. Zira “www” (World Wide Web) mucidi Tim Berners-Lee de yakın bir
gelecekte veriyi yönetme işi olan veri gazeteciliğinin büyük önem kazanacağını ifade
etmektedir.27
Veri gazeteciliği bir bilgi ayıklama sürecinin haber sonucuna dönüştürülmesindeki
teknikleri ifade etmektedir. Dikkat gerektiren bu süreçler aynı zamanda programlı çalışmanın
ne kadar önemli olduğunu tekrar gündeme getirmiştir. Gazetecilikte programın önemini
vurgulayan Robert Niles ise veri gazeteciliğinde bilginin kullanımının üç yönüne vurgu
yapmaktadır:28
1. Bilginin Toplanması (Gathering information): Dokümanların incelenmesi, kaynaklarla
konuşulması, görselleştirmelerden yararlanması vb. gibi basit raporlama tekniklerinin kullanımı.”
24 Liliana Bounegru, Lucy Chambers, Jonathan Gray, The Data Journalism Handbook (How Journalists
Can Use Data to Improve The News), Sebastopol, CA: O’Reilly Media, 2012. 25 Cindy Royal & Dale Blasingame “Data journalism: An explication”, Isoj International Symposium on
Online Journalism, 15 April,2015, https://isojjournal.wordpress.com/2015/04/15/data-journalism-an-explication/ 26 Simon Roger, Facts Are Sacred: The Power of Data, London: Faber and Faber, 2013 27 European Journalism Centre, Data Driven Journalism, Retrieved September 27, 2012,
http://datadrivenjournalism.net/about/faq. 28 Robert Niles, ‘The Programmer as Journalist: a Q&A with Adrian Holovaty’, Online Journalism
Review, 2006.
13
2. Bilginin Damıtılması (Distilling information): Editöryel aşama olan bilginin damıtılması,
bilginin hangi aşamasının önemli ve birbiriyle bağlantılı olduğuna karar verilmesi süreçlerini içermektedir.”
3. Bilginin Sunulması (Presenting information): Bilginin haber formatına getirilip yayınlanması.
Gazeteciliğin bilişim teknolojileri ile dönüşümünün günümüz habercilik anlayışındaki
yansıması olan veri gazeteciliği, okur kitlenin haber okuma deneyimindeki yeni boyutunu
temsil etmektedir. Yukarıda bahsi geçen bilgi kullanımının bu üç önemli yönü, veri
gazeteciliğini bir roman konsepti olmaktan kurtarıp medya organizasyonlarının kullandığı
bilginin, habercilik yapısına uygun hale gelmesine yardımcı olmaktadır. Verinin habere
dönüşüm sürecini betimleyen bu üç aşama veri gazeteciliğinin temelleridir.
Veri gazetecilerinin önemle üzerinde durdukları bazı bileşenler vardır. Bunlar;
analizlerde kullanılan metodoloji, veri gazetecilerinin kullandıkları ve araştırdıkları ham
verinin arka planının ne olduğu yani verinin doğruluğu, yayınlanan içeriğin sonuç analizinin
gerçekliği ve tabii ki teknik. Veri gazeteciliğinin özü sayılarla haber anlatmak/sayılardan haber
bulmak ve veriye kaynak olarak yaklaşmaktır.
Missouri Gazetecilik Okulu’ndan Profesör David Herzog veri gazetecisinin yaptığı işi
tanımlarken, “Bir veri gazetecisi günlük şiddet verilerini web tabanlı elektronik tabloda
inceleyen bir polis muhabiri olabilir, şehir haberleri hazırlayan bilgisayar destekli çalışan bir
muhabir olabilir ya da televizyonda araştırma bölümünden sorumlu bir yapımcı, gazeteciler
için analiz aracı uygulaması geliştiren yazılımcı gazeteci olabilir” demektedir.
Temple Üniversitesi’nden Profesör Meredith Broussard ise, “Veri gazeteciliği
sayılardan haber çıkarabilme pratiği ve sayıları haber yazmak için kullanma. İyi bir veri
gazetecisi olmak, iyi bir gazeteci olmanın da yolunu açar. Veri güdümlü habercilik / veri
gazeteciliği okuyuculara, izleyicilere içeriğin daha fazla filtrelenip, analiz edilip, olgular ve
gerçekler üzerinden yalanlara yer verilmeden verinin kullanımını sağlamak anlamına geliyor.
Medya organlarının o hedefe ulaşması için ise farklı düşünüp hareket etmesi gerekiyor.” diyor.
14
2. BİLGİSAYAR DESTEKLİ HABERCİLİĞİN DÖNÜM NOKTASI:
İNTERNET VE WİKİLEAKS
15
Gazetecilik var olduğundan ve yapılıyor olduğundan beridir
gazeteciler haberi daha etkin ve daha güvenilir kılmak için
veriyle her zaman ilgilenmiştir. Bilginin her formu yüzyıllar
boyunca gazetecilik mesleğini icra edenlerin içinde olduğu
bir dünyayı kapsar. Haberin, aktarılan bilginin güvenirliğine
olan ihtiyacın orijin noktasını ise gazeteci Alexander
Benjamin Howard 2014’te yayımladığı The Art and Science
of Data Driven Journalism raporunda; beş asır öncesine
Avrupa Rönesansına dikkat çekerek aktarıyor. Antik
gazeteler özellikle Roma İmparatorluğu’nun günlük gazetesi
Acta Diurna ve tipao’lar (resmi kurum raporları) Antik Çin
Gazetesi olarak hükümetin askeri kampanyaları, politika,
yasama ve yürütme gibi haberlerini içeriyor.
Raporun devamında 5. yüzyılda İtalyan tüccarların elleriyle yazdıkları ve dağıttıkları
özellikle ekonomik durumu ve ticarette yaşanan değişimleri, maliyet verilerini ve ayrıca
bunun yanında savaş, hastalık ve hava durumunu içeren verilerin düzenli bülten
şeklinde hazırladığına yer veriliyor.
Bunu 17. yüzyılda basılı versiyon takip
ediyor. Kâğıdın maliyetinin düşmesi,
baskı aletlerinin artması gibi unsurlar
devreye giriyor ve tüm bu gelişmelerin
gelecek yüzyıllarda bilginin üretilme ve
yayılma sürecine etkisi yansıtılıyor.
Devamında İsveçli ekonomist ve mühendis William Playfair’in 1787’de istatistiki
grafik metotlarının bulması ve devam eden periyotlarda grafik, çubuk grafikler, pasta
grafikler ve daire grafikler kullanması da bu süreci şekillendiriyor.
Teknoloji geliştikçe 18. yüzyılın sonlarına doğru okuyucular bilgiyi farklı formlarda
talep etmeye başlamış ve veri, haberlerde daha etkili ve daha çekici şekilde yer almaya
başlamıştır. Bu durum sadece beyaz yakalıların değil, orta sınıfın da karar alma
süreçlerine katılımını beraberinde getirmiştir. Önceki sayfalarda yer verdiğimiz
örnekteki gibi, Guardian editörleri Guardian’ın veri gazeteciliği tarihini anlatırken 18.
yüzyılda öğrencilerin okul kayıt masraflarına yer verildiğine yönelik büyük sarı
sayfalardaki rakamlara dikkat çekiyorlar. Aynı yüzyılda olmasa da Türkiye’nin de
yüzyıl öncesi arşivleri incelendiğinde sağlıkla ilgili verilere, ekonomi verilerine ham
şekilde rastlamak mümkün.
16
19. yüzyılın sonuna gelindiğinde ise istatistik, gazetelerde grafik, çizim, çizelge, ham
veri, harita vb. şekilde kullanılmaya başlanıyor ve artık gazetelerin bir parçası oluyor.
Devamında borsa verileri elektronik hale gelirken ekonomi sayfalarında, finans
bölümlerinde, emlak haberlerinde de yer alıyor. Down Jones gibi şirketler 1884 yılının
ortalarında borsa verilerini yayımlıyor ve günümüzde de bu veriler hem kağıt olarak
hem de çevrimiçi olarak Wall Street Journal üzerinden yayınlanmaya devam etmektedir.
20. yüzyılın ortalarına gelindiğinde ise araştırmacı gazetecilik yapan profesyonel
muhabirlerin devletlerin istatistiklerinin, mahkeme sonuçlarına yönelik raporların,
sızdırılmış devlet dokümanlarının, harcamalarının haberlerinde detaylı araştırma
dosyalarında yer almaya başladığı görülüyor. Dijital platforma taşınmadan önce de
bürokrasinin her zaman veri ürettiği, gazeteciler için her zaman bir kaynak olarak var
olduğu görülüyor.
Veri gazeteciliği/haberciliği olarak bugünkü ismini almasa da
bu alana yakın ilk çalışmalar 1950’lerde Bilgisayar destekli
habercilik / Computer-assisted reporting
(CAR) kavramıyla ortaya çıkmıştır. 1920’den
beri yayın yapan CBC televizyon kanalı
1950’de seçimlerden önce seçim simülasyonu
sistemi hazırlayarak veri toplayıp halka seçim
öngörüsünde bulunmuştur.
21. yüzyılın başlarına gelindiğinde ise mobil
bilgisayarlar, çevrimiçi bağlantılar, erişim, hız
ve verinin artması bilgisayar tabanlı
haberciliğin değişmesine neden olmuştur.
2012 yılından bugüne düzenlenen
yarışmalarda veri gazeteciliği ödülü alan ve
finale kalan projelerde etkileşimli seçim özel
projelerinin ağırlıklı olması da bu durumu
kanıtlar nitelikte.
Veri tabanına dayalı gazetecilik, 30 yıl öncesinde, mikrobilgisayarların
1980’li yıllarda haber merkezlerinde yaygınlaşmasıyla gelişmeye başlamıştır.
Bilgisayarları haber merkezlerinde kullanabilmek ve kolayca temin edebilmek
araştırmaların boyutlarını ve veriyle çalışma şeklini de değiştirmiştir. İnternet ile
başlayıp cep telefonları, tabletler, dizüstü bilgisayarlar ve bugün akıllı telefonlar
dediğimiz araçlarla devam eden bu değişim sürecinde bireyler, iletim ya da verinin
hem üreteni hem de yayanı haline geldi. Okuyucuların da içeriğe katılabilme
potansiyelinin bulunduğu, içeriğin yönlenebilme ve erişime geçmenin hızlı olarak
gerçekleşmesi, haber merkezleri için sonsuz bir değişimin her anlamda kapısını açtı.
Bilgi Edinme Hakkı (BEH)’ndan yararlanma ve açık devlet bilinci Türkiye’de yavaş
ilerlese de gelişmiş ülkelerde, bu iklimden etkilenerek altyapısının geliştirilmesi ve
devlet verilerine yapılandırılmış/ yapılandırılmamış formatlarda verilere ulaşmayı
kolaylaştırdı. Türkiye özelinde ise devlet kurumlarında verilerin iyi/kötü depolandığı
17
bir gerçek, ancak teknolojik altyapı, verilerin pdf gibi yapılandırılmamış formatlarda
yayımlanıyor olması verinin makine okunabilirliği açısından sorun yaratıyor.
2000’li yıllara gelindiğinde ise artık dünya veri gazeteciliğini/haberciliğini Wikileaks
(https://wikileaks.org) üzerinden tanıdı denebilir. Önceki sayfalarda da yer aldığı gibi
Wikileaks ile başlayan sızıntı veriler ve bu devasa verinin ne anlattığını birilerinin
analiz edip aktarması gerekiyordu. Wikileaks Olayı, 26 Temmuz 2010'da Amerikan
ordusunun 2004–2009 yılları arasında Afganistan Savaşı’nda tutmuş olduğu binlerce
belgeyi The Guardian, The New York Times ve Der Spiegel gazeteleriyle birlikte
açıklamasıydı. Belgeler bireysel olaylarla birlikte, savaşta ölen sivillerin bilgilerini de
içeriyordu. Sadece Irak savaşıyla ilgili 391 bin kayıt da aktarılmıştı. Haberciler bu
verilerden bir sonuç çıkarabilmek için haftalarca çalışmış, bilgisayar tabanlı her türlü
aracın desteğine ihtiyaç duymuştu. Sızdırılan binlerce belge vardı üstelik bunların
çoğu metindi, rapordu, adresti, ham belgelerdi. İşte o dönemde bu üç kuruluştan
gazeteciler bir araya gelerek bu kadar çok metni hem ölçülebilir bir veriye
dönüştürme, hem ayrıştırma hem analiz etme hem de doğruluğunu tespit etmek için
çalışmış, yeni bir gazetecilik alanı hiç olmadığı kadar görünür hale gelmişti. Çünkü
teknoloji, yeni medya dili, haberin tüketim şekli artık değişiyordu.
18
Nitekim sızan raporların Türkiye bölümü de Taraf gazetesine verilmişti fakat dosyalar
veri gazeteciliği açısından bakıldığında çok etkin şekilde kamuya aktarılamamıştı. Veri
gazeteciliğinin kökenleri çok eskilere dayansa da bu süreci bu çağda tekrar şekillendiren
Wikileaks dosyalarının medyaya sızmasıdır.
Binlerce dosya ile başa çıkma, bunu bilgisayar desteğini alarak habere entegre etme ve
bilgiyi tüm karmaşasına rağmen ham halinden en iyi filtrelenmiş, analiz edilmiş hale
dönüştürme ihtiyacı haber odalarını programcılar, veri mühendisleri, hackerlar,
yazılımcılar, tasarımcılarla daha fazla çalışır hale getirmişti ve getirmeye de devam
ediyor. Wikileaks hâlâ veri aktarmayı sürdürürken leaks (sızıntı)’ten esinlenerek yeni
sızıntılar ortaya çıkmaya devam ediyor; Swissleaks, Luxleaks, Afrikaleaks gibi.
Wikileaks’den sızdırılan büyük ham verilerle haftalarca mücadele eden gazeteciler bir
rehbere ihtiyaç duyarak Türkçe’ye de kazandırılan ilk kitabı (Data Journalism
Handbook) yazmaya karar verdiler. 2011 yılında Londra’da 48 saatlik MozFest2011
atölyesi sonucunca doğan kitap; ücretsiz, açık kaynak olarak gazetecilerin veriyi
kullanarak hikâyelerini geliştirmeleri için alanında uzman editörler, gazeteciler ve veri
gazeteciliği pratiği olan isimler tarafından hazırlanmış, Avrupa Gazeteciler Merkezi
(European Journalism Centre - EJC) ve Open Knowledge Foundation desteğiyle The
Australian Broadcasting Corporation, The BBC, The Chicago Tribune, Deutsche
Welle, The Guardian, The Financial Times, Helsingin Sanomat, La Nación
(Argentina), The New York Times, ProPublica, The Washington Post, The Texas
Tribune, Verdens Gang, Wales Online ve Zeit Online ile birlikte pek çok farklı
yayının katkısıyla oluşturulmuştu. Kitap açık kaynak elektronik olarak 14 dile çevrildi
ve farklı dillere de çevrilmeye devam ediyor.
19
Son dönemlerde ise çok farklı isimler ve yayınlardan yeni kitaplar yazılmaya
başladı. Veri gazetecisi Claire Miller’in, Getting Start with Data Journalism kitabı ve
Paul Bradshaw’ın, Data Journalism Heist de bu yeni kitaplar arasında gösterilebilir.
Bugün The Guardian Datablog, The New York Times UpShot, i100.independent,
ZeitOnline Datablog, The Washinton Post Data Post ve daha pek çok haber merkezi
veri gazeteciliği yapıyor. Daha önce de belirttiğimiz gibi bu alanda çalışma başlatan
ilk kurum Guardian gazetesidir. İlerleyen dönemlerde tartışmalara neden olsa da şu
anda tam zamanlı veri gazeteciliği /veri güdümlü gazetecilik / veri haberciliği yapan
kurumların başında eski New York Times blogger’ı yazar ve istatistikçi Nate Silver’ın
kurduğu FiveThirtyEight olmakla birlikte, Vox ve Propublica da var. Türkiye’de ise
doğrudan veri gazeteciliği disipliniyle çalışma yürüten büyük bir kurum yok ancak
haber analiz, interaktif haber bölümleri bulunan dijital yayınlar da veri gazeteciliği
örneklerine rastlanabiliyor artık. Aljazeera Türk’ün haber analiz, interaktif, kronoloji
bölümleri ve Solhaber’in interaktif.sol.org.tr sayfalarında veri güdümlü haberlere
ağırlıklı olarak yer verilirken, Dağ Medya’nın veri gazeteciliği bölümü de veri
gazeteciliği alanında dünyadaki son gelişmeleri Türkçe olarak duyurarak alana katkı
sağlıyorlar.
2.1. Veri Gazeteciliği Neden Önemli?
Veri gazeteciliği el kitabında (Data Journalism Handbook) Birmingham Şehir
Üniversitesi’nden, gazeteci ve akademisyen Paul Bradshaw veri gazeteciliği’ni basit
anlamıyla veri ile gazetecilik yapmak olarak tanımlıyor. Daha geniş anlamıyla da
oldukça büyük bir çalışma disiplini gerektiren, şeffaf gazetecilik, artırılmış gazetecilik
gibi pek çok tanımla birlikte dünya ölçeğinde dijitalleşen haber merkezlerinin veriyi
daha etkin kullanarak dönüştüren; aynı zamanda bilinç değişikliği yaratan bir
gazetecilik türü olarak açıklıyor. Ancak en önemlisi ise veri gazeteciliği ile artık çok
az şeyin saklanabildiği, devletlerin hesap verilebilirliğine ve yolsuzluklarla daha etkin
mücadele edilebildiğine özellikle dikkat çekiyor. Araştırmacı gazeteciliğin dijitalleşen
çağla uyumu, modern gazetecilik tanımının yapıldığı bu alan; bilgiyi/veriyi yeni
araçlar, yeni teknikler ile daha etkili bir süreçten geçirmek ve bu sürecin de veri
toplama, filtreleme, analiz etme, görselleştirme ve hikâyeleştirme aşamalarını
kapsayarak olgunlaşması anlamına geliyor. Bu daha fazla araştırma, istatistik,
programlama dili, yazılım, tasarım/dizayn demek.
Sayısal teknolojiler haber üretim anlayışını değiştiriyor. Medyanın dijital verilerin
aktığı bir havuza dönüşmesi hiç durmadan devam eden bir süreç,
bu sebepledir ki bu alanın tanımıyla birlikte etkileri de hâlâ tam olarak
anlaşılamamaktadır. Veri güdümlü gazetecilik, veri gazeteciliği, veriye dayalı
gazetecilik gibi tanımların çeşitliliği de bunun göstergesi. Peki, “araştırmacı
gazetecilik” temelli ise neden “veri gazeteciliği” deniyor? Ne değişti, fark nedir?” bu
soruların yanıtları ise değişen şartlar, sayısal teknolojiler ve İnternet üzerinden
şekilleniyor.
20
Kelime gazeteciliğinden, sıfırlar ve birler gazeteciliğine geçiş bu alanı farklı kılıyor.
Gazeteciliğin alet çantasına yeni araçlar, yeni meslek disiplinleri eklendi diyebiliriz.
Haber merkezleri artık, kod bilen, binlerce veri setini analiz edebilecek seviyede
elektronik tablo (excel) ya da farklı araçları etkin şekilde kullanabilen, yazılımdan,
programlamadan anlayan ayrıca temel istatistik bilgisi olan ve veri bilimciliğinden de
anlayan kişileri haberin bir parçası yapıyor. Çünkü, metinden daha güçlü hikaye/haber
anlatabilen teknikler gelişiyor. Üstelik veriler artık sadece “rakamlar” anlamına da
gelmiyor. Fotoğraf, video, ses kayıtları, metinler de artık programlama dilleriyle
ölçülebilir hale geliyor. Bu durum medya profesyonelleri için çoklu beceri anlamına
gelmekte. Sayısallaşmayla ortaya çıkan bu durum gazetecilerin beceri sayısının
arttığına işaret etmekte.
Etkileşimli haritalar (İnteraktif) yani iki yönlü veri sağlayan olanaklar, detaylı
grafikler, videolar, infografikler, tasarımlar, kodlama, üç boyutlu tasarımlar gibi
bilgiyi/haberi/hikâyeyi daha güçlü, daha dikkat çekici ve daha detaylı sunabilen bir
teknoloji var. Gazeteler ve dijital yayınlar tüm bu meslek gruplarından uzman kişileri
istihdam edemeseler de, haber merkezleri bilgi çağında gazetecilerin artık hiç olmadığı
kadar “her şeyden biraz bilme” dönemine girdiğini de gösteriyor.
Amerikan veri gazetecisi Eva Constantaras, çevrimiçi araçlara erişimin önceki yıllara
göre daha kolay ve her gün yenilerinin ekleniyor olmasının gazetecilerin çok fazla kod
bilgisine ihtiyaç duymadan, çok kolay görseller hazırlayarak, veriyi daha etkin
kullanabilme şansının artıyor olmasını önemli bir değişiklik olarak gördüğünü
belirtiyor.Devletlerin kamusal verileri herkesin kullanımına açması, açık veriye ve
veri tabanlarına erişimin kolaylaşması, doğruluğuna emin olunan verilerin haberde
kullanımının daha fazla şeffaflık sağlayarak gazeteciyle okuyucu arasında güveni
artırması da değişen şartlar
arasında yer alıyor.
Yandaki grafik School of Data’dan
Milena Marin’nin Nisan 2015’teki
sunumunda yer alan “Storytelling”
slaytından. Marin, gazeteciliğin
“5N1K” kuralına yeni bir yaklaşım
katıyor bu paylaşımıyla; “Bana
anlatma, göster” kavramını da
değişen şartlar arasında gösteriyor.
21
Bölüm Soruları
1) ABD merkezli kariyer planlama merkezi CareerCast'in çalışmasına göre, 2016'nın en
iyi mesleği "data bilimciliği"; en kötü meslek ise "gazete muhabirliği". Devletlerin
kamusal verileri herkesin kullanımına açması, açık veriye ve veri tabanlarına erişimin
kolaylaşması, doğruluğuna emin olunan verilerin haberde kullanımının daha fazla
şeffaflık sağlayarak gazeteciyle okuyucu arasında güveni artırması son yıllarda dünya
genelinde gazetecilere olan bakış açısını değiştirmede sizce etkili olabilir mi?
2) Çevre Haberciliği, Hak Odaklı Haberciliği, Yurttaş Gazeteciliği ve Barış Gazeteciliği
gibi alanların Veri Gazeteciliğiyle birleştiğinde daha başarılı yapılabileceğini
düşünüyor musunuz?
3) “Olay sadece haberi yapmakla bitmiyor. Olayı yazdığınız gibi çözümünü de yazmanız
gerekir” diye düşünen bir kişi gazeciliğin hangi yönüne dikkat çekmek istemiştir. Veri
Gazeteciliği bu tür habercilik anlayışının önünü açabilir mi?
22
3. GAZETECİLİKTE VERİNİN KULLANIMI
23
Diğer tüm sektörler ve kurumlar gibi gazetecilik pratikleri de veri bolluğu altındaki
internet ortamında anlamlı verileri depolama, değerlendirme ve onları analiz ederek
haberleştirme konusunda çeşitli yollar ve yöntemler denemektedir. Medya sektörü için
verinin doğru analizi her şeyden önce hedef kitlenin daha iyi anlaşılmasını, içeriğin
kişiselleştirilmesini ve veri gazeteciliği gibi yeni anlatı türlerinin dolaşıma girmesini
sağlamaktadır. Yakın zamanda büyük veri kavramının gazetecilik pratiklerinde
yarattığı temel dönüşümün veri gazeteciliği bağlamında sorgulaması önem
taşımaktadır.
Son on yılda, bilgisayar veri tabanları ve algoritmalar haber kuruluşlarına hızla girmiş
durumdadır. Her geçen gün daha fazla gazeteci, veritabanlarını ve algoritmaları
soruşturma yapmak için elverişli birer araç olarak görmekte ve kullanmaktadır.
3.1. Büyük Veri
Ana damar medyanın New York Times ve The Guardian gibi haber kuruluşlarının
yanı sıra, ProPublica gibi kâr amacı gütmeyen kurumlar ile daha az resmî olarak
nitelendirebileceğimiz araştırmacı gazeteci grupları veri işleme tekniklerine dayanan
çalışmalar üretmektedir. Bu girişimler, genellikle "büyük veri" olarak betimlenen
daha geniş bir fenomenden izole olarak değerlendirilmektedir. Bu popüler ifade
hükümet kayıtları, genetik diziler, internet kullanıcılarının bıraktığı izler gibi türlü
içeriklerden oluşan büyük miktardaki bilginin bilimsel araştırma, kamu politikaları
veya işletmeler gibi çeşitli platform ve alanlarda işlenmesi anlamına gelmektedir.
Büyük veri tartışmalarıyla birlikte gazetecilik alanında en çok yaygınlık kazanan ifade
yollarından biri veri görselleştirme olarak karşımıza çıkmaktadır. Veri görselleştirme
hacmi büyük veriyi anlamlı bir hale getirerek açığa çıkarmanın ve karmaşık
enformasyonu özetlemenin etkili bir yolu olarak, çağdaş gazeteciliğin önemli anlatı
türlerinden biri haline gelmektedir.
Büyük veri, yeni bir gazetecilik türü olarak veri gazeteciliğini ön plana çıkarırken,
haber odalarında da değişime neden olmaktadır. Örneğin, günümüzde Guardian
gazetesinin iki interaktif ekibi, BBC'nin çevrimiçi haber uzmanı ekibi ve Times'ın
görsel gazetecilik birimi bulunmaktadır. Yine Veri Gazeteciliği Ödülleri 2012 yılından
bu yana The Global Editors ağı tarafından düzenlenmekedir. Öte yandan, medya
sektörünün mevcut ödül kategorilerine dijital dünyada verinin işlenmesine dayalı yeni
kategorilerin de eklendiği görülmektedir. Bu kapsamda, Uluslararası Amnesty Medya
Ödülleri artık “dijital yenilik” kategorisine sahiptir. Benzer şekilde İngiliz Basın
Ödüllerinde de “dijital ödül” kategorisi oluşturmuştur. Tüm bu gelişmeler veriye ve
verinin işlenmesine dair potansiyel yeniliklerin artmasına ve alanın büyümesine
hizmet etmektedir.
Geçmişte ölçülemeyen, saklanamayan, analiz edilemeyen, paylaşılamayan ve belki de
“veri” olarak değeri anlaşılamayan türlü enformasyon parçaları, internet teknolojileri
ile birlikte verileştirilmeye başlamıştır. Daha basit bir anlatımla, büyük veri sosyal
medya platformlarında kullandığımız emojilerden gün içinde defalarca kez bastığımız
24
beğen tuşlarına; her türlü kullanıcı türevli içerikten insansız hava araçlarının topladığı
görüntülere dek uzanan çeşitlilikteki dağınık ve karmaşık enformasyon parçalarından
oluşur. İşte bu devasa veri setlerini betimlemede kullanılan büyük veri kavramı,
günümüzde modern bilimin ve işletmelerin temel enformasyon toplama ve analiz etme
yollarından biri olarak karşımıza çıkmaktadır.
Veri kaydetme ve depolama teknolojisinde benzeri görülmemiş ilerlemeler sonucunda
ticari kurumlardan tüketicilere, bilimden devlet yönetimine kadar hayatımızın her
boyutunda köklü değişiklikler meydana gelmektedir. Bu değişimle birlikte özellikle
endüstrinin büyük veriyi benimsemesi, kavramın popüler bir söylem haline gelmesine
sebep olmuştur. Akademik yayınlar da bu gelişmeyi takip etmeye başlamıştır.
Büyük veri, geleneksel veri tabanı sistemlerinin işleme kapasitesini aşan hacimdeki
veri setlerini tanımlamak için kullanılan bir kavramdır. Bu veri setleri çok büyüktür,
çok hızlı hareket etmektedir ve çoğunlukla veri tabanlarındaki altyapı alanında
saklanmaya ve incelenmeye uygun değildir. Başka bir anlatımla, bu veriden değer elde
etmek için onu işlemeye yarayacak alternatif yol ve yöntemlere ihtiyaç duyulmaktadır.
Bu nedenle, kurum ve kuruluşların büyük veriyi tespit edip depolayarak, düzenleyip
analiz edebilmeleri için öncelikle bilişim teknolojisinde donanım, yazılım ve hizmetler
için ek yatırım yapmaları gerekmektedir. Diğer bir anlatımla, büyük veri analizi yeni
yöntemlerin geliştirilmesi ve öğrenilebilmesi için eğitime, verinin kayıtlanabilmesi
için alt yapıya ve süreci yönetebilecek profesyonel iş gücüne ihtiyaç duymaktadır.
Büyük veri kavramı ilk kez Ağustos 2000’de, Seattle’da düzenlenen 8. Dünya
Ekonometri Kongresi’nde, Francis X. Diebold tarafından sunulan Makroekonomik
Ölçümler ve Kestirim İçin Büyük Veri Dinamik Faktör Modelleri (Big Data Dynamic
Factor Models for Macroeconomic Measurement and Forecasting) isimli bildiride
kullanılmıştır.
Francis X. Diebold, büyük veri kavramının ilk kez 90’lı yılların ortasında Silicon
Graphics (SGI)’ den John Mashey tarafından ortaya atıldığını belirtmektedir. Kavram,
ilk kez 90’lı yıllarda kullanılmış olsa da, aşağıda yer alan Tablo-1’de görüldüğü üzere
2011 yılında yaygınlık kazanmaya başlamıştır.
25
Şekil 1 ProQuest Araştırma Kütüphanesinde "büyük veri" terimini içeren belgelerin frekans dağılımı.
Büyük verinin akademi, endüstri ve medya arasında paylaşılan ortak bir kaynak
olması; her bir paydaşın çeşitli ve çoğunlukla birbiriyle çelişkili tanımlar sunmasına
neden olmaktadır. Bu nedenle büyük verinin ne olduğu konusunda genel ve tek bir
tanım bulunmamaktadır. Bu noktada alanda yapılmış farklı tanımları ele almak yararlı
olacaktır.
Öncelikle kavramı tanımlarken en çokkullanılan üç sözcüğün hacim (volume),
çeşitlilik (variety) ve hız (velocity) olduğu gözlenmektedir. Bu üç özellik ilk kez
Laney (2001) tarafından dile getirilmiş, ardından çok sayıda yazar tarafından
tekrarlanmıştır. Söz konusu özellikler verinin emsallerinden miktarca büyüklüğünü,
heterojen doğası nedeniyle çeşitli türlerde olduğunu ve hızı nedeniyle akışkan bir
doğası bulunduğunu ortaya koymaktadır.
Kavrama ilişkin literatür incelendiğinde, zaman içinde doğruluk (veracity) ile
değişkenlik ve karmaşıklık (variability&complexity) sözcüklerinin de tanımlamada
sıklıkla kullanılmaya başlandığı gözlenmektedir. Doğruluk, belirsiz verinin içindeki
değerli bilginin veri madenciliği ve veri yönetimi için geliştirilen araç ve yöntemlerle
değer kazanması olarak nitelenmektedir. Değişkenlik ise veri akış hızlarındaki
değişimi ifade etmektedir.
Bazı tanımlarda geleneksel yöntemlerle toplanıp depolanan verinin hacminin artan
doğası vurgulanırken; diğerlerinde hacimli verinin kurumlar, piyasalar, vatandaşlar ve
hükümetler arasındaki ilişki için içgörü sağlayarak karar verme davranışını
etkileyebileceği belirtilmektedir. Sonuç olarak büyük veri, çoğunlukla internet
ortamında yayıldığından ve büyük ölçüde yapılandırılmamış olduğundan, değeri ilk
26
bakışta anlaşılamayan hacimli enformasyon parçaları olarak tanımlanabilir. Büyük
veri analizi ise miktarca çok, dağınık ve karmaşık olan bu verilerin yeni yönemlerle
anlamlı hale getirilerek; mevcut durumun saptanması ve geleceğe yönelik
kestirimlerde bulunulması sürecidir.
Büyük Veri ve Yeni Medya
Büyük veri, her ne kadar üzerinde uzlaşılmış tek bir tanıma sahip olmasa da genel
olarak, gelişen ve yaygınlaşan internet, bilgisayarlar, akıllı telefonlar gibi yeni iletişim
teknolojileri üzerinden; Facebook, Twitter, YouTube, websiteleri ve bloglar gibi
sosyal medya uygulamaları aracılığıyla üre-tüketiciler(pro-consumer) tarafından
üretilen ve aynı zamanda tüketilen metinlerin, görsellerin ve videoların oluşturduğu
verilerin toplamı olarak tanımlanabilir.
Sosyal medyanın bireyler tarafından yaygın kullanımı, muazzam büyüklükteki verinin
ortaya çıkmasını sağlayan en önemli itici güç olmuştur. Görüldüğü üzere, büyük
verinin oluşturulduğu, depolandığı ve dağıtıma sokulduğu kanalların yeni medya
kanalları oluşu, kavramın iletişim disiplini ile olan organik bağını ortaya koymaktadır.
Diğer yandan, Facebook, Microsoft, Twitter, Linkedin gibi şirketlerin sahip olduğu
ortak özellikler; kalabalığın gücünden yararlanmaları, ortaya çıkan büyük veriyi
depolayacak veri merkezleri kurmaları, bilişim ve sosyal ağlarla ilgili teknolojik
yenilik üretmeleridir. Bu şirketler, elde ettikleri verileri analiz ederken salt kendi ticari
yararları açısından değil, aynı zamanda sosyal medya uygulamalarında da yenilikler
yaparak kullanıcıların ya da müşterilerinin beklentilerine karşılık vermektedir. Sosyal
ağ platformları kullanıcı bilgilerini verileştirmekte, bu verilerden yola çıkarak
uygulamalarını bireyler açısından daha verimli (örneğin, Linkedin’deki meslektaş
önerileri) hale getirmektedir.
Yeni medya-büyük veri ‘evliliğinin’ diğer bir önemli yönü ise kriz zamanlarındaki
işlevselliktir. Belirli bir bölgede yaşanan doğal afet durumlarında Twitter gibi bir
sosyal medya uygulaması hayat kurtarıcı olabilmekte; dahası afet bölgesinden atılan
Tweetler bölgedeki genel durumun anlaşılmasında ve kurumların acil durum
yönetiminde yararlı olabilmektedir. Örneğin büyük Japonya Depremi’nde
‘j_j_helpme’ etiketi kullanıma sunulmuş ve acil durum bölgesindeki bireyler
tweetlerini bu etiketi kullanarak atmıştır. Böylece, atılan tweetlerin tek bir ‘havuzda’
toplanması sağlanmış, ortaya çıkan ‘büyük veri’ çeşitli araçlarla analiz edilerek; genel
durumun anlaşılmasına dönük bilgi edinilmesine olanak sağlanmıştır.
Sonuç olarak, yeni medya büyük veriyi sürekli bir biçimde besleyen önemli kanallara
sahiptir. Büyük verinin analizi ise daha etkili ve doğru iletişim süreçlerinin
geliştirilmesinde önemli öngörüler sağlamaktadır. Bu bağlamda iki kavram birbiriyle
etkileşim halindedir.
27
Medya Kuruluşları Açısından Büyük Verinin Önemi
Büyük veri, birbirinden farklı pek çok alanda faaliyet gösteren kuruluşlar açısından
veri madenciliği ile doğru bir şekilde analiz edildiğinde son derece önemli
olabilmektedir. Sağlık hizmetlerinden, endüstriyel ürün tasarımlarına, bankacılık
hizmetlerinden pazarlama faaliyetlerine kadar pek çok alanda verinin gücünden hem
kuruluşların kendisi hem de müşterileri faydalanabilmektedir. Medya kuruluşları da
büyük verinin gücünü, veriyi toplamanın ve analiz etmenin önemini biraz yavaş ve
geç olsa da anlamaya başlamaktadır.
Medya ve eğlence şirketleri, geçmişte genellikle kendi sezgileri doğrultusunda karar
aldıkları için ve insanların paylaşmış oldukları içeriklerin bir tüketicisi olup
olmadığını anlamaya yarayacak bir ölçümü nasıl yapacaklarını bilmediklerinden
dolayı çok fazla başarılı olamamışlardır. Geleneksel medyada, örneğin televizyonlarda
sunulan dizilerin, filmlerin izlenme oranlarını ölçümlemek çoğu durumda zordur ve
hatalı sonuçlar verebilmektedir. Basılı gazetelerin tirajları ise çoğunlukla yalnızca satış
rakamlarına bakılarak değerlendirilmektedir.
Bugün itibariyle gelinen noktadaise dizilerin, filmlerin ve haberlerin internet
üzerinden sunulması, onları sunan medya kuruluşlarına bir dizi avantaj sağlamaktadır.
Hangi gazetenin ne kadar okunduğu -kaç tık aldığı-, okuyucuların sayfa üzerinde kalış
süreleri, haberlerle ve gazeteyle ilgili olarak yapılan kullanıcı yorumları, hangi dizinin
ya da filmin ne kadar izlendiği, dizideki karakterlerle ilgili olarak izleyicilerin
düşünceleri ile rahatsız edici sahneler ve karakterlerle ilgili kullanıcı yorumları
görülebilmektedir. Bu çok sayıdaki parametre sayesinde, izleyici/kullanıcı
araştırmalarında geleneksel kitle iletişim araçlarının ölçümlenmesine kıyasla doğruya
en yakın sonuçlar elde edilmektedir.
Elde edilen tüm bu veriler, medya kuruluşlarına sundukları ürünlerin zayıf
noktalarıyla ilgili fikir sunmakta; bu geri dönüşlerin veri madenciliği ile analizi
sayesinde sunmuş oldukları ürünlerde bazı düzeltmeler yapmalarına olanak
sağlanmaktadır. Dolayısıyla, büyük veri çağındaki medya kuruluşlarının elinde önemli
bir fırsat bulunmakta; bu fırsatın somut bir başarıya dönüşmesi medya kuruluşlarının
veri depolayabilme gücüne, verileri analiz etmelerini sağlayacak teknolojik araçlara
sahip olmalarına ve belki de en önemlisi bu verileri doğru bir şekilde analiz
edebilecek, veri analizi konusunda yetenekli insan kaynağına bağlı olmaktadır.
Büyük Veri, Gazetecilik Etiği ve Yeni Sorunlar
Büyük veri ve veri gazeteciliği temel olarak; kullanıcı gizliliğinin ihlal edilmesi, bilgi
güvenliğinin sağlanamaması, büyük verinin gazetecinin failliğini ortadan kaldırması ve
büyük veriye erişim olanaklarının herkes için eşit olmaması gibi çeşitli konularda
28
sorunlarla karşılaşmaktadır. Kullanıcı gizliliği konusu, büyük veriye ilişkin olarak
aşılması en zor etik sorunlardan biridir.
Büyük verinin etik sorunları beraberinde getirdiğini söylerler; çünkü verilerin kamuya
açık olması araştırmacıların kullanıcı türevli içeriği izin almaksızın kullanması gibi bazı
sonuçlar doğurur. Eğer sorulacak olsa, kullanıcıların çoğu ürettikleri içeriğin başka
yerlerde kullanılmasına izin vermeyecektir. Ayrıca, kullanıcıların çok büyük bir
çoğunluğu ürettikleri içeriği depolayabilen algoritmalardan da habersizdir. Bu nedenle,
araştırmacıların etik davranabilmeleri için, araştırmanın kaynaklarına hesap
verebilirliklerini kavramış olmalılardır. Akademisyenler, insana dayalı çalışmalar
yürütürlerken etik kurullardan onay almaktadır. Ancak pek çok etik kurul, büyük veri
madenciliği ve anonimleştirme süreçlerinin, verilerin kişisel olarak tanınabilir hale
gelmesi sorununa neden olabileceğini kavrayamamaktadır.
İnsanı konu alan araştırmalar ile gazetecilik mesleği arasında büyük veri kullanımına
dair farklılıklar olsa da, insanı konu alan araştırmalarda uyulması gereken kurallar
gazetecilik mesleği için de bir temel oluşturabilir. Çünkü gazeteciler de kitle iletişimi
söz konusu olduğu zaman bilgilendirilmiş rıza edinme konusunda zorluklarla
karşılaşmaktadır. Genellikle veriye katkı sağlayanların tamamıyla iletişime geçmek
mümkün değildir; çünkü çok fazla veri vardır. Büyük veriyi kullanan gazetecilerin ya
da araştırmacıların, bu veriye dahil olan kişilere belli bir ücret ödemesi gerekirse, çok
büyük bir verinin yalnızca çok küçük bir parçası olan bu kullanıcılara ödenecek ücret
çok düşük olacaktır; ama örneğin bir kişinin tüm arama geçmişinin dünyaya açılmasının
kişide yaratacağı hissin karşılığı çarpıcı olabilir. Ayrıca, gazeteciler çevrimiçi bir
topluluk hakkında bir çalışma yürütüyorlarsa, onların yalnızca gözlem yapmaları bile
topluluk ya da güvenlik hissini bozabilir.
Gazetecinin, sanal topluluğun tüm üyelerinden izin alarak araştırmasını yürütmesi
gizliliğe dair etik sorunu ortadan kaldıracaktır; ancak gazetecinin tek tek bireylere
ulaşması ve izin alması mümkün değildir. Bu nedenle gazetecilerin büyük veriyi
kullanımı oldukça sorunludur. Bu soruna neden olan faktörlerden birisi de, kullanım
sözleşmeleridir.
Kullanım sözleşmeleri kullanıcıların tüm kişisel enformasyonunu depolamayı
meşrulaştırmaya uygun zemin hazırlamaktadır. Sosyal medya uygulamalarına ya da
çeşitli sanal cemaatlere üye olmak isteyen kullanıcılar, üyeliklerini tamamlayabilmek
için son aşamada “kabul ediyorum” tuşuna basmak zorundalardır. Genellikle kabul
edilen kullanım sözleşmesi de gizlilik ihlali de dahil olmak üzere çeşitli sorunları
beraberinde getirir. Kullanıcılar da bu sözleşmeleri aslında istedikleri için değil, bu
platformlara dahil olmanın bir önkoşulu olduğu için mecburen kabul ederler. Kişisel
verilerinin kontrolünü bir başkasına devretmek, bu platformlara dahil olmak için
29
ödenmesi gereken bir bedeldir. Kısacası, kullanım sözleşmeleri kişisel verilerin
kontrolünün başkalarına devredilmesini yasal olarak mümkün hale getirmektedir.
Kullanıcıların yalnızca adı veya sosyal güvenlik numaraları gibi bazı kişisel
bilgilerinden yola çıkılarak ve çeşitli kişisel enformasyonları birleştirilerek onlar
hakkında bir dosya bile oluşturabilir. Üstelik, kişisel verileri elinde tutanlar, kişilere dair
çok daha özel bilgilere ulaşabilirler. Örneğin, şirketler eskiden yaz aylarında hangi
renkli otomobilin en çok satın alındığını bilmekten heyecan duyuyorlarken, günümüzde
ise geçen yıl ailenizin ne kadar diş macunu satın aldığını bilebilirler. Hatta kocanızdan
önce hamile olduğunuzu öğrenebilirler (Mateosian, 2013: 60). Büyük veri üzerine
çalışan kişiler, bir anlamda gözetim mekanizmasının kontrolünü de ellerinde tutuyor
hale gelirler. Böylece hem kullanıcıların gizliliği ihlal edilmiş olur, hem de büyük
verinin çok küçük bir parçası olan bu kişiler, kullanım sözleşmelerini mecbur oldukları
için onaylayarak, aslında bir gazetecinin çok da dahil olmak istemeyecekleri
araştırmasına katılmaya mecbur kalabilirler. Kısacası, kullanıcılar kullanım
sözleşmelerini onaylayarak kişisel verilerini platform sahiplerine devrederler ve
böylece mevcut güç ilişkilerinin sürmesine neden olurlar.
Büyük veri, deterministik bilginin insan davranışına uygulanmasından kaynaklanan
insan özerkliğinin kaybolmasıyla ilgili sorunları da ortaya çıkarmaktadır. Bu sorunlar,
bilgi karşısında özgür irade ve insan failliği hakkındadır. Kısacası büyük veri,
araştırmacıları ya da gazetecileri bireylerden uzaklaştırıyor gibi görünmektedir. Büyük
veri, bilgiyi yeni alanlara (çevrimiçi etkinliklerden gelen davranışları tahmin etme gibi)
genişletir; bireysel davranışları saptamada daha fazla doğruluğa erişir. Bilgiyi üretme
kabiliyeti, yeni aktörler ve daha güçlü araçlar yaratır. Tüm bu kabiliyetler de gazetecinin
etkinliğini azaltmaktadır, bu durum da yeni sorunlara neden olmaktadır.
Bilgisayarlar ve veri analizi kapasiteleri oldukça gelişmiştir; ancak hala büyük verinin
kendi başına bir gazetecilik değeri yoktur, bu nedenle de gazeteciler verinin içinde
gizlenmiş hikâyeyi bulup çıkarmalıdır (Parasie ve Dagiral 2012, 859). Bu anlamda,
büyük veriyi oluşturan, depolayan ve işleyen algoritmaların gazetecilerin yerine
geçtiğini söylemek zordur. Yine de makineler, haber seçimi ve haber değerlendirmeleri
gibi çeşitli konularda aktif olarak kullanılmaktadır.
Algoritmalar henüz gazetecilere olan gereksinimi ortadan kaldırmasa da oldukça önemli
roller üstlenmektedirler; ancak bu durum makinelerin etik olarak da hareket
edebileceğini gösterir mi? Kraemer buradan yola çıkarak makinelerin etik davranıp
davranamayacaklarını sorgular (Kraemer vd., 2011: 252). Matt Carlson da benzer
şekilde “otomatize gazetecilik” kavramı ile birlikte gazetecinin etkinliğinin
30
azaldığından bahseder. Bu durumun da gazetecilikte emek ve gazetecilik otoritesi gibi
konularda sorunlara neden olduğundan söz eder ve algoritmalara dayalı
değerlendirmelerin insan değerlendirmesinin otoritesinde bir düşüşe neden
olabileceğini söyler (Lewis, 2015: 326).
Gazetecinin failliğinin azalması da çeşitli etik sorunlara yol açabilir. Örneğin, bir
gazetecinin kamu yararını gözeterek bir olayı haberleştirmemeye karar vereceği
durumda bir algoritma nasıl davranacaktır?
Büyük veriye erişim olanaklarının tüm gazeteciler için eşit olmaması da büyük verinin
temel sorunlarından birisidir. Herkesin büyük verilere ulaşma imkânı yoktur; çünkü
büyük veri ile çalışabilmek bu veriyi işleyemeye uygun bilgisayarlar, depolamak için
geniş depolama kapasiteleri; kimi zaman da gerekli büyük veriye ulaşabilmek için ilgili
endüstri ile bağlantıda olmak gerekir. Bu nedenle, büyük veriye erişim imkânı da
üzerine düşünülmesi gereken bir konudur. Sermaye sahiplerinin ve büyük şirketlerin,
büyük veriye ulaşma, büyük veriyi depolama ve işleme imkânının daha fazla olması,
mevcut medya yapılanmasının ve eşitsizliklerin sürdürülmesine neden olacaktır ve
alternatif medya yapılanmaları büyük veriyi kullanma konusunda sıkıntılar
yaşayacaktır.
Ayrıca, herkesin büyük veriye ulaşma imkânın eşit olmadığı ve algoritmaları
oluşturanların güç sahipleri olduğu düşünüldüğünde, gazetecilerin büyük veriyi
yalnızca güç sahiplerinin çıkarlarına hizmet edecek şekilde kullanabileceği tehlikesi de
ortaya çıkmaktadır. Bunun da ötesinde, gazetecilerin karar verme görevini üstlenen
algoritmaların, toplumun çoğunluğunun yanı sıra azınlıkları da gerçekten temsil edip
etmeyeceği sorusu da ortaya çıkmaktadır. Medya sahipleri, gazeteciler ve iletişim
bilimciler, büyük veri, gazetecilik etiği ve gazeteciliğin geleceği hakkında düşünerek;
mevcut etik sorunların nasıl üstesinden gelinebileceği hakkında değerlendirmelerde
bulunmalıdırlar. Aksi halde büyük veri ile birlikte ortaya çıkan etik sorunlar geçmiş
sorunlara eklemlenerek var olmaya devam edecektir.
Yeni iletişim teknolojileri dolayımıyla ortaya çıkan ‘‘büyük veri’’, yalnızca içgörü ve
tahmin sağlamamakta, aynı zamanda gazetecilik mesleği ve uygulamaları üzerinde de
birtakım değişim ve dönüşümlerin yaşanmasına sebep olmaktadır. Teknolojik
altyapının verinin daha hızlı toplanıp, kontrol edilmesi ve doğrulanması gibi avantajlar
sağlaması; onun bir haber kaynağı olarak kullanılmasını da giderek daha önemli hale
getirmektedir. Diğer bir anlatımla, dünya daha dijital hale geldikçe; daha fazla bilgi veri
biçimlerinde depolanmakta, gazetecilerin verilere erişimi gittikçe kolaylaşmaktadır. Bu
verilerin belirli amaçlar doğrultusunda özetlenmesi amacıyla gerçekleştirilen veri
görselleştirme, en basit haliyle ham verinin kullanıcılar için anlaşılır hale getirilecek
şekilde görselleştirilmesi olarak tanımlanabilir. Veri görselleştirmeyi bir anlatı aracı
olarak kullanan veri gazeteciliği ise dijital dünyanın araştırmacı gazetecilik türleri
arasında son dönemde popülerleşen bir tür olarak karşımıza çıkmaktadır.
31
Veri gazeteciliği ve veri görselleştirme birbirleriyle ilişkili iki kavram olsa da aynı
anlama gelmemektedir. Çünkü veri gazeteciliği yalnızca veri görselleştirmeden
oluşmaz; ona indirgenemez. Veri analizine dayanan bir haber bazen en iyi imgeler ve
infografi ile anlatılabilirken; bazense sözcüklerle anlatılabilmektedir. Bu iki türün ortak
özelliği ise sayı ve istatistik içermeleridir. Özetleyecek olursak, veri görselleştirme veri
gazeteciliğinin temel anlatı unsurlarından biri olmakla birlikte, veri gazeteciliğinde
esnek anlatı biçimleri kullanılabilmektedir.
Veri gazeteciliği kazalar ve basın bültenleri gibi rutin haber akışının hâkim olduğu haber
odasındaki günlük çalışmaların aksine, hiç kimsenin hikayeleştirmediği bir alanda haber
bulmakla ilgilidir (Appelgren ve Nygren, 2014: 401). Bu anlamıyla veri gazeteciliği,
geleneksel gazeteciliğin yerine geçen değil aksine onu tamamlayan ve belki de
derinleştiren bir gazetecilik türü olarak değerlendirilebilecektir. Çünkü veri gazeteciliği
haber metni, fotoğraf ve video sunumundan oluşan bir haberciliğin çok daha ötesinde
bir habercilik biçimini ifade etmektedir.
Zotto, Schenker ve Lugmayr’a göre (2015), verinin haber içeriklerini geliştirme ve
habere konu olan bilgiyi zengileştirme anlamında kullanılması aslında 1800’lü yıllara
dayanmaktadır. Bu kapsamda, gazetecilerin zaten senelerdir bazı haberleri oluştururken
veri, görselleştirme ve istatistik kullandıklarını düşündüğümüzde; onların çalışma
pratikleri açısından neyin değiştiğini ve neyin “yeni” adledildiğini sorgulamak yerinde
olacaktır.
Bazı haber editörlerine göre “veri gazeteciliği” sözü anlamsızdır. Çünkü gazeteciler,
gazetecilik tarihi boyunca dijital araçları kullanmasalar da elle veri analizi yapmışlardır.
Bugün değişen şey ise, daha büyük veri kümlerinin dijital olarak ve daha hızlı analiz
edilebilmesidir. Yine geçmişte, izleyicilerin basılı bir haber ürününde yer alan verilere
kendi hikayelerini katma, haberleri filtreleme ve seçme olasılıklarının sınırlı olması
sebebiyle veri gazeteciliğinin Web'e bağlı bir doğası bulunmaktadır.
Yani iki asır öncesinde veriye erişim, veri kaynağının doğrulanması ve kullanıcı türevli
içeriğin aktarımı bugüne kıyasla çok daha zor olduğu için «veri gazeteciliği» tanımı,
içinde bulunduğumuz teknolojik çağın gazetecilik anlayışıyla daha uygun düşmektedir.
32
4. VERİ
33
Veri, bilginin yapılandırılıp kayıt
altına alınıp, kolay analiz
edilebilmesi için bir araya
getirilmesine denir. Bir veya
birden fazla bilgiden oluşan
kümedir. Veri genellikle
araştırma, gözlem, deney, sayım,
ölçüm yoluyla elde edilir. Yaş,
isim, telefon numarası, bir
toplama işleminin sonucu ya da
sınıfın yaş ortalaması birer
veridir.
Ham Veri
İngilizcesi “raw data” olan ham veri, düzenlenmemiş veri olarak ifade edilebilir. Ham
veri etkin şekilde bilgi üretme ve analiz için temel bir kaynak olarak görülebilir.
Örneğin, anketler aracılığı ile oluşturulan veriler (seçim verileri), bir oylama
yapıldığında (seçim sonuçları verileri), bir kayıt yapıldığında (doğum kayıtları verisi),
bir şey satın alındığında (çevrim içi satış kayıtları vb.) gibi. Bunu dışında veri, cep
telefonları, İnternet, uydu (GPS verisi gibi) ve birçok farklı teknolojiler tarafından
da oluşturulabiliyor.
Veri
Satır ve kolonlar bazında ifade edilen ve bir formata sahip olan veriler ölçüm, sayım,
deney, gözlem ya da araştırma yolu ile elde edilmektedir. Ölçüm ya da sayım yolu ile
toplanan ve sayısal bir değer bildiren veriler nicel veriler, sayısal bir değer
bildirmeyen veriler de nitel veriler olarak adlandırılmaktadır.
Yapısal olarak kategorik ve sürekli olarak iki gruba da ayrılabilen veri daha da derin
bir bileşen yapısına sahiptir.
Temel Kavramlar
Yeri gelmişken temel bazı kavramlara da değinmekte fayda var:
BİLGİ: İngilizcesi “information” olan olgudur. Sorgu ve raporlama fonksiyonları
sayesinde, veritabanındaki verinin çekilerek bilgiye dönüşümü sağlanır. Örneğin,
ürün, miktar ve fiyat toplamları, satılan ürünlerle bunların miktar ve hacimleri bilgiyi
sağlar.
34
NİTELİKLİ BİLGİ: İngilizcesi “knowledge” olan olgudur. Veri madenciliği
teknolojisi içeren uygulamalar sayesinde, veri içerisindeki gizli eğilim ve örüntülerin
belirlenmesi olarak düşünülebilir.
Veri Seti
Gündelik hayatımızda veriyi sıklıkla tablolarda düzenlenmiş buluruz.Tek bir tablonun
içeriği veri seti olarak ifade edilir. Veri setini analiz ederek ondan yeni bilgi - görsel
çalışmalar üretmek; karar alma, politika üretme süreci için önemlidir.
Veri seti örneği:
35
Veri Türleri
Fotoğrafta Ne görüyorsunuz? Golf topları.
Fotoğrafa yönelik ilk veri, topların golf için
kullanıldıkları. Golf; bir spor kategorisi. Bu
detay topu bir sınıflandırmaya koymamızda
yardımcı oluyor. Fakat bundan daha fazlası var
fotoğrafta. Topların “beyaz” renkte olduğu,
"kullanılmış" olduğunu da söyleyebiliriz.
Topların hepsinin bir ölçüsü de var, belirli bir
sayıdalar ve fiyatları da var. Önemsiz objelerde
bile onlarla ilişkili çok sayıda veri bulunur.
Verileri Nitel ve Nicel olarak 2 ana grupta
sınıflandırabiliriz.
Nitel Veri
Nitel veri (Qualitative data) Birimlere dayalı ölçümlerle değil sayımlarla değerleri
belirtilebilen, belli bir yapısal veya kurumsal özelliği taşımakla (veya taşımamakla)
simgelenen veriler. Cinsiyet, saç rengi vb. nitel özellikleri belirten veriler. Bir deneğin
niteliklerini belirten verilerdir. Eğitim durumu, ev sahibi olup olmama, vs… Nitel
veriler iki gruba ayrılır.
Sınıflanabilen Nitel Veri: Birbirinden bağımsız isim bildiren, kod ve numara ile
gösterilebilen, sınıflara ayrılan verilerdir. Taşıtların kara, hava ve deniz taşıtları olarak
ayrılması gibi…
Sıralanabilen Nitel Veri: Belirli bir miktar belirtmeyen, bir sıra ya da dereceye göre
elde edilen verilerdir. Öğrencilerin başarı durumu: pekiyi, iyi, orta… Ordu rütbeleri:
albay, yarbay, subay, astsubay…
Nicel Veri
Nicel veri (Quantitative data) birimlerin ölçüm ve tartım sonucu değerleri saptanan
sayısal özelliklerini belirten, aralıklı ölçekli veya orantılı ölçekli değişkenler. Bir
deneyin sayılabilir, ölçülebilir özelliğini veren verilerdir. Sürekli nicel veri ve kesikli
nicel veri olmak üzere iki türü vardır. Örneğin golf toplarının sayısı, ölçüsü, fiyatı, bir
testteki skor vs.
Sürekli nicel veri: Ondalıklı değerler alabilen nicel verilerdir. Boy uzunluğu, kilo,vs.
Kesikli nicel veri: Sayılarak elde edilen ve tam sayılı değerlerdir. Nüfus, öğrenci
sayısı, hane halkı sayısı.
36
Kategorik Veri
Kategorik veri (Categorical data) tanımladığınız veriyi bir kategoriye koyar:
Golf topu örneğimizde “kullanılmış olma” durumu kategoriktir. (“yeni”,
“kullanılmış”, “kırık” vb. kategorilerdir.)
Veriler toplanıp biçimlendirildiğinde daha fazla işimize yarar.
Yanda görelim:
Yukarıdaki tabloya rağmen her bir veri hâlâ tek başına çok anlamlı değil. Veriden
bilgi elde etmek için veriyi yorumlamamız gerekiyor. Golf topunun ölçüsünü ele
alalım: 43 mm çap bize çok şey anlatmıyor. Sadece diğer şeylerle
karşılaştırdığımızda anlamlı hale geliyor. Örneğin; sporda ekipmanlar için ölçü
yönetmelikleri vardır. Minimum golf müsabakası topunun ölçüsü 42,67mm’dir. Yani
topu bir müsabakada kullanabiliriz. Bu bir bilgi. Fakat hâlâ bilme değil.
Bilme, bilgi öğrenildiğinde, uygulandığında ya da anlaşıldığında yaratılır.
Renk
Kategori
Durum
Çap
Fiyat
Beyaz
Spor-Golf
Kullanılmış
43 mm
8 TL
37
Yapılandırılmamış Veriye karşı Yapılandırılmış Veri
İnsanlar için veri
‘Her biri 8 tl'den 43mm çapta, kullanılmış 5 beyaz golf topumuz var’ ifadesi bir insan
için anlaması kolay bir cümle. Ffakat aynı şeyi bilgisayarlar için söyleyemeyiz.
Yukarıdaki cümle yapılandırılmamış veriye örnek. Yapılandırılmamış verinin sabit
temelli bir yapısı bulunmuyor - cümle kolaylıkla değiştirilebilir ve hangi kelimenin
tam olarak neye gönderme yaptığı açık değildir. Aynı şekilde, pdf'ler, taranmış
fotoğraflar insan gözüne kolay, anlaşılır ve güzel hoş gelen bilgiler içerebilir ama
makineler için okunabilir değillerdir.
Yani bilgisayar dostu değillerdir.
Yapılandırılmamış veri
Yapılandırılmamış Veriye karşı Yapılandırılmış Veri
Bilgisayarlar için veri
Bilgisayarların insanlardan farklı tarafları var. Belirli kaynaklardan bilgi çıkarmalarını
sağlamak son derece güçtür. İnsanlar için kolay olan bazı şeyler, bilgisayarlar için hâlâ
zor olabiliyor. Bilgisayarın veriyi işleyip, analiz etmesi için onu okuyabilmesi
gerekiyor. Bu da verinin biçimlendirilmiş ve makine tarafından okunabilir formatta
olması gerektiği anlamına gelir. Bunu sağlamak için en sık kullanılan format
tiplerinden biri CSV'dir. CSV virgülle ayrılmış değerler demektir. Standart bir e-tablo
oluşturma formatıdır. Veri, yeni sıraların üstündeki her bir veri sırası ve virgüllerin her
38
bir sırada değerleri birbirinden ayırdığı boş bir metin dosyası ile temsil edilir. Çok
basit bir açık format olarak, kullanımı çok kolaydır ve genellikle açık verileri
yayımlamak için kullanılır.
Bir CSV dosyası içeriği aşağıdaki gibidir:
“adet”, “renk”, “durum”, “ürün”, “kategori”, “çap (mm)”, “birim fiyat (AUD)”,
“beyaz”, “kullanılmış”, “top”, “golf”, 43, 0.5
Ancak çok sayıda yapılandırılmış ve makine tarafından okunabilir format vardır.
4.1. Uluslararası Veri
Uluslararası veri kaynakları çok çeşitli veri kaynaklarından ve kurumlardan
yararlanılarak oluşturuluyorlar. Örneğin Dünya Bankası verilerini çok çeşitli
organizasyonlardan yararlanarak veri sağlıyor ve düzenli olarak güncelleniyor.
Uluslararası Araştırmacı Gazeteciler Konsorsiyumu (ICIJ)’nun dünya bankası
projelerini ele alarak yaptığı araştırmacı gazetecilik projeleri yakından incelediğinde
dünya genelinde pek çok kişinin projelerden zarar gördüğü belgeleniyor. 3 Milyondan
fazla kişinin 2003 - 2013 yılları arasında yaşam alanlarını terk etmek zorunda kaldığı
ve yerinden olduklarını anlaşılıyor.
39
Uluslararası Veri Örnekleri
Diğer önemli veri kaynağı ise şirketlerin bilgilerine ulaşabildiğiniz Open Corporates
sitesi. Bu açık veri tabanında 102 milyon şirkete ait bilgi, veri, kayıt mevcut.
Araştırdığınız şirket ve konu hakkında csv, xml, json,xls formatlarında verileri
indirme olanağınız da var. Platformunda ayrıca görselleştirme bölümü de var. BP,
Bank of America, Citigroup,Goldman Sachs, Morgen Stanley, JP Morgen, Wells
Fargo gibi önemli şirket bilgileri mevcut. Bu şirketlerle ülkelerin ilişkisini, vergi
ağlarını görselleştirerek görebiliyorsunuz.
Bir başka önemli uluslararası veri kaynağı ise Birleşmiş Milletler’e ait UNdata.
60 milyon kayıt, 34 veritabanı bulunan portaldan, araştırma konunuza göre ve
ihtiyacınız olan veri formatına göre filtreleme yaparak veri indirebilir,
yararlanabilirsiniz. UNdata verilerine göre yaklaşık 7 milyon kişi aşırı açlık sınırında.
Google tarafından halka açılan veriler hizmeti ise veri ile çalışanlar için oldukça
yararlı bir adres. Türkçe bölümü de mevcut. Ancak gelişmiş bölümünden daha fazla
yararlanılabilir. Filtreleme yapabilir, görselleştirebilir, bölgeler arasında karşılaştırma
yapabilir, erişime açarak, sitenize de yerleştirebilirsiniz. Tek dezavantajı
görselleştirdiğiniz çalışmanın veri setini indiremiyorsunuz. Orijinal kaynağına
gitmeniz gerekiyor.
armsglobe.chromeexperiments uluslararası veri kaynağı adresi ise 1992 - 2010
yılları arasında dünya genelinde küçük silah ve mühimmat ticareti verilerine,
ülkelerin ithalat ve ihracat trafiğine görsel olarak ulaşmanızı sağlıyor.
Düzenli olarak güncellenen Ekonomik Kalkınma ve İş birliği Örgütü Veri bölümü
de güncel, yararlı bir uluslararası veri kaynağı adresi. Filtreleme yapabilir,
görselleştirme ile analiz ettiğiniz konuyu daha net görebilir, veri setlerini dilediğiniz
formatta indirip, kullanabilirsiniz. Ayrıca çalışmanızı erişime açarak kendi sitenize de
ekleyebilirisiniz.
Uluslararası Veri Kaynakları
Video Destekli İçerik: https://www.youtube.com/watch?v=Vj-CT6DGJFI
Videoda yer alan ulusal veri kaynakları, örnekler & araçlar:
Dünya Bankası Veri http://data.worldbank.org/
Örnek: ICIJ - Yerinden Olma& Terk Edilmeye Zorlanma http://www.icij.org/project/world-
bank
40
Örnek: 3 milyondan fazla kişi Dünya Bankası’nın projeleri nedeniyle yerinden oldu
http://dagmedya.net/2015/05/12/2003-2013-yillari-arasinda-3-milyondan-fazla-kisi-dunya-
bankasinin-projeleri-nedeniyle-yerinden-oldu/
Dünya Genelinde Tüm Şirketlerin Bigilerinin Toplandığı Açık Veritabanı:
OpenCorporateshttps://opencorporates.com/
OpenCorporates görselleştirme https://opencorporates.com/viz/financial/index.html
OpenCorporates Hakkında: http://www.verigazeteciligi.com/daha-iyi-bir-gazeteci-olmaya-
yardimci-olan-14-veri-araci/
BM Veri http://data.un.org/
Örnek: UNDP Data|Yaklaşık 6.7 milyon kişi aşırı yoksul
http://dagmedya.net/2015/01/23/undp-raporuyaklasik-6-7-milyon-kisi-asiri-yoksul/
Google Halka Açık Veri Arama Bölümü: Public Data Explorer
https://www.google.com/publicdata/directory
Dünya Genelinde Ülkelerin Küçük Silah ve Mühimmat - İthal & İhracat trafiği:Small Arms
and Ammunition - Imports & Exports http://armsglobe.chromeexperiments.com/
Ekonomik Kalkınma ve İşbirliği Örgütü Veri: https://data.oecd.org
Örnek:OECD: Türkiye gelir eşitsizliğinde üçüncü http://dagmedya.net/2015/05/23/oecd-
turkiye-gelir-esitsizliginde-ucuncu/
Önemli bir uluslararası veri kaynağı Data Catalogs: Data Catalogs
Diğer Uluslararası Veri Kaynakları
World Health Organization
United Nations
World Bank
DataCatalogs.org
The Guardian’s world government data portal
Google’s public data directory
The data hub
DBPedia Datasets
Factual
41
Free GIS data
List of open data resources
Energy data repositories
Data wrangling
Quora thread: “Where can I find large datasets open to the public?”
Directory of APIs
Infochimps
Datamarket
Offshore Leaks
Investigative Dashboard
Open Corporates
Natural Earth data
4.2. Ulusal Veri
Ulusal veri kaynakları çeşitli veri kaynaklarından ve kurumlardan yararlanılarak
oluşturuluyor. Türkiye İstatistik Kurumu (TÜİK)’in veri yayımlama takvimi
bulunuyor ve düzenli olarak bu takvim ile raporları erişime açıyor. Bir filtreleme alt
yapısına sahip, veriler ağırlıklı olarak Excel ve pdf olarak paylaşılıyor. Kategorilerine
göre verilerin düzenli olarak güncellendiğini de söyleyebiliriz. Örnek olarak verilen
“2015 Yılında Dolaşım Sistemi Hastalıklarına Bağlı Ölümler Arttı” haberinde
kullanılan TÜİK raporunun Resmi İstatistik Programı (RİP) ile Ölüm Bildirim
Sistemi kaydı ile tutularak güncelendiğini görüyoruz.
Ulusal Veri Örnekleri
Önemli bir veri kaynağı olarak Resmi Gazete’nin 7 Şubat 1921 tarihinden itibaren
yayımlanan tüm sayılarına erişebilirsiniz. E- uygulama hizmeti de veren Resmi
Gazete'de ilanları, günlük yargı ilanlarını ve ihale duyurularını da takip etme olanağı
var.
Seçim dönmelerinde sıkça yararlanılan ancak güncelde de faydalanılan Yüksek Seçim
Kurulu seçim, oylama vb. verilerinin Seçim Sonuçları Paylaşım Sisteminde nasıl
illere, ilçelere göre filtrelenip, csv, excel formatlarında indirilebildiği gibi
görselleştirildiğini görüyorsunuz.
42
Türkiye Odalar ve Borsalar Birliği, T. C. Sosyal Güvenlik Kurumu, Türkiye Bankalar
Birliği, Bankacılık Düzenleme ve Denetleme Kurulu, T.C. Başbakanlık Sermaye
Piyasası Kurulu, T.C. Başbakanlık Hazine Müsteşarlığı, Merkez Bankası, Kalkınma
Bakanlığı, Maliye Bakanlığı web siteleri de belirli periyotlarla veri paylaşan ve
filtreleme alt yapılarına sahip web siteleri arasında.
4982 numaralı Bilgi Edinme Kanunu ile Bilgi Edinme Hakkı’ndan yararlanmak için
sıklıkla başvurulan Başbakanlık İletişim Merkezi(BİMER) de sık kullanılan sayfalar
arasında yer alıyor.
Ulusal Veri Kaynakları
Video destekli içerik: https://www.youtube.com/watch?v=b8Jw0oq6-I8
Videoda yer alan ulusal veri kaynakları, örnekler & araçlar:
Türkiye İstatistik Kurumu (TÜİK) http://www.tuik.gov.tr
Örnek: 2015 Yılında Dolaşım Sistemi Hastalıklarına Bağlı Ölümler Arttı
Resmi Gazete http://www.resmigazete.gov.tr/default.aspx#
Örnek: "Resmi Gazete" Konusu Meclis'te
Yüksek Seçim Kurulu http://www.ysk.gov.tr
Örnek:15 Kurumdan 10 Tanesi Ortalamanın Çok Altında
Örnek: Seçim sonuçlarına güvenilemeyeceğinin somut kanıtını buldum
Türkiye Odalar ve Borsalar Birliği http://www.tobb.org.tr
T. C. Sosyal Güvenlik Kurumu http://www.sgk.gov.tr
Türkiye Bankalar Birliği http://www.tbb.org.tr
Bankacılık Düzenleme ve Denetleme Kurulu http://www.bddk.org.tr
T.C. Başbakanlık Sermaye Piyasası Kurulu http://www.spk.gov.tr
T.C. Başbakanlık Hazine Müsteşarlığı http://www.hazine.gov.tr
Kalkınma Bakanlığı http://www.kalkinma.gov.tr
T.C. Merkez Bankası http://www.tcmb.gov.tr
Örnek:Merkez Bankasının Gerçek Faizini Birlikte Hesaplayalım
43
Maliye Bakanlığı http://www.bumko.gov.tr/
Örnek: 2016 Bütçe Tasarısı|Gelecek Yıl Bütçeden Bin 400 Araca Daha Harcama Yapacağız
Başbakanlık İletişim Merkezi http://www.bimer.gov.tr/Forms/pgMain.aspx
Örnek: “Türkiye’de Kamusal İletişim ve Bilgi Edinme:10 Yılın Ardından Panoramik Bir
İnceleme”
Veri Kataloğu: Türkiye
http://dataportals.org/
44
5. SİVİL VERİ:SOSYAL MEDYA, KİTLE KAYNAK
45
Önceki dersimizde yararlı olabilecek bazı ulusal-
uluslararası veri kaynaklarını, nerede, nasıl ve
hangi formatlarda indirilebildiğini gördünüz. Bu
bölümde ise kurumsal, resmî veri kaynaklarının
dışında insanların paylaşımları, katılımı ile oluşan
yurttaş verisini, sivil veri ve türlerini göreceksiniz.
Sosyal medya verisini, seçim, doğal afet gibi olaylarda paylaşılan verileri yakından
inceleyek, kitleleri sorunun çözümüne dahil etmek olarak bilinin "Kitle Kaynak"
kavramına Guardian Gazetesi örneği ile yakından bakacaksınız.
Sivil Veri Örnekleri
Bu bölümde sosyal medya verisi ile yani insanların fikirleri, tepkileri, takipçi bilgileri
ile şekillenen veri tabanlarına dikkat çekiyoruz.
Kılıçdaroğlu, Erdoğan gibi siyasetçilerin 6 milyonun üstünde takipçileri var. Bu veri
gazetecileri için de önemli bir sayı. Dönemsel olarak liderlerin takipçilerinin
gündemle birlikte nasıl tepki verdiklerini analiz etmeyi de sağlayabiliyor. Bir örnek
üzerinden gidelim; Çilek Ağacı portalı liderlerin Twitter takipçilerinin isim
istatistiklerini tutarak hangi liderin hangi isimde takipçiye yüzdelik olarak sahip
olduğunu analiz ediyor.
46
Sosyal medya verisine en iyi diğer örneklerden biri de seçim dönemleri seçmenlerin
tepkilerini, paylaşımlarını, fikirlerini gördüğünüz veriler.
Özellikle seçim dönemlerinde Twitter üzerinden açılan etiketlerin önemli bir veri
kaynağı olduğu gözlemlenmektedir. Canlı, video, hesap, fotoğraflar şeklindeki
bölümlerden de dilediğiniz içeriklere ulaşabiliyorsunuz ve tabii ki gelişmiş arama
teknikleri ile hem daha fazla detay araştırabiliyorsunuz hem de yararlanmak
istediğiniz veriyi kaydedip, embed ile bir editöre ekleyebiliyorsunuz. Bu bölümü etkin
araştırma teknikleri bölümünde daha detaylı öğreneceksiniz.
Diğer önemli bir örnek ise Özgecan Aslan cinayeti sonrası başlatılan #sendeanlat
etiketi ile atılan binlerce Tweet.
Oy ve Ötesi tarafından, tamamen halkın/seçmenin ve üye desteği ile seçim
dönemlerinde paylaşılan seçim verileri, sonuç raporları da önemli bir sivil veri
kaynağı olarak karşımıza çıkıyor.
Google Trend ise sivil veriye iyi bir örnek. İnternet kullanıcılarının gündeminde neyin
olduğunu ya da araştırdığınız şeyin ne kadar ilgi gördüğünü de grafiklerle, bölgesel
olarak da görebiliyorsunuz. Atatürk Airport örneği üzerinden incelersek patlamanın
olduğu günde ciddi bir arama olduğunu görüyoruz.
Küresel Haber Ajansı olarak kendini tanıtan, sosyal medyadaki etkili haberleri bulup
doğrulayarak dünyayla paylaşan Storyful.com da önemli bir adres.
Türkiye’den yine değerli bir örnek de http://nediyor.com
Bu adreste sosyal medya verisi üzerinden analiz yapmak isteyen, veri toplayanlar için
önemli bir platform. Siteye girdiğinizde haberlerin altına sadece ünlülerin Twitter
üzerinden yaptığı yorumları görüyorsunuz.
47
Sivil veri bölümünde yine önemli bir konu da kitlenin kaynağınız olması, sorunun
çözümün parçası olması. Felaket, deprem gibi olaylarda kitlenin gücüne ihtiyacınız
olduğunda sivil veri önemli bir kaynak olarak karşımıza çıkıyor.
Sivil Veri Kaynakları
Video Destekli İçerik: https://www.youtube.com/watch?v=8jKhHyWoaqE
Videoda yer alan veri kaynakları, örnekler & bahsedilen araçlar :
• Liderlerin Twitter Takipçilerinin İsim
İstatistikleri http://cilekagaci.com/2011/11/04/liderlerin-twitter-takipcilerinin-
isim-istatistikleri/
• Özegecan Arslan Cinayeti ve #sendeanlat twitter
etiketi http://www.bbc.com/turkce/haberler/2015/02/150212_sen_de_anlat
• Oy ve Ötesi http://oyveotesi.org/
• Google Trend & Atatürk Havalimanı https://www.google.com.tr/trends/?hl=tr
• Küresel Haber Ajansı (Sosyal medyadaki etkili haberleri bulup, doğrulayarak
dünyayla paylaşıyorlar):https://storyful.com/
• Haber altına sadece ünlülerin tweetlerinin ve yorumlarının yer aldığı
portal. http://nediyor.com/
• Kitle Kaynak: https://tr.wikipedia.org/wiki/Kitle_kaynak
• Guardian'ın, yüzlerce içeriği okuyucularıyla paylaşıp, "hangi konuyu
işleyelim?" dediği sorusu üzerine, okuyucuların milletvekillerinin harcamalarını
seçmesi ve onun
haberi https://www.theguardian.com/news/datablog/2009/jun/18/mps-expenses-
houseofcommons
• Ve diğerleri…
Kitle kaynak (crowdsourcing)
Aradığınız bilgiye resmi olarak ulaşamıyorsanız ve sosyal medyada da tartışılmıyor
ise Kitle Kaynak yöntemlerine başvurabilirsiniz.
Kitle kaynak (İngilizce: crowdsourcing), bir sorunun çözümünün hazırı yoksa, kendi
çalışanlarından veya piyasadaki seçme profesyonel danışman ya da uzmanlardan değil
48
de, kitlelerden, yani becerebilen herhangi birisinden sağlanması sürecine verilen isim
ya da sıfattır.
Kitle kaynak (crowdsourcing) örneği olarak Guardian gazetesinin veri gazeteciliği
bölümünde okuyucularına veriler sunarak, kendileri için bir haber konusu seçmelerini
istedikleri örneğini verebiliriz. Kitle kaynak bir insan ağına görev dağıtımı yaparak
sağlanan, bir paylaştırılmış problem çözme ve üretim süreci olarak tanımlanıyor.
Guardian’ın bu çalışması sonrasında okuyucuların «milletvekillerinin harcamalarına
yönelik» haberin oluşmasına, ve böylece gazetecinin, özellikle spesifik bir konuya
odaklanmasına yardımcı olduklarının örneğini görmekteyiz. Konuyla ilgili habere
erişmek için…
Kitle Kaynak Örnekleri
Kitle kaynak çözümlere İnternet aracılığıyla ulaşılabilir. Şu İnternet siteleri bu oluşuma
örnektir:
• Vikipedi: Bu site kitle kaynaklı çözümlere en güzel örnektir. Yazan ve
güncelleştirenler bu işi para almadan yaparlar.
• istockphoto.com: Grafik projelerinde kullanma amacıyla fotoğraf arayanlara amatör
fotoğrafçıların çektiklerini ucuza temin eden site. Örneğin profesyonel fotoğrafçılar
100 dolar istediği bir durumda bu site 1 dolar ile ayni gereksinimi karşılayabilir.
• Amazon Mechanical Turk: Makinelere zor, insanlara kolay cevapları para karşılığı
insanlara verdirtir. Bu cevaplar genellikle basit ama çok yüksek sayıda olur; o zaman
her küçük cevaba cüzi bir miktar ödenir.
• innocentive.com: Firmaların Ar-Ge bölümlerinin başa çıkamadığı bilimsel ya da
mühendislik sorunlarını çözene mükafat önerilebilen bir site. Burada bir çözüm on
binlerce dolar gelir getirebilir.
• yourencore.com: Firmaların bir kezlik projeler için emekli bilim adamları bulmalarını
sağlayan site.
• Emporis: Gönüllülerce bina verileri toplanmasını sağlayan site.
• ESP Game / Google Image Labeler: Resim aramada kullanılmak üzere resmi anlatan
yazıların bir İnternet oyununun yan etkisi olarak elde edilmesi için site.
• reCAPTCHA: Otomatik tanınması zor yazıların insan emeğiyle bilgisayar ortamında
aranır taranır hale getirilmesini sağlayan site.
• MoveOn.org: Kitle kaynak yöntemiyle siyasi faaliyetler örgütleyen bir site.
49
• Stardust@Home ve Galaxy Zoo: uzayın incelenmesine gönüllü insan gücü sağlayan
iki site.
• Innovation Exchange
• Foldit: Protein katlama stratejileri bulmak için kitlelerin yaratıcılığından yararlanan
İnternet oyunu.
• Birleşik Devletler'de Teksas eyaletinin polis teşkilatı Ocak 2008'de halktan
gönüllülerin elektronik nöbet beklemeleri için sınır boyu kameralar yerleştireceğini
açıkladı.
• FlipperTV (Kasım 2007) ve McCainpedia (Mayıs 2008): Amerikan başkanlık
seçiminde kullanılmak üzere halkın çektiği Cumhuriyetçi yanlısı videoların
kullanımını kolaylaştıran siteler.
5.1. Türkiye’den Örnek Veri Haberciliği Çalışmaları
Bu bölümde ise üç veri güdümlü haber ve proje örneğini inceleyeceğiz.
Birinci proje, soykırımı konu alıyor. Bosna'daki kurumların verilerinden
yararlanılarak oluşturulmuş.
İkinci proje, Suriye'deki son durumu kapsayan dinamik haritaların da olduğu
kapsamlı bir haber dosyası.
Üçüncü proje ise, Soma faciası sonrası geliştirilmiş olan 2012'den 2015'e kadar 20 iş
kolunda yaşanan iş kazalarının yer aldığı bir açık veritabanını içeriyor.
Video Destekli İçeriktir: https://www.youtube.com/watch?v=pYIw6hG6YK0
Videoda yer alan projeler & linkleri:
• Srebrenitsa Soykırımına Interaktif Müze-Tarik Dodiç
http://www.aljazeera.com.tr/haber/srebrenitsa-soykirimina-interaktif-muze
• SURİYE DOSYASI |Harita ve Rakamlarla Suriye'de Güncel Durum Erman Çete -
Turgut Yıldız http://interaktif.sol.org.tr/suriye-dosyasi/
http://interaktif.sol.org.tr/suriye-dosyasi/
İşçi Ölümleri Açık Veri tabanı - Pınar Dağ & Berkin Akkocaoğlu & Mustafa
Özsarıoğlu
• http://madencilik.dagmedya.net/
• http://community.globaleditorsnetwork.org/content/open-database-deceased-workers-
turkey-0
50
•
https://docs.google.com/viewerng/viewer?url=http://community.globaleditorsnetwork.
org/sites/default/files/open_database_of_deceased_workers_in_turkey.pdf
• http://www.dagmedya.net/2014/09/01/somada-herkes-birini-bekliyor/
• http://www.dagmedya.net/2014/09/01/konusmaya-ihtiyacimiz-var/
• http://www.dagmedya.net/2014/09/01/destek-parasina-dokunmadik/
Videoda Paylaşılan Projelerin Veri Kaynakları:
• Remembering Srebrenica-https://www.srebrenica.org.uk/
• BM Mülteciler Yüksek Komiserliği Verileri: http://www.unhcr.org/turkey/home.php
• BM Kalkınma Programı Verileri: http://www.tr.undp.org/content/turkey/tr/home.html
• Confronting Fragmentation, Syrian Center for Policy Research, 2015: http://scpr-
syria.org/publications/policy-reports/confronting-fragmentation/
• Al-Masdar Al-‘Arabi (The Arab Source):
https://www.almasdarnews.com/article/category/syria/
• Maden İşleri Genel Müdürlüğü: http://www.migem.gov.tr/
• Türkiye Taşkömürü Kurumu: http://www.taskomuru.gov.tr/
• Maden Tetkik ve Arama Genel Müdürlüğü:http://www.mta.gov.tr/v2.0/index.php
• Türkiye Kömür İşletmeleri Kurumu: http://www.tki.gov.tr/tr/Anasayfa
• Maden Mühendisleri Odası: http://www.maden.org.tr/
• Etimaden İşletmeleri Genel Müdürlüğü: http://www.etimaden.gov.tr/
• İş Sağlığı ve Güvenliği Genel Müdürlüğü:
http://www3.csgb.gov.tr/csgbPortal/isggm.portal
5.2. Veri Arama Araçları
Bu bölümde veri ararken ya da araştırma yaparken nasıl daha hızlı yol alırsınız,
istediğiniz formatta nasıl veriye daha hızlı ulaşırsınız hem video-uygulama, hem
sunum ile yer vereceğiz.
51
Video Destekli İçeriktir:
https://www.youtube.com/watch?v=dw0APztkcXo
Sunum Destekli İçeriktir:
https://docs.google.com/presentation/d/1GKKFzX1qu0jX0g4htn8e6z1nJNzoSbPJBRVCqPu
BepA/htmlpresent
Videoda bahsi geçen siteler:
- Google Arama
Operatörleri https://support.google.com/websearch/answer/2466433?hl=en
- Google Gelişmiş Arama https://www.google.com/advanced_search
- Twitter Gelişmiş Arama https://twitter.com/search-advanced
Daha fazla site
- Google'ın Araştırma Araçları ( Doğrulama araçları da
dahil) https://newslab.withgoogle.com/process/research
- Veri Stüdyosu http://www.verigazeteciligi.com/googledan-yeni-bir-arac-veri-studyosu-
360/
- Veri Gazetecilerinin En Sık Kullandığı Araçlar http://www.verigazeteciligi.com/medya-
dunyasi-veri-gazetecileri-hangi-araclari-neden-kullaniyor/
52
6. AÇIK VERİ, AÇIK TOPLUM, AÇIK DEVLET VE VERİ
GAZETECİLİĞİ
53
Vergilerinizin ne kadarının sokak lambaları veya kanser araştırmaları için harcandığını
tam olarak biliyor musunuz?
Evinizden işinize en kısa, en güvenli ve en manzaralı bisiklet yolu nedir? Ve yol
boyunca nefes aldığınız havada neler var?
Bölgenizde bulunabilecek en iyi iş olanakları ve kişi başına en çok meyve ağacının
düştüğü yer neresidir?
Derinden önemsediğiniz konularla ilgili kararları ne zaman etkileyebilir ve kimlerle
konuşmalısınız?
Yeni teknolojiler artık bu soruları otomatik olarak cevaplamaya yönelik hizmetleri
oluşturmayı mümkün kılıyor. Bu sorulara cevap bulmak için ihtiyaç duyacağınız
verilerin çoğu kamu kurumları tarafından üretilmektedir. Bununla birlikte, sıklıkla
ihtiyaç durulan veriler henüz kullanımı kolay bir biçimde bulunmamaktadır.
Açık veri kavramı, vatandaşların yaşamlarının geliştirilmesi ve devlet ile toplumun
daha iyi çalışması için resmî ve diğer bilgilerin potansiyelinin nasıl açılacağına dair
yeni hizmetlerle ilgili bir süreci kapsar. Açık verilerin ve özellikle açık hükümet
verilerinin - herkesin herhangi bir amaçla erişebileceği ve tekrar kullanabileceği, yani
«kamuya açık» kavramı birkaç yıldır var olmuştur.
2009'da açık verilerin genel olarak kamuoyunun bilgisine açılmasına yönelik yeni
girişimleri açıklayan ABD, İngiltere, Kanada ve Yeni Zelanda gibi hükümetlerin
girişimiyle, bu ülkelere ait veriler görülebilir hale geldi. Açık Veri kavramı özellikle
'hükümetle ilgili' açık verilerin temel kavramlarına gönderme yapmaktadır. Açık
verilerin nasıl değer yarattığını ve birçok farklı alanda nasıl olumlu bir etkisi
olabildiğini bu bölümde inceleyeceğiz. Bunun yanı sıra açık verilerin nasıl üretileceği
hakkında somut bilgilere de değineceğiz.
6.1. Neden Açık Veri?
Açık veriler, özellikle de açık hükümet verileri, henüz kullanılmayan, muazzam bir
kaynaktır. Pek çok kişi ve kuruluş, görevlerini yerine getirmek için çok çeşitli veri
türlerini toplamaktadır. Hem topladığı verilerin miktarı ve merkeziliğinden ötürü, hem
de verilerinin çoğunun kamuya açık veriler olması nedeniyle hükümet verileri
özellikle önemlidir.
Açık verilerin nerelerde değerli olduğu ve örneklerin nasıl kullanılabileceğini önceden
tahmin edebileceğimiz birçok alan vardır. Bunun yanı sıra devletin kendisi de dâhil
olmak üzere açık verilerin kullanılmasından istifade edebilecek birçok farklı grup ve
kişi vardır.
Bugünkü verilerin, gelecekte nasıl ve nerede değer yaratacağını tam olarak tahmin
etmek olanaksızdır. Yine de Hükümet verilerinin değer yarattığı çok sayıda alana
işaret etmek mümkündür.
Bu alanlardan bazıları şunları içerir:
54
Şeffaflık ve demokratik kontrol
Katılım
Kendi kendini güçlendirme
Geliştirilmiş veya yeni özel ürünler ve hizmetler
İnovasyon/Yenilik
Verimliliği artırılmış devlet hizmetleri
Devlet hizmetlerinin etkililiğinin iyileştirilmesi
Politikaların etki ölçümü
Birleştirilmiş veri kaynakları ve büyük veri hacimlerindeki modellerden yeni
bilgiler
Bu alanların çoğuna örnek bulmak mümkündür. Şeffaflık açısından, Finlandiya'nın
'vergi ağacı' ve İngilizlerin 'paralarım nereye gidiyor' projeleri, vergi masraflarının
hükümet tarafından nasıl harcanacağını göstermektedir.
Kanada’da hayır işleri üzerinden 3.2 milyar dolar tutarında nasıl vergi kaçırıldığına
dair açık veri örnekleri mevcuttur. Ayrıca, Danimarka'daki gibi çeşitli web siteleri
sayesinde, parlamentodaki faaliyetleri ve kanun yapma süreçlerini izleyerek, orada
tam olarak ne olduğunu ve hangi parlamenterlerin toplantılara katılmakta olduğunu
görebilirsiniz.
Açık devlet verileri, kendi hayatınızda daha iyi kararlar almanıza ya da toplumda daha
aktif olmanızı sağlamaya yardımcı olabilir. Danimarka'daki kamu tuvaletlerini
gösteren findtoilet.dk'yi kuran bir kadın, böylece mesane sorunları yaşayan insanların
artık daha fazla dışarı çıkmak için kendilerine güvenebildiklerini gösterdi. Hollanda'da
yaşayanları çevrelerindeki hava kalitesi belirlenen bir eşiğe ulaştığında, mesajla
uyaran hizmeti de başka bir örnek olarak verebiliriz.
New York'ta köpeğinizle nerelere gidebileceğinizi kolayca öğrenebilir ve aynı parkları
kullanan diğer insanları bulabilirsiniz. İngiltere'deki 'mapumental' ve Almanya'daki
'mapnificent' gibi hizmetler, işe gidip gelme sürenizi, konut fiyatlarını ve bir alanın ne
derece güzel olduğunu hesaba katarak yaşayacak yer bulmanızı sağlar. Bütün bu
örnekler açık hükümet verilerini kullanmaktadır.
Açık verilerin ekonomik açıdan da büyük önemi vardır. Sadece Avrupa Birliği’nde
açık verinin birkaç on milyar Avro ekonomik değeri olduğunu gösteren çalışmalar
mevcuttur.
Yeni ürünler ve şirketler de açık veriyi yeniden kullanmaktalar. Danimarkalı
husetsweb.dk, finansal planlama ve iş yapabilecek inşaatçılar bulma gibi evinizin
enerji verimliliğini artırmanın yollarını bulmanıza yardımcı olur. Bu sistem kadastro
55
bilgilerinin ve devlet sübvansiyonları ile yerel ticaret siciline ilişkin bilgilerin tekrar
kullanılması üzerine kuruludur.
Google çeviri, çeviri algoritmalarını eğitmek için tüm Avrupa dillerinde ortaya çıkan
muazzam miktarda Avrupa Birliği belgesini kullanır ve hizmet kalitesini böylece
geliştirir.
Açık verilerin hükümet için de değeri bulunmaktadır. Örneğin, hükümetin
verimliliğini artırabilir. Hollanda Eğitim Bakanlığı, eğitimle ilgili tüm verilerini tekrar
kullanım için çevrim içi olarak yayımladı. Bu sayede, o güne kadar aldıkları soruların
sayısı azalırken, iş yükü ve maliyetleri de azaltmış oldular. Geriye kalan soruları
yanıtlamak da, ilgili veriler açık olduğu için artık memurlar için daha kolay hale
gelmiştir.
Açık veriler devleti daha etkin hale getirmekte ve sonuçta maliyetleri de
düşürmektedir. Hollanda Kültürel Miras Birimi, görevlerini daha etkili bir şekilde
yürütmek için verilerini etkin şekilde yayımlamakta ve Wikimedia Vakfı gibi amatör
tarihsel topluluklar ve gruplarla işbirliği yapmaktadır. Bu, yalnızca verilerin
kalitesinde iyileşme sağlamayı değil, aynı zamanda bu birimi daha efektif hale
getirecektir.
Açık verinin hem toplumsal hem de ekonomik değer yaratma biçimlerinin sayısız
örneği olsa da, burada tam anlamıyla hangi şeylerin mümkün olabileceğini henüz
bilmiyoruz. Açık veri, yeni veri kombinasyonları, yeni uygulama alanları doğuracak
yeni bilgi ve kavrayışlar yaratabilir. Örneğin 19. yüzyıl Londra’sında kolera
ölümleriyle ilgili verileri su kuyularının verileriyle birleştirerek, içme suyu kirliliği ile
kolera arasındaki ilişkiyi keşfeden Dr. Snow, bu sayede Londra'daki kanalizasyon
sistemlerinin kurulmasına öncülük ederek nüfusun genel sağlığını geliştirilmesine etki
etmiştir.
Beklenmedik bilgiler farklı açık veri setlerinin birleşiminden kaynaklanabildiği için,
bu tür gelişmelerin zamanla oluşabileceğini göreceğiz. Kamu yönetimi verilerini açık
veriye çevirdiğimizde, bu kamunun kullanılamayan potansiyelini de açığa çıkarabilir.
Tabi bu durum veriler gerçekten açıksa, yani başkaları tarafından tekrar kullanılması
için herhangi bir kısıtlama (yasal, finansal veya teknolojik) yoksa gerçekleşecektir. Bu
konulardaki her kısıtlama, kullanıcıların kamusal verileri tekrar kullanmalarına engel
olur ve bunu yapmak için yararlı yollar bulmakta zorlanırlar. Potansiyelin
gerçekleşebilmesi için kamusal verilerin açık veri olması gerekir.
56
“Açık veriler, özellikle en
yoksullar başta olmak üzere,
milyonlarca çocuğun
yaşamının kurtarılmasını ve
iyileştirilmesini mümkün
kıldı." 2014, New York
"Açık devlet yapısı gazetecileri, araştırmacıları, devlet memurlarını ve halkı devlet yapısını
irdelemeye ve iyileştirmeye yöneltir. " - Açık Veri Tanımı El kitabı
Okuma Önerileri
"Veri becerisi sizi daha iyi bir gazeteci yapar"
Yukarıda verilen başlıklar ve makale alıntısı; açık veriyle çalışan bir sivil toplum
kuruluşunu, açık devlet politikaları ile iyileştirme yoluna nasıl
gidilebileceğini, Türkiye'nin veri sağlamadaki sorunlarına değinilmiş olan bir makale
alıntısını ve bir veri gazetecisinin veri ile çalışmanın etkilerine yönelik görüşlerini
içeriyor. Peki bu görüşler neden önemli?
57
Birkaç örnek ile detaylı görelim
Britanya'da 2015 yılında Traffod adlı
bir belediye, kalp krizlerinin sık
yaşandığı bölgeleri açık veri
yardımıyla tespit ederek, o bölgelere en
hızlı ulaştırılabilecek 15
adet elektroşok alet noktası oluşturdu.
Amaç ambülans ulaşıncaya kadar kalp
krizi geçiren birine en hızlı desteği
sağlayabilmekti. Belediye bunu açık
veri uzmanları, veri analizcileri,
sağlıkçılar, yerel
yönetimlerin desteğiyle hayata geçirdi.
Ve uzmanlar bu çalışmayı yürütürken
bölgede yaşanan ölüm oranlarını,
obezite oranını, hangi tür hastalıkların ağırlıkta olduğunu ve fiziksel aktivite
olanaklarının ne olduğunu tespit ve analiz ederek hayata geçirdi. Ancak projenin
önemli taraflarından biri elektroşok aletlerinin nerede olması gerektiği ya da hangi
bölgenin en iyi nokta olabileceğini yine o civarda yaşayanların belirleyebiliyor
olmasıydı. Proje haritasını
buradan inceleyebilirsiniz: www.infotrafford.org.uk/defibrillators
Açık Veri Enstitüsü (Open Data Institute)'nün
raporlarında açık veri ile bisikletli kazalarının en
sık görüldüğü noktaların tespitiyle önlem
alınabildiği, acil durumlarda deprem, sel felaketi vb.
gibi olaylarda oluşturulan kampanyalarla
sivillerin ilk yardım servislerine nasıl etkin şekilde
yardımcı olabildiklerine yönelik örnekler de yer
alıyor. Bu örnekler kapsamında belirtmek gerekir
ki, açık veriyi kullanan, açık verilerle etkin
çalışmalar yürütüp, uygulamalar geliştiren,
haberciliğin yapısını değiştirebilecek önemli veri
gazeteciliği projelerine imza atan, açık
devlet altyapısına destek olan kurum/kuruluş ve
kişilerin sayısı her geçen yıl artıyor dünyada.
Harita: Belediyenin yerleştirdiği elektroşok aletlerinin
bulunduğu noktaları gösteren İnteraktif harita
58
Örneğin, Unicef, 2014 yılının başlarında, büyük veri analizleri sonucunda verinin
tasniflenip anlamlandırılması ile milyonlarca çocuğun hayatının kurtarıldığını
açıklamıştı.
Başka bir örnek vermek gerekirse ölümcül sonuçlar doğurabilecek depremler büyük
veri ile tahmin edilebiliyor. Veriler, ölçülebilirlikleri doğrultusunda analiz edilerek
sorunun tespitinde ciddi bir destek sağlayabiliyor.
Fakat tersi de olabileceğinden, veriyle çalışırken her zaman şüpheci olmak gerektiği
de unutulmamalıdır. Çünkü kötü bir veriye dayalı analiz sonucunda hayatlar da
kararabilir. Bu noktada kötü/hatalı veriye dayalı gazetecilik yapmak da mümkün hale
gelir ki böyle bir durumda gazeteci bunun sonuçlarıyla tek başına baş etmek zorunda
kalacaktır.
59
7. AÇIK VERİ VE TEMELLERİ
60
Bu bölümde açık veri, açık devlet, açık devlet verisi, açık yönetim ortaklığı
kavramlarının tam olarak ne olduğuna değineceğiz. Verileri açmanın önemini,
sınırlarını, açık devlet olmanın standartlarını, yarattığı ekonomiyi, nasıl hayat
kurtarabildiğini, felaketleri nasıl önleyebildiğini örneklerle ele alacağız. Türkiye'nin
açık veri endeksi ve bunun önemi ile ilgili detaylara yer verip, veri gazeteciliğinin
dünya çapında ödül almış örneklerini, hangi haber siteleri tarafından etkin şekilde
yapıldığını görerek, açık veri ile ilişkisini inceleyeceğiz.
Açık Veri: “Herhangi bir telif hakkı, patent ya da diğer kontrol mekanizmalarına tabi
olmaksızın herkes tarafından ücretsiz ve özgürce kullanılabilen, tekrar kullanılabilen
ve dağıtılabilen veridir.” (Open Knowledge Foundation - OpenDefinition.org)
Görsel: Open Data Handbook
Açık Veri Sembollerinden biri.
Açık Veri Vakfı tarafından yayınlanan https://opendefinition.org/od/1.1/tr/ web
sitesinde toplam 40 ayrı dilde, bu tanımın ayrıntıları kesin bir dille 11 maddede
sıralanmıştır.
Bu sıralamada ele alınana maddelerin başlıcalarını özetlemek gerekirse;
• Uygunluk ve Erişim: Veriler, bir bütün olarak ve makul bir yeniden üretim
maliyetini aşmayacak şekilde, tercihen İnternet üzerinden indirilerek, ücretsiz olarak
temin edilebilecek bir şekilde sunulmalıdır. Verilerin ayrıca uygun ve değiştirilebilir
bir biçimde bulunması gerekir.
• Yeniden Kullanım ve Yeniden Dağıtım: Veriler, diğer veri setleri ile karıştırılması
da dâhil olmak üzere, yeniden kullanıma ve yeniden dağıtılmaya izin veren şartlar
altında sağlanmalıdır. Makine okunabilirliği (machine-readable) olmalıdır.
• Evrensel Katılım: Herkes kullanabilmeli, yeniden kullanabilir ve yeniden dağıtabilir
olmalıdır - çalışma alanlarına veya kişi ve gruplara karşı herhangi bir ayrımcılık
olmamalıdır. Örneğin, 'ticari' kullanımını veya belirli amaçlarla (örneğin yalnızca
61
eğitimde) kullanım gibi çeşitli kısıtlamalara izin verilmemektedir. Kısacası kısıtlama
olmadan, özgürce herkes tarafından kullanılabilmelidir.
Açık olmanın ne anlama geldiğini ve neden bu tanımın kullanıldığını açıklığa
kavuşturmanın neden bu kadar önemli olduğunu merak ediyorsanız, basit bir cevap
var: Birlikte çalışabilirlik. Birlikte çalışabilirlik, çeşitli sistemlerin ve kuruluşların
birlikte çalışabilme yeteneğini gösterir (işbirliği içerisinde çalışma). Bu durumda,
farklı veri setlerini birlikte kullanma veya karıştırma becerisi ön plandadır.
Birlikte çalışabilirlik önemlidir, çünkü açık veriler farklı bileşenlerin birlikte
çalışmasına izin verir. Büyük, karmaşık sistemler oluşturmak için, bileşen oluşturma
ve onları birbirine bağlama yeteneği gereklidir. Dolaysıyla birlikte çalışabilirlik
olmadan bu imkansız hale geliyor — Babil Kulesi'nin en ünlü efsanesinde anlatıldığı
ve günümüzde de bolca örneklerini yaşadığımız üzere, iletişim kurma
yetersizliği/becerisi (birlikte çalışmak için), kulenin inşası gayretinin tümüyle
parçalanmasına neden olmuştur.
Veriler açısından da benzer bir durumla karşı karşıyayız. Verilerin (veya kodun)
"ortak"larının özü, içerdiği bir "açık" malzemenin serbestçe diğer "açık" materyal ile
karışmasıdır. Birlikte çalışabilirlik, "açık olma"nın temel pratik faydalarını
gerçekleştirmek için kesinlikle önemlidir: Farklı veri setlerini bir araya getirme ve
dolayısıyla daha iyi ürün ve hizmetler geliştirme olanağı.
Açık olmanın net bir şekilde tanımlanması, iki farklı veri kaynağından iki açık veri
seti elde ettiğinizde onları bir araya getirebilmenizi ve kendi "Babil Kulesi"nden
kaçmamızı sağlar: Çok sayıda veri setini, gerçek değerlerinin bulunduğu büyük
sistemlerle birleştirmek için çok az yeterlilik vardır veya hiç yoktur.
Open Knowledge Foundation (OKFN) ve School of Data’yı son yıllarda “Açık veri”
kavramın geliştirilmesinde en etkili kurumlar arasında referans gösterebiliriz. School
of Data düzenli olarak veri türlerine yönelik açık sınavlar, açık eğitimler düzenliyor.
OKFN, Asya, Afrika, Avrupa’da ve bazı hassas ülkelerde özellikle (Kenya, Nijerya,
Jakarta, Tanzanya gibi bölgelerde) gazetecilerin desteği ile çalışmalar yapıyor. Ciddi
sorunlar yaşayan ülkelerde örneğin temiz suyun, sağlık, tuvalet ihtiyacı gibi önemli
ihtiyaçlara erişimi sağlayabilmek için bölgede gazetecileri yetiştirerek, bu konularda
detaylı veri teminini sağlayarak, sorun tespitine gitmenin yollarını deniyor, veri
gazeteciliği projeleri geliştiriyor ve geliştirmeye devam ediyor.
62
Bu kurumların katkılarıyla Açık Veri Sivil Toplum Ağı (Open Data Civil Society
Network) oluşturma çalışmaları da başladı ve bu konuda ilk çalışmalar Makedonya ile
yapıldı.
Peki tüm bunlar ne anlama geliyor?
Neden veri gazeteciliği için “açıklık” önemli?
Dijital çağda medya endüstrisi, halk
sağlığından halkın tüketim
alışkanlığına, özlük haklarından,
eğitimde yaşanan sıkıntılara ve gelir
eşitsizliğine kadar pek çok alanda
kamunun hesap verebilir oluşunun
haber merkezlerini dönüştürdüğünü
hatta hayat kurtarabildiğini
göstermeye çalışıyor.
7.1. Açık Veri ve Açık Bilgi
Açık bilgi, açık verinin erişilebilir, anlaşılabilir, anlamlı ve birinin gerçek sorununu
çözmeye yardımcı olmasıdır.
Açık veriden değer yaratmak sorun çözer, hayat kalitesine katkı sağlar. Verinin
açılması 2005'li yılların başında güçlü bir şekilde dünya gündemine
taşındı, üzerine konferanslar, çalıştaylar ve açık kaynak projeler ve açık kaynak araçlar
geliştirilmesi teşvik edildi.
63
3 Mart Dünya Açık Veri Günü
Uluslararası Açık Bilgi Vakfı her yıl 3
Mart’ta dünya genelinde Açık Veri
Günü etkinliği düzenlemektedir. Vakfın
her yıl ayırdığı mini hibeye dünya
genelinde kurumlar, şahıslar, sivil toplum
örgütleri başvuru yapabiliyor. Fondan
yararlanmak için özgün bir açık veri
faaliyeti yapabilirsiniz.
• 2017’de 3 Mart’ta İnsan Hakları için açık veri etkinliği yürüten Dağ Medya
ekibi, 2018’de ise Hayvan Hakları için açık veri etkinliği düzenledi.
• Etkinlik bilgisi için bu formu doldurup bu haritada görünür olmasını
sağlayabilirsiniz: http://opendataday.org/
Dağ Medya’nın 2017 Açık Veri Günü etkinliği için ise
tıklayınız: https://t.co/f108AWanFV
Veri Neden Açılmalıdır?
Devletler açık veri politikaları geliştirerek, açık
veri portalları açtı. Ancak açıklık tanımına göre
maalesef dünyada yayımlanan veri setlerinin
yüzde 89'u açık değil. Bir başka ifadeyle veri
setleri açıklık tanımına göre sadece yüzde 11
oranında açık.
Şeffaflık, sosyal ve ticari değerin serbestleşmesi
ve katılımın sağlanması için verilerin açık
olmasının önemi yadsınamaz.
Veri Neden Açılır?
Şeffaflık: Demokratik toplumlarda vatandaşlar devletinin neler yaptığını bilmeye
ihtiyaç duyar. Vatandaşlar, devlet verilerine özgürce erişebilmeli ve bu bilgiyi diğer
vatandaşlarla paylaşabilmelidir. Şeffaflık sadece erişmeyi değil, aynı zamanda
paylaşım ve tekrar kullanımı da kapsamaktadır. Bir şeyin anlaşılabilir olması için
64
analiz edilmesine ve görsel olarak sunulmasına ihtiyaç duyulur. Bu da verinin açık
olması ile mümkün olur. Bu sayede veri ve veriden elde edilen anlaşılır sonuçlar
özgürce kullanılabilir ve tekrar kullanılabilir.
Sosyal ve Ticari Değerin Serbest Bırakılması: Sayısal çağda veri, sosyal ve ticari
faaliyetler için ana kaynaktır. Yerel posta servisinin bulunmasından arama motoru
yapımına kadar her şey veriye erişimi gerektirir. Bu verinin çoğu devlet tarafından
oluşturulur ya da yönetilir. Devlet elindeki veriyi açarak, sosyal ve ticari değere
dönüşen yenilikçi iş alanları ve hizmetlerin oluşmasına olanak sağlamış olur.
Katılım ve Bağlılık: Katılımcı yönetişim ya da şirketler ve örgütler için kullanıcılarla
ve takipçilerle bağlılık. Çoğu zaman vatandaşlar devletleri ile örneğin 4-5 yılda bir
olan seçim zamanlarında olduğu gibi belirli bazı zamanlarda bir araya gelmektedir.
Veriyi açarak, vatandaşların doğrudan bilgilendirilmesine ve vatandaşın karar
verilirken içinde bulunmasına daha çok olanak sağlanır. Bu şeffaflıktan da öte bir
durumdur. Bu sadece yönetişimin işleyişinde neler yaşandığının bilinmesinden çok,
vatandaşın katkı sağlayabildiği bir durumdur.
Veri Hangi Durumda Açık Sayılır?
Veri, aşağıdaki durumları karşıladığında açık veri özelliğini kazanır:
Teknik olarak Açıklık: Makineler tarafından okunabilen (machine-readable) standart
yapıya uygunluk sağlamalıdır. Bilgisayar uygulamaları tarafından alınabilmeli ve
anlamlı bir şekilde işleme tabi tutulabilmelidir.
Yasal olarak Açıklık: Açık bir şekilde lisanslanmalıdır. Herhangi bir sınırlama
olmaksızın, ticari ya da ticari olmayan kullanım ve tekrar kullanıma izin vermelidir.
7.2. Açık Verinin Yapısı
Dünya Bankasına göre açık verinin yapısı 3 unsurdan oluşmaktadır.
Etkileşimli Yayıncılık: Buradaki düşünce, devletin veriyi etkileşimli olarak çevrimiçi
koymaları gerektiğidir. Verinin konulması için her defasında istenmesine gerek
kalınmamalıdır.
Makine Okunabilirliği: Buradaki düşünce, verinin sadece ekrandan okunmasından
ziyade, bilgisayarlar tarafından işleme tabi tutulmasına imkân sağlanması gerektiğidir.
Erişime sunulan veri aynı zamanda yüksek teknik engellere takılmadan
sınıflandırmaya (sort), elemeye (sift), süzgeçten geçirilmeye (fitler) de imkân
sağlamalıdır. Diğer taraftan pahalı yazılımlar kullanılmadan erişilebilen standart dosya
yapıları kullanılmalıdır.
65
Tekrar Kullanım İzni: Buradaki düşünce, erişime sunulan verinin herhangi bir kişi
tarafından tekrar kullanımı ya da paylaşımında yasal kısıtlamaların olmaması
gerektiğidir. Genellikle devlet verileri yeniden kullanılmayı yasaklayan telif veya IP
korumaları altına yerleştirilir ve veriyi tekrar kullanacak kişilerin veri kaynağına atıf
yapmasını gerektiren açık lisans bildirisi dışında başka bir sınırlama bulunmamaktadır.
Açık Veri Türleri Neler Olabilir?
Veri Nasıl Açılır ?
66
Basit tutularak: Küçük, basit ve hızlı şekilde işlenmesi. Tüm veri setlerinin hemen
açılması gerekmez
Veri seti/setleri seçimi yapılarak: Açılması düşünülen veri setinin seçilmesi
Açık lisans uygulayarak: Veride hangi fikri mülkiyet haklarının bulunduğunun
belirlenmesi ve en uygun açık lisansın uygulanması
Veri kullanılabilir yapılarak: Verinin herkes tarafından kullanılabilir bir yapıya
dönüştürülmesinin sağlanması
Veri bulunabilir yapılarak: Açılan veri setlerinin bir liste halinde İnternet üzerinden
yayınlanarak bulunması sağlanarak
7.3. Açık Devlet Verisi, Açık Devlet ve Açık Yönetim Ortaklığı
Açık Devlet Verisi: Devlet ya da devlet kontrolündeki birimlerin ürettiği, herkes
tarafından kullanılabilir, tekrar kullanılabilir ve dağıtılabilir olan veridir.
(Open Knowledge Foundation)
Açık Devlet: Verilerin açıkça paylaşılmasının ardından açık
devlet kavramı ortaya çıkmıştır. Halkın bilgilere erişebilmesinin
yanı sıra katılımına ve işbirliğine önem verilmesi de bu sürecin
önemli unsurları arasındadır. Açık devletin bileşenleri ise şeffaflık,
katılım ve işbirliğidir.
Açık Devletin Bileşenleri
ŞEFFAFLIK: Hükümetin halka devleti nasıl yönettiğine dair bilgiler sunmasıdır. Bu
sayede hesap sorulabilir bir yapı ortaya çıkacaktır.
Açıklık hesap sorulabilir devlet yapısını destekler.
Açık devlet yapısı gazetecileri, araştırmacıları, devlet memurlarını ve halkı, devlet
yapısını irdelemeye ve iyileştirmeye yöneltir.
KATILIM: Hükümet halktan bilgi, uzmanlık istemesidir. Politikacılar edindikleri
bilgiler sayesinde daha iyi politika üretebileceklerdir.
Devletin nasıl çalıştığı hakkında daha fazla bilgiye erişiliyor olması vatandaşın bu
yapıya daha fazla katılmasını beraberinde getirir.
En iyi fikirlerin çoğu halktan gelir
67
Halkın katılımı politikayı şekillendirir.
İŞ BİRLİĞİ: Devletin ulusal sorunları çözmek, problemlerin üstesinden gelebilmek
için halk ile işbirliği yapmasıdır.
Halkın katılımıyla edinilen bilgiler sayesinde idareciler daha bilinçli kararlar
alabilmektedir.
İş birliğinde hedef, problemleri çözmek için innovative stratejiler geliştirmektir.
Açık Devletin Riskleri
Güvenlik
Kişilik Haklarının İhlali
Verilerde Tutarsızlık
Açık Devletin Fırsatları
Kurumların Veri Odaklı Çalışması
Veri İşleme Teknolojisi Gelişimine Katkı
Kitlesel Kaynak Kullanımı (Crowdsourcing)
Açık Devlet Olası Adımları
Başarılı Örnek İncelemesi
Kamu Katılımının Teşviki
Üst Düzey Açık Devlet
Stratejisi
Sorumlu Merkezi Kuruluş
Kurum Bazında Açık
Devlet Stratejisi
Kamu Talep-Tedarik-
Teşvik Döngüsü
68
Açık Devlet Web Sitelerine Dünyadan Örnekler
Video Destekli İçerik: https://www.youtube.com/watch?v=xGOiBr3JAk8
Videoda yer alan açık devlet siteleri
• https://opendata.go.ke/
• https://www.data.gov/
• http://data.gov.be/en
• https://data.gov.uk/data/search
• https://opendatanederland.org/
• http://data.norge.no/
• http://geodata.gov.gr/
• https://opengovdata.ru/
• http://data.gov.au/
• http://open.canada.ca/en
• http://www.dati.gov.it/
• http://datos.gub.uy/
Dünyada Açık Devlet Yapısı
Birçok ulusal hükümet topladıkları verilerin bir kısmını halkla paylaşmak için web siteleri
oluşturmuştur.
data.gov - Amerika Mayıs 2009.
data.gov.uk - İngiltere Eylül 2009.
data.govt.nz – Yeni Zelanda Kasım 2009.
data.norge.no – Norveç Nisan 2010.
geodata.gov.gr - Yunanistan Temmuz 2010
opengovdata.ru – Rusya 2010
69
data.gov.au - Avustralya 2011.
data.gc.ca – Kanada Mart 2011.
opendata.go.ke – Kenya Haziran 2011.
data.gov.it – İtalya Ekim2011.
datos.gob.es – İspanya Ekim 2011.
datos.gub.uy – Uruguay Kasım 2011.
data.gouv.fr – Fransa Aralık 2011.
daten-deutschland.de – Almanya Şubat 2013.
Bazı Açık Veri & Devlet Uygulamaları
Birleşik Krallık Örneği
Bu proje Kasım 2009’da Birleşik Krallık Hükümeti tarafından düzenlenen “Bize En
İyi Yolu Gösterin” yarışmasında birinci olmuştur. Bu proje ile vatandaşlar,
devlet harcamaları ile ilgili bilgilere görsel olarak ulaşabilmektedir.
http://wheredoesmymoneygo.org/
70
7.4. Türkiye’de Açık Devlet Kavramı
ŞEFFAFLIK
Kamu idareleri hizmet sunabilmek için yürüttükleri faaliyetlerde şeffaflık ve hesap
verebilirlik ilkelerini dikkate almalı ve hizmetten yararlanan kesimlerin soru ve
taleplerine yönelik tatmin edici açıklamaları yapabilmelidir. Hizmetten yararlananların
71
kamuya ait bilgilere daha kolay ulaşabilmesini sağlamak amacıyla yapılan
çalışmaların artırılması ve bu alanlarda iyileştirmeler yapılması, şeffaflık ve hesap
verebilirliğin sağlanmasında önemli adımlar olarak görülmektedir.
Şeffaflık ve hesap verebilirlik ilkelerinin sağlanabilmesinin en önemli araçları
kamuoyunun doğru ve zamanında bilgilendirilmesini sağlayacak raporlama ve
bilgilendirme mekanizmalarının kurulmasından geçmektedir. Bu raporlar ve
bilgilendirmeler sayesinde kamuoyu, idarelerin yürüttükleri hizmetlere yönelik önemli
bilgiler elde edebilecek ve kamuoyu denetimi önemli mesafe kaydedecektir.
Vatandaşın bilgilendirilmesi, bilgisizlikten kaynaklanan yanlış anlamaları ve güven
açığını ortadan kaldıracaktır.
KATILIM
Bir ülkedeki karar alma süreçlerinde ve alınan kararların uygulanmasında ilgili tüm
paydaşların etkin rol oynaması olarak tanımlanan yönetişim olgusu, dünyada yaşanan
gelişmeler paralelinde Türk kamu yönetimi anlayışında da yer bulmuştur. Yönetişim
yaklaşımının temel amacı, karar alma süreçlerine, ilgili tüm tarafların katılımının
sağlanması suretiyle alınan kararların daha rasyonel ve etkili olmasının temin edilmesi
ve yönetimin tüm aşamalarında hesap verebilirliğin ve saydamlığın artırılmasıdır. Bu
bağlamda yerel, bölgesel, ulusal ve uluslar arası düzeyde pek çok aktörün karar alma
süreçlerine dâhil edilmesi ve diyalog ortamının tesis edilmesi öngörülmektedir.
Kaynak: Kamuda Stratejik Yönetim http://www.sp.gov.tr
Başbakanlık 2011–2015 Dönemi Stratejik Planı
A2- Vatandaşa daha hızlı, kaliteli ve güvenilir kamu hizmeti verilmesini
sağlamak.
• H2.2- Hizmetlerin verimliliğini, öngörülebilirliğini ve güvenilirliğini artırarak
vatandaş memnuniyetini yükseltmek.
Temel Stratejiler:
• Hizmet sunumunun basitleştirilmesi
• Kamu hizmet sunum sürecinde ağırlığı olan idari yüklerin tespit edilerek
azaltılmasına yönelik tedbirler alınması
• Kamu hizmet standartlarının belirlenerek duyurulmasının sağlanması
• Kamu hizmet yararlanıcısının memnuniyetini ölçecek sistemlerin tasarlanması
Başbakanlık 2011–2015 Dönemi Stratejik Planı
72
A3- Şeffaf, hesap verebilir, verimli ve etkili çalışan bir kamu yönetiminin
gerçekleştirilmesine öncülük etmek.
• H3.1- Şeffaflığı ve hesap verebilirliği artırarak kamuya önderlik etmek.
Temel Stratejiler:
• Şeffaflık ve hesap verebilirliği sağlayan uygulamaların tüm kamu yönetiminde
yaygınlaştırılmasına önderlik edilmesi
• Kamuoyunun bilgi edinmesini kolaylaştıran araçların niteliklerinin geliştirilmesi ve
bu tür araçların nicelik olarak artırılması
• Faaliyet sonuçlarının kamuoyuyla paylaşılması
• “İç Kontrol” konusundaki kurumsal farkındalığın artırılması
• Usulsüzlük ve yolsuzlukların bildirilmesine ilişkin yöntemler geliştirilmesi
• Yolsuzlukla mücadele alanında bilgi düzeyinin ve farkındalığın artırılması
• Etik değerler konusunda farkındalığın artırılması
Başbakanlık 2011–2015 Dönemi Stratejik Planı
A4- Karar alma süreçlerine toplumsal unsurların ve bireylerin katılımına imkân
veren dönüşümü sağlamak.
• H4.1- Karar alma süreçlerine katılımı teşvik edecek mekanizmaları güçlendirmek ve
yenilerini geliştirmek.
Temel Stratejiler:
• Karar alma süreçlerinin bütün aşamalarında katılımcılıkla ilgili adımların net bir
şekilde tanımlanması
• Vatandaşların ve sivil toplum kuruluşlarının katılımcılıkla ilgili olarak zamanında ve
yeterli düzeyde bilgilendirilmesi
• “Düzenleyici etki analizinin” danışmaya ilişkin süreçlerinin etkin bir şekilde
işletilmesine yönelik ortamlar oluşturulması
Başbakanlık 2011–2015 Dönemi Stratejik Planı
A4- Yerel yönetimlerde etkinliği, verimliliği, katılımcılığı, açıklığı ve hesap
verebilirliği sağlamak.
73
• H4.1- Yerel yönetimlerde halkın yönetime etkili katılımını ve açıklığı sağlayacak
düzenlemeler yapılacak ve yöntemler geliştirilecektir.
• H4.2- Mahalli idarelerin finansman imkânları ve hizmet kapasitesi
kuvvetlendirilecektir.
• H4.3- Mahalli idarelerde, mali disiplin anlayışı yerleştirilecek, hesap verebilirliğin
artırılması için düzenleme yapılacaktır.
• H4.4- Yerel yönetimlerin sundukları hizmetler için ülke çapında asgari hizmet
standartları belirlenecek, standartlara uygunluk ve performans denetimi Merkezi İdare
tarafından yapılacaktır.
• H4.5- Kırsal alan yönetiminde etkinlik sağlanması için düzenleme yapılacaktır.
• Devlete ait veriler özel sektör tarafından kopyalanmamalıdır. Bu veriler kullanılarak
devlete meydan okuma gibi durumların önüne geçilmelidir.
• Devlet halktan aldığı vergileri etkin bir şekilde kullanmalıdır. Örneğin devletin
paylaştığı açık verinin düzenlenmesi maliyetli ve bu veri sadece belli bir ticari kesimin
işine yarıyorsa devlet bu veriyi kullananlardan verinin maliyetini almalıdır.
• Data paylaşımından sağlanılan gelirler kar amacı gütmeyen kurumlara aktarılmalıdır.
• Her veriye herkesin ulaşması gibi bir durum söz konusu olamaz. Bu noktada veri
kısıtlı olarak paylaşılmalı ya da kısıtlı sayıda kişi ile paylaşılmalıdır.
• Açık verilerin ulaştırılmaya çalışıldığı hedef kitle bazı verileri ek süreçlerden
geçirmeden anlayamaz (Analizler, uygulamalar). Örneğin tıbbi, biyolojik ve ekolojik
veriler vb. Bu durumlar göz önünde bulundurulmalıdır.
7.5. Açık Yönetim Ortaklığı
Her şartta veri ile çalışmak habercilikteki bilincin değişmesine olanak tanıyor ayrıca
dijital çağın sağladığı olanaklarla bunu hiç olmadığı kadar etkin hale getiriyor.
Nitekim dünyada gazetecilik ve medya hareketleri, devletlerin şeffaflaşmasının önünü
hiç olmadığı kadar açmayı hedefleyen, açık toplum, açık devlet, açık bilgi, açık sağlık,
açık kültür, açık ders, açık bilim, açık kurs gibi pek çok yeni tanımları da beraberinde
getirdi. Öyle ki Open Knowledge küresel açık veri endeksleme anketi düzenlemeye
başladı. Ülkelerin resmî kurumlarının veriyi kamu yararı için gazetecilere,
araştırmacılara, halka ne kadar açık şekilde sunduklarını ya da bunu
sağlayıp/sağlamadığını ortaya koydu. www.opengovpartnership.org’da ülkeler
nezdinde aynı hizmeti ve aynı amacı hedefliyor. Türkiye incelendiğinde, Türkiye bu
74
oluşuma 2012’de imza atarak daha şeffaf olacağını, yolsuzluklarla mücadele edeceğini
beyan ediyor.
Açık Yönetim Ortaklığı: 20 Eylül 2011 tarihinde kurulmuş olan bir girişimdir.
Girişimin temel hedefi saydamlık ve hesap verilebilirliğin artırılması ile yolsuzlukla
etkin bir biçimde mücadele edilmesi, vatandaşların ve sivil toplumun kamusal karar
alma ve uygulama süreçlerine daha fazla katılımının sağlanması, açık ve etkin bir
kamu yönetimi için teknolojik imkânların daha fazla kullanılması ve vatandaşların
devlet karşısında daha güçlü konuma getirilmesidir.
Açık Yönetim Ortaklığına dâhil olmak isteyen ülkelerin öncelikle açık yönetimle ilgili
asgari yeterlilikleri karşılamaları ve Açık Yönetim Ortaklığı Bildirisini kabul etmeleri
gerekmekte. Ortaklık için ilk adım olan asgari yeterliliklerin karşılanması ile
kastedilen ise hükümetlerin dört temel alanda Mali Şeffaflık, Bilgi Edinme Hakkı,
Gelir ve Mal Bildirimi, Vatandaş Katılımı belirlenmiş olan kriterlere uyum
sağlamasıydı. Türkiye 20 Eylül 2011’deki resmi açılış töreninde Açık Yönetim
Ortaklığı Bildirisini kabul ederek ortaklığın bir parçası olmuştur. Bu süreçte yani
2011'den günümüze Türkiye, söz verdiği www.saydamlik.gov.tr, www.harcama.gov.tr
ve www.duzenleme.gov.tr sitelerini eylem plan takvimine göre henüz hayata
geçirememiştir.
22 Eylül 2016 tarihinde Türkiye’nin Açık Yönetim Ortaklığı Statüsü Pasif
duruma alınmıştır. Yolsuzlukla mücadele ve şeffaf yönetim anlayışının geliştirilmesi
kapsamında, Türkiye’nin de üyesi olduğu Açık Yönetim Ortaklığı’nın Yürütme
Komitesi Türkiye’nin 2014’ten bu yana bir eylem planı sunmamasına bağlı olarak
75
üyeliğinin pasif duruma alındığını açıkladı.
7 Nisan 2017 tarihi
itibari ile BİMER'e
yapılan başvuru
sonucunda
Türkiye'nin AYO
durumuna yönelik
aktarılan yanıt:
10 Ekim 2017 itibari ile Türkiye üyelikten çıkarıldı: Türkiye Açık Yönetim
Ortaklığı üyeliğinden çıkarıldı. Geçtiğimiz yıl Eylül ayında üyeliği pasif konuma
alınmıştı. Açık Yönetim Ortaklığı yürütme kurulu karar raporu dün yayımlandı.
Raporda Türkiye’nin 2016’da pasif konumu sonrası söz verdiği süreci yürütemediği,
standartlar ve kriterlere yönelik faaliyet yapmadığı ve konuyla ilgili bir bilgilendirme
yollandığı ama sonuç alınamadığına değiniliyor. Türkiye’nin bu sebeple üyelikten
çıkarıldığı raporlanıyor.
76
• Başbakanlığa Nisan ayında konu ile ilgili yapılan bilgi edinme başvurusunda ise
olağan üstü hal koşulları neden olarak gösterilmiş, yavaş bile olsa sürecin devam ettiği
belirtilmişti. Oluşum yolsuzlukla mücadele ve şeffaf yönetim anlayışının
geliştirilmesini
kapsıyor.
Türkiye 2011’de
ortaklığa
katılmıştır.
Ancak Türkiye
Türkiye’nin
2014’ten bu yana
bir eylem planı
sunamadı.
AYO Yürütme
Kurulu’nun Türkiye’nin
Amerika Büyükelçisi
Serdar Kılıç’a
aktardığı mektup şöyle:
OGP sayfasında yer alan
mektupta hiçbir eylem
planı yapılmadığı için
üyelikten Türkiye’nin çıkarıldığı, Türkiye’nin hesap verebilir ve şeffaf yönetim anlayışının
geliştirilmesi, yolsuzlukla mücadele edilmesi, vatandaşların ve sivil toplumun karar alma
süreçlerine aktif katılımının artırılması yolunda tekrar karar alması hakkında temenniye yer
veriliyor.
Açık Yönetim Ortaklığı (Open Government Partnership – OGP)
Açık Yönetim Ortaklığı (Open Government Partnership – OGP) politika yapım
süreçlerinde hesap verebilir ve şeffaf yönetim anlayışının geliştirilmesi, yolsuzlukla
mücadele edilmesi, vatandaşların ve sivil toplumun karar alma süreçlerine aktif
katılımının artırılması ve sivil toplum ile hükümet arasındaki diyaloğun
güçlendirilmesi gibi amaçlarla 2011 yılında kurulmuştu. Kurulduğu yıl Ortaklığa
katılan Türkiye, üç başlıktan oluşan bir Eylem Planı hazırlamıştı; Kamuoyu ile Bilgi
Paylaşımı, Politika Yapma ve Karar Alma Süreçlerine Katılım ve Etkin İşbirliği,
Farkındalık Artırıcı Faaliyetler Düzenlenmesi ve Taraflar Arasında Diyaloğun
Artırılması.
77
Şekil 2Açık Yönetim Ortaklığı (Open Government Partnership ) Yürütme Kurulu- 20 Eylül 2017 /New York
Şekil 3Görsel: http://www.igb.gov.tr ‘den alınmıştır.
78
Şekil 4Ekran Görüntüsü: http://www.opengovpartnership.org/country/turkey Turkey bölümünden alınmıştır.
7.6. Açık Veri Endeksi
Küresel Açık Veri Endeksi
Uluslararası Açık Bilgi Vakfı (International Open Knowledge Foundation (OKİ)
tarafından 2013 yılında yapılmaya başlanan Küresel Açık Veri Endeksi (Global Open
Data Index), dünya genelinde ülkelerin temel veri paylaşımında teknik ve yasal olarak
ne kadar açık olduklarını ölçmeyi hedeflemektedir. Ülkeler bilgiyi çeşitli formatlarda
sunmak zorunda değillerdir ancak son yıllarda büyük verilerden yaratılan değerler,
ülkelerin veri tabanlarına ulaşabilme olanakları bu konuyu küresel ölçekte bazı
ülkelerin gündemine taşımakta. Bu endekste ülkelerin kendilerini hem kıyaslama şansı
bulabildikleri hem de her yıl nasıl daha etkin şekilde açıklık kriterlerine
uyabileceklerine yönelik bir kolaylaştırıcı rol üstlenmekte. Endeks kitle kaynak
desteği ile hazırlanmaktadır.
79
Türkiye bölümü ise 2014'den bu yana Kadir Has Üniversitesi, Yeni Medya Bölümü
Veri Gazeteciliği dersi alan öğrencilerin katkılarıyla oluşturulmuştur. 2016 endeksi de
tamamlandı ancak sonuçlar henüz açıklanmadı.
Küresel Açık Veri Endeksi 2015 Sonuçlarına göre Tayvan birinci sıradadır.
Endeks Nasıl Oluşturuluyor?
Küresel Açık Veri Endeksi, hükümetler tarafından yayınlanan (veritabanları) içerikler
üzerinden hazırlanan kriterler baz alınarak ölçülüyor. Örneğin işsizlik verileri, GSYİH
verileri ulusal istatistik kurumunda yer alıyor mu, güncel mi, aylık olarak yükleniyor
mu, nüfus verileri yılda bir güncelleniyor mu? vb. kriterler üzerinden ölçülüyor
açıklık.Tabii ki teknik olarak açık mı bunlar da önemli kriterler arasında
(http://index.okfn.org/methodology)
Verisetleri kriterlere uygun ise aşağıdaki 9 soru üzerinden ne kadar açık olup
olmadığı puanlanıyor:
-Veri mevcut mu?
-Veri dijital formda mı?
-Kamuya açık mı?
-Veri ücretsiz olarak kullanılabilir mi?
-Veri çevrim içi olarak mevcut mu?
-Makine okunabilirlik mümkün mü?
-Veri toplu olarak mevcut mu?
-Veriler açık lisanslı mı?
-Veri güncel ve tarih bazlı güncelleniyor ve sağlanıyor mu?
80
8. AÇIK VERİ ENDEKSİNDE TÜRKİYE
81
Devletlerden bilgi edinme hakkı kapsamında devletin kamu verilerine erişimi kolayca
sağlaması Veri Gazeteciliği’nin sürdürülebilirliğini de destekliyor; çünkü Veri
Gazeteciliği projeleri çoğunlukla açık veriye ihtiyaç duyuyor. Yüksek kamu yararı
taşıyan gizli kaynakların kullanımı başka bir konunun başlığı olarak ele alınabilir ama
bu alanda üretilen projeler çoğunlukla herkesin rahatlıkla ulaşabildiği bir mantık ile
yürüyor.
Açık toplum olabilmek açık, şeffaf, hesap verilebilir, hukuk sisteminin de doğru
işlediği, gazeteciliğin de özgürce çalışma yapılabildiği, ifade özgürlüğünün olduğu,
yolsuzlukların da, hükümetlerin devlet hazinesinden ne kadar harcama yaptıklarının da
detaylarına kadar gösterebilen zincirleme bir ilişkiyi içeriyor. İnternet’i kontrol altına
alan devlet sayısı artarken, medya endüstrisinin kendi içinde “açıklık savaşı” vermesi
bu sebeple Veri Gazeteciliği’ni daha fazla önemli kılıyor.
http://global.census.okfn.org adresi üzerinden takip edebileceğiniz Küresel Açık Veri
Endeksinde, 2013-2016 yılları arasında Türkiye ve diğer ülkelerin yıllara göre «açık
veri» endeksini karşılaştırmak mümkün. Bu proje açık veriyi savunanlar ve bu konuya
dikkat çekenlerin katılımıyla gerçekleştirildi.
2013 yılına ait endekste Türkiye ile ilgili henüz bir veri girişi yok.
Open Knowledge tarafından dünya genelinde ülkelerin katılımıyla oluşturulan 2014
Küresel Açık Veri Endeksi’nin Türkiye editörlüğünü genç veri gazetecisi Berkin
Akkocaoğlu ve Pınar Dağ üstlenmişti.
Endeks verilerinin kapsamı incelendiğinde, ülkeler için yanıt verilmesi/temin
edilmesi/doğrulatılması gerekenler şöyle:
• Toplu Taşıma Saatleri, Devletin Bütçesi, Devletin Harcamaları, Seçim
Sonuçları, Şirket kayıtları, Ulusal Harita, Ulusal İstatistikler, Mevzuat/Kanun, Posta
Kodu/Zip Kod, Kirlilik ve Emisyon değerlerine yönelik veri setleri, açık verilerin
mevcut olup olmadığına yanıtlar aranıyor. Tüm bu bilgiler açık mı, erişilebilir mi?
Öyle ise nerede? Uzantı, kaynak, dosya vb.. vd.
• Bu ve benzeri tüm kategorilerdeki gelişimlerin kaynak göstererek ve doğrulatılarak
sistem üzerinde belirtilmesi gerekiyor.
82
Şekil 5Endeks değerlerinin ortalamaya etkisi (2013)
Açık Veri Endeksi
2015 Açık Veri Endeksi sonuçlarına göre, dünya genelinde pek çok ülkenin temel
bilgileri vatandaşlarına ve iş dünyasına açıklık standartlarına göre açmadığı görülüyor.
Açık verideki potansiyel faydanın 1 trilyon doların üzerinde olduğu öngörülüyor
ancak yavaş ilerleyen süreç bu önemli fırsatın yok olma riskini de doğuruyor. 2015
endeksine göre Tayvan açık veride birinci sırada.
Tayvan, 2014 yılı endeksinde 11. sırada yer alırken, 2015 yılında yüzde 78 ile birinci
sırada yer aldı. Britanya, Danimarka, Kolombiya ve Finlandiya da açıklıkta listenin
başında olan ülkeler arasında. Türkiye ise temel devlet verilerinde yüzde 37 açık ve
listede 47.sıraya yer alıyor. 2014 yılında ise 30.sırada ve yüzde 53 açıktı. Listenin en
altında ise Saint Kitts ve Nevis Federasyonu (Karayipler’deki Leeward Adalarında
bulunan iki adadan oluşan federal bir ülke), Libya, Suriye de yer alırken, en altta ise
verileri sadece yüzde 3 açık olan Myanmar yer alıyor.
83
Şekil 6 - 2015 Açık Veri Endeksinde Türkiye
Türkiye, temel devlet verilerinde yüzde 37 açık ve listede 47. sıraya yer alıyor.
2014 yılında ise 30. sırada ve yüzde 53 açıktı. (Veriler açıklandıkça sıralamalar da değişebilir)
>> Küresel Açık Veri Endeksi ülke karşılaştırmalarını buradan inceleyebilirsiniz…
Türkiye Küresel Açık Veri Dizini 2015
84
2016 Açık Veri Endeksi
5 Mayıs 2017'de yeni metodoloji ile açıklanan 2016 Açık Veri Endeksi 94 ülkede
gerçekleştirildi ve Türkiye yine 47. sırada yer aldı. Metodoloji değişikliği olduğu için
sitede yıllara göre yapılan karşılaştırılmalarda 2016 yılı bulunmuyor.
2016 yılı Açık Veri Endeksi’nin ilk sırasında Avustralya ve Tayvan bulunurken,
Türkiye 45.sırada yer aldı. Kuruluşun resmî sitesinde yayınlanan liste 94 ülkenin
tamamı incelenebilir.
Kadir Has veri gazeteciliği öğrencileri ve TÜİK’den de yardım alınarak tamamlanan
2016 endeksinin Türkiye bölümünde ise devlet harcamaları bölümü geçen yıl da
olduğu gibi yine yüzde 10 seviyesinde açık. Türkiye İstatistik Kurumu verileri ise
geçen yıl olduğu gibi yine yüzde 85 ile listede verilerin en açık olduğu devlet kurumu
olarak yer alıyor.
Endeks gazeteciler , sivil toplumcular, akademisyenler için oldukça yararlı bir veri
kaynağı konumunda. Ulaşılamayan ya da araştırması yapılan bir konu, habere yönelik
veri seti kaynağının açık olup olmadığına yönelik hızlı yanıt alabilmenin yollarından
biri. Ayrıca veri setleri CSV ve JSON formatlarında indirilebiliyor. Ayrıca API* da
mevcut.
* API (Application Programming Interface), bir uygulamaya ait işlevlerin başka bir
uygulamada da kullanılabilmesi için oluşturulmuş bir arayüzdür.
85
2016 Açık Veri Endeksinde Türkiye
Şekil 7https://index.okfn.org/place/tr/
Açık Veri Barometresi Raporu
Açık verilerin yaygınlaşmasını esas alan bir diğer vakıf olan World Wide Web Vakfı
Açık Veri Barometresi raporunu 2017 yılında yayınladı. Geçen yıl dördüncü edisyonu
yayınlanan raporda genel bulguları incelenen hükümetlerin/ülkelerin açıklık
hedeflerine doğru ağır adımlarla ilerlediklerini gösteriyor. Ülkemizin açık veri
konusundaki durumu ise pek iç açıcı değil.
Açık Veri ve Veri Gazeteciliği Derneği (AVVGD)
tarafından tamamı Türkçe’ye tercüme edilen rapor, 115
ülke ve yetki alanını kapsayan geniş bir çalışma. Son
baskından bugüne açık veri politikalarına yönelik
kapsamın yüzde 25 arttığını paylaşan WWW Vakfı, bölge
bölge çalışma yapılan etkin ülkelerin Kanada, İsrail,
Kenya, Kore, Meksika ve Britanya olduğunu paylaşıyor.
Raporun bulgularına göre bölgesel şampiyonlar
gösterdikleri istikrarlı ilerlemeyle öne çıkıyor ancak genel
olarak hükümetlerin veri açma taahhüdünde yavaşlama
ve durgunluk var. Hatta bazı durumlarda ilerleme
kaydedilmediği görülüyor.
86
Açık Veri Barometresi Raporu 2015
Şekil 8https://opendatabarometer.org/4thedition/detail-country/?_year=2015&indicator=ODB&detail=TUR
Açık Veri Barometresi Raporu 2016
Şekil 9https://opendatabarometer.org/4thedition/detail-country/?_year=2016&indicator=ODB&detail=TUR
87
Açık Veri Barometresinde Türkiye
Hükümet veri setlerinden yüzde 90’ı açık değil
2017 yılında yayımlanan 4.raporun önemli bulgularını sıralayacak olursak;
• Hükümet veri setlerinden yüzde 90’ı açık değil .
• Ankete katılan 115 hükümetten 79’unun açık hükümet veri portalı olmasına rağmen,
çoğu zaman en kapsamlı veriler resmi açık veri portalı dışındaki kaynaklarda
yayınlanıyor.
• Ukrayna, Arjantin, Filipinler, Burkina Faso ve Tanzanya gibi ülkeler bu sayıdaki
puanları ve sıralamalarında büyük ilerleme kaydettiler.
• Bütçe, şirket kayıtları, harcamalar, ihaleler, arazi mülkiyeti konularında gerçekte açık
verinin bulunduğu sınırlı sayıda hükümet bulunuyor. Bunlar yolsuzlukla mücadele ve
hükümetin hesap verebilirliğini sağlamak için kilit olan veri setlerinden oluşuyor.
• Mevcut verilerin üçte birinden daha azı günümüzde herhangi bir biçimde çevrimiçi
olarak kullanılmakta.
• Çalışmadaki veri setlerinin yalnızca yüzde 24’ü kolayca toplu olarak indirilebilir
durumda.
• WWW Vakfı, hükümetlerin/ülkelerin mevcut verileri çevrimiçi halde ve makine
okunabilirliğine uygun halde sunmasını öneriyor. Toplu halde ve ücretsiz olarak
sunulması gerektiğini de ekliyor.
Açık Veriye Zaman İçinde Gösterilen İlgi (Dünyada)
88
Türkiye’de Açık Veriye Zaman İçinde Gösterilen İlgi
Bölgesel İlgi
Search GoogleTrend
89
Google’da en çok aratılan Açık Veri kavramları
90
Dünya üzerindeki Veri Merkezleri
Küresel Açık Veri Endeksine göre dünya üzerinde 104 ülkede 3 bin 625 veri merkezi
bulunuyor- DataCenterMap
Şekil 10Türkiye’deki veri merkezleri
91
Türkiye’deki Veri Merkezleri
Açık Veri Pratiği: Türkiye
Bu bölümde Türkiye'nin 1800'lü yıllardan günümüze sosyal, ekonomik ve çevresel
gelişmelerini açık verileri kullanarak gözlemleyip, açık veri pratiğini
gerçekleştireceğiz. Bu pratikte, 2005 yılında Gap Minder Vakfı'nın geliştirdiği Gap
Minder aracından yararlanacağız.
Pratik 1:
Türkiye'de çocuk ölümleri düşüyor
mu?
Türkiye'de 1800-2015 yılları boyunca
değişiklik gösteren çocuk ölüm oranları
ve kişi başına düşen gelir sayısı. Yatay
eksen kişi başına düşen geliri, düşey
eksen ise 1000 doğumda görülen ölüm
oranını gösteriyor. Turuncu küre, yıllar
geçtikçe en tepedeki yerinden 2015'li
değerlere düşmüş durumda.
92
Dinamik grafiği Gap Minder'da inceleğiniz:
www.bit.ly/29IiQEO
Veri kaynağı:
https://docs.google.com/spreadsheets/d/1IbDM8z5XicMIXgr93FPwjgwoTTKMuyLfzU6
cQrGZzH8/pub?gid=1
Pratik 2: Türkiye'de beklenen yaşam süresi yıllar içinde artıyor mu?
Türkiye'de 1800-2015 yılları boyunca değişiklik gösteren beklenen yaşam süresi ile kişi
başına düşen gelir sayısı. Yatay eksen kişi başına düşen geliri, düşey eksen ise beklenen
yaşam süresini gösteriyor. Turuncu küre, beklenen yaşam süresinin yıllar geçtikçe 2015'li
değerlere yükseldiğini gösteriyor.
Dinamik grafiği Gap Minder'da inceleğiniz:
www.bit.ly/29ImDBY
Veri kaynağı:
https://docs.google.com/spreadsheets/d/1H3nzTwbn8z4lJ5gJ_WfDgCeGEXK3PVGcNj
Q_U5og8eo/pub?gid=1
93
Sıra sizde…
Yukarıdaki örnek pratiklerde olduğu gibi Gap Minder'ı kullanarak, Türkiye ile ilgili en az iki
konu hakkında pratik yapınız ve forumda linkini açıklamayla birlikte paylaşınız.
İsterseniz yeni geliştirilen Kabarcık Grafiği üzerinden de çalışabilirsiniz
94
9. VERİ GAZETECİSİ GİBİ DÜŞÜNMEK
95
96
Veri ile gazetecilik yapmak, haberi olabilecek en iyi şekilde anlatmaktır. Farklı
disiplinleri de kullanarak geliştirilen bu süreç geleneksel gazeteciliğe göre daha etkili
şekilde haberi anlatmaktır - ki bu zahmetli ve maliyetli bir çalışma biçimidir. Veri
Gazeteciliği dünyada gazeteciliğin tarihi kadar eskidir. Daha öncede değinildiği üzere
Guardian gazetesinin 18. yüzyılda basılmış arşiv yayınlarını incelendiğinizde de analiz
edilmiş verilerle, grafiklerle karşılaşıyorsunuz, Cumhuriyet Gazetesi"nin ilk
sayılarına baktığınızda da TÜİK verileri ile geliştirilmiş haberleri sarı sayfalarda
görüyorsunuz.
Yandaki örnek ise 1930 yılından
(11 Temmuz 1930),
Hakimiyeti Milliye Gazetesi bir
bankanın verilerini kullanarak
okuyuculara neden
tasarruf yapmaları
gerektiğini çizimle anlatıyor: "Hayat
Yokuşu" / Kaynak: Geçmiş Gazete
Dünya Nasıl Tanımlıyor?
“Veri Gazeteciliği bilginin düzenlenebilir, filtrelenebilir olarak kullanılabilmesi.”
Jeremy Gilbert, Washington Post
“Veri Gazeteciliği bilgiyi organize ederek, günümüz dünyası için anlamlı hale
getirmek”
Michelle Minkoff, Associated Press
“ Veri Gazeteciliği; veriyi gazetecilik için kullanmak”
Alberto Cairo, Miami Üniversitesi
* Dünya Nasıl Tanımlıyor? https://www.youtube.com/watch?v=i9-oFBAd0Xs
Neden şimdi önem kazanıyor?
Araç: Çevrimiçi araçlara erişimin kolaylaşması. Çok büyük teknik bilgi gerekmeden
kolayca etkileşimli haritalar, grafikler ve görsellerin yapılmasını sağlayan araçların
artması
Açık Veri: Devletlerin kamusal verilerini herkesin kullanımına açması,
veritabanlarına erişim kolaylaşması (Açık Devlet, Açık Devlet Verisi, Açık Yönetim
Ortaklığı Örneği)
97
Güven: Doğruluğuna emin olunan verilerin haberlerde kullanımı daha fazla şeffaflık
sağlayarak gazeteciyle okuyucu arasında güven sağlıyor
Farklı meslek gruplarının dahil olması: Gazeteciliğin/haberciliğin alet çantasına
yeni araçlar, yeni meslek disiplinlerinin ekleniyor olması (İstatistik, Veri Bilimi,
Programlama,Tasarım vb.vd)
Veri Gazeteciliği Yapma Süreci
Veri Toplama > Veri İşleme > Görselleştirme > Hikaye/Haber
Paul Bradshaw'ın piramidi de veri gazeteciliği yapma sürecini iyi anlatan örneklerden
biridir:
Derleme: Veri gazeteciliği iki şekilde başlar. Ya veri gerektiren bir sorunuz vardır ya
da soruya ihtiyaç duyan bir verisetiniz. Bunlardan hangisi geçerli olursa olsun onu
bir veri gazeteciliği hareketi olarak tanımlayan şey verinin derlemesidir.
Temizleme: Veriye sahip olmak sadece bir başlangıç. İçerdiği hikayelerden emin
olmak verinin kalitesine güvenebilmek anlamına gelir - ve bu da temizleme demektir.
Genel anlamda temizleme iki şekilde olur:
İnsan hatalarını kaldırmak ve veriyi kullandığınız başka bir veriyle tutarlı bir formata
çevirmek.
İçerik: Diğer kaynaklara olduğu gibi, veriye de güvenilemez. O da kendi geçmişi,
eğilimleri ve objektiflerini barındırır. Yani diğerleri gibi, verinize de sorular
sormalısınız: Kim biraraya getirdi, ne zaman, ne amaçla?
Nasıl oluşturuldu? Kim açıklayabilir?
Birleştirme: İyi hikayeler tek bir verisetinde bulunabilir, fakat sıklıkla iki verisetini
birleştirmeniz gerekecektir. Buna rağmen, tek kaynaklı ve çok-kaynaklı hikaye
seçenekleriniz olsa, hangisini tercih ederdiniz?
İletişim kurma: Veri gazeteciliğinde, bu noktada yapılacak en açık şey - bir haritada,
grafikte, bilgi grafiğinde ya da bir canlandırmada görselleştirmektir. Fakat burada,
98
- klasik anlatıdan, haber uygulamaları, olay incelemesi ve
kişiselleştirmeye, düşünülmesi gereken daha pek çok şey bulunuyor.
Örnekler…
#PanamaFiles #PanamaBelgeleri
Uluslararası Araştırmacı Gazeteciler Konsorsiyumu (ICIJ) Panama’da kayıtlı bir
hukuk firmasının 40 yılı aşkın süredir tuttuğu kayıtlara ve belgelere ulaştı. Kuruluş,
kamuoyuna ifşa edilen belgeleri, vergi cennetlerine bugüne kadar indirilmiş en büyük darbe
olarak görüyor.
99
Veri Gazetecisi / Veri Muhabiri Kimdir?
Gazeteciliğin Geleceği: Veri Gazeteciliği E-kitabında yer alan tanıma göre, veri
gazeteciliği araçlarını kullanabilen, veriyi habercilik için analiz edip, ondan etkin
şekilde hikaye anlatma yeterliliğine sahip kişilere veri gazetecisi (data journalist)
denir. Aşağıdaki linkte çeşitli basın kuruluşlarında çalışan veri gazetecileri yer alıyor.
Şekil 11 Görsel: Twitter ekran görüntüsüdür/2016
Veri Gazeteciliği Siteleri ve Veri Gazetecileri
Video Destekli İçerik:https://www.youtube.com/watch?v=t3HRwXVPk5Y
Videoda Yer Alan Siteler
Kenya.org, Kenya: http://internewskenya.org/dataportal/content?page=stories
Chinafile, Çin: http://www.chinafile.com/
Nacion, Kosta Rika: http://www.nacion.com/gnfactory/investigacion/periodismo-
datos/
Indiaspend,Hindistan:http://www.indiaspend.com/
Caixin, Çin: http://english.caixin.com/
Newvision, Uganda http://www.newvision.co.ug/
Propublica, ABD: https://www.propublica.org/data/
100
Dağ Medya, Türkiye : http://dagmedya.net/?s=Veri+Gazetecili%C4%9Fi
Fivethirtyeight, ABD: http://fivethirtyeight.com/
Washingtonpost, ABD:
https://www.washingtonpost.com/news/wonk/wp/category/data-visualization/
Zeit Online, Almanya: http://blog.zeit.de/open-data/
indy100 Independent, Britanya: http://indy100.independent.co.uk/
The Guardian Datablog, Britanya: https://www.theguardian.com/media/data-
journalism
Newyorktimes, Upshot, ABD: http://www.nytimes.com/section/upshot
Veri Gazeteciliği Araçları Nelerdir?
Veri gazetecileri çalışırken çok çeşitli araçlar kullanabilme şansına sahipler. Bunların
bazıları hem ücretsiz olabiliyor hem de kod bilgisi gerektirmiyor. En fazla kullanılan
araçlardan başında veriyi düzenlemek, temizlemek ve analiz etmek için, kullanılan
elektronik tablolar (Excel, Spreadsheet) yer alıyor. Bunun dışında;
SQL, veritabanı yönetim sistemi olup birden fazla veri setinin ya da daha büyük veri
kümelerinin sorgulanmasında yardımcı oluyor.
Open Refine, veriyi temizleme, dağınık veriyi düzenleme ve kötü formatları tespit
ederek dönüştürmeye yarıyor.
Şekil 12Görsel: http://gijn.org/2016/04/25/a-data-journalism-experts-personal-toolkit/
R kodu, Google Fusion tabloları veri görselleştirme açısından oldukça kullanışlı araçlar.
QGIS de haritalama araçları arasında yer alıyor. Bu araçlara yüzlercesi eklenebilir ancak veri
gazetecileri ile yapılan röportajlarda sıklıkla dile getirilen nokta; araçların değil, tekniğin
önemli olduğu, anlatılan hikayenin ne anlattığı ve nasıl anlatıldığının önemli olduğudur.
101
Veri İşleme (Temizleme Süreci)
Sıralama ve filtreleme/temizleme için farklı yazılımlar kullanılabilir. Aşağıdaki tablo
temizleme işlemi için kullanılan yazılımların işlevlerini gösteriyor.
(Spreedsheet, Google Spreadsheets, Open (libreoffice, Microsoft Excel, Google Refine ,
Data Wrangler, CometDocs, Ms Excel, Mr. Data Converter vb)
Veri gazeteciliği ekip işidir…
Tek Kişi - Bir kişi tek başına veri güdümlü projeler üretebilir. Çünkü
OpenRefine, Datawrapper, Tableau, Google Fusion Tables, CartoDB gibi bir dizi
ücretsiz araç var.
İki Kişilik Ekip - Guardian’ın Amerika’daki veri gazeteciliği ekibinin ödül alan
çalışması LGBTI hakları Rehberi
4-6 Kişilik Ekip - Oldukça etkili projeleri kısa sürede üretebilirler. WYNC’nin Sandy
Fırtınası örneği verilebilir.
Büyük Ekipler (20 üstü) - Stratejileri olan, haberi anlatmanın yöntemlerini en fazla
geliştiren, çevrimiçi haberciliğin çok farklı olabileceğini de gösteren ekiplerden
oluşuyor. New York Times’tan 2012 Olimpiyatları örneği gösterilebilir.
Veri Gazeteciliği Ödülleri
Veri gazeteciliği kavramı 2000'li yıllarda medya ve akademik dünyada terminoloji kazanmaya
başladığından beri hem bu alanı teşvik etmek hem de üretilen projelere bir standart
getirebilmek adına dünyanın ilk ulusal ve uluslararası veri gazeteciliği ödülleri verilmeye
başlandı.
Veri Gazeteciliği Ödülleri (Data Journalism Awards - DJA), Global Editors Network
(GEN) tarafından 2012 yılında başlatılan ve yönetilen, dünya çapında veri gazeteciliği
alanında en iyi çalışmaları inceleyen ilk uluslararası yarışmadır. Her yıl dünya genelinde
102
başvuruların çoğalarak arttığı yarışma, dünya medyası ve habercilerinin, veri ile çalışma
disiplinlerinin her geçen gün daha fazla artarak geliştiğini gösteriyor.
Ödüllü Bazı Veri Gazeteciliği Projeleri
Veri Gazeteciliği - En İyi Hikaye Dalında Ödül Alan Proje – 2014
The Migrants File
Proje, Paris, Stokholm ve Berlin merkezli Avrupa’nın en etkili ve en fazla kamu yararı
taşıyan veri güdümlü projelerini üreten Journalism++ ekibi dahil yaklaşık 15 Avrupa
ülkesinden gazetecinin katkısıyla hayata geçirildi. Proje, Avrupa Birliği (AB) üyesi
devletlerin göç politikalarının binlerce kadını, erkeği ve çocuğu nasıl ölüme sürüklediğini
ortaya koyuyor.
Çok çarpıcı sonuçları içeren veri güdümlü projenin çıktıları arasında, kayıp ve ölmüş
olanların tahmin edilenden, yüzde 50 daha fazla olduğu belirtiliyor; 2000 yılından günümüze
23 bin sığınmacının Avrupa’ya giderken öldüğünü ve hangi ülkelerden hangi şartlarda
yolculuk ederek hayatlarının son bulduğunu içeriyor. Her üç ayda bir düzenli olarak
güncellenen proje güzergahlarında Türkiye de var. Avrupa Birliği dahil pek çok Avrupa
ülkesinde yaptırımlar sağlansa da ölümler ve kayıplar devam ediyor.
103
# The Migrants File
Teknik açıdan bu tür veri gazeteciliği projelerinde en dikkat çekici unsurlardan biri de
verilerin çoğunlukta herkesin erişimine açık olmasıdır. Veri gazetecileri hem diğer
gazeteciler yararlanabilsin hem de bir eksiklik veya hata olması durumunda bunun
fark edilebilmesi için büyük emeklerle toplanan ve analiz edilen verileri kamuya açık
şekilde yayımlayabiliyorlar. Bu proje de onlardan biri. Proje açık veri tabanlı lisansa
sahip olup tüm veriler kamuoyuna açılmıştır.
#Swissleaks
Veri Gazeteciliği - En İyi Araştırmacılık Dalında Ödül Alan Proje – 2015
Swissleaks
2015 yılının Uluslararası Veri Gazeteciliği en iyi araştırma dalında ödül alan proje
SwissLeaks oldu. Uluslararası Araştırmacı Gazeteciler Konsorsiyumu tarafından, Britanyanın
Uluslararası Bankası HSBC'nin varlıklı müşterilerinin İsviçredeki hesapları üzerinden vergi
kaçırmalarına yardımcı olduğu ortaya çıkartılmış ve yapılan haberlerde bankanın, 10 ülkeden
30 binden fazla hesap aracılığıyla, zengin müşterilerin vergiden kaçmasına yardım ettiği
verilerine de yer verilmişti.
Türkiye'nin de olduğu birçok ülkeden binlerce müşterisinin vergi kaçırmasına olanak veren
yöntemler kullanıldığı detaylandırılıyordu. Bankanın İsviçre'deki merkezinde, İsviçre'den 11
bin 235,Fransa'dan 9 bin 187, Britanyadan 8 bin 844, Brezilya'dan 8 bin 667, İtalya'dan 7 bin
Görüntü: The Migrants File ekran görüntüsüdür. Avrupa'ya
giderken ölen/kaybolan insanların yolculuk etmeye
başladıkları ülkeler.
104
499, İsrail'den 6 bin 554, ABD'den 4 bin 183, Arjantin'den 3 bin 625, Türkiye'den 3 bin 105
ve Belçika'dan 3 bin 2 hesap bulunuyor. Yaklaşık hacmi 120 milyar doları aşan 30 bin hesap
içinde Türkiye'ye ait hesapların hacminin ise 3,4 milyar dolara yaklaştığı belirtiliyor.
Swissleaks, 47 ülkeden 157 gazetecinin ortak araştırması sonucunda ortaya çıkartıldı. Bu
projenin de tüm verileri herkesin erişimine açık.
Britanya merkezli HSBC Bankası’nın İsviçre’de, 1988 - 2007 yılları arasında 203
farklı ülkeden 106 bin müşterisinin vergi kaçırıp mal varlığını gizlemesine yardım
ettiği ortaya çıktı. Listede Türkiye’yle bağlantılı 3 bin 105 müşteri var.
www.theguardian.com/news/series/hsbc-files
http://dagmedya.net/2015/02/09/hsbcnin-musterileri-diktatorler-silah-tuccarlari-
ve-vergi-kacakcilariyla-baglantili-cikti/
https://dagmedya.net/2015/02/19/hsbc-dosyalari-10uncu-gununde-banka-10-
farkli-sorusturmayla-karsi-karsiya/
105
> 2016 Finalistlerini Forum’da İnceleyebilirsiniz…
Veri Görselleştirmesi (Büyük Haber Merkezi) Dalında Ödül Alan Proje - 2016
Wall Street Journal’dan Dov Friedman ve Tynan Debold’un projesi (New York City,
ABD) : “Battling Infectious Diseases in the 20th Century: The Impact of Vaccines” -
Amerika’nın 50 eyaletinde meydana gelmiş olan hastalıklardan etkilenmiş, hayatını
kaybetmiş kişiler ve aşının 70 yılı kapsayan piyasaya sürülmesi süreci.
Okuma Önerileri
• Avrupa Veri Gazeteciliği Manifestosu (Türkçe)
• Gelişen Dünyada Gelişen Veri Gazeteciliği - Eva Constantaras
• Küresel Veri Gazetecisi / Veri Gazeteciliği Sitesi Rehberi (İnceleme)
• Araştırma Sonuçları Bölüm 1: Veri Okuryazarlığını Tanımlama - Çeviren: Yasemin
Akbulut
• Araştırma Sonuçları Bölüm 2: Veri Okuryazarlığı Yöntemleri - Çeviren: Yasemin
Akbulut
• Araştırma Sonuçları Bölüm 3: Veri Okuryazarlık Çabalarının Etkisini Ölçme -
Çeviren: Yasemin Akbulut
• Veri Gazeteciliği Projelerinin İçerik Analizi | Ağırlıkta Finansal ve Coğrafi Veriler
Kullanılıyor - Pınar Dağ
• Veri Gazetecisi Ayşegül Engür'ün Ödüllü Veri Gazeteciliği Projesi, "Bolzano Halk
Cumhuriyeti" Ekibiyle Röportajı
106
• Veri Gazeteciliği Atölyelerine Katılım Araştırması|Katılımcıların % 63’ü daha önce
veri analizi eğitimi almamış -Sadettin Demirel & Pınar Dağ
107
10. VERİ ANALİZİ VE YORUMLAMA
108
Veri toplamanın, veri analizi yaparak karar almanın öneminin hızla arttığı bir çağda
yaşıyoruz. Veriye sahip olmak önemli bir güç olduğu gibi, bu veriyi kullanarak karar
vermek, ürün ya da hizmet geliştirmek; aktörlerin geleceğini belirleyen en temel unsur
olmaya başladı. Veri ile haber yaptığınızda daha yüksek kamu yararı taşıyor,
farkındalık yaratıyorsunuz.
Veriden yararlanıp analiz edip, yorumlayabildiğinizde artı değer yaratıp, önlem
alabiliyor, gerçek bir sorunu çözebiliyor ya da sorunu tespit edebiliyorsunuz. Gündelik
hayatımızda farkında olarak ya da olmadan sürekli olarak verinin kullanıcısı ve
üreticisi olarak rol alıyoruz. İnternet'in şekillenmesinde ve trendlerin belirlenmesinde
biz kullanıcılar etkiliyiz. Medyada, araştırma sonuçlarında, sosyal ağlarda ve webde
sürekli veri analizi sonuçları ile karşılaşıyoruz.
Şekil 13* School of Data yaz kampı - Mayıs 2016
109
Şekil 14Kaynak: http://wheredoesmymoneygo.org
Benim Param Nereye Harcanıyor?
http://www.bumko.gov.tr
110
Ne kadar alan orman kayboldu ve kazanıldı
Peki bu ifadeler, bu rakamlar, tablolar, grafikler ne ifade ediyor?
Nasıl bir hikayeyi aktarıyor, manipülasyonun ve yönlendirmenin bu kadar yoğun
olduğu çağımızda ne kadar doğru bu analizler?
Veri okuryazarlık neden önemli hale geliyor?
Yapılan çalışmalar, sayısal değerlendirmelerin, tablo ve grafiklerin olduğu analizlerin
anlatımı kolaylaştırdığı gibi güvenilirlik hissini de arttırdığını ortaya koyuyor. Öte
yandan veri ile çalışanların özellikle sık duyduğu bir söz var: "İstatistik yalan söyleme
sanatıdır".
Halbuki sorun ortaya konulan rakamlarda değil çoğu zaman, bu rakamların nasıl
yorumlandığında. Yani "İstatistik değil, insan yalan söyler".
Bu bölümde, temel istatistiksel kavramları tanıyarak, kolayca hesaplama ve uygulama
yapabileceğimiz araçlarla tanışacağız. Temel kavramlara da değineceğimiz bu
bölümde; merkezi eğilimi ölçecek, ortalama medyan ve tepe değeri öğrenerek, verinizi
filtreleyerek analiz edeceksiniz. Tipik eleman, merkezdeki eleman nasıl belirlenir
konusuna yer vererek, veri setlerinden nasıl bilgi çıkarılabileceğini uygulama, video
ve okumalarla detaylandıracaksınız.
Bir durumu ve veriyi anlamak için; tipik ve geneli bilmek tek başına yeterli olmaz.
Farklılaşmayı ölçmek de gerekir. Derslerin devamında farklılaşmaya da yer verilecek.
Üzerinde çalıştığımız veri büyüdükçe, ölçme işlemini, hesaplarını kağıt kalemle
111
yapmak zorlaşır. Dolayısıyla bir araç kullanarak, ki bu bölümde excel kullanacağız, bu
işlemleri yapmayı görecek, özet tabloları kullanarak veri analizi yapmanın ilk
adımlarını atacaksınız.
Devamında ise veri kazıma tekniklerini Tabula ve Import.io araçları ile öğrenecek,
kazınan verilerin nasıl yapılandırıldığını ve haberde kullanıldığını görecek,
uygulayacaksınız. Dersin son bölümünde ise veri gazetecilerinin çok sık kullandıkları
veri temizleme aracı Open Refine ile dağınık veriyi temizleyecek, uygulayacak,
forum ve okumalarla detaylı şekilde öğreneceksiniz.
Herkes İçin Temel İstatistik
İstatistik en genel yapılışı ile verinin toplanması,
analizi, yorumlanması, sunumu ve düzenlenmesi ile
ilgili çalışmaların tümü olarak tanımlanır.*
Bu tanıma bakınca istatistik ve veri bilimi
arasında önemli bir farklılık göze çarpmamakta,
halbuki her iki alanın çıktıları ve uygulamaları
değerlendirildiğinde bazı yaklaşım farklıkları
ortaya çıkmakta.
Bir veri bilimi projesinin / veri temelli projenin kabaca üç temel aşaması vardır:
Verinin toplanması
Analiz edilmesi
Sonuçların aktarılması.
İstatistik verinin toplanması aşamasında önemli rol oynar. Verinin toplanacağı grubun
(örneklem), genel (popülasyon) hakkında bilgi vermeye uygun seçilmesi (örneklem
seçilimi), deney tasarımı (istatistiksel olarak, tüm veri toplama süreçleri bir
deneydir) istatistiğin uzun süredir üzerinde çalıştığı alanlardır. Doğru soruların
sorulması ve gerektiğinde soruların revize edilmesi, çalışmada uygun verinin
toplanması için en önemli süreçlerdendir ki istatistik bu konular hakkında çok az şey
söyler.
Veri toplandıktan sonra analiz edilmek için uygun forma, şekle dönüştürülmelidir.
Önceki derslerimizde veri türlerini ve formatlarını incelemiştik. Bu dönüşümü
yapmadan veriyi analiz etmeye çalışmak veriyi sorgulamaktan çok kullanılan
araçlarla boğuşmaya dönüşür. Veri analizi veriyi düzenleme, görselleştirme ve
modelleme süreçlerini içerir.
112
Veriyi görselleştirmek anlamlı ilişkileri görmek için ilk adımdır. Farklı
görselleştirmeler (tablolar, grafikler...) verinin ne anlattığını görmek için en uygun
araç olabilir kimi zaman. Hatta bazen görselleştirmeler, sizi şaşırtabilir, veriden daha
önce fark edemediğiniz bilgileri / hikayeleri ortaya çıkarabilir. Veri görselleştirmesi
kişisel yorum ve tecrübeye dayalıdır ve istatistik biliminde yaygın bir araştırma alanı
değildir.
Modelleme ise istatistiğin daha yoğun olarak ilgilendiği, hesaplamaların işin içine
daha yoğun olarak girdiği bir aşamadır. Her modelin ön koşullarla belirlenmiş sınırları
vardır ve sizi şaşırtmaz. Ön koşullar kabul edildiğinde ne olacağını tanımlar ve
gösterir.
Veri analizinin sonucu bir model değildir. Gerektiğinde modeli de içeren bir
söylemdir. Eğer analiz sonuçlarının ortaya çıkardığı hikaye ilgili insanlara bir şey
ifade etmiyorsa, karar alma süreçlerini etkilemiyorsa başarılı değildir. Çalışma
sonuçlarının iletişimi, aktarımı ise istatistiğin belki de en az ilgilendiği alandır.
İstatistiki çalışmalara bakarsanız, her ne kadar veri görselleştirme unsurları olarak
tablolar ve grafikler kullanılsa da, uzman olmayan kullanıcının anlamakta zorlandığı,
çoğunlukla teknik sonuçlar görürüz. Ana akım istatistik araştırmalarında ya da
istatistik eğitim programlarında veri analiz sonuçlarının iletişiminin çok az yer aldığını
görürüz.
Bu sebeple veri bilimi / verinin analiz süreçlerinin hikayeleştirilmesi, iletişiminin etkin
şekilde kurulması açısından farklılık gösterir.
Veri bilimi ile istatistik arasındaki ilişkiden bahsettikten sonra, temel istatistik
kavramlarına değinmek isabetli olacaktır.
Video destekli örnek analiz
Bu dersin videosunda veri görselleştirmesinin hikaye anlatmada ne kadar güçlü bir
araç olabileceğini gapminder.org sitesi üzerinden deneyimleyerek göreceğiz. 8.
dersimizde açık veri pratiğinde kullandığınız aracı, bu bölümde de verilerin analizinde
kullanacağız.
Gapminder sürdürülebilir global kalkınmayı, sosyal, ekonomik ve çevresel kalkınma
hakkında lokal, ülkesel ve küresel seviyelerde bilgi ve istatistiklerin kullanımını
artırmayı ve anlaşılabilir kılmayı destekleyen, kâr amacı gütmeyen bir girişim.
www.gapminder.org sitesine bağlanarak, Gapminder World sekmesinden veri
görselleştirme ekranına ulaşabilirsiniz. Kısaca veri görselleştirme ekranındaki
değişkenleri inceleyelim. Grafiğin yatay ve dikey eksenlerinin yanında, bu eksenlerde
görüntüleyebileceğimiz parametreler menü olarak listelenmiş. Bu parametreler,
nüfustan, insani gelişmişlik endekslerine, ekonomiden altyapıya kadar pek çok farklı
alandan parametreler içeriyor.
113
Grafik ekranının hemen sağında ülkeler listelenmiş. Çalışmak istediğimiz ülkelerin
yanındaki kutucukları işaretleyerek bu ülkelerin grafik ekranında daha belirgin
olmasını sağlayabiliriz.
Yatay eksenin hemen altında zaman parametresi yer alıyor. Farklı yıllar için veri
kayan menüde (slider) istenilen yıl seçilerek görüntülenebiliyor. Ayrıca zaman
parametresinin hemen yanındaki play tuşuna basarak zamana bağlı olarak grafikteki
değişimleri hareket olarak görmek mümkün.
Şimdi örnek analize başlayabiliriz. Türkiye’nin milli gelir değişiminin farklı
parametrelerle ve ülkelerle ilişkisini incelemek istiyoruz.
Önce Türkiye'nin kişi başı milli geliri (Income per person (GDP/ per capita ....) ile 15
yaş üstü istihdam oranın (Aged 15+ employment rate) inceleyelim. İlk gözlem kişi
başı gelir artarken, istihdam oranının düştüğü. Gelir dağılımının zaman içerisinde
değişimi ya da gelir üreten faaliyetlerin yapısının değişimi hakkında bir şey
söyleyebilir mi bu bize?
İkinci olarak İran ve Türkiye’yi aynı parametreler açısından (kişi başı milli gelir ve
istihdam oranı) kıyaslayalım. Kişi başı milli geliri her iki ülkenin de oldukça yakın
değerde ve zaman içerisinde de bu ilişki korunuyor. Aynı değerlendirmeyi istihdam
oranları açısından söylemek mümkün değil. İran, Türkiye’ye göre daha düşük bir
istihdama sahipken, istihdam oranı İran’da artış Türkiye’de ise azalış gösteriyor.
İran’ın istihdam oranı bir noktadan sonra Türkiye’yi geçiyor.
İkinci bir kıyaslamayı Türkiye ile Güney Kore (Korea Rep.) arasında yapalım . Bu
sefer kişi başı milli gelir ile dünya çapında alınan patent sayısını (patents granded
total) kıyaslayalım. Güney Kore’nin milli geliri başlangıç yılı olan 1984 yılında
Türkiye’nin yaklaşık % 75’i oranındayken verinin olduğu son yıl olan 2002’de
Türkiye’nin değerinin 1.8 katına çımış durumda. Patent sayılarında ise Güney Kore
çok daha üstün. Türkiye ve Güney Kore’nin ekonomik büyüme sebepleri hakkında bir
fikir verebilir.
Diğer parametreleri kullanarak daha detaylı analizler yapabilir, yukarıda
geliştirdiğimiz fikirleri incelemeye devam edebilirsiniz.
Veri Tipleri
Önceki derslerimizde temel veri tiplerini öğrenmiştik.
Kısaca tekrarlamak gerekir ise:
Sayısal Veri: Sayısal olarak ifade edilebilen, üzerinde aritmetik işlemler yapılabilen
ve bu işlemlerin sonuçlarının anlamlı olduğu veri. Örneğin vize ve final sınavlarından
almış olduğunuz sınav notları belirli yüzdeler oranında hesaplanarak o derse ait
notunuzu oluşturuyor; 60,70,80 gibi…
114
Kategorik Veri: Bir duruma karşılık gelen, üzerinde aritmetik işlemlerin anlamlı
olmadığı veri. Örnek: Doğum yeri bilgisi (Doğum yeri bilgisi araç plakalarında olduğu
gibi sayısal olarak kodlanabilir Ankara = 06 , Adana = 01 gibi… Ancak aritmetik
işlemler yapmak burada anlamlı değildir: 06 (Ankara ) + 01 (Adana) = 07 (Antalya)
Kategorik veriyi kendi içerisinde nominal ve ordinal olarak ikiye ayırabiliriz. Ordinal
veri, nominalden farklı olarak sıralanabilir. Örnek: doğum tarihi ordinal veriye
örnektir. Doğum tarihine göre genç, yaşlı sıralaması yapılabilir. Doğum yeri ise
sıralanamaz, dolayısıyla nominal veridir.
Sayısal veriyi de kendi içinde oransal ve aralık verisi olarak ikiye ayırabiliriz.
Aralık verisi için farklar anlamlı iken oranlar ve çarpımlar anlamlı değildir.
Oransal veride ise bu işlemler anlamlıdır.
Aralık Örnek: Deprem ölçeği (Richter skalası): 6.0 büyüklüğündeki bir deprem 5.0
büyüklüğündeki bir depremden 10 kat daha güçlüdür. 6/5 =1,2 oranı deprem
büyüklüklerini kıyaslamak için anlamlı değildir.
Oran Örnek: Kamuoyu destek oranları belirli bir konu hakkında iki farklı zamanda
%20 ve %30 olsun. Araştırma yapıldığı ikinci zaman diliminde ilk zaman dilimine
göre 30/20 =1,5 kat olduğu değerlendirmesi doğrudur. Destek ilk zaman dilimine göre
(30-20) /10 = 0,5 (%50) artmıştır.
Sayısal veri için bir diğer ayrımda verinin sürekli ya da kesikli olması üzerinden
yapılır.
Örnek: Özellikle endüstriyel üretim süreçlerinde üretilen parçanın uzunluğu, kalınlığı,
derinliği, ağırlığı vb. değerler bir aralıkta değer alır ve sürekli veriye örnek teşkil eder.
Yaş, sınav sonuçları gibi ifadeler ise genelde tam sayı olarak ifade edilir ve kesikli
veriye örnektir.
Popülasyon ve Örneklem
Popülasyon, üzerinde yorumda
bulunmak istenilen, sonuçlar
çıkarılmak istenilen grubun
tamamını ifade eder. Popülasyon
genelde çok sayıda temsilci
içerir. Her bir temsilcinin
verisinin toplanması genelde
mümkün değildir, ya da çok zor
ve maliyetlidir. Popülasyonu
çalışmak için bu grubu temsil
eden daha küçük bir grup
seçilerek veri bu grup üzerinde
toplanır. Seçilen bu gruba örneklem adı verilir.
Örneklemi doğru seçmek yapılan çalışmanın gerçekçi olması için en önemli adımlardan
biridir. İstatistiksel olarak en uygun yöntem örneklemin popülasyondan rastgele seçilmesidir.
115
Örnek: Seçim öncesi sonuçları hepimiz merak ederiz. Seçim sonuçlarının popülasyonu; oy
verme iznine sahip tüm seçmenlerdir. Bu popülasyonun tüm verisini toplamak seçimi
gerçekleştirmeye eş değerdir. Araştırma kuruluşları seçim öncesi seçmen profilini yansıttığı
düşünülen daha küçük gruplara (2500-4000 kişi) seçim anketi uygular. Anket sonuçlarını
belirli bir hata payı doğrultusunda seçimin sonuçlarını tahmin etmek için kullanırlar.
Yukarıdaki örnek bizi istatistiğin farklı iki kavramına götürüyor:
Betimsel istatistik, var olan veriyi özetlemek, tasvir etmek, anlatmak için kullanılan
yöntemlerin tümünü içerir.
Çıkarımsal istatistik ise, var olan veriden gelecek ile ilgili, ya da seçim anketlerinde
olduğu gibi örneklemden popülasyon hakkında çıkarımlarda bulunmayı sağlayan
yöntemleri içerir.
Merkezi Eğilimi Ölçmek
İstatistik kelimesinin bir diğer anlamı da örneklemden hesaplanan her türlü sayısal
değer demektir. Başka bir anlatımla, sayısal veriden hesaplanarak elde edilen her türlü
ifadeye istatistik denilir. İstatistik bu bağlamda istatistik ölçütler yerine
kullanılmaktadır. Sağlık istatistikleri, nüfus istatistikleri gibi sıklıkla karşılaştığımız
ifadeler istatistiğin bu bağlamda kullanımına karşılık gelir. Bu derste bazı istatistik
ölçütlerine yer verilecek. Video ve okuma ile detaylandıracağız.
Aşağıda milletvekilliği.xlsx (TÜİK Milletvekiliği Genel Seçimleri 1923 -2011 Tablo
3 ve 4) dosyasının ekran görüntüsü yer alıyor.
Şekil 15Bu tablo yıllara göre Türkiye Büyük Millet Meclisi'ndeki milletvekili sayılarını ve cinsiyete göre dağılımını
gösteriyor.
116
Şu sorulara cevap arayalım öncelikle:
1935’ten 2011’e kadar
farklı sayılarda vekilin
mecliste olduğunu
görüyoruz. 1935’te
vekil sayısı 399 iken,
bu sayı 1965 - 69 - 73
- 77 - 87 - 91 yılarında
450; 1995 - 1999 -
2002 - 2007 ve 2011
yıllarında 550 değerini
almıştır.
Peki tipik bir mecliste
kaç milletvekili var?
Tek bir değerle bunu
ifade edebilir misiniz?
Ya da 1935 - 2011
yıllarında ortalama
kadın vekil sayısı kaç?
Yanda gördüğünüz tablo ise
Avrupa ülkelerindeki seçim
tarihlerini, toplam vekil
sayılarını ve kadın vekil
sayılarını gösteriyor.
Bu tabloya bakarak şu soruları cevaplayabilir misiniz?
Listedeki ülkelerde seçimler en sık hangi yılda yapılmış?
Avrupa ülkeleri geneli için kadın vekili sayısı için ne söyleyebilirsiniz?
Her iki örnekte de aslında veri kümesini özetlemeye, betimlemeye çalışıyoruz. Farklı değerler
alan parametreleri (yıl, vekil sayısı, kadın vekil sayısı) anlatan tek bir değer arıyoruz. Öyle bir
değer olsun ki bu veriden oluşturduğumuz hikayeyi okuyan kişinin aklında doğru çağrışımları
yapsın, tüm veriye bakmadan veri hakkında bilgi sahibi olsun. Burada sorduğumuz tüm
sorular «tipik elemanı», «geneli temsil eden elemanı», «en sık gözlenen elemanı» tarif
ediyor. Başka bir deyişle «verinin merkezini» arıyoruz. Verinin merkezini ölçmek için
kullandığımız değerlere merkezi eğilim ölçütleri denir.
117
Üç temel merkezi eğilim
ölçütü vardır:
• Ortalama (average /
mean)
• Ortanca / medyan
(median)
• Tepe değeri (mode).
Şimdi bu üç ölçütü, özelliklerini ve nerelerde kullanıldıklarını görelim. Her ne kadar bu
ölçütlerin formüllerinin basit birer uygulamasını vereceksek de, dersin videosunda excel
kullanarak bütün bu değerleri hesaplamayı izleyeceksiniz.
Aritmetik Ortalama
İlk ölçütümüz ortalama (aritmetik ortalama) şöyle tanımlanır:
'n tane sayının ortalaması sayıların toplamının n’e bölümüdür.
Örnek: 1995, 1999, 2002, 2007, 2011 seçimlerinde meclise sırası ile 13,23,24,50, ve 79 kadın
vekil girmiş, bu değerlerin ortalaması (13+23+24+50+79) / 5 = 37.8 "dir. Bu beş seçimde
meclise ortalama 38 kadın vekil girmiştir diyebiliriz. Hesapladığımız bu «ortalama değer»
tablodan seçilen son beş sayının merkezini göstermektedir.
Ortanca / Medyan
İkinci ölçütümüz verinin ortasını ifade eden ortanca/medyan (median) değeri
Veriyi sıraladığınızda (büyükten küçüğe, ya da küçükten büyüğe fark etmez) ortada
kalan değere medyan denir. Eğer verinin ortasında bir değil iki değer kalıyorsa
(toplamları çift sayıda eleman varsa böyle olacaktır), ortada kalan iki değerin ortası
(toplamlarının yarısı) medyan olacaktır.
Örnek: Bir önceki örnekteki veriyi değerlendirelim, kadın vekil sayıları 13, 23, 24, 50,
79. Sıraladığımızda ortada kalan değer 24, dolayısıyla bu beş sayının medyanı
24’tür. Sadece son dört seçimi hesaba katmış olsaydık; 23, 24, 50,79: ortada 24 ve 50
değerleri olacaktı. Bu değerin ortası (24+50) / 2 = 37 değeri medyan olacaktır.
Tepe değeri
Bir diğer merkezi eğilim ölçütü tepe değeridir (mod)
118
Ortalama ve medyan sadece sayısal verileri için tanımlı iken, tepe değeri kategorik veri içinde
tanımlıdır. Tepe değeri bir veri kümesinde en çok tekrar eden değer ya da değerlerdir. Örnek:
Avrupa’daki ülkelerin seçim istatistiklerinin bulunduğu dosyaya bakarsak eğer, farklı yıllarda
seçim yapılmıştır. Seçim yapılan yıllar arasında en sık gözlemlenen yıl 2011 yılıdır.
Listelenen 37 ülkenin 14’ünde 2011 yılında seçim yapılmıştır.
Şimdide yukarıda tanıttığımız 3 merkezi eğilim ölçütünün özelliklerini ve ne zaman
kullanıldıklarını kısaca tartışalım.
Ortalama ve medyan tek bir değer alabilirken, tepe değeri (mod) birden fazla değer
alabilir.
Kategorik veride kullanılabilecek tek ölçüt tepe değeridir.
Veri kümesindeki çok büyük ve küçük değerler ortalamada önemli sapmalara yol
açabilir. Medyan değeri ise çok büyük ve küçük değerlerden ortalama kadar
etkilenmez. Bu farklılık bu iki ölçütün nerede kulanılacağını da belirler. Eğer veri
kümesinde ekstrem değerler var ise medyan kullanmak daha doğrudur, aksi takdirde
ortama kullanmak yerinde olacaktır.
Ortalama değer, veri kümesindeki her bir elemanı hesaba katarak hesaplanır,
dolayısıyla uygun olan durumlarda medyandan daha fazla kullanılır. Ayrıca aritmetik
işlemler ortalamayla daha kolay yapılabilir. Farklı grupların ortalaması biliniyorsa bu
gruplar birleştirilerek oluşturulan büyük grubun ortalaması basit bir aritmetik işlemle
hesaplanabilir. Büyük grubun medyanını bulmak içinse tüm veri yeniden sıralanarak
ortadaki değer ya da değerler bulunmalıdır.
Video destekli örnek
Bu videoda merkezi ölçütleri excel kullanarak nasıl hesaplayabileceğinizi
göreceksiniz. Sizler de milletvekiliği.xlsx dosyası üzerinde benzer hesaplamaları
yapabilirsiniz.
Bu videoda temel merkezi eğilim ölçütlerini excel yardımı ile nasıl yapacağımızı
göreceğiz. Bunun yanı sıra excelde sıralama ve yeni değişkenler tanımlamayı da pratik
olarak uygulayacağız. Örneğimizde Microsoft Excel 2003 ile bu işlevlerin nasıl
yapılacağını açıklamaya çalışacağım. Sizin kullandığınız program versiyonlarında
ufak değişiklikler olmakla birlikte, menüler benzer olacaktır.
Milletvekilliği.xlsx dosyasını açarak başlayalım. Bu dosyanın alt kısmında iki ayrı
sayfa olduğunu göreceksiniz. Türkiye ismiyle kayıtlı dosyada Türkiye Genel Seçim
sonuçlarının 1935 - 2011 yılları arasındaki istatistikleri, Avrupa ülkeleri dosyasında
ise Avrupa ülkelerinde 2008 - 2011 yılları arasında yapılan genel seçim istatistiklerini
bulabilirsiniz
119
Önce Türkiye seçim istatistikleri sayfasında çalışalım. Genel seçimlerin yılları, toplam
milletvekili sayıları, erkek ve kadın vekil sayıları var bu tabloda. Erkek ve kadınların
temsil oranlarını gösteren E. Temsil oranı ve K. Temsil oranı kolonları ise boş
bırakılmış, bu değerleri biz tamamlayacağız.
Önce sıralama ve filtreleme ile başlayalım. Her ne kadar bu tabloda çok fazla veri
olmasa da aklımızdan bu veriyi sıralamamız oldukça zor. Bunun için veri
kategorilerini belirleyen ilk satırı farklı bir renkle boyayayalım önce. İlk satırdaki
kolon isimlerini seçtikten sonra HOME menüsü altındaki CHECKBOX opsiyonu
seçerek bu işlemi yapabilirsiniz.
DATA menüsü altındaki FİLTER opsiyonununu seçerek filtre ekleyebilirsiniz. Artık
kolon isimleri gri renk ile gösteriliyor ve kutucuklarının yan tarafında birer ok işareti
var. Bu işarete bastığınızda açılan menüden SORT SMALLEST TO LARGEST ve
SORT LARGEST TO SMALLEST opsiyonlarını seçerek veriyi sırası ile küçükten
büyüğe ya da büyükten küçüğe sıralayabilirsiniz. Artık en çok ve en az vekilin
seçildiği, kadın vekil sayısını en az ve en çok olduğu seçim yıllarını bulmak çok daha
kolay.
Bu farkı görebilmek için erkek ve kadın vekil temsil oranları tanımlayalım. Erkek
vekil temsil oranını erkek vekil sayısını toplam vekil sayısına bölerek elde
edebilirsiniz.
Kadın vekil sayısını da benzer şekilde elde edebilirsiniz. Excel’de erkek temsil oranı
hesaplatmak için 1935 yılına karşılık gelen satırdaki boş hücreye ‘= C2/B2’ yazmanız
yeterlidir. C2 hücresinde 1935 yılındaki erkek vekil sayısı B2 hücresinde ise aynı yıla
ait toplam vekil sayısı var. Diğer yıllar için teker teker ilgili hücreleri seçip benzer bir
bölüm ifadesi yazmaya gerek yok. Temsiliyet oranını hesapladığımız ilk hücreyi sağ
alt köşesinden tutup aşağıya uzatarak aynı hesabın diğer yıllar içinde otomatik
yapılmasını sağlayabilirsiniz.
İkinci olarak Avrupa ülkeleri sayfasını açalım. Filtreleri ekleyip kadın vekil sayısına
göre sıralama yaparsanız Almanya’nın en fazla sayıda (204) kadın vekile sahip
olduğunu Lihteştayn, Kıbrıs ve Malta’nın ise en az sayıda (6) kadın vekile sahip
olduğunu göreceksiniz. Temsiliyet oranlarını hesaplayıp, bu orana göre sıralarsanız
ülkelerin sıralamasının nasıl değiştiğini videoda görebilirsiniz.
Çalışma Soruları
Avrupa ülkeleri sayfasında ortalama, medyan ve tepe değerlerini siz de
hesaplayabilirsiniz.
Kadınların mecliste temsiliyet oranları değerlendirildiğinde, Türkiye Avrupa
ortalamasının ne kadar altındadır?
Listedeki ülkelerin meclislerindeki kadın temsiliyet oranlarının ortalaması ile
medyanı arasında yaklaşık ne kadar fark vardır?
120
Listedeki ülkelerin meclislerinde ortalama kaç kadın vekil vardır?
Listedeki ülkelerin meclislerinde ortalama kaç vekil vardır?
Okuma Parçaları
• Bir Veritabanı İle Röportaj - Çeviri: Zerrin Yarbay Şahin
• Veri Denetleme aracı (İnceleme)
• (Açık Ders) merkezi eğilim ölçüleri
121
11. DAĞILIMI / FARKLILAŞMAYI ÖLÇMEK
122
Geçen derste merkezi eğilimin üç temel eğilim ölçütünü, ortalama, ortanca ve tepe
değerini uygulamalarını ele almıştık. Bu bölümde ise veri setlerindeki dağılımı ve
farklılaşmayı ölçmeyi öğreneceğiz.
Pek çok veri setinin ortak özelliği, aldığı değerlerin birbirinden farklı olmasıdır. Bu
farklılaşmayı ölçmek de istatistiğin temel önceliklerinden biridir. Bu derste bir veri
kümesinin kendi içindeki farklılaşmasını nasıl ölçebileceğimizi göreceksiniz. Basit bir
örnekle başlayalım. İki hayali ülkenin yıllık büyüme oranları aşağıdaki tablodaki gibi
verilmiş olsun.
Her iki ülkenin de verilen yıllar için ortalama büyüme oranı 2.5 değerini alıyor.
Ortalamaya göre karşılaştırma yaptığımızda bu ülke benzer büyüme oranlarını
yakalamış gözüküyor. A ülkesinin değerlerine baktığımızda incelenen 7 yıl için
büyüme oranlarının 0.8 ile 4.2 arasında farklı değerler aldığını görüyoruz. B ülkesinin
büyüme değerleri ise 2,1 - 2,9 arasında farklı değerler alıyor. A ülkesinin büyüme
oranlarının farklılaşmasının B ülkesinin büyüme oranlarının farklılaşmasından daha
fazla olduğunu bu basit gözlem ile kolayca ortaya çıkartabiliriz.
Veri setinin en büyük ve en küçük değerleri arasındaki farka (A ülkesi için 4.2 - 0.8 =
3.4, B ülkesi için 2,9-2.1) açıklık (range) adı verilir. Açıklık bir veri setinin
farklılaşmasını değerlendirmek için kullanılan en temel ve basit ölçütlerden biridir.
123
Şimdi biraz daha farklı ve daha uzun bir zaman dilimini kapsayan aşağıdaki veri setini
değerlendirelim;
Her iki ülkeyi şu ana kadar öğrendiğimiz istatistiksel ölçütler açısından kıyaslayalım.
Tepe değeri sayısal verinin değerlendirilmesinde nadiren kullanıldığından listede yer
verilmedi. Bu tabloyu oluşturmak için kullandığımız ölçütler, iki ülkenin büyüme oranları
arasındaki farklılığı göremiyor. D ülkesinin büyüme oranları ortalama değeri olan 1.0
etrafında yoğunlaşırken, C ülkesinin büyüme oranları ortalamadan uzak ekstrem değerlerde
yoğunlaşıyor. Yani üst satırdaki veriler ‘tipik’ , ‘genel’ eleman etrafında yoğunlaşırken, alt
satırdaki veriler marjinal, ekstrem değerlerde kümeleniyor.
Bu örnekte incelediğimiz farklılaşmayı istatistiksel olarak ölçmek için varyans ve
standart sapma ölçütleri kullanılır. Varyans değeri sayısal olarak standart sapmanın
karesidir [Varyans = (Standart Sapma)2]. Dolayısıyla birini biliyorsak diğerini
kolaylıkla hesaplayabiliriz. Standart sapma adından da anlaşışacağı gibi bir veri
setinin standart değerinden (ortalamasından) ne kadar saptığını ölçen tek bir değerdir.
Örneğin C ülkesinin büyüme oranı 2005 yılında -1.5’tur (ekonomi küçülmüş), yani
ortalamadan 2.5 puan sapmıştır. Standart sapmayı hesaplamak için her değerin
ortalamadan farkı hesaplanır, hesaplanan değerlerin karesi alınır, alınan karelerin
ortalaması alınır, hesaplanan değerin karekökü alınır. Biraz karışık değil mi?
Excel'de diğer tüm temel istatistiksel ölçütler gibi standart sapma da hazır bir
fonksiyon olarak sunuluyor, dolayısıyla uzun uzun hesap yapmak zorunda
kalmayacağız ancak bu ifadenin anlamını biraz daha açıklamakta fayda
olacaktır. Standart sapmayı hesalamak için her bir değerin ortalamadan uzaklığını
alıyoruz önce. Yani her bir değerin tipik, genel temsilciden ne kadar farklılaştığını
ölçüyoruz. Değerlerin önce karesini almak daha sonra başka hesapmalamalar
yaptıktan sonra karekökünü almak teknik sebeplerden dolayı ihtiyaç duyduğumuz,
aynı zamanda biribirini dengeleyen operasyonlar. Standart sapma en basit ifadesi ile
tüm değerlerin ortalamadan farklılaşmalarının ortalaması, bir çeşit ortalama
farklılaşma değeri.
124
Standart Sapma Açık Formülü
S= standart sapma
x_1 , x2 , ......, xn veri setindeki değerler (yukarıdaki örnek için büyüme oranları)
o= Ortalama değer
Ortalamaları aynı olan iki verinin farklılaşmalarını standart sapma yardımı ile
hesaplamayı öğrendik.
Peki ortalamaları farklı olan veri setlerinde farklılaşmayı nasıl ölçebiliriz? Hangi
veri setinin daha stabil olduğuna nasıl karar veririz?
İki hayali ülkemiz; E ve F aynı zaman diliminde, sırası ile ortalama yüzde 2.5 ve 3.0
büyüme oranı göstermiş olsun. Büyüme oranlarının standart sapmaları da E ülkesi için
0.2, F ülkesi içinse 0.3 olsun. Hangi ülke daha istikrarlı bir büyüme göstermiştir? 2.5
büyüme ortalamasında 0.2’lik standart sapmamı yoksa 3.0 büyüme ortalamasında 0.3
lük bir standart sapmamı daha büyük bir değişkenliğe karşılık gelir?
Bu ve benzeri kıyaslamaları yapmak için kullandığımız ölçüte değişim katsayısı adı verilir.
Değişim katsayısı standart sapmanın ortalamaya olan oranıdır;
Yukarıdaki örneğe geri dönersek E ülkesinin değişim katsayısı 0.2/2.5 = 0.04, F
ülkesinin değişim katsayısı ise 0.3/3.0 = 0.1’dir. E ülkesinin F ülkesine göre daha
istikrarlı büyüme oranlarına sahip olduğunu söyleyebiliriz.
Hayali ülkeler üzerinden tartıştığımız istatistiksel ölçütleri gerçek veri üzerinde excel
yardımı ile tartışmaya hazırız artık. Videoda kullanacağımız veri dünya
bankasının http://data.worldbank.org/indicator/NY.GDP.MKTP.KD.ZG
sayfasından indirilmiş ve daha rahat çalışmanız için düzenlenmiş olan verisidir.
Verinin düzenlenmiş haline Ekonomi.xlsx dosyasından ulaşabilirsiniz.
Video Destekli İçerik: https://www.youtube.com/watch?v=G53AUtjCBDY11
125
Video Açıklamaları
Bu dosyada 216 ülkenin 1961’den 2015’ e kadar yıllık büyüme oranları var. Bazı
ülkelerde bütün bu zaman aralığı için veri olmadığı görülüyor. Bu ülkeler için verinin
olduğu yılları çalışacağız.
Bu tabloya maksimum (max), minimum (min) , açıklık (range), ortalama (average),
standart sapma (standart deviation) ve değişim katsayısı (coefficient of varaiton)
kolonlarını ekleyelim.
Açıklığı hesaplamak için maksimum ve minimum değerlerine ihtiyacımız var. Daha
önce ortalama, medyan ve tepe değerini hesaplarken yaptığımıza benzer şekilde MAX
ve MIN fonksiyonlarını çağırarak bu işlemi yapabiliriz. Açıklık maksimum ve
minimum arasındaki fark olduğundan yeni bir değişken yaratıp bunu daha önce
hesapladığımız max ve min değerlerinin farkına eşitleyelim.
Bir ülke için herhangi bir değeri hesapladıktan sonra, hesapladığımız değerin
bulunduğu kutucuğu sağ alt köşesinden aşağı doğru çekerek diğer ülkelerin ilgili
değerlerini de otomatik olarak hesaplayabiliriz.
Değişim kat sayısını hesaplamak içinse ortalama ve standart sapmaya ihtiyacımız var.
Ortalamayı nasıl hesaplayacağımızı geçen ders görmüştük. Standart sapmayı
hesaplamak içinse STDEV (standart deviation’ın kısaltması) fonksiyonu çağırmak
yeterli olacaktır.
Son olarak değişim kat sayısını hesaplamak için yeni bir değişken yaratarak bu
değişkeni standart sapmanın ortalamaya bölümüne eşitleyelim.
Filtreleri ekledikten sonra tablomuz analize hazır.
NOT 1: Bazı hücrelerde #DIV/0! uyarısını aldık bunun sebebi bu hücrelerde
hesaplama için kullanılan değerlerin bazılarının 0 olması. Herhangi bir sayının 0’a
bölümü tanımsızdır. Bu uyarı mesajında sıfıra bölme hatası yaptığımız uyarısını
alıyoruz. Bu hatayı aldığımız ülkelere baktığınızda çoğunluğu küçük ada ülkeleri
olduğunu görürüz ve tabloda bu ülkelerin büyüme değerleri yok. Bu ülkeleri
belirlemek için, bu ülkelerin olduğu satırları farklı bir renkle boyadık.
NOT 2: Yeni tanımladığımız değişkenleri Excel’e hesaplattığımızda noktadan sonra
çok rakamlı ifadeler elde ettik. Excel aritmetik işlemlerde eğer hücreler önceden
biçimlendirilmemişse otomatik olarak 8 ondalıklı bir ifade verir. Sayısal ifadelerde
kaç ondalık kullanacağınızı hücreleri biçimlendirerek belirleyebilirsiniz (SAĞ klik,
FORMAT CELLS, NUMBER, DECIMAL PLACES)
NOT 3: Sayısal fonksiyonları çağırırken ‘’=’’ işaretini kullanmayı unutmayın. =
MAX (A1:A5) ifadesi yazdığınızda bir hücreye, Excel bu ifadeyi hücrenin değerinin
A1 ve A5 hücreleri arasındaki hücrelerde değerlerin maksimumuna eşit olacağını
anlayacak ve bu değeri hesaplayacaktır. "=" işareti koymazsanız Excel yazdığınız
126
ifadeyi metin olarak algılayacak ve herhangi bir sayısal işlem yapmayacak, bu ifadeyi
gösterecektir.
Dinleme Önerisi: Data Madenciliği ve Oscar Tahminleri
Excel & Özet Tablo ile Veri Analizi
Bu derste Excel'de istatistiksel ölçütleri hesaplamanın farklı bir yöntemini
göreceksiniz. Ayrıca özet tabloları (pivot table) yardımı ile veriyi düzenleyerek analiz
yapmayı inceleyeceksiniz.
(Konu video ve okuma önerileri ile detaylandırılmıştır.)
Daha önceki derslerde Excel'de tanımlı fonksiyonları kullanarak istatistiksel ölçütleri
hesaplamayı gördünüz. Bu derslerde gördüğünüz istatistiksel ölçütler veri analizinin
en temel kavramlarından bazıları. Sıklıkla kullanılan bu ölçütlerin
tümünü Excel'de hesaplamayı sağlayan bir eklenti (Analysis ToolPak) mevcut.
Bu linkteki videoda, eklentiyi nasıl etkin hale getirebileceğiniz ve nasıl kullanacağınızı
izleyebilirsiniz.
Video Açıklamaları
127
Excel’de istatistiksel pek çok yöntem ve aracı kolaylıkla kullanmak için geliştirilmiş
bir eklenti (Analysis ToolPak) var. Bu eklentiyi aktif hale getirmek için aşağıdaki
adımları takip edebilirsiniz.
Sırası ile FILE> OPTIONS> ADD-INS menülerine girin, karşınıza çıkan ekranda
Manage: Excel Add-ins opsiyonunu seçip Go butonuna basın.
Manage: Excel Add-ins opsiyonunu seçip Go butonuna basın.
Karşınıza çıkan ekranda Analysis ToolPak
opsiyonunun yanındaki kutucuğu işaretleyip, OK
butonuna basın.
DATA sekmesinin en sağında, Data Analysis
opsiyonun eklendiğini göreceksiniz.
128
Bu eklentiyi kullanmak için
yeni eklenen Data analysis
butonuna basın.
Karşınıza çıkan menüden
Descriptive Statistics’i
(Betimsel İstatistik) seçin
Input Range kısmına
analiz etmek istediğiniz
veri kesitini girin
(daha önce gördüğümüz
excel fonksiyonlarında
olduğu gibi)
Grouped by kısmına
veriyi nasıl gruplamak
istediğinizi girin:
Columns (kolonlar) ya
da Rows (satırlar)
Output options: Elde
edeceğiniz tablonun
nerede
görüntüleneceğini
seçmenizi sağlar.
Summary Statistics (Özet İstatistikler) opsiyonun yanındaki kutucuğu işaretleyin.
OK butonuna bastığınızda özet istatistikler tablosu otomatik olarak oluşturulacaktır.
129
Skewness ve Kurtosis bu derste işlemediğimiz verinin dağılımının şekli hakkında
bilgi veren iki istatistiksel ölçüttür. Tablodaki diğer değerler daha önce gördüğümüz
ölçütler.
Böylelikle tüm istatistiksel ölçütleri tek bir işlemle elde edebiliyoruz.
Özet Tablo ile Veri Analizi
«Dağılımı/ Farklılaşmayı Ölçmek» bölümünde ülkelerin büyüme oranlarını
incelmiştik. Bu incelemeyi yaparken ülke bazında değerlendirme yapmıştık.
Kullandığımız tabloda ülkeler, bölgesel olarak (region) ve gelir seviyesine (income
status) göre de sınıflandrılımıştı. Bu veriyi incelerken aşağıdaki konularara yönelik
sorular sorulması da muhtemel:
Bölgelere göre büyüme nasıl değişmekte?
Gelir seviyesine göre büyüme nasıl değişmekte?
Bölgeler içerisinde gelir seviyesi nasıl bir dağılım gösteriyor?
Her bir bölgede kaçar ülke var?
Her bir gelir seviyesinde kaçar ülke sınıflandırılmış?
Bu ve benzeri pek çok soru, daha önce öğrendiğimiz filtreleme ve hesaplama
yöntemleri kullanılarak cevaplanabilir. Bu soruları cevaplamak için veriyi uygun
şekilde sıralamak, düzenlemek, istatistiksel ölçütleri hesaplamak için kullandığımız
fonksiyonları uygun veri kesitleri üzerinde çalıştırmak gerekir.
Bu işlemleri pratik bir şekilde gerçekleştirmek için Excel’in Pivot Tables (özet
tablolar) özelliğini kullanmak mümkün. Aşağıdaki videoda pivot tables (özet tablolar)
özelliğinin veri analizinde nasıl kullanıldığını göreceksiniz.
Video Destekli İçerik:
www.youtube.com/watch?v=wy2Q5gmIFCQ
Bu videoda pivot tables (özet tablolar) özelliğini kullanmayı göreceğiz.
INSERT > PIVOT TABLE özelliğini seçin.
Karşınıza çıkan ekranda;
Analiz etmek veri tablosunu yada kesitini seçin (diğer Excel fonksiyonlarında olduğu
gibi)
130
Özet tabloyu görüntülemek
istediğiniz yeri seçin (New worksheet’i
seçtiğinizde aynı Excel dosyasında
yeni bir sayfada oluşturacaktır özet
tablosunu)
Özet tablo
boş bir şekilde
yeni bir sayfa
oluşturulacaktır
Sağ taraftaki menünün yukarısında veri
kategorileri listelenecektir. Bu
kategorilerden analiz etmek
istediklerinizi rows (satırlar), columns
(kolonlar), filters (filtreler) values
(değerler) isimleri ile ayrılmış bölgelere
sürükleyip bırakarak özet tablonuzu
oluşturabilirsiniz.
Values kısmında seçmiş olduğunuz
parametrenin üzerine tıkladığınızda
açılan menüden VALUE FIELD
SETTINGS opsiyonunu kullanarak seçtiğiniz parametrenin istatistiksel ölçütlerini
tabloya ekleyebilirsiniz.
131
Seçmiş olduğunuz filtreler özet tablosunun en üst satırlarında görüntülenecektir.
Okuma Parçaları
Veriyle Başla, Hikayeyle Bitir
Veri Analizi - Veri Kalitesi ve Bütünlüğü
Kötü veriyi düzeltmenin 5 yolu
PDF'den ve Web'den Veri Kazıma
Bu bölümde verinin ayıklanmasının zor olduğu PDF formatındaki dosyalardan nasıl
kazındığı yer alıyor. Ayrıca webden verinin nasıl kazınarak e-tablolara aktarılıp
kullanıldığını örneklerle işleyeceğiz. Video, okuma ve forum ile bu pratikleri de
pekiştirmiş olacaksınız.
PDF'den Veri Kazıma
Veri formatının makine okunabilir olması, erişiminin zor olmaması ondan yararlanma
hızını arttırıyor. Açık formatlı verinin kamusal alanda ve habercilikte değer yaratma
potansiyelini önceki derslerimizde anlatmıştık. Veriler kapalı formatta ve
yapılandırılmamış şekilde mevcut olduğunda ise işler zorlaşabiliyor.
132
PDF de bu formatlardan biri.
Örnek 1:
Örnek:1
2014 yılında Arjantin yönetimi 2004-2013 yılları arasında yapılan harcamaların
verilerini ham PDF dosyaları ve görsel olarak paylaşmıştı. Yığınlar dolusu
yapılandırılmamış ve bilgiyasalar tarafından (makine okunabilirliği olmayan)
okunamayan ve analizi oldukça güç dosyalardı bunlar.
Veri gazeteciliği siteleri arasında yer alan La Nacion gazetesi bu verileri kazımayı,
dönüştürmeyi (PDF'den excel'e , excel'den CSV'ye, TSV'ye) başarmış, veriyi
kullanılabilir, yapılandırılmış veri setlerine dönüştürmüş; bu sayede harcamalar daha
detaylı görülebilmiş ve manşet haber olarak yer almıştı.
Haber her anlamda o dönemde hem yönetimin şefffalığına yönelik etkiler yaratmış
hem de yasal sürece yönelik araştırmaların daha etkin şekilde yürütülmesinin yolunu
açmıştı. Ayrıca veri gazetecileri bu dönüştürülmüş yığınla, veriden çok sayıda farklı,
veri güdümlü haber de çıkarmışlardı. Ödül alan bu projeyi buradan detaylı olarak da
inceleyebilirsiniz: http://blogs.lanacion.com.ar/projects/data/argentina%C2%B4s-
senate-expenses-2004-2013/
133
Örnek 2:
23 Temmuz 2016 tarihli Resmi Gazete'de yer alan 58 sayfalık OHAL'in Kanun
Hükmünde Kararnamesi. Taranmış bir PDF dosyası. Açık format değil,
yapılandırılmış değil, makine okunabilirliği ise yok. PDF dosyasının tamamı:
http://dagmedya.net/wp-content/uploads/2016/07/kapatilan-okullarin-tam-listesi-
Tabula ile PDF’den Veri Kazıma
Veriseti : 2015 -2016 yılı MEB Eğitim İstatistikleri Raporu
(Bilgi Edinme Hakkın"dan yararlanılarak temin edilmiştir)
Araç hakkında kısa bilgi / url: http://tabula.technology Tabula açık kaynaklı pdf"den
veri kazıma aracıdır. Yukardaki adresten cihazınıza indirebilirsiniz.
Araç sadece elektronik pdf dosyalarından veri kazıyabilir. Taranmış rapor veya
dökümanlar Tabula ile kazınamaz. Ayrıca aracı kurmadan önce Java yazılımı
cihazınıza kurulmalı. Bu adresten edinebilirsiniz: https://java.com/tr/download/ Eğer
Tabula yazılımı cihazınıza yüklemekte sorun yaşıyorsanız, aşağıdaki beta sürümlerini
deneyebilirsiniz.
Beta veya diğer sürümler için: https://github.com/tabulapdf/tabula/releases
134
Video Destekli İçerik: www.youtube.com/watch?v=GjhwKLVzm5M
Tabula ile PDF’den Veri Kazıma Video Açıklamaları
00:05 pdf’ten veri kazımak için kullanacağımız açık kaynak araç Tabula
00:09 sağdaki bölümden yazılımı indirebilirsiniz
00:31 uygulama cihazımızda bu şekilde görülüyor uygulamayı başlatırsak tarayıcı
sekmesinde yeni bir sayfa açılıyor
00:50 tüm kazıma işlemlerini bu sayfa üzerinden yapabiliriz
01:00 Tabula ile kazıyacağımız pdf tablosu MEB'in toplam eğitim bütçesi verileri
01:11 Bunun için Tabula'ya ihtiyacımız var. Uygulamayı başlattığımızda yeni bir
tarayıcı sekmesinde karşımıza işlem yapacağımız arayüz çıkıyor.
01:23 Sonrasında kazımak istediğimiz dokümanı Tabula'ya yüklüyoruz ve import
butonuna tıklıyoruz
02:03 Dokümanı Tabula'ya yükledik, yapmamız gereken kazıyacağımız verileri
seçmek
02:10 kazımak istediğimiz veri setini fare ile seçiyoruz
02: 27 Preview & Export butonuna tıklıyoruz.
02:47 Görüldüğü gibi veriler satır ve sütun olarak ayrıldı.
02:57 Ve veri seti doğru bir şekilde kazındı.
03:05 Son olarak veriyi CSV olarak indiriyoruz.
03:26 Tabula ile kazıyıp indirdiğimiz CSV dosyasını Google E-tablolarla Excel (xls)
formatına çevirebilir, kolay bir şekilde analiz edebiliriz.
Web Sayfasından Veri Kazıma
Bu bölümde html tabanlı web sitelerinden; veri
kazıma aracı olan import.io yardımıyla nasıl veri
kazınacağını göreceğiz. Import.io ile kazınan veri
ise,Türkiye’de iktidara gelen hükümetler listesini
içeriyor (link). Wikipedia sayfasında yer alan
yapılandırılmamış veriler import.io aracılığıyla
kazınacak. Kazınan veri CSV dosya formatında
PC'ye indirilecek. Sonrasına Google e-tablolar
135
aracılığıyla excel (xls) dosya formatına dönüştürülüp, analiz edilir ve makine
okunabilir hale getirilecek.
Video Destekli İçerik: www.youtube.com/watch?v=c3ja_IyTRrU
Import.io İle Webden Veri Kazıma Video Açıklamaları
00:05 Kazımak istediğimiz veri, Türkiye’yi yöneten hükümetler listesi.
00:18 wikipedia sayfasındaki veriyi Excel formatına dönüştürmek ve daha kolay
analiz edilebilir hale getirmek istiyoruz.
00:25 bunun için ımport.io veri kazıma aracını kullanacağız.
00:31 ilk olarak kazıyacağımız sayfanın url’sini kopyalıyoruz.
00:39 Adresi Import.io arama çubuğuna yapıştırıyoruz ve try it out butonuna
tıklıyoruz.
01:07 görüldüğü gibi veri sütunlara bölünerek kazındı.
01:19 bu aşamada aynı zamanda sütun isimlerini düzenleyebiliriz.
01:59 düzenledikten sonra “done” butonuna tıklayarak indirme sayfasına
gidebilirsiniz.
02:01 son olarak kazıdığımız veriyi CSV formatında indiriyoruz.
02:17 indirdiğimiz veriyi google e-tablolar aracılığıyla kolay bir şekilde excel (xls)
formatına çevirebiliriz.
02:45 Görüldüğü üzere import.io ile wikipedia’dan kolay bir veri kazıma işlemi
gerçekleştirdik. Aynı işlemi birçok site için deneyebilirsiniz.
Araç url: www.import.io
Kullanılan veri seti kaynağı:
https://tr.wikipedia.org/wiki/T%C3%BCrkiye_h%C3%BCk%C3%BBmetleri_listesi
Okuma Parçaları ve Forum
Okuma
- Veri Gazeteciliği ve Web Kazımanın Etiği Üzerine - Çeviri: Veri Gazetecisi
Ayşegül Engür
- Web"den Veri/İçerik Kazıma:Gazeteciler İçin Rehber - Çeviri: Faruk Aydıner
136
Forum
- Tabula aracını kullanarak bir PDF'den kazıma yapınız ve paylaşınız.
(PDF'in orjinal olması önemli)
- Import.io'yu kullanarak bir web sayfasından veri kazıyınız ve paylaşınız.
- http://www.avvg.org.tr/fg-veri-kazima-katilimci-pratikleri-/68-veri-kazima-
katilimci-pratikleri-forum.html
Dağınık Veri Temizleme
Dağınık xml dosyası örneği:
Kaynak: http://stackoverflow.com/questions/23247323/how-to-read-messy-xml-data-row-by-
row-in-javascript-in-sencha-touch
Veriler kazındığında ya da bilgi edinmeden temin edildiğinde istenen yapıda ve
kalitede olmayabiliyor. Boşluklar, satır ve sütünlar birbirine geçmiş olabiliyor, bazı
hücreleri ayırmak gerekebiliyor. Veriler, Excel ile de temizlenip analiz edilebilir,
ancak Open Refine aşağıdaki sunumda da yer aldığı gibi Excel'den daha fazla
fonksiyonu olan bir araç. Bu sebeple bu bölümde bir açık kaynak araç olan Open
Refine'ı kullanarak dağınık veriyi temizleyeceğiz. Araç web tarayıcısında çalışır.
Video Destekli İçeriktir: https://www.youtube.com/watch?v=qwCAWvW6gHw
Sunum için tıklayınız:
https://docs.google.com/presentation/d/1oGiOp8xUV5g5vbhYHP1S1lCYiSDGPz
OJZuk1eIdhKuQ/edit#slide=id.p4
Videoda temizlenen veri seti: 2015 yılı müze ve ören yeri istatistikleri:
https://docs.google.com/spreadsheets/d/12M0PXlFFZqj-
gPfQLB3Zw41EgTStfI2Baux2AuHHYdw/edit?usp=sharing
Araç buradan indirilebilir: http://openrefine.org/download.html
137
Open Refine Video Açıklama Metni
00:06 Bu videoda Open Refine ile dağınık veri temizleme pratiği yapacağız
00:17 Open Refine şu adresten ücretsiz olarak indirebilirsiniz, kurduktan sonra
uygulama; tarayıcı penceresinde açılacaktır.
01:05 Uygulama açıldığında dosyamızı sisteme nasıl yükleyeceğimize dair seçenekler
sunuluyor. (En iyi performans için kendi cihazınızdan yükleyiniz)
01:25 Veri setini yüklüyoruz. Temizleyeceğimiz veri seti 2015 yılı Müze ve Ören yeri
ziyaretçi sayıları ( Uyarı: veri seti video için dağınık veri haline getirildi)
01:55 Görüdüldüğü gibi ilk sütundaki veriler düzensiz, şehir adları, büyük küçük
harfli, ayrı, eksik yazılmış ve boşluklar var. Ayrıca adresler de müzelerle aynı sütuna
yazılmış
02:36 İlk olarak küçük harflerle yazılmış öğelerden kurtulalım: edit cells > common
transform > To uppercase. Görüldüğü gibi küçük harflerle yazılmış öğeler düzeltildi
03:15 İl adlarından önce boşluklar yer alıyor. Boşlukları da düzeltelim: edit cells >
common transform > Trim leading and trailing white space. Görüldüğü gibi
boşluklar düzeltildi.
03:53 Yanlış yazılmış illeri belirlemek için “Text Facet” fonksiyonunu kullanacağız.
Facet > Text Facet
4:07 Sol tarafta bir pencere açıldı ve birbirine benzeyen il adları gösteriliyor. Bu
kısımda il adlarını düzenleyebiliriz. İl adına imleci sürüklersek; kolayca “edit”
butonuna tıklayarak düzenliyoruz.
4:50 Eğer büyük bir veri temizliyorsanız, bu işlem vaktinizi alabilir. Bu yüzden
“Cluster” fonksiyonu ile yazım hatalarını kolay bir şekilde düzeltebiliriz.
5:04 Üstteki Cluster butonuna tıklıyoruz ve karşımıza çıkan pencereden birleştirilecek
grupların adını değiştiriyoruz.
06:17 Görüldüğü üzere Cluster fonksiyonu Text facet’den daha çok ve daha kolay
temizleme işlemi yapıyor
08:03 Ayrıca adres ve müze isimleri 2. sütunda birleşik yazılmış. Open refine ile bu
sütunu ikiye ayırabiliriz. edit column > split into several column. Sonrasında ise edit
column > rename this column diyerek ayrıdığımız sütunu adlandırabiliriz.
09:23 Eğer hata yaparsanız veya geriye dönmek isterseniz sol üst köşedeki “undo /
redo” butonuyla kolaylıkla geriye dönüş yapabilirsiniz
09:40 Veriyi temizledikten sonra, sağ üstteki export butonuyla istediğimiz
formatta indirebiliriz.
138
12. VERİ GÖRSELLEŞTİRME
139
Bu bölümde görselleştirmenin karar verme sürecinde etkisini, önemini, gelişimini
göreceksiniz. Kırım Savaşı örneği bu konudaki ilkler arasında önemli bir
görselleştirmedir. Şöyle düşünelim diyelim ki binlerce, yüzbinlerce ya da milyonlarca
ham veriyi anlamaya ihtiyacınız var. Ama bunu yapmak için zamanınız kısa. Veriye
belki aşinasınız, kaynaklarını biliyorsunuz, belki çoktan ne hakkında olduğunu ve neyin
analiz edileceğini de biliyorsunuz. Yani elinizde mevcut olan veriye yabancı değilsiniz.
Bu durumda biraz daha hızlı ilerleyebilirsiniz. Ama bir de tersini düşünelim. Veri
setlerine dair her hangi bir fikriniz yok, başka bir ekip/kaynak tarafından sizin
elinize geçiyor ve veriye dair hiçbir fikriniz yok. Her ne durumda olursanız olun
kullanacağınız veri; yürütüyor olduğunuz faaliyetlerinizde / karar almanıza etki ediyor.
Bu sebeple veriyi kullanmadan ne anlattığını anlamak, veri görselleştirmeye neden
ihtiyaç duyulduğunu da açıklayan sebeplerden biri.
Yukarıdaki şekil, 1843 Kırım Savaşı döneminde hemşire ve istatistikçi Florence
Nightingale’in savaş sırasında orduda ölenlere ilişkin topladığı veriyi polar diyagram ile
görüntülediği çalışmayı gösteriyor. Üsküdar Selimiye Kışlası hastanesindeki ölümleri
gösteren bu şeklin başlığı "Doğu'daki ordudaki ölümlerin sebepleri diagramı" olarak
geçmekte.
Nightingale’in, bu istatistiksel aracı kullanarak gösterdiği sonuçlar ve bunları açıkça ve
anlaşılır bir rapor ile İngiliz Kralliyet Komisyonu araştırmasına sunması, o dönmede
büyük etki yaratmıştır.
1853-1856 yılları arasında gerçekleşen Kırım Savaşı sırasında, Üsküdar, Selimiye
Kışlası, İngilizler tarafından kullanılmıştı. Florence Nightingale de, 1854'te kışlaya
gelerek yaralı İngiliz askerlerinin tedavisinde görev almıştır.
Diyagram neyi anlatıyor?
Kırmızı bölgeler savaş yaralanmalarını gösteriyor, mavi bölgeler önlenebilir
hastalıklardan ölen askerleri gösteriyor ve siyah bölümler ise diğer nedenlerden
ölen askerleri göstermekte. Diyagram aynı zamanda, Rusya'nın o dönemdeki
saldırılarının karşısında kolera, tifo ve dizanteriden çok daha fazla askerin
öldüğünü belgeliyordu. (Aylar üzerinden sağdaki 1. yılı -54/55-, soldaki 2.yılı
55/56-ifade ediyor) Bu da hastanelerde daha fazla önlem alınması gerektiğine
yönelik dönemin karar vericilerini ikna etmişti.
140
Veri görselleştirme, bilginin
etkin şekilde kullanılarak karar
alma sürecini etkilemede önemli
araçlardan biridir. Haberin daha
etkin anlaşılmasına yardım eder.
Ancak, her görselleştirme
dikkatli olunmadığında yarardan çok ciddi bir yanılgıya neden de olabilir. Bazen en iyi
kafa karıştıran kaynağa da dönüşebilir. Öte yandan dikkatli yapılmış görselleştirme
çalışmaları gerçek çözüm üretebilir, karar alma mekanizmasını harekete
geçirebilirler. En iyi veri görselleştirme; veri setinde ipucu bulmak, bulgular keşfetmek
yani yeni şeyler anlatarak, bir ilişki bağı oluşturabilmektir. Bu ilişkileri anlamak ve
yorumlayıp, gözlemlemeyi başarmak, iyi karar alabilmenin anahtarıdır. Bu sebeple
belirtmek gerekir ki eğer görselleştirme doğru yapılır ise minik bir veriseti bile olsa çok
şey ifade edebilir.
Bu bölümde veri görselleştirmenin estetik, etkileyici ve dikkat çekici yönlerinin dışında,
neden günümüz için önemli olduğunu, nasıl yapılması gerektiğini, geliştirmenin
yöntemlerini, kurallarını, görsel etiğin ne olduğunu ve sınırlarını kapsamlı şekilde ele
alarak, verilen veri setleri ile e-tablolar (çizgi, sütun, pasta grafik ve nüfus piramidi) ile
haritalandırma çalışmaları yapmanızı sağlayacak teknikler aktarılmaktadır.
Veri Görselleştirme Nedir?
Veri Görselleştirme: Ham verilerin hızlı ve etkili karar almada kolayca anlaşılır
görüntülere / fotoğraflara dönüştürülme sürecidir.
141
Örnek-1
Grafik: (M.Ö 950-Avrupa) Bilinen
ilk nicel gösterge - gezegenlerin ve
ayların değişen konumunu gösteren
bir çoklu zaman serisi grafiği.
Örnek- 2
Harita: Bilinen en eski harita.
Çatalhöyük/Konya Müzesi-Türkiye
(m.ö 6500)
20.yüzyılın başlarında Gestalt Psikologları, elementlerin bir şekle / sembole
dönüştürüldüğünde algısal olarak çıktısının beklenenden daha etkin olduğunu
gözlemlemiştir.
Veri görselleştirmenin yeni değil, teknoloji ile zaman içinde geliştiğini belirtmek
yanlış olmaz. Bilgisayar tabanlı görselleştirme çalışmaları da 1984'den itibaren hız
kazanmıştır.
“Grafikte mükemmellik;
izleyiciye/okuyucuya
en kısa sürede, en az
mürekkeple, sonsuz sayıda
fikir verir” - Edward Tufte,
1983”
142
Veri Görselleştirmenin Kökleri ve Tipleri
Veri Görselleştirmenin Kökleri
Kartografya/Haritacılık
İstatistik
Veri
Görsel Düşünme
Teknoloji
Veri Görselleştirme Tipleri
Doğrusal Görselleştirme
Düzlemsel Görselleştirme
Hacimsel Görselleştirme
Çok-Boyutlu Görselleştirme
Hiyerarşik Görselleştirme
Zamansal Görselleştirme
İletimsel Görselleştirme
Veri Görselleştirme Süreci
Ham veriyi bulma, toplama, doğrulama / güncelliğinden emin olma, temizleme, analiz
etme ve verisetinin özelliğine göre görselleştirme / sunma süreçlerini kapsar.
143
Veri Görselleştirmenin Sınırları
Veri Kalitesi: Görselleştirme için kullanılan verinin kalitesi iyi bir görselleştirme
çalışmasının öncelikli konusudur. Ham veri yeterince iyi kalitede değil ise
görselleştirmek de mümkün olmayabilir. Önceki bölümde dağınık verinin nasıl
temizlendiğine yer verilmişti. Verinin temizlenerek kullanılır hale getirilmesi
görselleştirme öncesi için önemli bir süreç.
Neden-Sonuç İlişkisi: Veri görselleştirme sıklıkla ilişkileri göstermede kullanılır.
Neden-sonuç ilişkisinin olmadığı, bir şeyin sadece olmuş gibi gösterilmesinden
kaçınılması gerekiyor. Bu nedenden ötürü görselleştirilen şey ciddi yanlışlara neden
olabiliyor.
Doğrulanabilir - Kanıtlanabilir Olma: Veri görselleştirme; anlamlandırma, ham veriyi
toplama, doğrulama, temizleme, analiz etme, sunma sürecini kapsıyor mu? Eğer
kapsamıyor ise ne işe yaradıkları sorgulanmalı. Hangi açıdan ölçme / analiz etme /
karara verme gibi detayları içinde barındırıyor? Yoksa sadece güzel görsellerden mi
ibaret?...bunları bilmek önemlidir.
Görsel Etik
Görseller ve fotoğraflar: düşüncelerimizin, duygularımızın, davranışlarımızın iyi ve
kötü yönde şekilenmesine etki etmektedir.
Görsel etik sadece dijital etik ya da görsel gazetecilik, reklamcılık, halkla ilişkiler ya
da tv gazeteciliği değildir ya da insanları görsellere maruz bırakarak tektipçi bir
şey yapmak da değildir. Görsel etik iletişimin sinir sistemidir, iletişimin "ruhudur".
Yani, "Gözler kalbin aynasıdır" ve bu bir ironi barındırmamaktadır.
Görsel Etik Neden Önemlidir?
Görmek inanmaktır.
Görselleştirilen şey kelimelerden daha güçlüdür ve daha fazla alternatif sunar.
144
Okuma Parçaları ve Forum
Okuma/İnceleme
Veriyi Kavramak İçin Veri Görselleştirmeyi Kullanmak
Açık Yayınlanmış Haberleri Görselleştirme (İnceleme)
Forum
Yıllara göre gazete ve dergi sayısı, 2011 - 2015 grafiğini yorumlayınız:
www.avvg.org.tr/fg-grafik-yorumlama-/101-grafik-yorumlama-2-forum.html
Veri Görselleştirme Kuralları
Bu bölümde veriyi görselleştirirken hangi kurallara dikkat edilmesi gerektiğini
öğreneceğiz.
Veri Görselleştirme Yöntemleri Periyodik Tablosu
Üretilen görselleştirmelerin pek çoğu periyodik tabloda yer alan yöntemlerden yararlanılarak
geliştiriliyor. Tablo, hangi veri seti için hangi görsel seçilmeli, yöntem ne olmalı gibi sorulara
yanıtlar vermekte. Tabloya interaktif olarak aşağıdaki linkten ulaşılabilir: www.visual-
literacy.org/periodic_table/periodic_table.html
145
Periyot tablosunda sarı bölümlerde yer alan bazı harfler; C (süreç), T (tablo), Pi (Yuvarlak
Diyagram), L (Çizgi Grafik), B (Çubuk Grafik) vb. gibi veri ile görselleştirme yaparken
önerilen grafikleri kapsıyor. Cy, Hy ve harfler üzerinde yer alan semboller
ise yapılan görselleştirmenin neye yanıt verebileceğini içeriyor. Tablo henüz Türkçeye
kazandırılmış olmasa da, link üzerinden interaktif kısmını inceleyerek ve üzerinde biraz
zaman geçirerek görselleştirme yöntem tablosunu daha iyi anlama şansı bulabilirsiniz.
Bazı Temel Veri Görselleştirme Kuralları
Gereksiz Biçimlendirmeden Uzak Durma
Gereksiz Dağınıklıkların Kaldırılması
146
Grafik Yapmadan Önce Filtrelenmesi
Gereksiz Renk Kullanılmaması
Veri Nasıl Sunulur
147
Verisetiniz ile değişik kategorilerden değerleri karşılaştırmak için çubuk grafik, bir
değeri zaman içinde takip etmek için çizgi grafik, iki veri arasındaki etkileşimi
göstermek için serpilme grafik, coğrafyayla ilgili veriyi görselleştimemek için ise
haritalandırma çalışması yapabilirsiniz.
Veri Görselleştirmeyi Geliştirme Yöntemleri
Veriseti için doğru görselleştirme aracı seçildiğinden emin olmalı ve rahat kullanılan,
pratik yapma şansının en fazla olduğu araç seçilmeli.
Bilginin doğru sunulduğundan emin olunmalı, şüpheci yaklaşılmalı (Görselleştirme
aracının veride çarpıklıklar, verinin yanlış sunulmasına / yorumlanmasına neden
olması gibi.)
Bilgiyi mantık çerçevesinde analiz etme / sıralama / kullanma (Kategoriye dikkat
etmek, alfabetik sıralamak vb.) Bunu yapmak okuyucunun veri ile daha fazla iletişime
geçmesini sağlar.
Karşılaştırılması kolay olmalıdır (İzleyen / okuyan için kolay filtrelenmeli /
karşılaştırılmalı, kolay anlam çıkartılmalı ve bilgi alınmalı.
Verinin gereken dikkati çekmesi sağlanmalı (Gereksiz ikonlar, semboller, ek
görselleştirmeler ile izleyicinin dikkati dağıtılmamalı)
Uygun renk paletleri ve simgeleri kullanılmalı (Gereksiz etiketlemeleri kaldırarak
anlamın artırılması önemlidir) ColorTab
Bazı Veri Görselleştirme Araçları
148
Excel
• Spreadsheet (e-tablo)
• Google Chart
150
Okuma Parçaları ve Forum
Okuma
Diyagram ve grafik yapmanın 7 temel yolu -Nathan Yau-
Çeviri: Dersu Ekim Tanca
Veri Gazeteciliği ve Salgın: Grafiklerde Ebola -Simon Roger-
Çeviri: Dersu Ekim Tanca
Forum
Bir iyi bir kötü görselleştirme örneği/linki paylaşınız.
www.avvg.org.tr/fg-bir-iyi-bir-kotu-gorsellestirme-ornegilinki-paylasiniz-/102-bir-iyi-
bir-kotu-gorsellestirme-ornegilinki-paylasiniz-2-forum.html
Görselleştirme Örnekleri ve İncelemeler
Kötü Veri Görselleştirme (Dosya)
İyi Veri Görselleştirme Örnekleri (Gerçek Projeler Üzerinden)
Kötü Veri Rehberi İçin Tıklayınız:
(https://docs.google.com/document/d/1uNM2HtlzH3uXOtdUQGrA6EWz8664HWL4
QJT8zuOFtSc/edit)
İncelemeler:
Veri Görselleştirme Kataloğu
Veri Görselleştirmek ( 1 ) - ( 2 )
Türkçe Altyazılı Video: "David McCandless: Veri Görselleştirmenin Güzelliği"
151
13. VERİ GÖRSELLEŞTİRME ELEMENTLERİ
152
Veri görselleştirme beş elementten oluşmaktadır:
Veri > Görünüm/Tasarım > Bulgu > Hikaye >Etkileşim
Bu elementler görselleştirmenin başarılı olmasını da sağlayan önemli ana
başlıklardır.
Başarılı bir görselleştirmenin 5 elementini kısaca açıklayacak olursak:
1. Veri: Verisiz hiçbir şey sunamazsınız. (Etkileşim için veri gereklidir)
2. Görünüm: Veriyi analiz etmenin en iyi yöntemidir görünüm/tasarım.
(Görmek inanmaktır)
3. Bulgular: İyi bir haber/hikaye için gerekli olabilecek görsel trendleri, farklılıkları, vb.
keşfetmek.
4. Hikaye/Haber: Veriden çıkan bulgular hikayenin gelişmesini güçlendirir.
Bulunan hikaye verinin önemini de gösterir.
5. Etki: Görselleştirilen verinin etki yaratması, farklı olanı ortaya koyabilmesi.
E-Tabloda Grafik Yapma
(Çizgi, Çubuk, Pasta-Nüfus Piramidi)
Bu bölümde web tabanlı olan e-tabloyu kullanarak çizgi, sütun, pasta grafiği ve nüfus
piramidi pratiğini gerçekleştireceğiz.
153
Grafik: Görüntünün bir yüzey üzerinde temsil
edilmesidir. Fotoğraflar, çizimler, diyagramlar, haritalar ve diğer resimler birer
grafiktir.
Grafikler genelde yazı, illüstrasyon ve renkten oluşur.
Video Destekli İçerik: https://www.youtube.com/watch?v=JrpmBWxSczM
Google E-Tablo Video Altyazı Dökümü (Grafikler)
> Çizgi Grafik
00:06 Bu videoda Google e-tablolar kullanarak grafik oluşturma pratiği yapacağız.
Veri seti: TÜİK’in istatistiklerle kadın bülteninden, 1935-2015 arası cinsiyet
dağılımına göre vekil sayısı
00:21 İlk olarak çizgi grafik pratiği oluşturacağız, çizgi grafik genelde dönemsel
olarak değişen olguları görselleştirmede kullanılıyor
00:35 ilk olarak görselleştireceğimiz veri setini seçiyoruz
00:45 Sonrasında sağ üst köşedeki grafik ekle butonuna tıklıyoruz. Karşımıza
elimizdeki veriyi düzenleyeceğimiz bir editör çıkıyor. Çizgi grafiği seçip,
"özelleştirmeye" tıklayarak grafiği düzenliyoruz
01:11 Grafik başlığını değiştirebiliriz.
01:46 Sonrasında grafiğin yatay ve dikey düzlemini adlandırıyoruz
02:08 Grafiğin renklerini belirliyoruz.
03:00 Grafiği jpeg olarak indirebiliriz
03:18 Grafiği interaktif bir şekilde web sitenize ekleyebilirsiniz
05:37 Grafiği yaptıktan sonra veri seti güncellenir veya değişirse grafik de veri setine
göre güncellenecektir.
Video Destekli İçerik: https://www.youtube.com/watch?v=JrpmBWxSczM
Google E-Tablo Video Altyazı Dökümü (Grafikler)
> Sütun grafik
05:53 İkinci grafiğimiz sütun grafik, yine görselleştirilecek verileri fare ile seçip grafik
ekle butonuna tıklıyoruz
06:06 Sütun grafiği seçip, düzenleyebiliriz.
08:05 Grafiği yayımlayarak yine interaktif bir görselleştirme elde edebiliriz
154
> Pasta grafik
09:03 Son olarak yaş gruplarına göre mahkum verileriyle pasta grafik oluşturacağız.
Öncelikle görselleştireceğimiz veri setini seçiyoruz
09:12 Öneriler bölümünden pasta grafiği seçip "özelleştirme" bölümünden kolay bir
şekilde düzenleyebiliriz
10:10 Grafiği jpeg formatında indirebiliriz
10:38 Aynı zamanda grafiği interaktif olarak da yayımlayabiliriz.
Google E-Tablo Video Altyazı Dökümü (Grafikler)
> Nüfus piramidi
11: 27 Son olarak nüfus piramidi oluşturma pratiği yapacağız. Bunun için TÜİK 2015
yılı nüfus veri setini kullanacağız. İlk olarak 2015 yılı erkek-kadın nüfus verilerini yaş
gruplarına ayrılmış şekilde başka bir sayfaya yapıştıralım
12:09 Sonrasında erkek veya kadın nüfus verilerinden birini negatif değer haline
getiriyoruz (rakamların önüne eksi (-) ekleyerek) (ÖNEMLİ)
12:54 Görselleştireceğimiz veriyi seçip grafik ekle butonuna tıklayalım ve çubuk
grafiği seçelim.
13:25 Özelleştirme menüsünden "yığınla" ve "ters" kutularını işaretleyelim )
(ÖNEMLİ) ve grafiği düzenleyelim.
15:17 Son olarak grafiği interaktif olarak yayımlayabiliriz.
Videoda yer alan görselleştirme çalışmalarının veri setleri ve açıklamaları:
1-2-3) "İstatistiklerle Kadın" veri seti üzerinden Google grafik aracılığıyla çubuk,
çizgi ve pasta grafik pratikleri yapıldı. Grafik düzenleme ve interaktif olarak paylaşma
detayları verildi, bir editöre nasıl yerleştirildiği gösterildi.TÜİK İstatistiklerle Kadın
2015: https://docs.google.com/spreadsheets/d/1WTNbwsFlSJO00BjGPXBGjZ1ceZA
uexCHleICIPBI6uw/edit?usp=sharing
Ceza Tevkif Evleri web sayfasında yer alan veriler Google Spreadhseet importHtml
fonksiyonu kullanarak kazındı.
Yaş gruplarına göre mahpus sayısı 2016 (Ceza ve Tevkif Evleri)
https://docs.google.com/spreadsheets/d/1WTNbwsFlSJO00BjGPXBGjZ1ceZAuexCH
leICIPBI6uw/edit?usp=sharing
Çizgi-Sütun-Pasta Grafikler
155
Çizgi-Sütun-Pasta Grafikler
Çizgi-Sütun-Pasta Grafikler
156
4) "2015 TÜİK Yaş ve Cinsiyet" dağılımına göre nüfus istatistikleri kullanılarak
nüfus piramidi görselleştirme pratiği yapıldı.
Nüfus Piramidi
Okuma Parçaları ve Forum
Okuma / İnceleme
Bilginin Görselleştirilmesinde Sosyal Ağ Analizinin Kullanımı-Umut Al
298 Veri Görselleştirme Aracı ve Kaynak
Görselleştirme araçları için Harvard Üniversitesi
157
Forum
Öğrendiğiniz görselleştirme çalışmalarından (çizgi, sütun, pasta grafiği ve nüfus
piramidi) bir ya da iki tanesini farklı veri setlerini kullanarak yapınız ve forumda
paylaşınız:
www.avvg.org.tr/fg-ogrendiginiz-gorsellestirme-calismalarindan-en-az-iki-tanesini-farkli-
veri-setini-kullanarak-yapiniz/104-ogrendiginiz-gorsellestirme-calismalarindan-en-iki-
tanesini-yapiniz-2-forum.html
Füzyon Tablo ile Haritalandırma
Bu bölümde ise füzyon tabloları kullanarak haritalandırma çalışmasını video, okuma
ve forum desteğiyle öğreneceksiniz. Coğrafi Bilgi Sistemini (CBS/GİS)'i öğrenecek,
videoda yer alan haritalandırma çalışmasını inceleyerek farklı haritalandırmaları
göreceksiniz.
Coğrafi Bilgi Sistemi Nedir (CBS)
Karmaşık sosyal, ekonomik, çevresel vb. sorunların çözümüne yönelik
mekana/konuma dayalı karar verme süreçlerinde, kullanıcılara yardımcı olmak üzere,
büyük hacimli coğrafi verilerin; toplanması, depolanması, işlenmesi, yönetimi,
mekansal analizi, sorgulaması ve sunulması fonksiyonlarını yerine getiren donanım,
yazılım, personel, coğrafi veri ve yöntem bütünüdür.
Google haritalar, Carto DB, Fusion Tablolar ve Masaüstü CBS uygulamaları (QGIS
gibi), Coğrafi Bilgi Sistemini kullanan araçlardan bazılarıdır. Bu derste açık kaynaklı
bu araçlardan «Füzyon Tablolar» aracıyla yapılan haritalandırma yer almakta. Ancak
çok sayıda araç, haritalandırma için kullanılabilir.
Video Destekli İçerik: https://www.youtube.com/watch?v=i9Zm71tGjoc
Videoda yer alan görselleştirme çalışmalarının veri setleri ve açıklamaları:
2014 yılı tiyatro gösteri sayısı verileri Füzyon haritalar aracılığıyla görselleştirildi. Füzyon
haritalar yardımıyla harita paylaşımı, legend ekleme ve sembol değiştirme pratikleri yapıldı.
Veri seti: 2014 Yılı İllere göre Tiyatro Gösteri Sayısı (MEDAS /TÜİK) Füzyon Haritası
Kullanılan veri setinin kaynağı:
https://docs.google.com/spreadsheets/d/1nlsLwAEDUvSDLIgEC1AVUfOpIpYfeVcB_tFQv
C-37Qo/edit#gid=1446484294
158
Okuma Parçaları ve Forum
Okuma /İnceleme
Editörler Hangi Görselleşitirme Aracını Kullanıyor
Forum
Öğrendiğiniz haritalandırma çalışmasını farklı veri seti ile yaparak forumda
paylaşınız:
www.avvg.org.tr/fg-ogrendiginiz-haritalandirma-calismasini-farkli-veri-seti-ile-
yaparak-forumda-paylasiniz/105-ogrendiginiz-haritalandirma-calismasini-farkli-veri-
seti-ile-yaparak-forumda-paylasiniz-2-forum.html
Türkçe Altyazılı Video: "Eric Berlow ve Sean Gourley: Haritalandırarak
Yaymaya Değer Fikirler"
159
14. VERİ İLE HİKAYE ANLATMA
160
Bundan önceki bölümlerde veriyi, açık veriyi, veri gazeteciliğini, veri analizini,
veri görselleştirmeyi öğrendiniz. Bu son bölümde ise iyi hikaye anlatmanın
önemini, özellikle veriyle çalışırken bize neden yeni bir şeyler anlatması
gerektiğini göreceksiniz.
Ek olarak «öğrendiklerimizden ne anlıyoruz, nasıl anlatıyoruz ve nasıl anlatmalıyız»
gibi soruların yanıtlarını da bulacaksınız.
Bu bölümün amacı veriyle nasıl etkin haber/hikaye anlatıldığına değinmek, anlatırken
neden dikkatli olmak gerektiğini kavramaktır.
Yandaki
fotoğraf 2013 yılında
Akdeniz'de şiddetli
yağmur sonrası bir
restorant masasının
üstünde unutulmuş
domatesin farklı
açılardan çekilmiş
fotoğraflarından
oluşan bir kolaj. İyi
hikaye anlatıcılığı da
böylesi bir kolaj
gibidir, ancak her
açıdan
görülebildiğinde
mümkündür farklı
şeyleri anlayabilmek.
Veriyle hikaye
anlatmak ve
anlattığınız
hikayenin ilginç
tarafları bu açıdan
önemlidir.
Şekil 16* Şiddetli yağmur sonrası bir restoranda masanın üstünde unutulmuş bir domatesin kolajı (pd-2013)
Hikayeyle Başlama, akış şemasını kullanma
161
Açıklamalı akış şeması: www.verigazeteciligi.com/veri-gazeteciligi-projelerinde-
tikanmayi-onlemek-icin-akis-semalari-kullanin/
Hikaye formu: https://docs.google.com/spreadsheets/d/1r-
Jl1XpzFWJmOnorlCmOUZwSy6zdvn0bG7yUZ7KtVTk/edit#gid=224561306
Bulguları Gözden Geçirme
Verinin birden fazla gözden geçirilmesi, denetlenmesi, karşılaştırılması, teknik olarak
kontrol edilmesi. Verinin doğrulanması.
Açıklamalı veri denetleme aracı:
http://www.verigazeteciligi.com/veri-denetleme-araci-data-proofer/
162
Araştırma ile ilgili bir ya da iki istatistiki noktaya odaklanma
Elinizde büyük, dağınık bir veri var. Bu noktada en önemli detay veri ile mülakat
tekniğini kullanarak dikkat çekici noktaların üzerinde durmak.
Bu pratik okuyanların daha fazla dikkatini çektiği gibi daha fazla paylaşım, daha fazla
erişim etkisi yaratabiliyor.
Örnek-1| "16 bombalı saldırının 13’ünde kadınlar canlı bomba/1996-2015)
Haberin detayları: http://dagmedya.net/2015/01/07/15-bombali-saldirinin-11inde-
kadinlar-canli-bomba/
Açık veri seti:
https://docs.google.com/spreadsheets/d/1zfcUVmd0qfQ_7ewNclHB-
UPO5urs7f7NrTSRibVNi0A/edit#gid=0
Örnek-2 Dünyanın en zengin 6 ülkesi dünyadaki toplam mültecilerin sadece %9'una kapılarını
açtı. Almanya, Amerika, Fransa, Çin, Britanya ve Japonya 2.1 milyon mülteciye ev sahipliği
yapıyor.
Grafiği webde gör: https://infogr.am/cddd5b81-8eb4-42bb-9917-c5282b4f17f9
163
Veri kaynağı: www.weforum.org/agenda/2016/07/richest-countries-fewest-refugees-
oxfam?utm_content=bufferc3bd7&utm_medium=social&utm_source=twitter.com&utm
_campaign=buffer
Bulduğunuz bulguyu
görselleştirme, hangi veri
görselleştirme aracının ve grafik
türünün kullanılacağını belirleme,
görselleştirmeler için kullanılacak
başlıkları belirleme.
Araç:
https://datavizcatalogue.com/TR/
164
Verinin İnsanların Dikkatini Çekmesi (İnsansılaştırma)
Kullanılan verilerin insanla
ilişkisi kurulabilmeli.
İnsanların önemsemesini
sağlama ve birinin gerçek
bir sorununa ışık tutabilmesi
önem taşıyor.
Örnek| "Türkiye’de
Suriyelilere sağlanan “geçici
koruma” statüsü, mülteci
haklarının çok uzağında"
Haberin detayları:
http://dagmedya.net/2015/06/14/ozel-dosyaturkiyede-suriyelilere-saglanan-gecici-
koruma-statusu-multeci-haklarinin-cok-uzaginda/
Yararlı ve Bilgilendirici Olma
165
Kullanılan veri bir başkasının işine yarıyor mu? Yaptırım uyguluyor mu? Bir başkası
yaptığınız analizden yaralanarak farklı olarak ne yapabilir? Eğer bunları
yaptırabiliyorsanız hikayeniz/haberiniz güçlü demektir. Bir başka anlatımla
kullandığınız
veriyle anlatmayı
başardığınız
haber/hikaye
insanların daha
iyi karar
almalarına
yardımcı
olabiliyor.
Öngörü
insanların
dikkatini çeker.
Kararlarını
etkiler.
Örnek: Veri
gazetecisi Simon
Roger’ın, Irak
Savaşında ölen
siviller haritası
haberi sonrasında, haberin en altına eklediği veri setleri, detayları ile "bu veriyle bir
şey yapabilir misin?" diye soruyor adeta.
Forum
Forum
• 'Brüt ve Asgari Ücret ve Hesaplanışı' başlıklı iki sayfada yer alan veri setlerini analiz
ederek dikkat çekici taraflarını yazınız, hikayeleştirip forumda paylaşınız. Paylaşmak
için: http://www.avvg.org.tr/fg-veri-ile-hikaye-anlatma/107-veri-ile-hikaye-anlatma-
pratigi-2--forum.html (En az 150 sözcük)
Açık Kaynak Araçlarla Uygulama
Önceki bölümde veri ile hikaye anlatmayı, hikayeyle başlama ve akış şeması
kullanma, veri denetimi detaylarını ve örneklerini sunumlarla öğrendiniz. Bir veri
setini inceleyerek verinin çarpıcı taraflarını forumda paylaştınız. Bu derste ise açık
kaynak araçlardan Infogr.am, Cartodb, Tableau ve Knoema araçlarını kullanmayı
öğrenerek, uygulayacaksınız.
166
Infogr.am
Açıklamalı Dosya:
https://docs.google.com/document/d/1eowjLv6a1pfbmHAIr2217iCZuK29PFuC0HgOhA
Pi2eI/edit
Url: infogr.am
Cartodb
Açıklama dosyası: https://docs.google.com/document/d/1QzcVPSY-
whU0KcT2i1ygmizYqcrdgWg-HDBsmFU3PEU/edit
Url: https://cartodb.com/
167
Tableau
Açıklama dosyası:
https://docs.google.com/document/d/1-YOQfsMrOZMKk8SzOPUEVAYSAM-
UkK1SsokbIDmzihA/edit
İndir: https://public.tableau.com/s/download/
Knoema
Açıklama dosyası için:
https://docs.google.com/document/d/1mO5o0QmzRjqQHIjWSSPGksGyqdd6WC72-
168
i58lYqZBzk/edit
Url:https://knoema.com/
Forum
Forum
• Infogr.am, Cartodb, Tableau ve Knoema araçlarından en az iki tanesini hikayesini
yazdığınız veri seti için kullanınız ve forumda paylaşınız: http://www.avvg.org.tr/fg-
acik-kaynak-araclarin-uygulanmasi/108-acik-kaynak-araclarin-uygulanmasi-2-
forum.html
169
YARARLANILAN KAYNAKLAR
Aslan, Alaattin; Bayrakçı, Serkan; Küçükvardar, Mert (2016). “Bilişim Çağında
Geleneksel Gazeteciliğin Dönüşümü: Veri Gazeteciliği”, Marmara İletişim
Dergisi, sayı 26, (s.55–70), http://dergipark.gov.tr/download/article-file/267619
Dağ, Pınar (2015). Gazeteciliğin Geleceği: Veri Gazeteciliği,
https://www.academia.edu/16286677/GAZETECİLİĞİN_GELECEĞİ_VERİ_GA
ZETECİLİĞİ_-Pınar_Dağ_Ekitap_