26 Mart 2019 Salı

SOSYAL MEDYA VERİLERİ ÜZERİNDEN SİBER İSTİHBARAT FAALİYETLERİ, BÖLÜM 2

SOSYAL MEDYA VERİLERİ ÜZERİNDEN SİBER İSTİHBARAT FAALİYETLERİ, BÖLÜM 2



      Günümüzde sosyal medyanın ulaştığı güç seviyesi göz önüne alındığında, devletler tarafından sosyal medya verileri üzerinde istihbarat çalışmaları yapmanın artık kaçınılmaz olduğu anlaşılacaktır. Bu çalışmalar gerek sitelerle belirli anlaşmalar çerçevesinde gerekse devletlerin kendi yöntem ve teknikleriyle yürütülebilmektedir. Burada esas olan kitlelerin hareketlerini önceden tespit ederek olası tehlikeleri eylem haline dönüşmeden önce engelleyebilmek ve/veya 
olası şüpheli kişilerin takibi ve engellenmesidir. Toplum ve devlet güvenliği için ülkelerin sosyal medya verilerine kayıtsız kalması mümkün değildir. 

Bu çalışmada, Türkiye’de kadına şiddet ve bunun karşısında toplumsal tepkilerin ölçümüne, toplum görüşlerin anlaşılmasına ve karar vericilerin benzer durumlarda toplumun nabzını nasıl tutabileceğine örnek olması açısından bir çalışma gerçekleştirilmiştir. 

IV. TWİTTER VERİLERİ ÜZERİNDE UYGULAMA 

Türkiye’de, üniversite öğrencisi bir genç kız 11 Şubat 2015 tarihinde kaybolmuş ve araştırmalar sonucu kendisinin cinayete kurban gittiği ortaya çıkmıştır. 

Bu cinayete tüm toplumun tepkisi çok büyük ve etkili olmuştur. Kadına şiddete pek çok ortamda tepki gösterilmiştir. Bu ortamlardan en önemlisi ise sosyal medya olmuştur. Toplum, sanatçılar, politikacılar, sporcular, yerli ve yabancı basın olmak üzere her kesimden bu konuyla ilgili twitler yayınlanmıştır. 
Toplumun nabzını tutan en önemli sosyal medya sitelerinden olan Twitter üzerinde böyle durumlarda, bu verilerden istihbarat çalışması yapmak, ilgili birimlerin amaçlarından biri olmalıdır. Kitleler sosyal medya mesajları üzerinden 
harekete geçebilmekte, bireysel veya kitlesel şiddete başvurabilmekte, gösteri veya eylem organize edebilmektedir. Bu süreç içerisinde yazdığı twitler yüzünden ifade vermeye çağrılan veya basında açıklama yaparak düzeltmeler yapmaya çalışanlar dahi olmuştur. 

Olayın ortaya çıkmasını takiben twitter dinlenerek 15 Şubat – 15 Mart 2015 tarihleri arasındaki bir aylık süreçte NodeXL [32] temasıyla, twitter üzerinden konu ile ilgili 62273 veri çekilmiştir. Bu veriler üzerinde yapılan analiz 
sonuçları açıklanmıştır. 

Twitter’dan elde edilen veriler öncelikle “Tweet”, “Mentions” ve “ReplyTo” olmak üzere üç ayrı gruba ayrılmıştır. Her grup kendi içinde değerlendirilmiştir. Sonuç olarak ortaya, 22626 Twit, 38766 Etiket(bahsetme) ve 796 Cevap verisi çıkmıştır. 85 veri ise boş veya sadece simgesel veri olarak temizlenmiştir. 

Yapılan işlemlerden sonra, Fruchterman-Reingo algoritmasıyla her üç veri grubuna ait ağ grafiği Şekil 2,3 ve 4’te görüldüğü gibi olmuştur. 


Şekil 2. Twit verileri ağ grafiği. 


Şekil 3. Etiket verileri ağ grafiği. 


Şekil 4. Cevap verileri ağ grafiği. 

Şekil 2’de görülen düğümlerin tamamı kendine dönmektedir çünkü sadece twit verileri işlenmiştir. Şekil 3 ve Şekil 4’te ise etiket ve cevap verileri, kişiler arasındaki bağlantıyı göstermektedir. 

Yazılan twitler bütün halinde analiz edildikten sonra içerisinde çok fazla Uniform Resource Locator (URL) bulunması, ülkemizde Trending Topic (TT) listesinin 
çoğunlukla reklam amaçlı kullanıldığını göstermiştir (Tablo 1). 


TABLO I 

EN ÇOK KULLANILAN DOMAİN LİSTESİ 

Bu sonucu destekleyen diğer bir bulgu, en çok kullanılan etiket (# hashtag) tablosunda ortaya çıkmıştır. Tablo 2’de 
görüldüğü gibi ilk üç sırayı konu dışında bulunan “lys”, “aof” ve “ygs” etiketleri almıştır. Bu twitler ve içerisindeki 
URL’ler incelendiğinde, Tablo 1’de görülen bazı web sitelerin sınav reklamına yönelik twitler olduğu görülmüştür. 



TABLO II 

 EN ÇOK KULLANILAN ETİKETLER LİSTESİ 

Anahtar kelime grupları incelendiğinde ise Tablo 3’te görüldüğü gibi gündem konusu ile ilgili kelime grupları belirgin şekilde ortaya çıkmıştır. Buradan anlaşılmaktadır ki pek çok kullanıcı, gündem konuları kelimelerini kullanarak pek çok farklı konuda da paylaşım yapmaktadır. 


TABLO III 

EN ÇOK KULLANILAN ANAHTAR KELİME GRUPLARI (İKİLİ) 

Twit verileri daha sonra URL’lerden arındırılmış ve 1919 twit üzerinde analizler gerçekleştirilmiş ve ortaya çıkan ağ grafiği Şekil 5’te görüldüğü gibi olmuştur. 


Şekil 5. URL’lerden arındırılmış twit grafiği 

Cinayet ile ilgili açılan etiketler, reklam linklerinden ayrıldığında ortaya ilginç bir durum çıkmıştır. Başka bir şehirde, başka bir nedenle, başka bir cinayete kurban giden genç bir üniversite öğrencisinin ismi de veriler içerisinde görülmüştür. Böyle bir durumda toplum hafızasının olaylar arasında köprüler kurarak tepki gösterebilme olasılığı da görülmüştür (Tablo 4). 


TABLO IV 

 EN ÇOK KULLANILAN ETİKETLER 

Son olarak twit verileri içerisinde # bulunan veriler de temizlenerek 1212 veri elde edilmiş ve ortaya çıkan ağ 
grafiği Şekil 6’da görüldüğü gibi olmuştur. 


Şekil 6. URL ve #’ lerden arındırılmış twit grafiği 

2 kelime yakınlık merkeziliği arasındalık merkeziliği merkezilik, 
Bu verilerden NodeXL ile twitler içerisinde kullanılan kelime grupları sayıları belirlenmiş ve ortaya çıkan anahtar kelime grupları Tablo 5’te görüldüğü gibi olmuştur. haber twitleri ile etiketli twitler temizlendiğinde elde edilen veriler, 
konu ile en alakalı twit veriler olmuştur. 


TABLO V 

EN ÇOK KULLANILAN KELİME GRUPLARI (TWİT) 

Etiket içeren twit verileri daha karmaşık bir yapı içermektedir. Burada kelimeler üzerinde işlem yapılabildiği gibi, bağlantılar üzerinde de analizler yapılabilmekte dir. Etiketli veriler üzerinde yapılan analiz işlemi sonrasında en çok kullanılan kelime grupları Tablo 6’da görüldüğü gibidir. 


TABLO VI 

EN ÇOK KULLANILAN KELİME GRUPLARI (ETİKETLİ TWİT) 


Sosyal ağ analizinde en çok kullanılan kavramlardan birisi merkeziliktir. En sık kullanılan merkezilik çeşitleri ise yakınlık merkeziliği (closeness centrality) ve arasındalık merkeziliği (betweennes centrality)’dir. Yakınlık merkeziliği 
(Eşitlik 1) bir birimin diğer birimlere grafikteki uzaklığının toplamıdır (Otte & Rousseau, 2002). 

(1) [33] 

Arasındalık merkeziliği (Eşitlik 2) ise bir birimin ağda diğer birimler arasında bulunma derecesidir. Bir birimin yüksek derece arasındalığı varsa, köprü görevindedir [33,34]. 

(2) [33] 

Analiz edilen veriler üzerinde ortaya çıkan merkezilik sonuçları Tablo 7’de görüldüğü gibi olmuştur. 


TABLO VII 

MERKEZİLİK SONUÇLARI 

Minimum arasındalık merkeziliğinin 0(sıfır) olması, bağımsız twitlerin olduğu anlamına gelmektedir. Ancak ortalama arasındalık merkeziliğine bakıldığında, 65787,287 gibi yüksek bir oran olması, birbiriyle bağlantılı pek çok twit 
verisinin olduğu anlamına gelmektedir. Ayrıca maximum yakınlık merkeziliğinin ve maximum arasındalık merkeziliği oranlarına bakıldığında, elde edilen twit verileri içerisinde birbiriyle bağlantılı pek çok twitin olduğu anlaşılmaktadır. 

V. SONUÇLAR VE ÖNERİLER 

Ortaya çıkan tablo ve grafiklerden de anlaşıldığı gibi, sosyal medya verileri pek çok bilginin ortaya çıkarılabileceği bir büyük veri kaynağıdır. Bu çalışma içerisinde Türkiye’de sosyal medya üzerinde çok tartışılan bir olay analizi 
gerçekleştirilmiştir. Elde edilen veriler içerisinden bilgi çıkarımı ve görselleştirme işlemleri yapılmıştır. Bazı anlamlı bilgilere ulaşılmıştır. Türkiye’de TT listesinde pek çok paylaşım reklam amaçlı yapılmaktadır. Twitler içerisindeki 
web site adresleri bunu göstermiştir. Gerçek verilere ulaşmak için öncelikle veriler içerisinde temizleme işlemi gerçekleştirilmektedir. Veriler URL’lerden ve etiketlerden temizlendiğinde daha anlamlı bilgiler ortaya çıkmaktadır. 
Verilerin analizi sırasında aynı twitler içerisinde farklı cinayetlerden birlikte bahsedilmesiyle görülmüştür ki toplum hafızası, benzer olaylar arasında köprü kurabilmektedir. Ayrıca etiketli verilerde de yüksek merkezilik oranları göstermiştir ki bazı kullanıcılar ve twitler, pek çok farklı kullanıcı arasında köprü görevi görmektedir. 

Toplumsal olayların önceden tespit edilebilmesi veya gerçekleşen olaylarda geriye dönük araştırma yapılabilmesi için, sosyal medya verileri önemli bir istihbarat ortamı haline gelmiştir. Siber istihbarat günümüzde daha da önem 
kazanmaya başlamıştır. Ülkeler istihbarat kurumlarında siber istihbarat birimleri oluşturmaya başlamıştır. Gereksinimler doğrultusunda farklı program ve algoritmalar kullanılarak, sosyal medya veri yığınlarından istendik sonuçlara ulaşmak mümkündür. Bu kadar yoğun verinin aktığı ortamlara kayıtsız kalınmamalıdır. İstihbarat açısından çok önemli olan sosyal medya sitelerinden ticari, akademik veya güvenlik amaçlarıyla analiz edilebilir. 

Sosyal medya verileri üzerinde analiz işlemleri yaparken karşılaşılan sorunlardan bazıları haber linkleri, TT listesinde görünmek için sadece belirli kelimeleri kullanarak twit yazmak, sadece simgeler içeren twit verileri, kısaltılmış 
kelimeler içeren twitler, farklı diller kullanılarak yazılan etiketli twitler olmuştur. Bu sorunlar araştırmacıların çözmesi gereken sorunlardan başlıcaları olmuştur. Ayrıca sosyal medya siteleri üzerinde gerçekleştirilen duygu analizi işlemleri, toplum nabzını tutmaya yönelik önemli bir konudur. Türkçe diline ait araştırmaların azlığı, Türkçe kelime kütüphanesinin tam olarak oluşturulmamış olması da bu çalışma sırasında karşılaşılan eksiklikler olmuştur. Araştırmacılara sosyal medya verileri üzerinde siber istihbarat, veri temizleme, Türkçe duygu analizi işlemleri konuları, gelecekte araştırma konuları olarak önerilmektedir. 

YAZARLAR ÖZGEÇMİŞİ;

Serkan Savaş

1982 yılında Ankara’da doğdu. Lisans eğitimini Gazi Üniversitesi Teknik Eğitim Fakültesi Bilgisayar Sistemleri Öğretmenliği Bölümü’nde tamamladı. Yüksek Lisans eğitimini Gazi Üniversitesi Bilişim Enstitüsü Elektronik-Bilgisayar Eğitimi Anabilim Dalı’nda tamamladı. Halen Gazi Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği (Tek. Fak.) Anabilim Dalı Doktora öğrencisi olarak eğitimine devam etmekte ve Kızılcahamam Mesleki ve Teknik Anadolu Lisesi’nde Müdür Yardımcısı olarak çalışmaktadır. Veri Madenciliği, Büyük Veri, Siber Güvenlik ve Siber İstihbarat alanlarında çalışmaları vardır. 

Nurettin Topaloğlu

Elektronik Bölümü mezunu olup, Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü’nde Öğretim Üyesi olarak çalışmaktadır. 
Bilişim teknolojileri ve sistemleri ilgi alanına girmektedir. 


KAYNAKLAR 

[1] Koçak, Z. (2006-5). Six Degrees Of Seperation. Hukuk Gündemi Dergisi, 108. 
[2] Tufan, S. (2013, 09 10). Aramızdaki Mesafe: En fazla 6 kişi. 08 15, 2015 tarihinde INNOVA: 
http://www.innova.com.tr/blog/yazi.asp?ID=117&baslik=Aramizdaki-mesafe_-En-fazla-6-kisi adresinden alındı 
[3] Whoriskey, P. (2008, 08 02). Instant-Messagers Really Are About Six Degrees from Kevin Bacon. 08 15, 2015 tarihinde The Washington Post: 
http://www.washingtonpost.com/wp-dyn/content/article/2008/08/01/AR2008080103718.html 
[4] Smith, D. (2008, 08 03). Proof! Just six degrees of separation between us. 08 15, 2015 tarihinde The Guardian: 
http://www.theguardian.com/technology/2008/aug/03/internet.email 
[5] Grossman, L. (2015, 12 15). PERSON OF THE YEAR 2010. 08 15, 2015 tarihinde TIME: 
http://content.time.com/time/specials/packages/article/0,28804,2036683_2037183,00.html 
[6] nedir.com. (tarih yok). Arap Baharı Nedir? 08 5, 2015 tarihinde: 
http://arapbahari.nedir.com/ 
[7] Vikipedi. (2015, 06 23). Arap Baharı. 08 10, 2015 tarihinde Vikipedi: 
https://tr.wikipedia.org/wiki/Arap_Bahar%C4%B1 
[8] Kınık, A. M. (2012). Arap Baharı Bağlamı’nda Sosyal Medya-Birey Etkileşimi ve Toplumsal Dönüşüm. 21. Yüzyılda Eğitim ve Toplum Eğitim 
Bilimleri ve Sosyal Araştırmalar Dergisi, 87-98. 
[9] Babacan, M. E., Haşlak, İ., & Hira, İ. (2011). Sosyal Medya ve Arap Baharı. Akademik İncelemeler Dergisi, 63-92. 
[10] Banko, M., & Babaoğlan, A. R. (2013). Gezi Parkı Sürecine Dijital Vatandaş'ın Etkisi. 
[11] Haber, Mynet (2015, 07 04). Sultanahmet'te Çinli sandıkları Koreli turist grubuna saldırdılar. 08 10, 2015 tarihinde Mynet Haber: 
http://www.mynet.com/haber/guncel/sultanahmette-cinli-sandiklari-koreli-turist-grubuna-saldirdilar-1909429-1 
[12] Cumhuriyet. (2015, 07 09). Bu sefer de Çinli sanılan kadını dövdüler. 08 10, 2015 tarihinde Cumhuriyet: 
http://www.cumhuriyet.com.tr/video/video/318071/Bu_sefer_de_Cinli_sanilan_kadini_dovduler.html 
[13] TDK. Türk Dil Kurumu. 03 29, 2015 tarihinde Türk Dil Kurumu: 
http://www.tdk.gov.tr/ 
[14] Avcı, G. (2004). İstihbarat Teknikleri: Aktörleri - Örgütleri ve Açmazları. İstanbul: Timaş Yayınları. 
[15] Özdağ, Ü. (2010). İstihbarat Teorisi. Ankara: Kripto Yayınları. 
[16] Warner, M. 03 29, 2015 tarihinde Central Intelligence Agency: 
https://www.cia.gov/library/center-for-the-study-of-intelligence/csi-publications/csi-studies/studies/vol46no3/article02.html 
[17] Özçoban, C. (2014). Uluslararası İlişkiler Ana Bilim Dalı Yüksek Lisans Tezi. 21. Yüzyılda Ulusal Güvenliğin Sağlanmasında Siber İstihbaratın 
Rolü. İstanbul, Türkiye: T.C. Harp Akademileri Stratejik Araştırmalar Enstitüsü. 
[18] MİT. 03 29, 2015 tarihinde Milli İstihbarat Teşkilatı: https://www.mit.gov.tr/tarihce/giris.html 
[19] MİT2. 03 29, 2015 tarihinde Milli İstihbarat Teşkilatı: http://www.mit.gov.tr/t-cark.html 
[20] Sechser, T. S. (2003). Intelligence and Prediction In An Unpredictable World. Eisenhower National Security Series, 4. 
[21] Alkan, M. (2012). Siber Güvenlik ve Siber Savaşlar. Ankara: Siber Güvenlik Siber Savaşlar TBMM İnternet Komisyonu. 
[22] Bayraktar, G. (2014). Harbin Beşinci Boyutunun Yeni Gereksinimi: Siber İstihbarat. Güvenlik Stratejileri Dergisi, 119-147. 
[23] Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market. Journal of Computational Science, 1-8. 
[24] Zhang, X., Fuehres, H., & Gloor, P. A. (2011). COINs2010: Collaborative Innovation Networks Conference. Predicting Stock Market 
Indicators Through Twitter “I hope it is not as bad as I fear”. Procedia - Social and Behavioral Sciences. 
[25] Agnihotri, R., Kothandaraman, P., Kashyap, R., & Singh, R. (2012). Bringing Social into Sales- The Impact of Salespeoples Social Media Use 
on Service Behaviors and Value Creation. Journal of Personal Selling & Sales Management, 333-345. 
[26] Mostafa, M. M. (2013). More than words: Social networks’ text mining for consumer brand sentiments. Expert Systems with Applications, 4241–4251. 
[27] Tang, X., & Yang, C. C. (2014). Detecting Social Media Hidden Communities Using Dynamic Stochastic Blockmodel with Temporal 
Dirichlet Process. ACM Transactions on Intelligent Systems and Technology, 36. 
[28] Weichselbraun, A., Gindl, S., & Scharl, A. (2014). Enriching semantic knowledge bases for opinion mining in big data applications. Knowledge-
Based Systems, 75-85. 
[29] Yang, M. C., & Rim, H. C. (2014). Identifying interesting Twitter contents using topical analysis. Expert Systems with Applications, 4330–4336. 
[30] Omand, S., Bartlett, J., & Miller, C. (2012). Introducing Social Media Intelligence(SOCMINT). Intelligence and National Security, 801-823. 
[31] Papic, M., Noonan, S., & Çeviri(Ece Dündar). (2011). Sosyal Medya: Bir Protesto Aracı. Türk Kütüphaneciliği, 165-172. 
[32] Smith, M. (2015, 02 23). NodeXL: Network Overview, Discovery and Exploration for Excel. 08 10, 2015, CodePlexProject Hosting for OSS: 
http://nodexl.codeplex.com/ 
[33] Otte, E., & Rousseau, R. (2002). Social network analysis: a powerful strategy, also for the information sciences. Journal of Information Science, 441-453. 
[34] Blogger, G. (2012, 05 24). Tools for Transparency: A How-to Guide for Social Network Analysis with NodeXL. 08 15, 2015 tarihinde Sunlight F: 
https://sunlightfoundation.com/blog/2012/05/24/tools-for-transparency-a-how-to-guide-for-social-network-analysis-with-nodexl/ 


***

Hiç yorum yok:

Yorum Gönder