VERİ MADENCİLİĞİ (DATA
MİNİNG)
Herhangi bir
bilginin akılda kalabilecek biçimde kalmasıdır. Basit anlamda ulaşıtığımız
bilgileri madenleme işlemidir. Genel olarak araştırdığımız büyük veriler
içerisinde gelecek ile ilgili tahminde bulunmamızı sağlayıp bilgisayar programı
kullanarak aranmasıdır. Veri madenciliği alanları istatistik, makine bilgisi,
veri tabanları, ve yüksek performanslı işlem gibi temelleri de içerir.
VERİ MADENCİLİĞİ SÜRECİ :
1.
Problemin tanımlanması
2.
Verilerin hazırlanması
3.
Modelin kurulması ve değerlendirilmesi
4.
Modelin kullanılması
5.
Modelin izlenmesi
VERİ MADENCİLİĞİ NASIL YAPILIR ?
Ø
Veri
madenciliğinin yapılabilmesi için elde etmek istediğimiz konu veya konular
sabitlenmelidir.
Ø
İkinci adımda
elde ettiğimiz konular gruplandırılmalıdır.
Ø
Yapılan
gruplandırmanın ardından Veri Tabanları oluşturulmalıdır.
Ø
Oluşturduğumuz
veri tabanlarında istemediğimiz verileri temizleyebiliriz (silebiliriz).
Ø
Veri tabanında
kalan veriler tek bir çatı altında birleştirilmelidir.
Ø
İstenilen konu
ile alakalı veri tabanında analiz yapılıp gerekli veriler seçilmelidir.
Ø
Kalan veri
tabanının ‘’kayda değer (işlenebilecek)’’ hale getirilmesi gereklidir.
Ø
Akıllı metodlar
kullanılarak kayda değer veri tabanında örüntü araması yapılmalıdır.
Ø
Çıkan sonuç
değerlendirilmelidir.
Ø
Değerlendirmenin
sonucunda elde ettiğimiz bilgiler hazır olup kullanıcıya aksettirilebilir
(sunulabilir).
Veri madenciliği belirli temel
bileşenlere sahiptir, bunlar :
**
Veri Tabanı: Ulaşmak istediğimiz
bilgininde bulunduğu veri kümesidir.
**
Veri Tabanı Teknikleri: Verileri
elekten geçirerek kayda değer hale getiren tekniklerdir
**
Bilgi Tabanı: Elekten geçirdiğimiz
verilerin muhafaza edildiği yer.
**
Veri Madenciliği Motoru: Karar verme
mekanizmaları, Yapay Zeka ve Yapay Sinir Ağları bilgisi gerekmektedir.
Bilgisayarın karar vermesi için bilgisayarın eğitilmesi gereklidir.
**
Örüntü Değerlendirme: Sonuca
ulaştığımız bölümdür.
**Kullanıcı
Arayüzü: Elde ettiğimiz bilgilerin girileceği yer ve bilgisayarın
yinelediği yanıtların aksettirileceği bölümdür.
Veri
madenciliğinde kullanılan Algoritmalar ;
n Bulanık Kümeler
n Genetik Algoritmalar
n Yapay Sinir Ağları
n Kural Çıkarımı
n Duruma Dayalı Nedensellik
n İstatistik Teknikler
n Karar Ağaçları
Veri madenciliğinde kullanılan
Yöntemler ;
n Kümeleme
n Sınıflama
n Birliktelik Kuralları
n Tahminleyici Modelleme
n Değişim Ve Sapma Tespiti Analizi
n Veri Görselleştirme
Veri Madenciliği Hangi Alanlarda
Uygulanılır ;
n Sağlık Sektörü
n Haberleşme Sektörü
n Finans Sektörü
n Devlet Uygulamaları gibi vs. alanlarda uygulanır.
VERİ
MADENCİLİĞİNİN GÜNLÜK YAŞAMDA KULLANIMLARI
Ø Kaçak enerji kullananları tespit eden ve olası kaçak
kullanımları tahmin etmeyi sağlar. Düşük maliyetlidir ve kaçak kullananlara
karşı mücadele etmeye imkan sağlamaya yardımcı olur.
Ø Tedavi isteklerinin zamana, bölgeye ve ihtiyaca göre
değerlendirilip ortaya çıkabilecek salgın hastalık olasılığının tespiti , kontrol
altına alınması planlama açısından yararlı olur.
Ø Kredileri tahsil ederken ödeyememe riski olan
kişilerin tespit edilip ortaya çıkabilecek kredi mağduriyetini minimize eder.
VERİ
MADENCİLİĞİ HANGİ AMAÇLARLA KULLANILIR ?
Veri madenciliği bir çok alanda
çok gerekli bilgilere ulaşmak için kullanılır. Bu bilgiler ‘’ bir ülkeye tehdit
unsuru oluşturabilecek kişilerin gözlemlenmesinden’’ tutun da ‘’ firmaların pazarlama stratejilerini belirlemesinde ’’ kullanılır. Örneğin ; ABD’ de FBI’ ın siber güvenlik birimi ABD’ de yaşayan insanların gönderdiği e-
postalardan tutun da sosyal ağlardan paylaştığı durum güncellemelerine kadar
her bir bilgiyi takip ederek, belli süzgeçlerden geçirerek gözetim altına
alabiliyor
0 yorum:
Yorum Gönder