Veri madenciliği; konu ile ilgili uzmanlardan, gözlem ve deneyler sonucunda elde edilen verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin genelleme yapacak şekilde çıkarılmasıdır.
Veri madenciliği programları genellikle veri içindeki gizli ilişki ve örüntüleri ortaya çıkarabilmek için kullanılır. Bu durum özellikle pazarlama şirketlerinin işine geliyor ve veri madenciliği bu alanlarda oldukça yaygın. Bir şirket için sattığı ürünün kimler tarafından en çok ne zaman satın alındığını bilmek ve ona göre yatırımlar yapmak gerçekten büyük önem taşıyor. Yalnızca pazarlama-satış alanlarında değil tıp, eğitim, bankacılık gibi sahalarda da veri madenciliği oldukça ön planda. Bu yöntemle belli bir hastalığın hangi bölgede kaç insanı etkilediğini görmek çok daha kolay oluyor. Bu iki örnekte gördüğümüz gibi veri madenciliği günümüzde hızla büyüyen bilgi yığınını anlayabilmek ve derinlerine inebilmek adına gerçekten büyük önem taşıyor.
Bilgi Keşif Süreci (Knowledge Discovery Process) olarak da adlandırılan veri madenciliği, elbette tek bir adımdan oluşmuyor. Birbirini takip eden bir çok döngü ve alınan geri dönütler sonucu tüm bu bilgiler toplanarak çözüme ulaşılıyor. Bu sürecin adımlarının ise temel olarak aşağıdaki gibi olduğunu söyleyebiliriz:
-Çözülmesi istenen problemin anlaşılması
-Eldeki verinin yorumlanması
-Veri hazırlığı (Veri temizliği ve ön işleme)
-Modelleme(Veri madenciliği algoritmaları)
-Değerlendirme (Kullanılan algoritmaların performans kontrolü)
-Tertip
Veri madenciliği kullanım alanlarına göre farklılık gösterirken aynı zamanda veri içinde aranan örüntü türüne göre de çeşitlenebiliyor. Bu kullanım araçlarından en popüler olanlarını listede görebiliriz:
-Sınıflandırma
-Kümelendirme
-Ortak noktaları belirleme
-Görselleştirmek – Kullanıcı için kolaylaştırma
-Özetlemek – Bir grubu tanımlama
-Tahmin yürütme
-Bağlantı Kurma – İlişkilendirme
-Veri Madenciliği ile Veri Sorgulama
Veri sorgulama dediğimiz tabir kullanıcının arama motorlarında ya da veri tabanında aramak üzere yazdığı kelimeler olarak açıklanabilir. Veritabanı ile etkileşim kurabilmek amacıyla yazılmış dillere sorgu dili (query language) denir. Bu dillerin arasında en çok bilinen standart ise Yapılandırılmış Sorgu Dili(Structured Query Language) olarak adlandırılır. Bu iki yöntem arasındaki farkları incelemeye çalışalım. Veri Sorgulama kısmında belli bir örüntünün varlığı sorgulanırken veri madenciliğinde ise veri içinde bulunan tüm örüntüler kullanıcıya sunuluyor.
Bebek Bezi – Bira ilişkisi
Wal-Mart yönetimi müşteri kartı sisteminden veri toplayıp bu verileri birleştirmeye karar verdi. Bu veriler ile müşterilerin ne zaman, nerede, neler satın aldığı görülebiliyordu. Bu kombinler sonucu farklı ürünlerin satışı arasında bir çok bağlantı olduğu ortaya çıktı. Bu bağlantıların bir kısmı tahmin edilebilir bağlantılardı, cin alan insanların ardından tonik ve limon satın alması gibi. Asıl beklenmeyen sonuç ise bebek bezi ve bira arasındaki ilişkiydi. Görülen o ki, cuma akşamları bebek bezi alan erkekler, ardından bira almaya meyilliydi. Bu bağıntıyı kimse öngörmüyordu ve sorgulanması akla gelmeyecek bir ilişkiydi. Bu nedenle bebek bezi – bira örneği veri madenciliği ile veri sorgulaması arasındaki farkı açıklayan mükemmel bir örnek.
Kaynak: http://e-bergi.com/y/veri-madenciligi
ASKON Konya’da MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları’na katıldım
ASKON Konya’nın MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları kapsamında 23 Ağustos 2023 Çarşamba günü ASKON Konya şubesinde>>>
Ağu
Matlab’da matrisin tüm elemanlarını belirli bir sayıdan nasıl çıkarırız?
Elimizde doğruluk oranlarının olduğu bir k matrisi olduğu varsayalım, bu matris içerisindeki tüm değerleri 1>>>
Şub
Matlab’ta iç içe döngüyle matris gezerek istediğimiz veriyi nasıl buluruz?
Başlık tam ifade eder mi bilmiyorum ama benim ihtiyacım olan şey 10 sütun, 1593 satıra>>>
Şub
A Review on Deep Learning-Based Methods Developed for Lung Cancer Diagnosis
Yüksek Lisans öğrencilerimden Türkan Beyza KARA’nın sunmuş olduğu “A Review on Deep Learning-Based Methods Developed>>>
Oca
İlk yabancı yazarlı ortak makalem yayınlandı
Birbirimizi hiç görmeden ve sesli olarak da hiç konuşmadan e-posta üzerinden tanışıp ortak bir çalışma>>>
4 Comments
Eki
Konya’da göz lazer ameliyatı oldum
25 yıldır takmakta olduğum ve kendisinden ayrılırken 6,5 numara olan gözlüğüme Konya’da göz lazer ameliyatımı>>>
Ağu
Tek kelimeyle beni nasıl tanımladılar?
YouTube üzerinden yapmış olduğum bir yoruma gelen yanıtta “…dürüst olun…” içeriğini görünce aklıma geçtiğimiz günlerde>>>
3 Comments
Ağu
Konya Akıllı Şehir HACKATHON’unda 3.olduk
Kısaca daha önceki yazımda bahsettiğim Konya Akıllı Şehir HACKATHON’unda 3.olduk. Selçuk Üniversitesi Teknoloji Fakültesi Bilgisayar>>>
1 Comment
May
Sentius ekibi olarak, Akıllı Şehir HACKATHON’una katıldık
Konya Akıllı Şehir HACKATHON’unda 3.olduk Konya Bilim Merkezi ile GDG Konya’nın düzenlediği Akıllı Şehir HACKATHON’una>>>
1 Comment
May
BİLMÖK 2022 için yazılmış gecikmiş bir yazı :)
Türkiye’nin en büyük öğrenci kongresi BİLMÖK 21-23 Mayıs 2022 günlerinde Konya’da Konya Teknik Üniversitesi’nin organizasyonuyla>>>
May
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…>>>
Kas
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem İndirmek için tıklayınız.>>>
Eyl
Konya Model Fabrika’yı Ziyaretim ve Konya Dijital Dönüşüm
“konya dijital dönüşüm” kelimesini Google üzerinden arattığım zaman Konya Model Fabrika‘yı keşfettim. 5 Ağustos 2021>>>
Ağu
Otomatlar, Biçimsel Diller ve Turing Makineleri – Dr. Emre Sermutlu – Cinius Yayınları
2020-2021 bahar yarıyılında Otomata Teorisi ve Biçimsel Diller dersini verirken kullanmam için Selçuk Üniversitesi Teknoloji>>>
Mar
4-6 MART 2021 ÇEVRİMİÇİ TÜBİTAK-2237-B PROJE EĞİTİMİ ETKİNLİĞİ KTÜ – TRABZON
Alanında dünyada öncü Prof. Dr. Yener EYÜBOĞLU, Prof. Dr. Asım KADIOĞLU, Prof. Dr. Nurettin YAYLI,>>>
Mar
ARDEB 1001 – 2020 Sonuçlarını Değerlendirme ve Yenilikler Toplantısı
>>>
Şub
2021 yılı içerisinde değerlendirilebilecek konferanslar
GLOBAL CONFERENCE on ENGINEERING RESEARCH online 2-5 June 2021 Abstract or Full Paper Submission: 2>>>
Şub
Sayfamda paylaştığım bütün Karikatürler silinmiştir
İsimsiz bir uyarı yorumuyla araştırdığım vakit gördüm ki bazı karikatüristler blog sayfalarında karikatür paylaşanlara dava>>>
Oca
MATLAB – Error: Functions cannot be indexed using {} or . indexing.
data = get(z9).OutputData{1}; satırında aşağıdaki şekilde hata vermekteydi. Error: Functions cannot be indexed using {}>>>
Oca
“ERASMUS+ Yüksek Öğretim” konulu seminer notları
“ERASMUS + Yüksek Öğretim” konulu seminer notları Dr. Öğretim Üyesi Kemal TÜTÜNCÜ hocam tarafından sunulan>>>
Oca