“A density-based algorithm for discovering clusters in large spatial databases with noise” başlıklı çalışma Martin Ester, Hans-Peter Kriegel, Jiirg Sander, Xiaowei Xu tarafından yapılmış olup KDD-96 konferansında sunulmuştur.
Sınıf belirleme, veritabanındaki nesneleri anlamlı alt sınıflara gruplama işlemidir. Örneğin nehir kenarındaki evleri gruplamak isteyebiliriz.
Kümeleme işlemi için öne çıkan zorluklar:
-Kümelenecek veriler hakkında bilgi sahibi olunmaması
-Kümelerin belirsiz şekillerde birbirinden ayrılması(küresel, doğrusal, çizgisel gibi…)
-Kümelenecek veri sayısının binlerle ifade edilmesi
DBSCAN büyük hacimli veritabanlarında, kümelerin birbirinden keyfi şekillerle ayrıldığı durumlarda da başarılı sonuçlar üretmektedir.
Kümeleme Algoritmaları
1-Parçalayarak Kümeleme
2-Hiyerarşik Kümeleme
Parçalayarak Kümeleme yaklaşımında başlangıçta belirlenen küme sayısına mevcut veriler dağıtılır. k-means ve k-medoid algoritmaları bu gruba girmektedir. Sonuçta oluşan bütün kümeler konveks (dışbükeydir) ve bu verilerin bu şekilde kümelenmediği veritabanları için doğru sonuçlar üretilemeyeceğini göstermektedir. Bu yaklaşımda uzay voronoi diyagramı şeklinde bölümlenir ve her bir voronoi hücresi bir kümeyi temsil eder.
k-medoid algoritması geliştirilerek CLARANS algoritması üretilmiştir. CLARANS algoritması 2’den n’e kadar küme sayıları için siluet katsayısı {silhouette coefficient (Kaufman & Rousseeuw 1990) } değeri üretir ve bu katsayının maksimum olduğu durumu ideal küme sayısı olarak belirler. Fakat bu işlemi n’e kadar yapmak O(n) kadar zaman gerektirdiğinden uygulanması zordur.
CLARANS tüm kümelenecek veriyi aynı anda hafızaya alma stratejisini benimsediğinden büyük veritabanları için uygun değildir. Büyük veritabanları için CLARANS’ın çalışma zamanı çok uzundur. Bu yüzden tüm nesneler değil, sadece bir grup nesnenin aynı anda ele alındığı bir yaklaşım düşünülmüştür. Böylece hem daha az bellek alanı kullanılacak, hem de işlem zamanı kısalacaktır.
Hiyerarşik Kümeleme yaklaşımında veritabanı hiyerarşik bir şekilde bölünerek kümelenir. Hiyerarşik kümelemede önceden küme sayısı belirlenmemektedir. Burada belirlenen sonlandırma kriterine kadar işlem sürer ve her bir nesne bir ağaç dalında yaprak misali tek kalıncaya kadar işlem sürdürülür.Sonlandırma kriterini belirlemek ciddi bir problemdir. Dışbükey olmayan kümeleme işlemlerinde kullanılmaktadır. Ejcluster algoritması her iki nokta arasındaki mesafeyi hesapladığından O(n2) hesaplama zamanına ihtiyaç duymaktadır.
Küme alanlarında yoğunluk fazlayken, boş alanlarda veya gürültülü verilerin bulunduğu yerlerde yoğunluk azdır.
DBSCAN algoritmasında yoğunluk ölçümü için Öklid ve Manhattan uzaklığı gibi yöntemler veya başka uzaklık ölçüm yaklaşımları kullanılabilir.
Eps ve MinPts parametrelerinin belirlenmesi
2 boyutlu veri setleri için MinPts değerinin 4 olarak alınması önerilmiştir.
DBSCAN sentetik ve gerçek veri setleri ile CLARANS algoritması ile karşılaştırılmıştır. Renksiz bir şekilde sonuç grafikleri verildiğinden tam anlaşılamayan sonuçları görmek için renkli grafiklere bakılması önerilmiştir.
İndirmek için:
A-density-based-algorithm-for-discovering-clusters-in-large-spatial-databases-with-noise
ASKON Konya’da MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları’na katıldım
ASKON Konya’nın MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları kapsamında 23 Ağustos 2023 Çarşamba günü ASKON Konya şubesinde>>>
Ağu
Matlab’da matrisin tüm elemanlarını belirli bir sayıdan nasıl çıkarırız?
Elimizde doğruluk oranlarının olduğu bir k matrisi olduğu varsayalım, bu matris içerisindeki tüm değerleri 1>>>
Şub
Matlab’ta iç içe döngüyle matris gezerek istediğimiz veriyi nasıl buluruz?
Başlık tam ifade eder mi bilmiyorum ama benim ihtiyacım olan şey 10 sütun, 1593 satıra>>>
Şub
A Review on Deep Learning-Based Methods Developed for Lung Cancer Diagnosis
Yüksek Lisans öğrencilerimden Türkan Beyza KARA’nın sunmuş olduğu “A Review on Deep Learning-Based Methods Developed>>>
Oca
İlk yabancı yazarlı ortak makalem yayınlandı
Birbirimizi hiç görmeden ve sesli olarak da hiç konuşmadan e-posta üzerinden tanışıp ortak bir çalışma>>>
4 Comments
Eki
Konya’da göz lazer ameliyatı oldum
25 yıldır takmakta olduğum ve kendisinden ayrılırken 6,5 numara olan gözlüğüme Konya’da göz lazer ameliyatımı>>>
Ağu
Tek kelimeyle beni nasıl tanımladılar?
YouTube üzerinden yapmış olduğum bir yoruma gelen yanıtta “…dürüst olun…” içeriğini görünce aklıma geçtiğimiz günlerde>>>
3 Comments
Ağu
Konya Akıllı Şehir HACKATHON’unda 3.olduk
Kısaca daha önceki yazımda bahsettiğim Konya Akıllı Şehir HACKATHON’unda 3.olduk. Selçuk Üniversitesi Teknoloji Fakültesi Bilgisayar>>>
1 Comment
May
Sentius ekibi olarak, Akıllı Şehir HACKATHON’una katıldık
Konya Akıllı Şehir HACKATHON’unda 3.olduk Konya Bilim Merkezi ile GDG Konya’nın düzenlediği Akıllı Şehir HACKATHON’una>>>
1 Comment
May
BİLMÖK 2022 için yazılmış gecikmiş bir yazı :)
Türkiye’nin en büyük öğrenci kongresi BİLMÖK 21-23 Mayıs 2022 günlerinde Konya’da Konya Teknik Üniversitesi’nin organizasyonuyla>>>
May
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…>>>
Kas
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem İndirmek için tıklayınız.>>>
Eyl
Konya Model Fabrika’yı Ziyaretim ve Konya Dijital Dönüşüm
“konya dijital dönüşüm” kelimesini Google üzerinden arattığım zaman Konya Model Fabrika‘yı keşfettim. 5 Ağustos 2021>>>
Ağu
Otomatlar, Biçimsel Diller ve Turing Makineleri – Dr. Emre Sermutlu – Cinius Yayınları
2020-2021 bahar yarıyılında Otomata Teorisi ve Biçimsel Diller dersini verirken kullanmam için Selçuk Üniversitesi Teknoloji>>>
Mar
4-6 MART 2021 ÇEVRİMİÇİ TÜBİTAK-2237-B PROJE EĞİTİMİ ETKİNLİĞİ KTÜ – TRABZON
Alanında dünyada öncü Prof. Dr. Yener EYÜBOĞLU, Prof. Dr. Asım KADIOĞLU, Prof. Dr. Nurettin YAYLI,>>>
Mar
ARDEB 1001 – 2020 Sonuçlarını Değerlendirme ve Yenilikler Toplantısı
>>>
Şub
2021 yılı içerisinde değerlendirilebilecek konferanslar
GLOBAL CONFERENCE on ENGINEERING RESEARCH online 2-5 June 2021 Abstract or Full Paper Submission: 2>>>
Şub
Sayfamda paylaştığım bütün Karikatürler silinmiştir
İsimsiz bir uyarı yorumuyla araştırdığım vakit gördüm ki bazı karikatüristler blog sayfalarında karikatür paylaşanlara dava>>>
Oca
MATLAB – Error: Functions cannot be indexed using {} or . indexing.
data = get(z9).OutputData{1}; satırında aşağıdaki şekilde hata vermekteydi. Error: Functions cannot be indexed using {}>>>
Oca
“ERASMUS+ Yüksek Öğretim” konulu seminer notları
“ERASMUS + Yüksek Öğretim” konulu seminer notları Dr. Öğretim Üyesi Kemal TÜTÜNCÜ hocam tarafından sunulan>>>
Oca