“A Survey of Binary Similarity and Distance Measures” başlıklı çalışma Seung-Seok Choi, Sung-Hyuk Cha, Charles C. Tappert tarafından hazırlanmış olup 2010 yılında “Journal of Systemics, Cybernetics and Informatics 8.1” dergisinin 43-48.sayfaları arasında basılmıştır.
ÖZET
İkili özellik vektörü (binary feature vector) sunumda kullanılan yaygın yöntemlerdendir. Benzerliği ve farklılığı ölçmek kümeleme, sınıflandırma gibi bir çok problemde önemli kıstaslardandır. Jaccard’ın 1901’de ekolojik türlerin sınıflandırılması için bir benzerlik önergesi sunduğundan beri, çeşitli alanlarda sayısız ikili benzerlik ve farklılık ölçümleri önerilmiştir.Doğru veri analizi için doğru ölçümlerin yapılması gerekmektedir. Çalışmada 76 ikili benzerlik ve farklılık yaklaşımı toplanmış ve hiyerarşik kümeleme tekniği ile korelasyonları ortaya konmuştur.
GİRİŞ
İkili benzerlik(similarity) ve farklılık(dissimilarity) (uzaklık/distance) ölçütleri, sınıflandırma, kümeleme, gibi model analizi problemlerinde kritik bir rol oynamaktadır. Performans, uygun ölçek seçimi üzerine kurulduğundan, birçok araştırmacı, yüzyıldır en anlamlı ikili benzerlik ve farklılık ölçümlerini bulmak için gayret göstermektedir. Çok sayıda ikili benzerlik ve farklılık ölçme tekniği çeşitli alanlarda önerilmiştir.
Örneğin, ekolojik türlerin kümelenmesi için Jaccard benzerlik ölçütü kullanmış ve Forbes ekolojik olarak ilgili türlerin kümelenmesi için bir katsayı önermiştir. Biyomühendislik, etnoloji, taksonomi, görüntü alımı, jeoloji ve kimya da ikili benzerlik ölçümlerini uygulamıştır.Son zamanlarda, parmak izi, iris görüntüleri ve el yazısı karakter tanıma gibi biyometride tanımlama problemlerini çözmek için aktif olarak kullanılmıştır.Birçok araştırmada özellikleri ve öne çıkan yönleri tartışılmaktadır.
Literatürde çok sayıda ikili benzerlik ölçütleri tanımlanmış olmasına rağmen, sadece birkaç karşılaştırmalı çalışma çok çeşitli ikili benzerlik ölçümlerini toplamıştır. Hubalek 43 benzerlik ölçütünü topladı ve bunların 20’si, ilgili katsayıların beş kümesini üretmek için fungus verileri üzerinde küme analizi için kullanıldı. Jackson ve ark. ekolojik 25 balık türünün en iyi ölçütünü seçmek için sekiz ikili benzerlik ölçütünü karşılaştırdı. Tubbs, şablon eşleştirme problemini(template matching problem) çözmek için yedi benzerlik ölçütünü özetledi ve Zhang ve ark. el yazısının tanımlanmasında tanıma kabiliyetini göstermek için yedi ölçüyü karşılaştırdı. Willett, ikili parmak izi kodu için 13 benzerlik ölçütünü değerlendirdi. Cha ve ark. karşılaştırmalı çalışmayla sınıflandırma performansını artırmak için ağırlıklı ikili ölçümü önerdi.
Bununla birlikte, mevcut ikili ölçütleri sıralamış veya gruplandıran az çalışma yapılmıştır. Benzerlik veya farklılık ölçütlerinin sayısı genellikle birkaç ticari istatistiksel küme analiz araçlarından sağlananlarla sınırlıydı. Geçen yüzyılda kullanılan 76 ikili benzerlik ve farklılık ölçütleri toparlanmış ve analiz edilerek ve bu ölçütlerle ilgili en kapsamlı çalışma yapılmıştır.
TANIMLAR
i ve j ikili örneklerinin ifade ettiği operasyonel taksonomik birimler:
İlgili açıklama:
Literatürde taranan 76 benzerlik/farklılık ölçütü: S=Similarity, D=Distance/Dissimilarity
Önerilen ölçütler incelendiğinde bazı ölçütlerde iki bitinde 0 olma durumunun göz ardı edildiği görülmektedir. Bu devam eden bir tartışmadır. Sokal ve ark. iki durumunda 0 olması halinde bir benzerlik olmadığını iddia etmişlerdir. Kimileri negatif eşleşmeye 0,5 oranında bir değer verirken, kimileri de ağırlıklı değerler vermek suretiyle değerlendirmeye almışlardır.
Önerilen tüm ikili ölçütler kendi alanlarında belirli bir iyileştirme yapmışlardır. 100 yıldan fazladır ikili ölçüt önerme süreci devam etmektedir.
İkili Benzerlik Ölçütlerinin Kronolojik Tablosu ve Yıllara Göre Mesafe Alma Ölçütü:
HİYERARŞİK KÜMELEME
İkili Benzerlik Ölçütlerini gruplamak için hiyerarşik kümeleme işlemi yapılmıştır. 100 boyutlu 30 tane rastgele ikili özellik vektörü oluşturulmuş ve 100’er kere çalıştırılarak birbirleriyle en alakalı ikili benzerlik ölçütleri aşağıdaki dendrogramda gösterilmiştir.
Yukarıdaki bilgilere dayanarak çalışmamızda hangi ikili benzerlik ölçütünü kullanacağımıza karar verebiliriz.
Çalışmayı indirmek için:
ASKON Konya’da MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları’na katıldım
ASKON Konya’nın MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları kapsamında 23 Ağustos 2023 Çarşamba günü ASKON Konya şubesinde>>>
Ağu
Matlab’da matrisin tüm elemanlarını belirli bir sayıdan nasıl çıkarırız?
Elimizde doğruluk oranlarının olduğu bir k matrisi olduğu varsayalım, bu matris içerisindeki tüm değerleri 1>>>
Şub
Matlab’ta iç içe döngüyle matris gezerek istediğimiz veriyi nasıl buluruz?
Başlık tam ifade eder mi bilmiyorum ama benim ihtiyacım olan şey 10 sütun, 1593 satıra>>>
Şub
A Review on Deep Learning-Based Methods Developed for Lung Cancer Diagnosis
Yüksek Lisans öğrencilerimden Türkan Beyza KARA’nın sunmuş olduğu “A Review on Deep Learning-Based Methods Developed>>>
Oca
İlk yabancı yazarlı ortak makalem yayınlandı
Birbirimizi hiç görmeden ve sesli olarak da hiç konuşmadan e-posta üzerinden tanışıp ortak bir çalışma>>>
4 Comments
Eki
Konya’da göz lazer ameliyatı oldum
25 yıldır takmakta olduğum ve kendisinden ayrılırken 6,5 numara olan gözlüğüme Konya’da göz lazer ameliyatımı>>>
Ağu
Tek kelimeyle beni nasıl tanımladılar?
YouTube üzerinden yapmış olduğum bir yoruma gelen yanıtta “…dürüst olun…” içeriğini görünce aklıma geçtiğimiz günlerde>>>
3 Comments
Ağu
Konya Akıllı Şehir HACKATHON’unda 3.olduk
Kısaca daha önceki yazımda bahsettiğim Konya Akıllı Şehir HACKATHON’unda 3.olduk. Selçuk Üniversitesi Teknoloji Fakültesi Bilgisayar>>>
1 Comment
May
Sentius ekibi olarak, Akıllı Şehir HACKATHON’una katıldık
Konya Akıllı Şehir HACKATHON’unda 3.olduk Konya Bilim Merkezi ile GDG Konya’nın düzenlediği Akıllı Şehir HACKATHON’una>>>
1 Comment
May
BİLMÖK 2022 için yazılmış gecikmiş bir yazı :)
Türkiye’nin en büyük öğrenci kongresi BİLMÖK 21-23 Mayıs 2022 günlerinde Konya’da Konya Teknik Üniversitesi’nin organizasyonuyla>>>
May
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…
Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…>>>
Kas
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem
Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem İndirmek için tıklayınız.>>>
Eyl
Konya Model Fabrika’yı Ziyaretim ve Konya Dijital Dönüşüm
“konya dijital dönüşüm” kelimesini Google üzerinden arattığım zaman Konya Model Fabrika‘yı keşfettim. 5 Ağustos 2021>>>
Ağu
Otomatlar, Biçimsel Diller ve Turing Makineleri – Dr. Emre Sermutlu – Cinius Yayınları
2020-2021 bahar yarıyılında Otomata Teorisi ve Biçimsel Diller dersini verirken kullanmam için Selçuk Üniversitesi Teknoloji>>>
Mar
4-6 MART 2021 ÇEVRİMİÇİ TÜBİTAK-2237-B PROJE EĞİTİMİ ETKİNLİĞİ KTÜ – TRABZON
Alanında dünyada öncü Prof. Dr. Yener EYÜBOĞLU, Prof. Dr. Asım KADIOĞLU, Prof. Dr. Nurettin YAYLI,>>>
Mar
ARDEB 1001 – 2020 Sonuçlarını Değerlendirme ve Yenilikler Toplantısı
>>>
Şub
2021 yılı içerisinde değerlendirilebilecek konferanslar
GLOBAL CONFERENCE on ENGINEERING RESEARCH online 2-5 June 2021 Abstract or Full Paper Submission: 2>>>
Şub
Sayfamda paylaştığım bütün Karikatürler silinmiştir
İsimsiz bir uyarı yorumuyla araştırdığım vakit gördüm ki bazı karikatüristler blog sayfalarında karikatür paylaşanlara dava>>>
Oca
MATLAB – Error: Functions cannot be indexed using {} or . indexing.
data = get(z9).OutputData{1}; satırında aşağıdaki şekilde hata vermekteydi. Error: Functions cannot be indexed using {}>>>
Oca
“ERASMUS+ Yüksek Öğretim” konulu seminer notları
“ERASMUS + Yüksek Öğretim” konulu seminer notları Dr. Öğretim Üyesi Kemal TÜTÜNCÜ hocam tarafından sunulan>>>
Oca