Otomatik Doküman Sınıflandırma

“Otomatik Doküman Sınıflandırma” başlıklı çalışma Rumeysa Yılmaz, Rıfat Aşlıyan ve Korhan Günel tarafından 1-3 Şubat 2012 günü XIV. Akademik Bilişim Konferansı’nda bildiri olarak sunulmuştur.

Doküman sınıflandırmanın amacı bir dokümanın özelliklerine bakarak önceden belirlenmiş belli sayıdaki kategorilerden hangisine dâhil olacağını belirlemektir.

Döküman Sınıflandırmanın Genel Yapısı:
dokuman-siniflandirmanin-genel-yapisi

Metin dokümanları oldukça fazla sözcük içerirler. Bazı sözcükler vardır ki bunların bütün dokümanlardaki frekansı oldukça yüksektir. Bunlara Türkçede çok sık kullanılan; “gibi”, “ise”,
“yani”, “veya”, “ama”, “ne”, “neden”, “şey”, “hiç” sözcükleri örnek verilebilir. Bundan dolayı bu sözcükler ayırt edici özelliğe sahip değillerdir ve bu sözcükler dokümanlardan elenir. Eleme işlemi indeksleme işlemi olarak adlandırılır ve bunu takip eden adımlardan oluşur.

Önişleme safhasında dokümanlardaki boşluk, rakam ve noktalama işareti gibi herhangi bir anlam ifade etmeyen karakterler elenir, büyük harfler küçük harflere dönüştürülerek temizlenmiş doküman haline getirilir. Dokümanlardaki sözcükler, RASAT heceleme algoritmasıyla hecelere ayrılır. Dokümanlardaki sözcüklerin ve hecelerin frekansları 0 ile 1 arasında normalize edildikten
sonra her sınıf için oluşturulmuş olan öznitelik vektör veritabanındaki sözcükler ve hecelerle karşılaştırılarak dokümanın sınıfı belirlenir.

İndirmek için:
Otomatik_Dokuman_Siniflandirma

ASKON Konya’da MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları’na katıldım

ASKON Konya’nın MEVKA TeknoGirişim Girişimci-Yatırımcı Buluşmaları kapsamında 23 Ağustos 2023 Çarşamba günü ASKON Konya şubesinde>>>

24
Ağu

Matlab’da matrisin tüm elemanlarını belirli bir sayıdan nasıl çıkarırız?

Elimizde doğruluk oranlarının olduğu bir k matrisi olduğu varsayalım, bu matris içerisindeki tüm değerleri 1>>>

22
Şub

Matlab’ta iç içe döngüyle matris gezerek istediğimiz veriyi nasıl buluruz?

Başlık tam ifade eder mi bilmiyorum ama benim ihtiyacım olan şey 10 sütun, 1593 satıra>>>

20
Şub

A Review on Deep Learning-Based Methods Developed for Lung Cancer Diagnosis

Yüksek Lisans öğrencilerimden Türkan Beyza KARA’nın sunmuş olduğu “A Review on Deep Learning-Based Methods Developed>>>

09
Oca

İlk yabancı yazarlı ortak makalem yayınlandı

Birbirimizi hiç görmeden ve sesli olarak da hiç konuşmadan e-posta üzerinden tanışıp ortak bir çalışma>>>

4 Comments

21
Eki

Konya’da göz lazer ameliyatı oldum

25 yıldır takmakta olduğum ve kendisinden ayrılırken 6,5 numara olan gözlüğüme Konya’da göz lazer ameliyatımı>>>

21
Ağu

Tek kelimeyle beni nasıl tanımladılar?

YouTube üzerinden yapmış olduğum bir yoruma gelen yanıtta “…dürüst olun…” içeriğini görünce aklıma geçtiğimiz günlerde>>>

3 Comments

02
Ağu

Konya Akıllı Şehir HACKATHON’unda 3.olduk

Kısaca daha önceki yazımda bahsettiğim Konya Akıllı Şehir HACKATHON’unda 3.olduk. Selçuk Üniversitesi Teknoloji Fakültesi Bilgisayar>>>

1 Comment

29
May

Sentius ekibi olarak, Akıllı Şehir HACKATHON’una katıldık

Konya Akıllı Şehir HACKATHON’unda 3.olduk Konya Bilim Merkezi ile GDG Konya’nın düzenlediği Akıllı Şehir HACKATHON’una>>>

1 Comment

29
May

BİLMÖK 2022 için yazılmış gecikmiş bir yazı :)

Türkiye’nin en büyük öğrenci kongresi BİLMÖK 21-23 Mayıs 2022 günlerinde Konya’da Konya Teknik Üniversitesi’nin organizasyonuyla>>>

24
May

Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…

Genç Bakış Gazetesi’nden Beyzanur Polat’ın yaptığı haber…>>>

22
Kas

Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem

Binary Sooty Tern Optimization Algorithms for solving Wind Turbine Placement Problem İndirmek için tıklayınız.>>>

10
Eyl

Konya Model Fabrika’yı Ziyaretim ve Konya Dijital Dönüşüm

“konya dijital dönüşüm” kelimesini Google üzerinden arattığım zaman Konya Model Fabrika‘yı keşfettim. 5 Ağustos 2021>>>

06
Ağu

Otomatlar, Biçimsel Diller ve Turing Makineleri – Dr. Emre Sermutlu – Cinius Yayınları

2020-2021 bahar yarıyılında Otomata Teorisi ve Biçimsel Diller dersini verirken kullanmam için Selçuk Üniversitesi Teknoloji>>>

21
Mar

4-6 MART 2021 ÇEVRİMİÇİ TÜBİTAK-2237-B PROJE EĞİTİMİ ETKİNLİĞİ KTÜ – TRABZON

Alanında dünyada öncü Prof. Dr. Yener EYÜBOĞLU, Prof. Dr. Asım KADIOĞLU, Prof. Dr. Nurettin YAYLI,>>>

06
Mar

ARDEB 1001 – 2020 Sonuçlarını Değerlendirme ve Yenilikler Toplantısı

>>>

19
Şub

2021 yılı içerisinde değerlendirilebilecek konferanslar

GLOBAL CONFERENCE on ENGINEERING RESEARCH online 2-5 June 2021 Abstract or Full Paper Submission: 2>>>

08
Şub

Sayfamda paylaştığım bütün Karikatürler silinmiştir

İsimsiz bir uyarı yorumuyla araştırdığım vakit gördüm ki bazı karikatüristler blog sayfalarında karikatür paylaşanlara dava>>>

23
Oca

MATLAB – Error: Functions cannot be indexed using {} or . indexing.

data = get(z9).OutputData{1}; satırında aşağıdaki şekilde hata vermekteydi. Error: Functions cannot be indexed using {}>>>

16
Oca

“ERASMUS+ Yüksek Öğretim” konulu seminer notları

“ERASMUS + Yüksek Öğretim” konulu seminer notları Dr. Öğretim Üyesi Kemal TÜTÜNCÜ hocam tarafından sunulan>>>

01
Oca

Bildiri İncelemeleri