Ders Adı | METİN MADENCİLİĞİ | Kod | BLMU9040 |
Kredi | 3 | AKTS | 8 |
Z/S | Seçmeli | Teorik Saat | 3 |
Uygulama Saat | 0 | Lab Saat | 0 |
Ders Dili | Türkçe | Dersi Veren | Doç. Dr. ATAKAN KURT |
Dersin Veriliş Türü | |||
20. yüzyılın son çeyreğinde Bilgisayar ve İletişim teknolojilerinde meydana gelen hızlı değişimlere İnternetin ve mobil akıllı telefonların hızla yaygınlaşması da eklenince büyük miktarlarda metin kümeleri ortaya çıkmış bulunmaktadır. Doğal Dilde yazılmış bu metin kümelerinin büyük çoğunluğu yapısız (unstructured) metinlerdir. Sosyal medyadan sağlığa, eğitimden iş dünyasına, finanstan psikolojiye hayatın her safhasında ortaya çıkan bu metinlerden saklı olan faydalı bilgileri ortaya çıkarmak için kullanılan yöntemlerin hepsine metin madenciliği adı verilir. Bu derste metin madenciliğinin temelleri, uygulamalı örnek problemler üzerinde veri madenciliği yazılımlarıyla anlatılmaktadır.
Büyük metin kümeleri içindeki gizli ve faydalı bilgilere veri madenciliği yöntem ve araçları kullanarak etkin ve pratik bir şekilde erişim sağlamak. Metin kümeleri üzerinde sınıflandırma, gruplandırma ve ilişkilendirme teknik, yöntem ve mtodlarını incelemek. Metin üzerinde sesbilimsel, biçimbilimsel, sözdizimsel, ve anlamsal doğal dil işleme tekniklerini kullanarak metinleri temizleme, ayrıştırma, birleştirma, normalize etme ve dönüştürme işlemlerini yapmak, arama motoru ve bilgi erişim tekniklerini ve algoritmalarını incelemek.
Dersler konu anlatımı, tartışma, değerlendirme biçiminde işlenecek olup, derste ödevler ve dönem projesi verilmektedir. Ayrıca arasınav ve final sınavı yapılacaktır.
Bir adet ana ders kitabı, yardıncı ders kitapları, sunumlar, bildiri vb diğer yayınlar.