| Ders Adı | METİN MADENCİLİĞİ VE DOĞAL DİL İŞLEME | Kod | YÖN7033 |
| Kredi | 3 | AKTS | 8 |
| Z/S | Seçmeli | Teorik Saat | 3 |
| Uygulama Saat | 0 | Lab Saat | 0 |
| Ders Dili | Türkçe | Dersi Veren | Dr. Ögr. Üyesi ŞENOL EMİR |
| Dersin Veriliş Türü | Örgün | ||
Bu dersin amacı, metin madenciliği ve doğal dil işleme (NLP) alanının temel kavramlarını, yöntemlerini ve güncel yaklaşımlarını öğretmektir. Ders kapsamında, metin ön işleme tekniklerinden klasik vektör uzayı modellerine, kelime gömülülerinden dönüştürücü (transformer) mimarilerine ve büyük dil modellerine kadar uzanan yöntemlerin kuramsal temelleri ve uygulamaları ele alınmaktadır. Öğrencilerin, metin verilerinden anlamlı bilgi çıkarabilme, modern NLP modellerini kullanabilme ve bu alandaki etik, yanlılık ve gizlilik sorunlarını eleştirel bir bakış açısıyla değerlendirebilme yetkinliği kazanmaları hedeflenmektedir.
Metin ön işleme ve temizleme teknikleri, kelime torbası (bag-of-words), TF-IDF ve vektör uzayı modelleri, Word2Vec, GloVe, fastText gibi kelime gömülüleri(embeddings), temel konu modelleme yöntemleri, duygu analizi ve metin sınıflandırma, isimlendirilmiş varlık tanıma (NER), metin özetleme, soru-cevap sistemleri, sohbet robotlarının temel prensipleri, dönüştürücü (transformer) mimarisi ve BERT/GPT gibi önceden eğitilmiş modellerin kullanımı ve ince ayar yapılması (fine-tuning), Hugging Face Transformers kütüphanesi ile pratik uygulamalar, Türkçe ve çok dilli doğal dil işleme zorlukları, metin madenciliğinde gizlilik, yanlılık ve etik konular ile bu alanlardaki güncel önemli makalelerin incelenmesi ve tartışılması.
Çevrimiçi ve yüz yüze eğitim
- Altınok, D. (2021). Mastering spaCy: An end-to-end practical guide to implementing NLP applications using the Python ecosystem. Packt. - Albrecht, J.,Ramachandran S., Winkler C., Blueprints for Text Analytics Using Python: Machine Learning-Based Solutions for Common Real World (NLP) Applications - Kadre, S., Kadre, S., & Dey, S. (2025). Mastering Text Analytics: A Hands-on Guide to NLP Using Python. Apress.