Metin İşleme 1 —  Eski Tarz Yöntemler (Bag of Words ve TFxIDF)


Günümüz teknolojilerinin ve İnternet altyapılarının geldiği noktada; yapısal olmayan metin içerikli veri miktarı her geçen gün artmaktadır. Yapısal olmayan bu veriler üzerinde Makine Öğrenmesi modellerini ve algoritmalarını uygulayabilmemiz için öncelikle metinlerin işlenmesi gerekmektedir. Kabaca adımlar şu şekildedir: “metin verileri” → “özniteliklere” (yani yapısal bir formata), öznitelikler → “vektörlere” çevrilir.

Yazının tamamına “Deep Learning Türkiye” medium blog sitesinden erişebilirsiniz…

Metin İşleme 1 — Eski Tarz Yöntemler (Bag of Words ve TFxIDF)

Deniz Kılınç

Advertisements

Proje Birincilik Ödülü: “Makine Öğrenmesi Destekli Sahte Twitter Kullanıcısı Tespiti”


Danışmanlığını yaptığım Yazılım Mühendisliği 3.sınıf öğrencim Ceyhun Akyol ile katıldığımız 26. Bilim ve Bahar Şenliği Proje Yarışmasında, Mühendislik Bilimleri kategorisinde, “Makine Öğrenmesi Destekli Sahte Twitter Kullanıcısı Tespiti” isimli projemizle 1.lik ödülünü almaya hak kazandık.

Sistem Mimarisi

Makine Öğrenmesi Özet Bilgi

  • Çalışma için veri seti özel oluşturuldu.
  • Deneysel olarak test edilen algoritmalar:
    • NaiveBayes
    • NaiveBayesMultinomial
    • NaiveBayesUpdateable
    • Logistic
    • SGD
    • KStar
    • IterativeClassifierOptimizer
    • RandomSubSpace
    • MultiClassClassifier
    • MultiScheme
    • Vote
    • ZeroR
    • J48
    • LMT
    • RandomTree
  • Öznitelik seçim denemeleri
    • CfsSubsetEval
    • Relief
  • En iyi Accuracy değeri
    • Random Forest + Relief: %90.4

Bazı Ekran Görüntüleri

Öğrencimi gösterdiği yoğun gayretten ötürü ayrıca tebrik ediyorum…

Dr. Deniz Kılınç