Program, beşer harflik öbeklerin istatistik yöntemleriyle analiz edilmesi esasına dayanır. 100.000 civarında kelimeden oluşan büyük metinler üzerinde yapılan çalışmalar, kelimelerin neredeyse üçte birinin bu şekilde düzeltilmesi gerektiğini ortaya çıkarıyor. Bu program, bazı örneklerde bir hayli belirsizlik yaratabilen bu gibi durumlarda %99 başarı sağlıyor.
Teknik olarak yapılması daha kolay olan Türkçe Karakter Temizleme Programı da aynı proje dahilinde yapılmıştır.
Dış bağlantılar
- Yazım Türkçeleştirme Programı
- http://pisi.uludag.org.tr:8080/zemberek_web Zemberek projesi web arayüzü