İstatistiksel Makine Çevirisi

Kısaca: İstatistiksel Makine Çevirisi, parametreleri iki dilli metin derlemlerinin incelenmesi yoluyla elde edilen istatistiksel modelleri kullanan bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir. ...devamı ☟

İstatistiksel Makine Çevirisi, parametreleri iki dilli metin derlemlerinin incelenmesi yoluyla elde edilen istatistiksel modelleri kullanan bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir. İstatistiksel Makine Çevirisi yaklaşımına ilişkin ilk düşünceler Warren Weaver tarafından 1949 yılında ortaya atılmıştır. Bu düşünce, Claude Shannon'ın bilgi kuramına dayanmaktaydı. Uzun bir aradan sonra bu yöntem IBM araştırma laboratuarlarında Thomas J. Watson Araştırma merkezinde 1991 yılında tekrar gündeme gelmiştir. Son yıllarda bu makine çevirisi yöntemine olan ilgi hızla artmıştır ve en fazla uygulanan yöntemlerden birisi haline gelmiştir. Temelleri İstatistiksel Makine Çevirisi yaklaşımının arka planındaki düşünce bilgi teorisine dayanır. Buna göre bir belgenin çevirisi, kaynak dildeki bir metnin (örnekte f ile gösterilen Fransızca) hedef dildeki metne (örnekte e ile gösterilen İngilizce) p(e|f) ile ifade edilen bir olasılık dağılımı altında karşılık gelen şeklidir. p(e|f) ile ifade edilen olasılık dağılımını modellemek birkaç şekilde mümkündür. Öne çıkan yöntemlerden birisi Bayes teoremini uygulayarak problemi iki parçaya bölmektir. Çeviri problemi p(e|f) \propto p(f|e) p(e) şeklinde modellendiğinde p(f|e) ifadesi, kaynak dildeki metin dizisinin hedef dildeki dizinin çevirisi olma olasılığını ifade eder ve çeviri modeli olarak adlandırılır. p(e) ifadesi ise çevirisi yapılan bu metnin hedef dilde karşılaşılabilen bir metin olma olasılığını ifade eder. Bu model ise dil modeli olarak adlandırılır. \tilde ile ifade edilen en iyi çeviriyi bulma problemi, en yüksek koşullu olasılığı veren şu metin dizisini seçmekle çözülür: \tilde = arg \max_ p(e|f) = arg \max_ p(f|e) p(e) . Kısacası bir metnin hedef dildeki karşılığını bulma probleminin cevabı, iki ayrı modelin koşullu olasılığı alınarak en doğru biçimde elde edilmeye çalışılır. Böyle bir modellemeyi güçlü şekilde uygulayabilmek için hedef dildeki bütün metin dizilerini e^* arama sürecinden geçilmesi gerekir. Bu arama işini etkin şekilde halletmek için yabancı dildeki metni inceleyen ve üzerinde arama yapılan uzayı daraltan optimizasyon metotları kullanılır. Ne var ki bu türden optimizasyon yöntemleriyle arama süresinden kazanç sağlanırken doğru çevirinin bulunması ihtimalinde azalma da meydana gelebilir. Bu tür bir ödünleşme, yani kalite ve hız arasında seçim yapma durumu konuşma tanıma uygulamalarındaki ile benzerdir. Çeviri sistemleri bütün metinleri ve çevirilerini saklayamayacağı için çeviri cümle bazında yapılır fakat bu bile tek başına yeterli olmaz. Dil modelleri elde edilirken n gram modelleri kullanılarak kelime dizilerinin birbiri ardına gelme sıklığını gösteren tablolar oluşturulur. Çözücü program dil modelinin parametrelerini bu tablolardan elde eder. İstatistiksel Çeviri Modelleri başlangıçta yalnızca kelime analizine dayalı modellerdi. IBM modelleri 1-5 ve Franz-Joseph Och'un 6. modeli bu çerçevededir. Deyim tabanlı çeviri modellerinin geliştirilmesiyle çeviri modellerinin kapasitesi yönünde büyük bir gelişme sağlanmıştır. Bu sayede çeviri birimlerinin yalnızca kelimelerden değil, biribiri ardına gelen kelime dizilerinden de meydana gelebileceği varsayımı altında daha gerçekçi modelleme yapılabilme imkanı doğmuştur. Son yıllarda ise cümlelerin kelime veya kelime grupları yerine bir ağacın dalları gibi tek bir yerden ayrışan yapılar şeklinde kurulduğunu varsayan ve iç içe geçmiş kelime gruplarının da olabileceğini varsayan modeller geliştirilmeye başlanmıştır.

Kaynaklar

Vikipedi

Bu konuda henüz görüş yok.
Görüş/mesaj gerekli.
Markdown kullanılabilir.