Makine çevirisi: Revizyonlar arasındaki fark

Vikipedi, özgür ansiklopedi
[kontrol edilmiş revizyon][kontrol edilmemiş revizyon]
İçerik silindi İçerik eklendi
Drgulcu (mesaj | katkılar)
Değişiklik özeti yok
İng. den çeviri
1. satır: 1. satır:
[[Dosya:WordLensDemo5Feb2012.jpg|küçükresim| İspanyolca metni İngilizceye çeviren bir cep telefonu uygulaması]]
'''Makine çevirisi''' veya '''robot çeviri''', [[bilgisayar destekli çeviri]] kullanılarak bir içeriği başka bir dile çevirme yazılımı arayıcığıyla kullanılan çevirilere denir.
'''MT'''<ref name="MT1998.EmptyAtlantic">{{Dergi kaynağı|başlık=Lost in Translation|yazarlar=Budiansky|tarih=December 1998|sayfalar=81–84|çalışma=[[Atlantic Magazine]]|ilk=Stephen}}</ref> kısaltmasıyla da anılan '''makine çevirisi''', metin veya konuşmayı bir [[Dil|dilden]] diğerine [[Çeviri|çevirmek]] için yazılım kullanımını araştıran [[bilgisayarlı dilbilim]]<nowiki/>in bir alt alanıdır.


Temel düzeyde kullanılan robot çeviri, bir dildeki kelimelerin başka bir dildeki basit yerine koyulmasını gerçekleştirir, ancak tek başına bu genellikle bir metnin iyi bir çevirisini üretemez çünkü tüm deyimlerin ve hedef dildeki en yakın eşlerinin tanınması gereklidir.
MT bir dildeki sözcüklerin başka bir dildeki sözcüklerle mekanik olarak yer değiştirmesini gerçekleştirir, ancak bu tek başına nadiren iyi bir çeviri üretir; çünkü hedef dildeki tümceler ve bunların (en yakın) karşılıklarının tanınması gerekir. Bir dildeki tüm kelimelerin başka bir dilde karşılığı yok ve birçok kelimenin birden fazla anlamı vardır.


Bu problemi istatistiksel ve nöral tekniklerle çözmek, daha iyi çevirilerle, dilsel tipolojideki farklılıkları ele almaya, deyimlerin çevirisine ve anomalilerin izolasyonuna yol açan hızla büyüyen bir alandır.<ref>Albat, Thomas Fritz. "Systems and Methods for Automatically Estimating a Translation Time." US Patent 0185235, 19 July 2012.</ref>
Yapılan güncellemeler ve sinirsel teknolojinin makine çevirisine entegre edilmesi ile birlikte makine çevirisi kalitesi yükselmiştir.

Mevcut makine çevirisi yazılımı genellikle etki alanına veya [[Meslek|mesleğe]] göre özelleştirmeye izin verir ([[Meteoroloji|hava durumu raporları]] gibi), izin verilen değiştirmelerin kapsamını sınırlayarak çıktıyı iyileştirir. Bu teknik, özellikle '''resmi veya kalıplaşmış dilin kullanıldığı alanlar'''da etkilidir. Buradan hükümet belgeleri ve yasal belgelerin makine çevirisinde, konuşma veya daha az standartlaşmış metin çevirisine göre daha kullanılabilir çıktı ürettiği sonucu çıkar.

İyi bir çıktı kalitesi, insan müdahalesiyle de elde edilebilir: örneğin, bazı sistemler, eğer kullanıcı metindeki hangi kelimelerin özel adlar olduğunu açık bir şekilde belirlediyse, daha doğru çeviri yapabilir. Bu tekniklerin yardımıyla MT'nin insan çevirmenlere yardımcı olacak bir araç olarak sınırlı durumlarda kullanılabilecek çıktılar üretebilir (örneğin, hava durumu raporları).

Makine çevirisinin ilerleme ve potansiyeli tarihi boyunca tartışıldı. 1950'lerden bu yana, başta Yehoshua Bar-Hillel olmak üzere birçok akademisyen<ref>{{Kitap kaynağı|başlık=Language and Information: Selected Essays on Their Theory and Application|tarih=1964|sayfalar=174–179|yer=Reading, Massachusetts|yayıncı=Addison-Wesley|ilk=Yehoshua}}</ref> yüksek kalitede tam otomatik makine çevirisi elde etme olasılığını sorguladı.<ref>{{Tez kaynağı|url=https://docs.google.com/fileview?id=0B7-4xydn3MXJZjFkZTllZjItN2Q5Ny00YmUxLWEzODItNTYyMjhlNTY5NWIz|başlık=The Limits of Machine Translation|erişimtarihi=<!--2020-05-12-->|arşivtarihi=17 October 2021|arşivurl=https://web.archive.org/web/20211017205439/https://drive.google.com/file/d/0B7-4xydn3MXJZjFkZTllZjItN2Q5Ny00YmUxLWEzODItNTYyMjhlNTY5NWIz/view?usp=drive_open|tarih=2009|lisans=MA|sayfa=5|yayıncı=University of Copenhagen}}</ref>

== Tarih ==

=== Kökenler ===
Makine çevirisinin kökenleri, [[olasılık]] ve [[istatistik]] dahil olmak üzere sistemik dil çevirisi için teknikler geliştiren dokuzuncu yüzyılda Arap bir [[Kriptografi|kriptograf]] olan [[Kindî|Al-Kindi'nin]] çalışmasına kadar izlenebilir.<ref>{{Web kaynağı|url=http://amodern.net/article/cryptological-origins-machine-translation/|başlık=The Cryptological Origins of Machine Translation: From al-Kindi to Weaver|erişimtarihi=2 September 2019|arşivtarihi=14 August 2019|arşivurl=https://web.archive.org/web/20190814061915/http://amodern.net/article/cryptological-origins-machine-translation/|tarih=January 2018|çalışma=Amodern|ilk=Quinn}}</ref> Makine çevirisi fikri daha sonra 17. yüzyılda ortaya çıktı. 1629'da [[René Descartes]], farklı dillerdeki eşdeğer fikirlerin aynı sembolü paylaştığı evrensel bir dil önerdi.<ref>{{Kitap kaynağı|başlık=Universal Language Schemes in England and France, 1600-1800|tarih=1975|yer=Toronto|yayıncı=University of Toronto Press|isbn=0-8020-5296-7|ilk=James}}</ref>

Doğal dillerin çevirisinde bilgisayarların kullanılması fikri, 1947 gibi erken bir tarihte İngiltere'deki AD Booth<ref>{{Kitap kaynağı|url=https://archive.org/details/sim_computers-and-people_1953-05_2_4/page/n8/|başlık=Computers and Automation 1953-05: Vol 2 Iss 4|kısım=MECHANICAL TRANSLATION|tarih=1953-05-01|dil=en|sayfalar=6|yayıncı=Berkeley Enterprises|diğerleri=Internet Archive|ilk=Andrew D.}}</ref> ve aynı yıl [[Rockefeller Vakfı|Rockefeller Foundation'dan]] [[Warren Weaver]] tarafından önerildi. " [[Warren Weaver]] tarafından 1949'da yazılan memorandum, makine çevirisinin ilk günlerinde belki de en etkili tek yayındı."<ref>{{Kitap kaynağı|url=https://pdfs.semanticscholar.org/eaa9/ccf94b4d129c26faf45a1353ffcbbe9d4fda.pdf|başlık=Early Years in Machine Translation|arşivtarihi=2020-02-28|arşivurl=https://web.archive.org/web/20200228015454/https://pdfs.semanticscholar.org/eaa9/ccf94b4d129c26faf45a1353ffcbbe9d4fda.pdf|kısım=Warren Weaver and the launching of MT|ansiklopedi=[[Semantic Scholar]]|sayfa=17|seri=Studies in the History of the Language Sciences|yıl=2000|cilt=97|isbn=978-90-272-4586-1|doi=10.1075/sihols.97.05hut|yazar=J. Hutchins}}</ref><ref>{{Web kaynağı|url=https://www.britannica.com/biography/Warren-Weaver|başlık=Warren Weaver, American mathematician|erişimtarihi=7 August 2020|arşivtarihi=6 March 2021|arşivurl=https://web.archive.org/web/20210306061225/https://www.britannica.com/biography/Warren-Weaver|tarih=July 13, 2020}}</ref> Bunu diğerleri izledi. 1954'te [[Birkbeck, Londra Üniversitesi|Birkbeck College']]<nowiki/>da APEXC makinesinde İngilizcenin Fransızcaya ilkel bir çevirisinin bir gösterimi yapıldı. O zamanlar konuyla ilgili popüler dergilerde makaleler yayınlandı (örneğin, ''Wireless World'ün'' Eylül 1955 sayısında Cleave ve Zacharov tarafından yazılan bir makale). O dönemde Birkbeck Koleji'nde de öncülük edilen benzer bir uygulama, [[Braille alfabesi|Braille]] metinlerini bilgisayarda okuyor ve oluşturuyordu.

=== 1950'ler ===
Yehoshua Bar-Hillel, araştırmalarına MIT'de başladı (1951). Profesör Michael Zarechnak liderliğindeki bir [[Georgetown Üniversitesi]] MT araştırma ekibi (1951), 1954'te Georgetown-IBM deney sisteminin halka açık bir gösterimini yaptı. Japonya<ref>{{Kitap kaynağı|başlık=パーソナルコンピュータによる機械翻訳プログラムの制作|tarih=1986-08-13|dil=ja|sayfa=16|yer=Tokyo|yayıncı=(株)ラッセル社|alıntı=わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されている。(translation (assisted by [[Google Translate]]): In 1959 Japan, the [[w:jp:電気試験所|National Institute of Advanced Industrial Science and Technology]](AIST) tested the proper English-Japanese translation machine ''Yamato'', which reported in 1964 as that reached the power level over the score of 90-point on the textbook of first grade of junior hi-school.)|isbn=494762700X}}</ref><ref>{{Web kaynağı|url=http://museum.ipsj.or.jp/computer/dawn/0027.html|başlık=機械翻訳専用機「やまと」-コンピュータ博物館|erişimtarihi=4 April 2017|arşivtarihi=19 October 2016|arşivurl=https://web.archive.org/web/20161019171540/http://museum.ipsj.or.jp/computer/dawn/0027.html}}</ref> ve Rusya'da (1955) MT araştırma programları ortaya çıktı ve ilk MT konferansı Londra'da yapıldı (1956).<ref name="Nye">{{Akademik dergi kaynağı|url=https://www.sciencehistory.org/distillations/magazine/speaking-in-tongues|başlık=Speaking in Tongues: Science's centuries-long hunt for a common language|erişimtarihi=20 March 2018|arşivtarihi=3 August 2020|arşivurl=https://web.archive.org/web/20200803130801/https://www.sciencehistory.org/distillations/magazine/speaking-in-tongues|yazarlar=Nye|tarih=2016|sayı=1|sayfalar=40–43|çalışma=Distillations|cilt=2|citeseerx=live}}</ref><ref name="Babel">{{Kitap kaynağı|başlık=Scientific Babel: How Science Was Done Before and After Global English|tarih=2015|yer=Chicago, Illinois|yayıncı=University of Chicago Press|isbn=9780226000299}}</ref>

David G. Hays "1957'de bilgisayar destekli dil işleme hakkında yazdı" ve "1955'ten 1968'e kadar [[RAND Corporation|Rand]]'da hesaplamalı dilbilim proje lideriydi."<ref>{{Haber kaynağı|url=https://www.nytimes.com/1995/07/28/obituaries/david-g-hays-66-a-developer-of-language-study-by-computer.html|başlık=David G. Hays, 66, a Developer Of Language Study by Computer|erişimtarihi=7 August 2020|arşivtarihi=7 February 2020|arşivurl=https://web.archive.org/web/20200207035914/https://www.nytimes.com/1995/07/28/obituaries/david-g-hays-66-a-developer-of-language-study-by-computer.html|yazarlar=Wolfgang Saxon|tarih=July 28, 1995|çalışma=[[The New York Times]]|alıntı=wrote about computer-assisted language processing as early as 1957.. was project leader on computational linguistics at Rand from 1955 to 1968.}}</ref>

=== 1960–1975 ===
ABD'de Makine Çevirisi ve bilgisayarlı Dilbilim Derneği (1962) ve Ulusal Bilimler Akademisince Otomatik Dil İşleme Danışma Komitesi'nin (ALPAC) kurulmasıyla (1964) araştırmacılar bu alana katılmaya devam ettiler. Ancak ilerleme gerçekte çok daha yavaştı ve araştırmaların beklentileri karşılamadığını gösteren ALPAC raporundan (1966) sonra, fon büyük ölçüde azaldı.<ref name="ueno">{{Kitap kaynağı|başlık=パーソナルコンピュータによる機械翻訳プログラムの制作|tarih=1986-08-13|dil=ja|sayfa=16|yer=Tokyo|yayıncı=(株)ラッセル社|isbn=494762700X}}</ref> Savunma Araştırma ve Mühendislik Direktörü'nün (DDR&E) 1972 tarihli bir raporuna göre, MT'nin büyük ölçekli uygulanabilirliği, Logos MT sisteminin bu çatışma sırasında askeri kılavuzları Vietnamca'ya çevirmedeki başarısıyla yeniden tesis edildi.

Fransız Tekstil Enstitüsü özetleri Fransızca yanında İngilizce, Almanca ve İspanyolca'ya çevirmek için MT'yi kullandı (1970); Brigham Young Üniversitesi, [[Mormon]]<nowiki/>ik metinleri otomatik yolla çevirmek için bir proje başlattı (1971).

=== 1975 ve sonrası ===
1960'larda "ABD hükümetinin sözleşmeleri kapsamında alana öncülük eden" SYSTRAN, Xerox tarafından teknik kılavuzları çevirmek için kullanıldı (1978).<ref name="MT1998.EmptyAtlantic">{{Dergi kaynağı|başlık=Lost in Translation|yazarlar=Budiansky|tarih=December 1998|sayfalar=81–84|çalışma=[[Atlantic Magazine]]|ilk=Stephen}}</ref> [[Berim|Hesaplama]] gücü arttıkça ve daha ucuz hale geldikçe, [[İstatistiksel makine çevirisi|makine çevirisi için istatistiksel modellere]] 1980'lerin sonlarından başlayarak daha fazla ilgi gösterildi.<ref>{{Kitap kaynağı|başlık=Conceptual Information Processing|tarih=2014|sayfalar=5|yer=New York|yayıncı=Elsevier|isbn=9781483258799|ilk=Roger C.}}</ref> SYSTRAN'ın ilk uygulama sistemi, 1988 yılında Fransız Posta Servisi'nin Minitel adlı çevrimiçi hizmeti tarafından uygulandı.<ref>{{Kitap kaynağı|başlık=Machine Translation and the Information Soup: Third Conference of the Association for Machine Translation in the Americas, AMTA'98, Langhorne, PA, USA, October 28–31, 1998 Proceedings|tarih=2003-06-29|sayfalar=276|yer=Berlin|yayıncı=Springer|isbn=3540652590}}</ref> MT ile aynı olmasa da, Çeviri Belleği teknolojisini ilk geliştiren ve pazarlayan Trados (1984) dahil olmak üzere çeşitli bilgisayar tabanlı çeviri şirketleri de piyasaya sürüldü. Rusça / İngilizce / Almanca-Ukraynaca için ilk ticari MT sistemi Kharkov Devlet Üniversitesi'nde geliştirildi (1991).

1998'de, "29.95 $ gibi bir fiyata" bilgisayarda çalıştırmak üzere "İngilizce ile seçtiğiniz büyük bir Avrupa dili arasında tek yönde çeviri yapmak için program satın alınabilirdi".<ref name="MT1998.EmptyAtlantic">{{Dergi kaynağı|başlık=Lost in Translation|yazarlar=Budiansky|tarih=December 1998|sayfalar=81–84|çalışma=[[Atlantic Magazine]]|ilk=Stephen}}</ref>

Web üzerinde MT, SYSTRAN'ın küçük metinlerin ücretsiz çevirisini sunmasıyla başladı (1996) ve ardından bunu günde 500.000 istek toplayan AltaVista Babelfish<ref name="MT1998.EmptyAtlantic">{{Dergi kaynağı|başlık=Lost in Translation|yazarlar=Budiansky|tarih=December 1998|sayfalar=81–84|çalışma=[[Atlantic Magazine]]|ilk=Stephen}}</ref> aracılığıyla sağladı (1997).<ref>{{Web kaynağı|url=https://digital.com/about/babel-fish/|başlık=Babel Fish: What Happened To The Original Translation Application?: We Investigate|erişimtarihi=2019-11-22|arşivtarihi=20 November 2019|arşivurl=https://web.archive.org/web/20191120032732/https://digital.com/about/babel-fish/|tarih=November 18, 2019|dil=en-US|çalışma=Digital.com}}</ref> Web'deki ikinci ücretsiz çeviri hizmeti, Lernout &amp;amp; Hauspie'nin GlobaLink'iydi.<ref name="MT1998.EmptyAtlantic" /> ''Atlantic Magazine'' 1998'de "Systran'dan Babelfish ve GlobaLink'ten Comprende"nin "Yetkin bir performansla" "Buna güvenme"yi ele aldığını yazdı.<ref>and gave other examples too</ref>

Google'da Çeviri Geliştirme bölümünün gelecekte başkanı olan Franz Josef Och, 2003 te DARPA'nın hızlı MT yarışmasını kazandı.<ref>{{Kitap kaynağı|başlık=Routledge Encyclopedia of Translation Technology|tarih=2015|sayfalar=385|yer=Oxon|yayıncı=Routledge|isbn=9780415524841|ilk=Sin-Wai}}</ref> Bu süre zarfındaki diğer yenilikler arasında açık kaynaklı istatistiksel MT motoru MOSES (2007), Japonya'da cep telefonları için bir metin/SMS çeviri hizmeti (2008) ve İngilizce, Japonca ve Çince için konuşmadan konuşmaya çeviri işlevine sahip bir cep telefonu yer aldı (2009). 2012'de Google, [[Google Çeviri]]'nin kabaca bir günde 1 milyon kitabı dolduracak kadar metin çevirdiğini duyurdu.

== Çeviri süreci ==
İnsan [[Çeviri|çevirisi süreci]] şu şekilde tanımlanabilir:

# Kaynak metnin [[Anlambilim|anlamının]] [[Kod|çözülmesi]]; Ve
# Bu [[Anlambilim|anlamı]] hedef dilde yeniden [[Kod|kodlamak]].

Basit görünen prosedürün arkasında karmaşık bir [[Bilişsellik|bilişsel]] operasyon yatmaktadır. Kaynak metnin tam anlamını çözmek için, onun [[Dilbilgisi|grameri]], [[Anlambilim|semantiği]], [[Sözdizim|sözdizimi]], [[Deyim|deyimleri]] vb. yanı sıra konuşmacının kültürü hakkında da derinlemesine bilgi gerektirir. Çevirmen, hedef dildeki kodlama için de aynı derinlikte bilgiye ihtiyaç duyar.

Makine çevirisindeki zorluk burada yatmaktadır: Bir metni bir kişinin anladığı gibi "anlayacak" ve hedef dilde [[Turing testi|sanki bir kişi tarafından yazılmış]] izlenimi veren yeni bir metin nasıl programlanır. Bir 'bilgi tabanı' tarafından desteklenmediği sürece MT, orijinal metnin kusurlu da olsa yalnızca genel bir "özünü" ("ana fikir") alabilir. Bu, toplam doğruluğun vazgeçilmez olduğu durumlar dışında birçok amaç için yeterlidir.

== Yaklaşımlar ==
[[Dosya:Direct_translation_and_transfer_translation_pyramid.svg|sağ|küçükresim|300x300pik| Bernard Vauquois'nın aracı temsilin karşılaştırmalı derinliklerini gösteren piramidi, zirvede diller arası makine çevirisi, ardından aktarım tabanlı ve ardından doğrudan çeviri]]
Makine çevirisinde [[Uzman sistemler|dil bilgisi kurallarına]] dayalı bir yöntem kullanıldığında hedef dilin en uygun kelimeleri kaynak dildeki kelimelerin yerini alacaktır.

Makine çevirisinin başarısı için öncelikle doğal dili anlama sorununun çözülmesi gerektiği sıklıkla tartışılır.<ref name="Lehrberger1988">{{Kitap kaynağı|url=https://books.google.com/books?id=YUNLlurHNAEC&q=%22natural+language+understanding%22+%22machine+translation%22|başlık=Machine Translation: Linguistic Characteristics of MT Systems and General Methodology of Evaluation|erişimtarihi=18 October 2020|arşivtarihi=17 October 2021|arşivurl=https://web.archive.org/web/20211017205439/https://books.google.com/books?id=YUNLlurHNAEC&q=%22natural+language+understanding%22+%22machine+translation%22|yayıncı=John Benjamins Publishing|yıl=1988|isbn=90-272-3124-9|yazar=John Lehrberger}}</ref>

Genel olarak, "'''kural tabanlı yöntemler'''" bir metni ayrıştırır; genellikle hedef dildeki metnin üretildiği aracı, sembolik bir temsil oluşturur. Aracı temsilin doğasına göre, diller arası makine çevirisi veya aktarıma dayalı makine çevirisi olarak bir yaklaşım tanımlanmaktadır. Bu yöntemler, [[Biçimbilim|morfolojik]], [[Sözdizim|sözdizimsel]] ve [[Anlambilim|semantik]] bilgileri ve '''büyük kural kümeleri'''ni içeren kapsamlı [[Lügatçe|sözlükler]] gerektirir.

Yeterince veri yüklendiğinde, makine çevirisi programları genellikle yeterince iyi çalışır. Zorluk, belirli bir yöntemi desteklemek için doğru türden '''yeterli veri'''yi elde etmektir. Örneğin, '''istatistiksel yöntemlerin çalışması için gereken çok dilli büyük veri külliyatı, dilbilgisine dayalı yöntemler için gerekli değil,''' ancak yöntemin dikkatli bir şekilde tasarlaması için yetenekli bir dilbilimciye ihtiyaç vardır.

Yakından ilişkili diller arasında çeviri yapmak için kural tabanlı makine çevirisi kullanılabilir.

=== Kural tabanlı ===
'''Kural tabanlı makine çevirisi''' (RBMT) aktarım tabanlı, diller arası ve sözlük tabanlı makine çevirisi paradigmalarını içerir. Bu tür çoğunlukla [[sözlük]] ve gramer programlarının oluşturulmasında kullanılır. Diğer yöntemlerden farklı olarak RBMT, her iki dilin morfolojik ve sözdizim kuralları ve anlamsal analizi hakkında daha fazla bilgi içerir. Temel yaklaşım, giriş cümlesinin yapısını, kaynak dil için bir ayrıştırıcı ve bir çözümleyici, hedef dil için bir üreteç ve gerçek çeviri için bir aktarım sözlüğü kullanarak çıktı cümlesinin yapısıyla ilişkilendirmeyi içerir. RBMT'nin en büyük dezavantajı, her şeyin açık hale getirilmesi gerektiğidir: RBMT'nin en büyük çöküşü, her şeyin açık hale getirilmesi gerektiğidir: imla varyasyonu ve hatalı girdi, bununla başa çıkmak için kaynak dil analizörünün bir parçası haline getirilmeli ve tüm belirsizlik örnekleri için sözcüksel seçim kuralları yazılmalıdır. Kendi içinde yeni alanlara uyum sağlamak o kadar da zor değildir, çünkü çekirdek dilbilgisi alanlar arasında aynıdır ve etki alanına özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlıdır.Çekirdek dilbilgisi tüm alanlarda aynı olduğundan ve alana özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlı olduğundan, yeni alanlara uyum sağlamak kendi başına o kadar da zor değildir.

==== Aktarım tabanlı makine çevirisi ====
'''Aktarım tabanlı''' makine çevirisi orijinal cümlenin anlamını simüle eden bir ara temsilden çeviri oluşturur. Diller arası makine çevirisin'den farklı olarak çeviride yer alan dil çiftine kısmen bağlıdır.

==== Diller arası ====
Diller arası makine çevirisi, kural tabanlı makine çevirisi yaklaşımlarının bir örneğidir. Bu yaklaşımda tercüme edilecek metin, '''diller arası dil''', yani "'''dilden bağımsız bir temsile'''" dönüştürülür. Hedef metin daha sonra interlingua'dan üretilir. Sistemin en büyük avantajlarından biri, çevrilebileceği hedef dil sayısının yüksek olmasıdır. Ancak, ticari düzeyde işlevsel hale getirilen tek diller arası makine çevirisi sistemi, Caterpillar Teknik İngilizcesini (CTE) diğer dillere çevirmek için tasarlanmış KANT sistemidir (Nyberg ve Mitamura, 1992).

==== Sözlük tabanlı ====
Bu tip çeviri, [[sözlük]] girişlerine dayalı, sözcüklerin bir sözlük tarafından olduğu gibi çevrileceği anlamına gelir.

=== İstatistiksel ===
İstatistiksel makine çevirisi, Kanada Hansard külliyatı, Kanada parlamentosu İngilizce-Fransızca kaydı ve [[Avrupa Parlamentosu]] EUROPARL kaydı gibi iki dilli metin külliyatlarına dayalı [[İstatistik|istatistiksel yöntemler]] kullanır. Ancak bu tür derlemler birçok dil çifti için nadirdir. İlk istatistiksel makine çevirisi yazılımı, [[IBM|IBM'den]] [[CANDIDE]] idi. Google, SYSTRAN'ı birkaç yıl kullandıktan sonra Ekim 2007'de istatistiksel bir çeviri yöntemine geçti. 2005 yılında Google, sistemlerini eğitmek için Birleşmiş Milletler materyallerinden yaklaşık 200 milyar kelime kullanarak dahili çeviri yeteneklerini geliştirdi; çeviri doğruluğu iyileştirildi.<ref>{{Web kaynağı|url=http://blog.outer-court.com/archive/2005-05-22-n83.html|başlık=Google Translator: The Universal Language|erişimtarihi=2012-06-12|arşivtarihi=20 November 2008|arşivurl=https://web.archive.org/web/20081120030225/http://blog.outer-court.com/archive/2005-05-22-n83.html|tarih=25 January 2007|yayıncı=Blog.outer-court.com}}</ref> Google Translate ve benzeri istatistiksel çeviri programları, daha önce insanlar tarafından çevrilmiş yüz milyonlarca belgedeki kalıpları tespit ederek ve bulgulara dayalı olarak akıllı tahminler yaparak çalışır. Genel olarak, belirli bir dilde ne kadar çok insan tarafından tercüme edilmiş belge varsa, çevirinin kaliteli olma olasılığı o kadar yüksektir.<ref>{{Web kaynağı|url=https://translate.google.com/about/intl/en_ALL/|başlık=Inside Google Translate – Google Translate|erişimtarihi=14 April 2014|arşivtarihi=16 April 2014|arşivurl=https://web.archive.org/web/20140416101812/https://translate.google.com/about/intl/en_ALL/}}</ref> METIS II ve PRESEMT gibi İstatistiksel Makine çevirisine yönelik daha yeni yaklaşımlar, minimum korpus boyutu kullanır ve bunun yerine örüntü tanıma yoluyla sözdizimsel yapının türetilmesine odaklanır. Daha fazla geliştirme ile bu, istatistiksel makine çevirisinin tek dilli bir metin külliyatından çalışmasına izin verebilir.<ref>{{Kitap kaynağı|url=http://www.mt-archive.info/10/HyTra-2013-Tambouratzis.pdf|başlık=Proceedings of the Second Workshop on Hybrid Approaches to Translation|erişimtarihi=<!--18 November 2013-->|arşivtarihi=13 April 2014|arşivurl=https://web.archive.org/web/20140413123538/http://www.mt-archive.info/10/HyTra-2013-Tambouratzis.pdf|kısım=Language-Independent Hybrid MT with PRESEMT|tarih=2013|sayfalar=123–130|yer=Sofia|yayıncı=Association for Computational Linguistics|isbn=978-1-937284-63-3}}</ref> SMT'nin en büyük zorluğu, çok miktarda paralel metne bağımlı olması, morfoloji bakımından zengin dillerle (özellikle bu tür ''dillere'' çeviri yaparken) sorunları ve tekil hataları düzeltememesidir.

=== Örnek tabanlı ===
Örnek tabanlı makine çevirisi (EBMT) yaklaşımı, 1984 yılında Makoto Nagao tarafından önerildi.<ref>Nagao, M. 1981. [https://web.archive.org/web/20180104132414/https://pdfs.semanticscholar.org/bc43/f6bccb18a5a4892daa8e66756e0a684e7f5c.pdf A Framework of a Mechanical Translation between Japanese and English by Analogy Principle], in Artificial and Human Intelligence, A. Elithorn and R. Banerji (eds.) North- Holland, pp. 173–180, 1984.</ref><ref>{{Web kaynağı|url=http://www.aclweb.org/index.php?option=com_content&task=view&id=36&Itemid=30|başlık=the Association for Computational Linguistics – 2003 ACL Lifetime Achievement Award|erişimtarihi=2010-03-10|arşivtarihi=12 June 2010|arşivurl=https://web.archive.org/web/20100612214728/http://aclweb.org/index.php?option=com_content&task=view&id=36&Itemid=30|yayıncı=Association for Computational Linguistics}}</ref> Örnek tabanlı makine çevirisi, [[analoji]] fikrine dayanır. Bu yaklaşımda, kullanılan derlem zaten çevrilmiş metinleri içeren bir derlemdir. Çevrilecek bir cümle verildiğinde, bu külliyattan benzer alt cümle bileşenleri içeren cümleler seçilir.<ref>{{Web kaynağı|url=http://kitt.cl.uzh.ch/clab/satzaehnlichkeit/tutorial/Unterlagen/Somers1999.pdf|başlık=Kitt.cl.uzh.ch &#91;CL Wiki&#93;|erişimtarihi=18 November 2013|arşivtarihi=7 January 2014|arşivurl=https://web.archive.org/web/20140107060626/http://kitt.cl.uzh.ch/clab/satzaehnlichkeit/tutorial/Unterlagen/Somers1999.pdf}}</ref> Benzer cümleler daha sonra orijinal cümlenin alt cümle bileşenlerini hedef dile çevirmek için bir araya getirilir.

=== Hibrit MT ===
Hibrit makine çevirisi (HMT), istatistiksel ve kural tabanlı çevirilerin güçlü yönlerinden yararlanır.<ref name="speechtechmag.com">{{Web kaynağı|url=http://www.speechtechmag.com/Articles/News/News-Feature/AppTek-Launches-Hybrid-Machine-Translation-Software-52871.aspx|başlık=Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)|erişimtarihi=2012-06-12|arşivtarihi=9 June 2009|arşivurl=https://web.archive.org/web/20090609220330/http://www.speechtechmag.com/Articles/News/News-Feature/AppTek-Launches-Hybrid-Machine-Translation-Software-52871.aspx|tarih=2 March 2009|yayıncı=Speechtechmag.com|yazar=Adam Boretz}}</ref> Yaklaşımlar farklılıklar gösterebilir:

* '''İstatistikler tarafından sonradan işlenmiş kurallar''' : Çeviriler, kurallara dayalı bir motor kullanılarak gerçekleştirilir, daha sonra çıktıyı ayarlamak/düzeltmek için istatistikler kullanılır.
* '''Kurallarla yönlendirilen istatistikler''' : Kurallar istatistik motorunu yönlendirmek amacıyla önceden kullanıldığı gibi çıktıyı işlemek için de kullanılır. Bu yaklaşım çeviri yaparken çok daha fazla güce, esnekliğe ve kontrole sahiptir.

Daha yakın zamanlarda, Nöral MT'nin gelişiyle birlikte, '''kurallara dayalı''', '''istatistiksel''' ve '''sinirsel''' makine çevirisini birleştiren yeni bir hibrit çeviri sürümü ortaya çıkıyor. Yaklaşım, NMT ve SMT'den yararlanmanın yanı sıra kural kılavuzlu bir iş akışında ön ve son işlemeden yararlanmaya olanak tanır. Dezavantajı, yaklaşımı yalnızca belirli kullanım durumları için uygun kılan karmaşıklıktır.

=== Nöral MT ===
MT'ye [[derin öğrenme]] tabanlı bir yaklaşım olan [[nöral makine çevirisi]] son yıllarda hızlı bir ilerleme kaydetti ve Google, çeviri hizmetlerinin artık önceki istatistiksel yöntemlerine göre bu teknolojiyi tercih ettiğini duyurdu. <ref>{{Haber kaynağı|url=https://www.theregister.co.uk/2016/11/17/googles_neural_net_translates_languages_not_trained_on/|başlık=Google's neural network learns to translate languages it hasn't been trained on|erişimtarihi=4 September 2017|arşivtarihi=1 September 2017|arşivurl=https://web.archive.org/web/20170901063659/http://www.theregister.co.uk/2016/11/17/googles_neural_net_translates_languages_not_trained_on/}}</ref> Bir Microsoft ekibi, 2018'de WMT-2017'de ("EMNLP 2017 İkinci Makine Çevirisi Konferansı") insan eşitliğine ulaştığını iddia etti.<ref>{{Web kaynağı|url=https://blogs.microsoft.com/ai/chinese-to-english-translator-milestone/|başlık=Microsoft reaches a historic milestone, using AI to match human performance in translating news from Chinese to English|erişimtarihi=21 April 2021|arşivtarihi=2 March 2019|arşivurl=https://web.archive.org/web/20190302093149/https://blogs.microsoft.com/ai/chinese-to-english-translator-milestone/|tarih=March 14, 2018}}</ref> Ancak ulaşılan fikir birliği, iddia edilen insan denkliğinin gerçek olmadığı, tamamen sınırlı alanlara, dil çiftlerine ve belirli test paketlerine<ref>Antonio Toral, Sheila Castilho, Ke Hu, and Andy
Way. 2018. Attaining the unattainable? reassessing claims of human parity in neural machine translation. CoRR, abs/1808.10432.</ref> dayalı olduğu, yani istatistiksel anlamlılık gücünden yoksun olduğu yönündedir. NMT'nin gerçek insan parite performanslarına ulaşması için hala uzun bir yolculuk var.

Deyimsel ifade çevirisini, çok kelimeli ifadeleri ve düşük frekanslı kelimeleri (OOV veya kelime dağarcığı dışı kelime çevirisi olarak da adlandırılır) ele almak için, dil odaklı dilsel özellikler son teknoloji ürünü nöral makine çevirisi (NMT) modellerinde araştırılmıştır. <ref>{{Web kaynağı|url=https://aclweb.org/aclwiki/Multiword_Expressions|başlık=Multiword Expressions – ACL Wiki|erişimtarihi=8 May 2021|arşivtarihi=8 May 2021|arşivurl=https://web.archive.org/web/20210508110238/https://aclweb.org/aclwiki/Multiword_Expressions}}</ref> Örneğin, Çince karakter ayrıştırmalarının kök ve vuruşlara NMT'de çok kelimeli ifadeleri çevirmede yardımcı olduğu kanıtlanmıştır.

2022'den itibaren genellikle en iyi makine çevirisi sonuçlarını sağladığı düşünülen [[DeepL Çeviri|DeepL Translator]] gibi nöral MT araçlarıyla yapılan çeviriler için genellikle yine de bir insan tarafından son düzenleme yapılması gerekiyor.<ref>{{Akademik dergi kaynağı|url=https://www.nature.com/articles/d41586-022-02767-9|başlık=Poor English skills? New AIs help researchers to write better|erişimtarihi=9 January 2023|yazarlar=Katsnelson|tarih=29 August 2022|sayı=7925|dil=en|sayfalar=208–209|çalışma=Nature|cilt=609|pmid=36038730|doi=10.1038/d41586-022-02767-9}}</ref><ref>{{Web kaynağı|url=https://towardsdatascience.com/deepl-an-exceptionally-magnificent-language-translator-78e86d8062d3|başlık=DeepL: An Exceptionally Magnificent Language Translator|erişimtarihi=9 January 2023|tarih=18 February 2022|dil=en|çalışma=Medium}}</ref><ref>{{Haber kaynağı|url=https://www.dw.com/en/deepl-cologne-based-startup-outperforms-google-translate/a-46581948|başlık=DeepL outperforms Google Translate – DW – 12/05/2018|erişimtarihi=9 January 2023|dil=en|çalışma=Deutsche Welle}}</ref>

=== Çevirileri iyileştirmek için potansiyel AI tabanlı teknikler ===
Makine çevirileri için geliştirilmekte olan teknikler şunları içerir:

* [[Doğal dil işleme]]<ref>{{Kitap kaynağı|başlık=2020 IEEE 3rd International Conference of Safe Production and Informatization (IICSPI)|kısım=Natural Language Processing and Its Applications in Machine Translation: A Diachronic Review|tarih=November 2020|sayfalar=210–214|isbn=978-1-7281-7738-0|doi=10.1109/IICSPI51290.2020.9332458}}</ref><ref>{{Akademik dergi kaynağı|başlık=Natural language processing: state of the art, current trends and challenges|yazarlar=Khurana|tarih=1 January 2023|sayı=3|dil=en|sayfalar=3713–3744|çalışma=Multimedia Tools and Applications|cilt=82|issn=1573-7721|pmc=9281254|pmid=35855771|doi=10.1007/s11042-022-13428-4}}</ref> – kaynak metnin semantik olarak anlaşılmasını (ör. anlam, duygu, adlandırma ve bağlamlar) ve ayrıca çeviri sonuçlarını iyileştirmek için gerçek dünyayla ilgili bir veri tabanı aracılığıyla ayarlamalar sağlar. Bir çalışmada, "hedef dildeki cümlelerle birlikte çeviriyi" tamamlamak için bir "anlamsal birim kitaplığı" kullanılmıştır.<ref>{{Kitap kaynağı|başlık=Proceedings of the 2022 3rd International Conference on Artificial Intelligence and Education (IC-ICAIE 2022)|kısım=English Machine Translation System Based on Semantic Selection and Information Features|kısım-url=https://www.atlantis-press.com/proceedings/ic-icaie-22/125981093|tarih=27 December 2022|dil=en|sayfalar=963–967|yayıncı=Atlantis Press|isbn=978-94-6463-039-8|doi=10.2991/978-94-6463-040-4_145}}</ref> 
* [[GPT-3]] <ref>{{Haber kaynağı|url=https://techxplore.com/news/2022-11-quality-ai-literary-human.html|başlık=Study assesses the quality of AI literary translations by comparing them with human translations|erişimtarihi=18 December 2022|yazarlar=Fadelli|dil=en|çalışma=techxplore.com}}</ref><ref name="arxiv221014250">{{ArXiv kaynağı|title=Exploring Document-Level Literary Machine Translation with Parallel Paragraphs from World Literature}}</ref> kullanılarak son düzenleme

== Büyük sorunlar ==
[[Dosya:Stir_Fried_Wikipedia.jpg|sağ|küçükresim|250x250pik| Makine çevirisi, "{{Dil|zh|鸡枞}} gibi bazı anlaşılmaz ifadeler üretebilir." ( ''Macrolepiota albuminosa'' ) "Wikipedia" olarak işleniyor.]]
[[Dosya:Machine_translation_in_Bali.jpg|sağ|küçükresim|333x333pik| Kırık Çince "{{Dil|zh|沒有進入}}" Bali, Endonezya'daki makine çevirisinden. Kırık Çince cümle "bir giriş yok" veya "henüz girmedim" gibi bir anlama geliyor.]]
Profesyonel edebi çevirmenler veya insan okuyucular tarafından en son gelişmiş MT çıktılarıyla ilgili [[Problem çözme (bilişsel psikoloji)|çeşitli sorunlar sistematik olarak tanımlamıştır]].<ref name="arxiv221014250">{{ArXiv kaynağı|title=Exploring Document-Level Literary Machine Translation with Parallel Paragraphs from World Literature}}</ref> '''Yaygın sorunlar''' doğru çevirisi "sağduyu-benzeri semantik dil işleme veya bağlam üzerinden" ancak yapılabilen bölümlerin çevirilerinde yer alıyor.<ref name="arxiv221014250" /> Ayrıca kaynak metinlerde de hatalar olabilir, yüksek kaliteli eğitim (çeviricilerin) verileri eksik olabilir.

== Notlar ==

== İleri okuma ==

* {{Kaynak|başlık=Encyclopedia Americana|katkı=Translation|sayfalar=12–15|kaynak=none|başlık-bağı=Encyclopedia Americana|yıl=1986|cilt=27|ilk=J. M.}}
* {{Kitap kaynağı|url=https://archive.org/details/introductiontoma0000hutc|başlık=An Introduction to Machine Translation|yer=London|yayıncı=Academic Press|yıl=1992|isbn=0-12-362830-X}}
* {{Dergi kaynağı|başlık=Tower of Babble|yazarlar=Lewis-Kraus|tarih=7 June 2015|sayfalar=48–52|çalışma=New York Times Magazine|ilk=Gideon}}
* {{Akademik dergi kaynağı|başlık=The 2020s Political Economy of Machine Translation|yazarlar=Weber|tarih=2022|sayı=1|dil=en|sayfalar=96–112|çalışma=Business and Politics|cilt=24|doi=10.1017/bap.2021.17|arxiv=2011.01007}}

== Dış bağlantılar ==

* [http://www.omniglot.com/language/articles/machinetranslation.htm Makine Çevirisinin Avantajları ve Dezavantajları]
* [http://www.eamt.org/iamt.php International Association for Machine Translation (IAMT)] Archived</link>
* [http://www.mt-archive.info Makine Çevirisi Arşivi] Archived</link> John Hutchins tarafından. Makine çevirisi ve bilgisayar tabanlı çeviri teknolojisi alanındaki makalelerin, kitapların ve makalelerin elektronik deposu (ve bibliyografyası)
* [http://www.hutchinsweb.me.uk/ Makine çevirisi (bilgisayar tabanlı çeviri)] - John Hutchins'in yayınları (makine çevirisiyle ilgili birkaç kitabın [[PDF|PDF'lerini]] içerir)
* [https://web.archive.org/web/20080120192259/http://bowland-files.lancs.ac.uk/monkey/ihe/mille/paper2.htm Makine Çevirisi ve Azınlık Dilleri]
* [http://www.foreignword.com/Technology/art/Hutchins/hutchins99.htm John Hutchins 1999] Archived</link>
* [https://slator.com/machine-translation/ Slator Haberleri ve makine çevirisindeki son gelişmelerin analizi]
* [https://www.machinetranslation.com/blog/how-machine-translation-is-changing-the-landscape-of-foreign-language-learning Sınıftan Gerçek Dünyaya: Makine Çevirisi Yabancı Dil Öğreniminin Manzarasını Nasıl Değiştiriyor?]
<nowiki>
[[Kategori:Otomasyon yazılımları]]
[[Kategori:Doğal dil işleme görevleri]]
[[Kategori:Bilgisayar destekli çeviri]]
[[Kategori:Bilişimsel dilbilim]]
[[Kategori:Yapay zekâ uygulamaları]]
[[Kategori:Makine çevirisi]]</nowiki>


Bazı makine çevirisi araçları [[Google Translate]], [[Microsoft Tercüman]] ve [[Yandex.Çeviri]]'dir.


{{tekno-taslak}}
{{Otorite kontrolü}}
{{Çeviri info}}
{{Çeviri info}}



Sayfanın 09.19, 1 Ağustos 2023 tarihindeki hâli

İspanyolca metni İngilizceye çeviren bir cep telefonu uygulaması

MT[1] kısaltmasıyla da anılan makine çevirisi, metin veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanımını araştıran bilgisayarlı dilbilimin bir alt alanıdır.

MT bir dildeki sözcüklerin başka bir dildeki sözcüklerle mekanik olarak yer değiştirmesini gerçekleştirir, ancak bu tek başına nadiren iyi bir çeviri üretir; çünkü hedef dildeki tümceler ve bunların (en yakın) karşılıklarının tanınması gerekir. Bir dildeki tüm kelimelerin başka bir dilde karşılığı yok ve birçok kelimenin birden fazla anlamı vardır.

Bu problemi istatistiksel ve nöral tekniklerle çözmek, daha iyi çevirilerle, dilsel tipolojideki farklılıkları ele almaya, deyimlerin çevirisine ve anomalilerin izolasyonuna yol açan hızla büyüyen bir alandır.[2]

Mevcut makine çevirisi yazılımı genellikle etki alanına veya mesleğe göre özelleştirmeye izin verir (hava durumu raporları gibi), izin verilen değiştirmelerin kapsamını sınırlayarak çıktıyı iyileştirir. Bu teknik, özellikle resmi veya kalıplaşmış dilin kullanıldığı alanlarda etkilidir. Buradan hükümet belgeleri ve yasal belgelerin makine çevirisinde, konuşma veya daha az standartlaşmış metin çevirisine göre daha kullanılabilir çıktı ürettiği sonucu çıkar.

İyi bir çıktı kalitesi, insan müdahalesiyle de elde edilebilir: örneğin, bazı sistemler, eğer kullanıcı metindeki hangi kelimelerin özel adlar olduğunu açık bir şekilde belirlediyse, daha doğru çeviri yapabilir. Bu tekniklerin yardımıyla MT'nin insan çevirmenlere yardımcı olacak bir araç olarak sınırlı durumlarda kullanılabilecek çıktılar üretebilir (örneğin, hava durumu raporları).

Makine çevirisinin ilerleme ve potansiyeli tarihi boyunca tartışıldı. 1950'lerden bu yana, başta Yehoshua Bar-Hillel olmak üzere birçok akademisyen[3] yüksek kalitede tam otomatik makine çevirisi elde etme olasılığını sorguladı.[4]

Tarih

Kökenler

Makine çevirisinin kökenleri, olasılık ve istatistik dahil olmak üzere sistemik dil çevirisi için teknikler geliştiren dokuzuncu yüzyılda Arap bir kriptograf olan Al-Kindi'nin çalışmasına kadar izlenebilir.[5] Makine çevirisi fikri daha sonra 17. yüzyılda ortaya çıktı. 1629'da René Descartes, farklı dillerdeki eşdeğer fikirlerin aynı sembolü paylaştığı evrensel bir dil önerdi.[6]

Doğal dillerin çevirisinde bilgisayarların kullanılması fikri, 1947 gibi erken bir tarihte İngiltere'deki AD Booth[7] ve aynı yıl Rockefeller Foundation'dan Warren Weaver tarafından önerildi. " Warren Weaver tarafından 1949'da yazılan memorandum, makine çevirisinin ilk günlerinde belki de en etkili tek yayındı."[8][9] Bunu diğerleri izledi. 1954'te Birkbeck College'da APEXC makinesinde İngilizcenin Fransızcaya ilkel bir çevirisinin bir gösterimi yapıldı. O zamanlar konuyla ilgili popüler dergilerde makaleler yayınlandı (örneğin, Wireless World'ün Eylül 1955 sayısında Cleave ve Zacharov tarafından yazılan bir makale). O dönemde Birkbeck Koleji'nde de öncülük edilen benzer bir uygulama, Braille metinlerini bilgisayarda okuyor ve oluşturuyordu.

1950'ler

Yehoshua Bar-Hillel, araştırmalarına MIT'de başladı (1951). Profesör Michael Zarechnak liderliğindeki bir Georgetown Üniversitesi MT araştırma ekibi (1951), 1954'te Georgetown-IBM deney sisteminin halka açık bir gösterimini yaptı. Japonya[10][11] ve Rusya'da (1955) MT araştırma programları ortaya çıktı ve ilk MT konferansı Londra'da yapıldı (1956).[12][13]

David G. Hays "1957'de bilgisayar destekli dil işleme hakkında yazdı" ve "1955'ten 1968'e kadar Rand'da hesaplamalı dilbilim proje lideriydi."[14]

1960–1975

ABD'de Makine Çevirisi ve bilgisayarlı Dilbilim Derneği (1962) ve Ulusal Bilimler Akademisince Otomatik Dil İşleme Danışma Komitesi'nin (ALPAC) kurulmasıyla (1964) araştırmacılar bu alana katılmaya devam ettiler. Ancak ilerleme gerçekte çok daha yavaştı ve araştırmaların beklentileri karşılamadığını gösteren ALPAC raporundan (1966) sonra, fon büyük ölçüde azaldı.[15] Savunma Araştırma ve Mühendislik Direktörü'nün (DDR&E) 1972 tarihli bir raporuna göre, MT'nin büyük ölçekli uygulanabilirliği, Logos MT sisteminin bu çatışma sırasında askeri kılavuzları Vietnamca'ya çevirmedeki başarısıyla yeniden tesis edildi.

Fransız Tekstil Enstitüsü özetleri Fransızca yanında İngilizce, Almanca ve İspanyolca'ya çevirmek için MT'yi kullandı (1970); Brigham Young Üniversitesi, Mormonik metinleri otomatik yolla çevirmek için bir proje başlattı (1971).

1975 ve sonrası

1960'larda "ABD hükümetinin sözleşmeleri kapsamında alana öncülük eden" SYSTRAN, Xerox tarafından teknik kılavuzları çevirmek için kullanıldı (1978).[1] Hesaplama gücü arttıkça ve daha ucuz hale geldikçe, makine çevirisi için istatistiksel modellere 1980'lerin sonlarından başlayarak daha fazla ilgi gösterildi.[16] SYSTRAN'ın ilk uygulama sistemi, 1988 yılında Fransız Posta Servisi'nin Minitel adlı çevrimiçi hizmeti tarafından uygulandı.[17] MT ile aynı olmasa da, Çeviri Belleği teknolojisini ilk geliştiren ve pazarlayan Trados (1984) dahil olmak üzere çeşitli bilgisayar tabanlı çeviri şirketleri de piyasaya sürüldü. Rusça / İngilizce / Almanca-Ukraynaca için ilk ticari MT sistemi Kharkov Devlet Üniversitesi'nde geliştirildi (1991).

1998'de, "29.95 $ gibi bir fiyata" bilgisayarda çalıştırmak üzere "İngilizce ile seçtiğiniz büyük bir Avrupa dili arasında tek yönde çeviri yapmak için program satın alınabilirdi".[1]

Web üzerinde MT, SYSTRAN'ın küçük metinlerin ücretsiz çevirisini sunmasıyla başladı (1996) ve ardından bunu günde 500.000 istek toplayan AltaVista Babelfish[1] aracılığıyla sağladı (1997).[18] Web'deki ikinci ücretsiz çeviri hizmeti, Lernout &amp; Hauspie'nin GlobaLink'iydi.[1] Atlantic Magazine 1998'de "Systran'dan Babelfish ve GlobaLink'ten Comprende"nin "Yetkin bir performansla" "Buna güvenme"yi ele aldığını yazdı.[19]

Google'da Çeviri Geliştirme bölümünün gelecekte başkanı olan Franz Josef Och, 2003 te DARPA'nın hızlı MT yarışmasını kazandı.[20] Bu süre zarfındaki diğer yenilikler arasında açık kaynaklı istatistiksel MT motoru MOSES (2007), Japonya'da cep telefonları için bir metin/SMS çeviri hizmeti (2008) ve İngilizce, Japonca ve Çince için konuşmadan konuşmaya çeviri işlevine sahip bir cep telefonu yer aldı (2009). 2012'de Google, Google Çeviri'nin kabaca bir günde 1 milyon kitabı dolduracak kadar metin çevirdiğini duyurdu.

Çeviri süreci

İnsan çevirisi süreci şu şekilde tanımlanabilir:

  1. Kaynak metnin anlamının çözülmesi; Ve
  2. Bu anlamı hedef dilde yeniden kodlamak.

Basit görünen prosedürün arkasında karmaşık bir bilişsel operasyon yatmaktadır. Kaynak metnin tam anlamını çözmek için, onun grameri, semantiği, sözdizimi, deyimleri vb. yanı sıra konuşmacının kültürü hakkında da derinlemesine bilgi gerektirir. Çevirmen, hedef dildeki kodlama için de aynı derinlikte bilgiye ihtiyaç duyar.

Makine çevirisindeki zorluk burada yatmaktadır: Bir metni bir kişinin anladığı gibi "anlayacak" ve hedef dilde sanki bir kişi tarafından yazılmış izlenimi veren yeni bir metin nasıl programlanır. Bir 'bilgi tabanı' tarafından desteklenmediği sürece MT, orijinal metnin kusurlu da olsa yalnızca genel bir "özünü" ("ana fikir") alabilir. Bu, toplam doğruluğun vazgeçilmez olduğu durumlar dışında birçok amaç için yeterlidir.

Yaklaşımlar

Bernard Vauquois'nın aracı temsilin karşılaştırmalı derinliklerini gösteren piramidi, zirvede diller arası makine çevirisi, ardından aktarım tabanlı ve ardından doğrudan çeviri

Makine çevirisinde dil bilgisi kurallarına dayalı bir yöntem kullanıldığında hedef dilin en uygun kelimeleri kaynak dildeki kelimelerin yerini alacaktır.

Makine çevirisinin başarısı için öncelikle doğal dili anlama sorununun çözülmesi gerektiği sıklıkla tartışılır.[21]

Genel olarak, "kural tabanlı yöntemler" bir metni ayrıştırır; genellikle hedef dildeki metnin üretildiği aracı, sembolik bir temsil oluşturur. Aracı temsilin doğasına göre, diller arası makine çevirisi veya aktarıma dayalı makine çevirisi olarak bir yaklaşım tanımlanmaktadır. Bu yöntemler, morfolojik, sözdizimsel ve semantik bilgileri ve büyük kural kümelerini içeren kapsamlı sözlükler gerektirir.

Yeterince veri yüklendiğinde, makine çevirisi programları genellikle yeterince iyi çalışır. Zorluk, belirli bir yöntemi desteklemek için doğru türden yeterli veriyi elde etmektir. Örneğin, istatistiksel yöntemlerin çalışması için gereken çok dilli büyük veri külliyatı, dilbilgisine dayalı yöntemler için gerekli değil, ancak yöntemin dikkatli bir şekilde tasarlaması için yetenekli bir dilbilimciye ihtiyaç vardır.

Yakından ilişkili diller arasında çeviri yapmak için kural tabanlı makine çevirisi kullanılabilir.

Kural tabanlı

Kural tabanlı makine çevirisi (RBMT) aktarım tabanlı, diller arası ve sözlük tabanlı makine çevirisi paradigmalarını içerir. Bu tür çoğunlukla sözlük ve gramer programlarının oluşturulmasında kullanılır. Diğer yöntemlerden farklı olarak RBMT, her iki dilin morfolojik ve sözdizim kuralları ve anlamsal analizi hakkında daha fazla bilgi içerir. Temel yaklaşım, giriş cümlesinin yapısını, kaynak dil için bir ayrıştırıcı ve bir çözümleyici, hedef dil için bir üreteç ve gerçek çeviri için bir aktarım sözlüğü kullanarak çıktı cümlesinin yapısıyla ilişkilendirmeyi içerir. RBMT'nin en büyük dezavantajı, her şeyin açık hale getirilmesi gerektiğidir: RBMT'nin en büyük çöküşü, her şeyin açık hale getirilmesi gerektiğidir: imla varyasyonu ve hatalı girdi, bununla başa çıkmak için kaynak dil analizörünün bir parçası haline getirilmeli ve tüm belirsizlik örnekleri için sözcüksel seçim kuralları yazılmalıdır. Kendi içinde yeni alanlara uyum sağlamak o kadar da zor değildir, çünkü çekirdek dilbilgisi alanlar arasında aynıdır ve etki alanına özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlıdır.Çekirdek dilbilgisi tüm alanlarda aynı olduğundan ve alana özgü ayarlama sözcüksel seçim ayarlamasıyla sınırlı olduğundan, yeni alanlara uyum sağlamak kendi başına o kadar da zor değildir.

Aktarım tabanlı makine çevirisi

Aktarım tabanlı makine çevirisi orijinal cümlenin anlamını simüle eden bir ara temsilden çeviri oluşturur. Diller arası makine çevirisin'den farklı olarak çeviride yer alan dil çiftine kısmen bağlıdır.

Diller arası

Diller arası makine çevirisi, kural tabanlı makine çevirisi yaklaşımlarının bir örneğidir. Bu yaklaşımda tercüme edilecek metin, diller arası dil, yani "dilden bağımsız bir temsile" dönüştürülür. Hedef metin daha sonra interlingua'dan üretilir. Sistemin en büyük avantajlarından biri, çevrilebileceği hedef dil sayısının yüksek olmasıdır. Ancak, ticari düzeyde işlevsel hale getirilen tek diller arası makine çevirisi sistemi, Caterpillar Teknik İngilizcesini (CTE) diğer dillere çevirmek için tasarlanmış KANT sistemidir (Nyberg ve Mitamura, 1992).

Sözlük tabanlı

Bu tip çeviri, sözlük girişlerine dayalı, sözcüklerin bir sözlük tarafından olduğu gibi çevrileceği anlamına gelir.

İstatistiksel

İstatistiksel makine çevirisi, Kanada Hansard külliyatı, Kanada parlamentosu İngilizce-Fransızca kaydı ve Avrupa Parlamentosu EUROPARL kaydı gibi iki dilli metin külliyatlarına dayalı istatistiksel yöntemler kullanır. Ancak bu tür derlemler birçok dil çifti için nadirdir. İlk istatistiksel makine çevirisi yazılımı, IBM'den CANDIDE idi. Google, SYSTRAN'ı birkaç yıl kullandıktan sonra Ekim 2007'de istatistiksel bir çeviri yöntemine geçti. 2005 yılında Google, sistemlerini eğitmek için Birleşmiş Milletler materyallerinden yaklaşık 200 milyar kelime kullanarak dahili çeviri yeteneklerini geliştirdi; çeviri doğruluğu iyileştirildi.[22] Google Translate ve benzeri istatistiksel çeviri programları, daha önce insanlar tarafından çevrilmiş yüz milyonlarca belgedeki kalıpları tespit ederek ve bulgulara dayalı olarak akıllı tahminler yaparak çalışır. Genel olarak, belirli bir dilde ne kadar çok insan tarafından tercüme edilmiş belge varsa, çevirinin kaliteli olma olasılığı o kadar yüksektir.[23] METIS II ve PRESEMT gibi İstatistiksel Makine çevirisine yönelik daha yeni yaklaşımlar, minimum korpus boyutu kullanır ve bunun yerine örüntü tanıma yoluyla sözdizimsel yapının türetilmesine odaklanır. Daha fazla geliştirme ile bu, istatistiksel makine çevirisinin tek dilli bir metin külliyatından çalışmasına izin verebilir.[24] SMT'nin en büyük zorluğu, çok miktarda paralel metne bağımlı olması, morfoloji bakımından zengin dillerle (özellikle bu tür dillere çeviri yaparken) sorunları ve tekil hataları düzeltememesidir.

Örnek tabanlı

Örnek tabanlı makine çevirisi (EBMT) yaklaşımı, 1984 yılında Makoto Nagao tarafından önerildi.[25][26] Örnek tabanlı makine çevirisi, analoji fikrine dayanır. Bu yaklaşımda, kullanılan derlem zaten çevrilmiş metinleri içeren bir derlemdir. Çevrilecek bir cümle verildiğinde, bu külliyattan benzer alt cümle bileşenleri içeren cümleler seçilir.[27] Benzer cümleler daha sonra orijinal cümlenin alt cümle bileşenlerini hedef dile çevirmek için bir araya getirilir.

Hibrit MT

Hibrit makine çevirisi (HMT), istatistiksel ve kural tabanlı çevirilerin güçlü yönlerinden yararlanır.[28] Yaklaşımlar farklılıklar gösterebilir:

  • İstatistikler tarafından sonradan işlenmiş kurallar : Çeviriler, kurallara dayalı bir motor kullanılarak gerçekleştirilir, daha sonra çıktıyı ayarlamak/düzeltmek için istatistikler kullanılır.
  • Kurallarla yönlendirilen istatistikler : Kurallar istatistik motorunu yönlendirmek amacıyla önceden kullanıldığı gibi çıktıyı işlemek için de kullanılır. Bu yaklaşım çeviri yaparken çok daha fazla güce, esnekliğe ve kontrole sahiptir.

Daha yakın zamanlarda, Nöral MT'nin gelişiyle birlikte, kurallara dayalı, istatistiksel ve sinirsel makine çevirisini birleştiren yeni bir hibrit çeviri sürümü ortaya çıkıyor. Yaklaşım, NMT ve SMT'den yararlanmanın yanı sıra kural kılavuzlu bir iş akışında ön ve son işlemeden yararlanmaya olanak tanır. Dezavantajı, yaklaşımı yalnızca belirli kullanım durumları için uygun kılan karmaşıklıktır.

Nöral MT

MT'ye derin öğrenme tabanlı bir yaklaşım olan nöral makine çevirisi son yıllarda hızlı bir ilerleme kaydetti ve Google, çeviri hizmetlerinin artık önceki istatistiksel yöntemlerine göre bu teknolojiyi tercih ettiğini duyurdu. [29] Bir Microsoft ekibi, 2018'de WMT-2017'de ("EMNLP 2017 İkinci Makine Çevirisi Konferansı") insan eşitliğine ulaştığını iddia etti.[30] Ancak ulaşılan fikir birliği, iddia edilen insan denkliğinin gerçek olmadığı, tamamen sınırlı alanlara, dil çiftlerine ve belirli test paketlerine[31] dayalı olduğu, yani istatistiksel anlamlılık gücünden yoksun olduğu yönündedir. NMT'nin gerçek insan parite performanslarına ulaşması için hala uzun bir yolculuk var.

Deyimsel ifade çevirisini, çok kelimeli ifadeleri ve düşük frekanslı kelimeleri (OOV veya kelime dağarcığı dışı kelime çevirisi olarak da adlandırılır) ele almak için, dil odaklı dilsel özellikler son teknoloji ürünü nöral makine çevirisi (NMT) modellerinde araştırılmıştır. [32] Örneğin, Çince karakter ayrıştırmalarının kök ve vuruşlara NMT'de çok kelimeli ifadeleri çevirmede yardımcı olduğu kanıtlanmıştır.

2022'den itibaren genellikle en iyi makine çevirisi sonuçlarını sağladığı düşünülen DeepL Translator gibi nöral MT araçlarıyla yapılan çeviriler için genellikle yine de bir insan tarafından son düzenleme yapılması gerekiyor.[33][34][35]

Çevirileri iyileştirmek için potansiyel AI tabanlı teknikler

Makine çevirileri için geliştirilmekte olan teknikler şunları içerir:

  • Doğal dil işleme[36][37] – kaynak metnin semantik olarak anlaşılmasını (ör. anlam, duygu, adlandırma ve bağlamlar) ve ayrıca çeviri sonuçlarını iyileştirmek için gerçek dünyayla ilgili bir veri tabanı aracılığıyla ayarlamalar sağlar. Bir çalışmada, "hedef dildeki cümlelerle birlikte çeviriyi" tamamlamak için bir "anlamsal birim kitaplığı" kullanılmıştır.[38] 
  • GPT-3 [39][40] kullanılarak son düzenleme

Büyük sorunlar

Makine çevirisi, "Çince鸡枞 gibi bazı anlaşılmaz ifadeler üretebilir." ( Macrolepiota albuminosa ) "Wikipedia" olarak işleniyor.
Kırık Çince "Çince沒有進入" Bali, Endonezya'daki makine çevirisinden. Kırık Çince cümle "bir giriş yok" veya "henüz girmedim" gibi bir anlama geliyor.

Profesyonel edebi çevirmenler veya insan okuyucular tarafından en son gelişmiş MT çıktılarıyla ilgili çeşitli sorunlar sistematik olarak tanımlamıştır.[40] Yaygın sorunlar doğru çevirisi "sağduyu-benzeri semantik dil işleme veya bağlam üzerinden" ancak yapılabilen bölümlerin çevirilerinde yer alıyor.[40] Ayrıca kaynak metinlerde de hatalar olabilir, yüksek kaliteli eğitim (çeviricilerin) verileri eksik olabilir.

Notlar

İleri okuma

Dış bağlantılar

[[Kategori:Otomasyon yazılımları]] [[Kategori:Doğal dil işleme görevleri]] [[Kategori:Bilgisayar destekli çeviri]] [[Kategori:Bilişimsel dilbilim]] [[Kategori:Yapay zekâ uygulamaları]] [[Kategori:Makine çevirisi]]


  1. ^ a b c d e "Lost in Translation". Atlantic Magazine. December 1998. ss. 81–84.  Birden fazla yazar-name-list parameters kullanıldı (yardım); Yazar |ad1= eksik |soyadı1= (yardım)
  2. ^ Albat, Thomas Fritz. "Systems and Methods for Automatically Estimating a Translation Time." US Patent 0185235, 19 July 2012.
  3. ^ Language and Information: Selected Essays on Their Theory and Application. Reading, Massachusetts: Addison-Wesley. 1964. ss. 174–179.  Yazar |ad1= eksik |soyadı1= (yardım)
  4. ^ The Limits of Machine Translation (MA tez). University of Copenhagen. 2009. s. 5. 17 October 2021 tarihinde kaynağından arşivlendi. 
  5. ^ "The Cryptological Origins of Machine Translation: From al-Kindi to Weaver". Amodern. January 2018. 14 August 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 2 September 2019.  Yazar |ad1= eksik |soyadı1= (yardım)
  6. ^ Universal Language Schemes in England and France, 1600-1800. Toronto: University of Toronto Press. 1975. ISBN 0-8020-5296-7.  Yazar |ad1= eksik |soyadı1= (yardım)
  7. ^ "MECHANICAL TRANSLATION". Computers and Automation 1953-05: Vol 2 Iss 4 (İngilizce). Internet Archive. Berkeley Enterprises. 1953-05-01. s. 6.  Yazar |ad1= eksik |soyadı1= (yardım)
  8. ^ J. Hutchins (2000). "Warren Weaver and the launching of MT". Early Years in Machine Translation (PDF). Semantic Scholar. Studies in the History of the Language Sciences. 97. s. 17. doi:10.1075/sihols.97.05hut. ISBN 978-90-272-4586-1. 2020-02-28 tarihinde kaynağından (PDF) arşivlendi. 
  9. ^ "Warren Weaver, American mathematician". July 13, 2020. 6 March 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 August 2020. 
  10. ^ パーソナルコンピュータによる機械翻訳プログラムの制作 (Japonca). Tokyo: (株)ラッセル社. 1986-08-13. s. 16. ISBN 494762700X. わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されている。(translation (assisted by Google Translate): In 1959 Japan, the National Institute of Advanced Industrial Science and Technology(AIST) tested the proper English-Japanese translation machine Yamato, which reported in 1964 as that reached the power level over the score of 90-point on the textbook of first grade of junior hi-school.) 
  11. ^ "機械翻訳専用機「やまと」-コンピュータ博物館". 19 October 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 April 2017. 
  12. ^ Nye (2016). "Speaking in Tongues: Science's centuries-long hunt for a common language". Distillations. 2 (1): 40–43. CiteSeerX live $2 |citeseerx= değerini kontrol edin (yardım). 3 August 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 March 2018. 
  13. ^ Scientific Babel: How Science Was Done Before and After Global English. Chicago, Illinois: University of Chicago Press. 2015. ISBN 9780226000299. 
  14. ^ Wolfgang Saxon (July 28, 1995). "David G. Hays, 66, a Developer Of Language Study by Computer". The New York Times. 7 February 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 August 2020. wrote about computer-assisted language processing as early as 1957.. was project leader on computational linguistics at Rand from 1955 to 1968. 
  15. ^ パーソナルコンピュータによる機械翻訳プログラムの制作 (Japonca). Tokyo: (株)ラッセル社. 1986-08-13. s. 16. ISBN 494762700X. 
  16. ^ Conceptual Information Processing. New York: Elsevier. 2014. s. 5. ISBN 9781483258799.  Yazar |ad1= eksik |soyadı1= (yardım)
  17. ^ Machine Translation and the Information Soup: Third Conference of the Association for Machine Translation in the Americas, AMTA'98, Langhorne, PA, USA, October 28–31, 1998 Proceedings. Berlin: Springer. 2003-06-29. s. 276. ISBN 3540652590. 
  18. ^ "Babel Fish: What Happened To The Original Translation Application?: We Investigate". Digital.com (İngilizce). November 18, 2019. 20 November 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 2019-11-22. 
  19. ^ and gave other examples too
  20. ^ Routledge Encyclopedia of Translation Technology. Oxon: Routledge. 2015. s. 385. ISBN 9780415524841.  Yazar |ad1= eksik |soyadı1= (yardım)
  21. ^ John Lehrberger (1988). Machine Translation: Linguistic Characteristics of MT Systems and General Methodology of Evaluation. John Benjamins Publishing. ISBN 90-272-3124-9. 17 October 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 October 2020. 
  22. ^ "Google Translator: The Universal Language". Blog.outer-court.com. 25 January 2007. 20 November 2008 tarihinde kaynağından arşivlendi. Erişim tarihi: 2012-06-12. 
  23. ^ "Inside Google Translate – Google Translate". 16 April 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 April 2014. 
  24. ^ "Language-Independent Hybrid MT with PRESEMT". Proceedings of the Second Workshop on Hybrid Approaches to Translation (PDF). Sofia: Association for Computational Linguistics. 2013. ss. 123–130. ISBN 978-1-937284-63-3. 13 April 2014 tarihinde kaynağından (PDF) arşivlendi. 
  25. ^ Nagao, M. 1981. A Framework of a Mechanical Translation between Japanese and English by Analogy Principle, in Artificial and Human Intelligence, A. Elithorn and R. Banerji (eds.) North- Holland, pp. 173–180, 1984.
  26. ^ "the Association for Computational Linguistics – 2003 ACL Lifetime Achievement Award". Association for Computational Linguistics. 12 June 2010 tarihinde kaynağından arşivlendi. Erişim tarihi: 2010-03-10. 
  27. ^ "Kitt.cl.uzh.ch [CL Wiki]" (PDF). 7 January 2014 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 18 November 2013. 
  28. ^ Adam Boretz (2 March 2009). "Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)". Speechtechmag.com. 9 June 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 2012-06-12. 
  29. ^ "Google's neural network learns to translate languages it hasn't been trained on". 1 September 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 September 2017. 
  30. ^ "Microsoft reaches a historic milestone, using AI to match human performance in translating news from Chinese to English". March 14, 2018. 2 March 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 April 2021. 
  31. ^ Antonio Toral, Sheila Castilho, Ke Hu, and Andy Way. 2018. Attaining the unattainable? reassessing claims of human parity in neural machine translation. CoRR, abs/1808.10432.
  32. ^ "Multiword Expressions – ACL Wiki". 8 May 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 8 May 2021. 
  33. ^ Katsnelson (29 August 2022). "Poor English skills? New AIs help researchers to write better". Nature (İngilizce). 609 (7925): 208–209. doi:10.1038/d41586-022-02767-9. PMID 36038730. Erişim tarihi: 9 January 2023. 
  34. ^ "DeepL: An Exceptionally Magnificent Language Translator". Medium (İngilizce). 18 February 2022. Erişim tarihi: 9 January 2023. 
  35. ^ "DeepL outperforms Google Translate – DW – 12/05/2018". Deutsche Welle (İngilizce). Erişim tarihi: 9 January 2023. 
  36. ^ "Natural Language Processing and Its Applications in Machine Translation: A Diachronic Review". 2020 IEEE 3rd International Conference of Safe Production and Informatization (IICSPI). November 2020. ss. 210–214. doi:10.1109/IICSPI51290.2020.9332458. ISBN 978-1-7281-7738-0. 
  37. ^ Khurana (1 January 2023). "Natural language processing: state of the art, current trends and challenges". Multimedia Tools and Applications (İngilizce). 82 (3): 3713–3744. doi:10.1007/s11042-022-13428-4. ISSN 1573-7721. PMC 9281254 $2. PMID 35855771. 
  38. ^ "English Machine Translation System Based on Semantic Selection and Information Features". Proceedings of the 2022 3rd International Conference on Artificial Intelligence and Education (IC-ICAIE 2022) (İngilizce). Atlantis Press. 27 December 2022. ss. 963–967. doi:10.2991/978-94-6463-040-4_145. ISBN 978-94-6463-039-8. 
  39. ^ Fadelli. "Study assesses the quality of AI literary translations by comparing them with human translations". techxplore.com (İngilizce). Erişim tarihi: 18 December 2022. 
  40. ^ a b c A bot will complete this citation soon. Click here to jump the queue arXiv:[1].