Araştırmacılar antik metinlerin sırlarını çözmek için yapay zeka kullanıyor

Araştırmacılar antik metinlerin sırlarını çözmek için yapay zeka kullanıyor

İsviçre’deki St. Gall Manastırının kütüphanesi, sekizinci yüzyıl zamanlarına kadar uzanan yaklaşık olarak 160 bin cilt edebi esere ve tarihi el yazmalarına ev sahipliği yapmaktadır. Bu eserlerin tümü, günümüzde nadiren konuşulan dillerde parşömen üzerine el ile yazılmıştır.

Sayıları milyonlara ulaşan söz konusu yazıtlar, insanlığın bu tarihi değerlerini korumak için dünyanın her yerindeki kütüphanelerde ve manastırlarda güvenli bir şekilde muhafaza edilmiştir. Bu koleksiyonların kayda değer bir kısmı dijital resimlendirme aracılığı ile kamuya sunulmaktadır. Fakat uzmanlar, içerisinde henüz hiç okunmamış olağanüstü sayıda belge ve dünya tarihinin gizlerine ışık tutacak bir define olduğunu söylemektedirler.

Şu anda; Notre Dame Üniversitesi’ndeki araştırmacılar, insan algısına dayanan karmaşık antik el yazılarını okumak ve derin öğrenme transkripsiyonunun kapasitesini geliştirmek için yapay sinirsel ağ geliştirmektedirler.

Notre Dame Üniversitesi Bilgisayar Bilimi ve Mühendisliği Bölümü’nde doçent olan Walter Scheirer, “Uzun zaman önce modası geçmiş, yüzyıllar öncesine dayanan ve artık neredeyse hiç kullanılmayan Latince gibi dillerde yazılmış tarihi belgelerle uğraşıyoruz.” dedi, “Bu belgelerden güzel fotoğraflar edinebilirsiniz, fakat bizim yapmayı amaçladığımız şey uzman bir okurun gözünden sayfanın algısını taklit eden bir yol ile transkripsiyonu otomatikleştirerek hızlı ve incelenebilir bir metin okuması sağlamaktır.”

Scheirer’ın ekibi, dokuzuncu yüzyılda St. Gall Manastırı’ndaki kâtipler tarafından yazılmış Latin el yazmalarının dijitalleştirilmesi üzerine çalıştı. Okurlar, kendi elleri ile yazdıkları transkripsiyonlarını özel olarak dizayn edilmiş bir yazılım arayüzüne girdiler. Ekip daha sonra hangi kelimelerin, karakterlerin ve paragrafların kolay veya zor olduğunu anlamak için transkripsiyon esnasındaki tepki sürelerini ölçtü. Scheirer, işin içine bu tür verileri dahil etmenin insan davranışları ile daha tutarlı bir bağlantı oluşturduğunu, hataları azalttığını ve metnin daha doğru, daha gerçekçi bir şekilde okunmasını sağladığını açıkladı.

Scheirer, “Bu genel olarak makine öğreniminde kullanılmayan bir stratejidir. Direkt olarak psikolojik algı araştırmalarından gelen davranışsal ölçümleri alarak bu psikofiziksel ölçümleri veri içerisinde sınıflandırıyoruz. Daha sonra bu karakterlerin algılanmasındaki genel zorlukların bağlantısını bildirip, bu ölçümlere dayanarak düzeltmeler yapabiliyoruz.” dedi.

Derin öğrenme ile antik metinleri yazıya dökmek beşerî bilimler alanında öğrenim görmüşler için büyük bir ilgi kaynağıdır.

Notre Dame Üniversitesi Klasik Dönem bölümünde doçent olan Hildegung Müller, “Sadece fotoğraflarını çekmek ve söz konusu metinleri okumak ile incelenebilir bir okuma sağlayan bir programa sahip olmak arasında fark vardır.” dedi, “Bu çalışmada kullanılan metinleri (dokuzuncu yüzyıl el yazmalarını) dikkate alacak olursanız bunun Orta Çağ’ın erken bir aşaması olduğunu görürsünüz. Bu dönem baskı makinesinin icadından çok uzun zaman öncedir. Bu dönem muazzam miktarda el yazmalarının üretildiği zamandır. Daha önce hiç kimsenin görmediği, teşhis edilemeyen metinler olan bu el yazmaları her türden gizli bilgiyi içermektedir.”

Scheirer zorlukların devam ettiğini söyledi. Ekibi, özellikle eksik veya hasar görmüş belgelerin olması durumunda transkripsiyonların doğruluk payını arttırabilmenin yanı sıra herhangi bir sayfada bulunan resim veya diğer ögeler gibi ağın işlemesinde karışıklığa yol açabilecek etmenleri nasıl açıklayabileceği üzerinde çalışıyor.

Ancak ekip, programı Amharca (Etiyopya’da konuşulan Güney Sami Grubuna ait olan bir dil) metinlerini yazıya dökebilecek şekilde ayarlayabildi ve karakter setlerini tamamen farklı bir dile adapte ederek kullanıcılar için bilgileri yazıya dökme ve çevirebilme kapasitesine sahip bir program geliştirmeye yönelik ilk adımını attı.

Müller, “Edebi alanlarda oldukça yardımı dokunabilir. Her iyi edebi eser, devasa miktarda tarihi belgeyle çevrelenmiştir, fakat gerçekten yararlı olacağı yer tarihi arşiv araştırmalarıdır.” dedi, “Dijital beşerî bilimleri geliştirmeye büyük bir gereksinim var. Erken modern dönemler ve Orta Çağ hakkında konuştuğunuzda tarihi olayların sonuçlarını ve detaylarını anlamak istiyorsanız yazılı belgelere bakmanız gerekir ve bu metinler bizim sahip olduğumuz tek şeydir. Problem, Batı dünyasının dışında daha da büyük olabilir. Tehdit altında olan kültürlerdeki kaybolan dilleri bir düşünün. Her şeyden önce bu eserleri korumalı, erişilebilir olmasını sağlamalı ve bir noktada, onları hala devam eden kültürel süreçlerin bir parçası haline getirmek için çevirilere dahil etmeliyiz. Bunu yaparken de zamana karşı yarıştığımızı unutmamalıyız.”

Yazar: Jessica Sief

Çeviren: Muhammed Hikmet İğdemir

Düzenleyen: Zeynep Özçelik

Kaynak: ScienceDaily

Leave a comment