Искусственный интеллект и глиняные таблички
|
|
Все больше появляется статей о возможностях искусственного интеллекта для исследования документов древнейшими письменностями — от перевода древних текстов до заполнения недостающих частей глиняных табличек. Но не лучше ли нам отныне оставить расшифровку древних текстов компьютерам? Доцент Алвин Клокхорст, специалист по хеттскому языку, в этом не убежден. «Этим летом в новостях говорилось, что ИИ может сканировать глиняные таблички, а затем немедленно переводить их. Я даже не могу себе представить, что это правда», — говорит он. «Хеттский язык написан клинописью, и когда вы видите тексты на хеттском языке, кажется, что они написаны очень красивыми прямыми буквами, но на самом деле это трехмерные гравюры. Это очень затрудняет их сканирование и распознавание компьютером. "Более того, 30 000 сохранившихся фрагментов хеттских текстов на самом деле слишком мало, чтобы правильно научить компьютер переводить хеттский язык, считает Клоекхорст. «Если вы напечатаете все фрагменты глиняных табличек, у вас останется около трех тысяч листов формата А4. Трудно заставить систему работать с ними, особенно потому, что важные части фрагментов иногда отсутствуют. Вы также видите, что исследователи, которые над этим сейчас работают, часто имеют низкий процент надежности — до 70%.»
|
|
Хотя компьютеры пока не могут взять на себя работу Клокхорста, он видит возможности для ИИ в других областях. «Две недели назад немецкие исследователи разместили в Интернете цифровой корпус всех существующих текстов на хеттском языке. Я этому очень рад, потому что тот факт, что его раньше не существовало, оставил огромный пробел в нашей области». Помимо прочего, эта разработка упрощает статистический анализ текстов. «В хеттском языке правописание не является полностью фиксированным», — объясняет Клоекхорст. «Если у вас есть корпус в цифровой форме, вы можете сравнить, какое написание где используется, гораздо быстрее, чем если бы вам приходилось каждый раз идти в библиотеку, чтобы найти расшифровку глиняной таблички». Поэтому в последние годы уже были вложены значительные средства в оцифровку глиняных табличек. «Возможно, от хеттского языка сохранилось относительно немного, но у нас есть, возможно, полмиллиона табличек на других древних языках», — говорит Клоекхорст.
|
|
«Некоторые из них сейчас разваливаются на музейных складах. С помощью нового 3D-сканера мы можем их оцифровать. Это невероятно круто, еще и потому, что, будучи ученым, вы можете работать гораздо более целенаправленно, сразу концентрируясь на самом тексте, не Вся ручная работа по сбору данных. Были даже попытки сканировать глиняные таблички внутри глиняных конвертов». И, возможно, надеется Клоекхорст, через несколько лет ИИ сможет действительно помочь расшифровать то, что находится на этих оцифрованных планшетах. «Может быть, компьютер сможет проанализировать, какие фрагменты принадлежат друг другу, сравнивая линии разрыва таблеток», — размышляет он. «Это очень помогло бы, хотя я думаю, что нам по-прежнему будут нужны люди для проверки результатов».
|
|
Источник
|