Aenees: искусственный интеллект Google DeepMind восстанавливает древние тексты и их историю

Команда Google DeepMind представила новую модель искусственного интеллекта под названием AENEAS. Это чрезвычайно мощный инструмент для историков и археологов, которые обучались сотням тысяч латинских текстов. Эней не только реконструирует потерянные фрагменты открытых надписей, но и расскажет об их истории и происхождении, а также о их приблизительных знакомствах.

Граждане Римской империи знали и любили писать. Это даже отражено в серии HBO «Рим», где граффити на стенах зданий древнего Рима являются чем -то обычным явлением. Некоторые из этих надписей сохранились по сей день, хотя и в очень поврежденной форме. Многие разделы текстов о памятниках, папирусах и других фрагментах из последней цивилизации также остаются незамеченными. Чтобы восстановить, датировать и поставить открытые фрагменты в контексте, историки должны тратить годы на каждую из них, полагаясь исключительно на свой собственный опыт и помощь коллег.

Энея изменит базовый подход к этой работе.

Важно подчеркнуть, что Эней — это не только восстановление высоко фрагментированных текстов. Модель ИИ даже помогает определить географическое происхождение поврежденной надписи-она с большой точностью укажет одну из 62 провинций древней Римской империи, где была сделана эта надпись. В дополнение к датированию надписи, будет важен контекст, который искусственный интеллект будет объяснять понятным образом, что в конечном итоге найдет выражение в исторических чатах для любителей истории.

Анимация восстановленного бронзового военного диплома от Сардинии 113/14 г. н.э. (CIL XVI, 60)

AENEAS — это мультимодальная генеративная нейронная сеть, которая обрабатывает изображения как текста, так и надписей.

Большой набор данных был создан для обучения модели — латинский эпиграфический набор данных (ВЕЛ), в том числе более 176 000 латинских надписей из наиболее полных научных источников. В модели используется дециффир, чтобы обработать текстовые входные данные, а также специализированные сети для восстановления потерянных символов и текстов знакомств.

Географическое определение происхождения надписей выполняется с учетом как текстом, так и визуальной информации. Эней может найти текстовые и контекстуальные параллели среди тысяч надписей за считанные секунды, что значительно ускоряет работу историков.

Тестирование модели ИИ на практике показывает, что она восстанавливает поврежденные надписи с точностью 73%, если пробелы не превышают 10 потерянных символов. Этот показатель падает до 58% только в том случае, если длина восстановления неизвестна, что само по себе является чрезвычайно сложной задачей. Используя визуальные данные, AENEAS может взять одну из древних римских надписей для 62 провинций с точностью 72%. Для знакомств модель ИИ имеет текст через 13 лет интервалов дат, предоставленных историками.

Основные возможности AENEAS включают поиск параллелей, который представляет собой анализ огромного объема латинских надписей, позволяющий идентифицировать тексты с аналогичными формулами, синтаксисом, стандартизированными формулами или происхождением (Это помогает историкам поместить надписи в более широкий исторический контекст) Одновременный анализ текстовой и визуальной информации, а также их комбинация и восстановление пробелов неизвестной длины, что делает его уникальным инструментом для работы с сильно поврежденными артефактами.

Наконец, Aeneas может работать с любыми другими сценариями и средствами массовой информации, и все, что вам нужно сделать, это тренировать его на новых языках. Разработчик обещает распространять свободные Aeneas, который основан на открытом исходном коде. Чтобы доказать это, компания опубликовала ссылки на все необходимые файлы и базы, включая уроки.

Aeneas был разработан в сотрудничестве с Университетом Ноттингема, а также с исследователями из университетов в Уорике, Оксфорде и Афинском университете экономики и бизнеса.

Испытания модели ИИ были проведены с помощью 23 историков, которые анализируют устаревшие надписи с и без энеи. Результаты показали, что в 90 % случаев модель способствовала новым исследованиям и улучшила точность происхождения и датировки текстов. Например, Эней усовершенствовал датирование текста «Res Gestae Divi Augusti», приписываемого римскому императору августа, предлагая два вероятных диапазона, для которых историки утверждают, и ИИ делают это количественным, что демонстрирует видимость научных исследований.

Конечно, Энея не заменяет историков, но действует как инструмент, который интегрируется в их рабочий процесс, предоставляя гипотезы и параллели для дальнейшего анализа. Модель ИИ показывает потенциал для расширения на другие древние языки, такие как греческие или египетские иероглифы, которые могут обогатить мировую историографию. Интерактивная версия AENEAS доступна бесплатно на прогнозировании thepast.com, а код и набор данных открыты для исследователей, что поощряет дальнейшее улучшение модели ИИ.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх