От редактора

Новости на ваш e-mail

 

Новости на ваш e-mail

 

Лента новостей

Фоторепортаж

реклама

   

Новости

 

Компьютер расшифровывает древний язык

01 Июл 2010

В книге «Забытые языки» (2002) Эндрю Робинсон, английский популяризатор науки, заявил, что «успешная дешифровка требует синтеза логики и интуиции, которой компьютеры не обладают и, скорее всего, никогда обладать не будут». Реджина Бардзилэй, адъюнкт-профессор Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института, её последипломный студент Бен Снайдер и сотрудник Университета Южной Калифорнии Кевин Найт (все — США) приняли это на свой счёт.

Компьютер расшифровывает древний язык

Через месяц на ежегодном собрании Ассоциации вычислительной лингвистики в Швеции они представят новую компьютерную систему, которая в течение нескольких часов расшифровала значительную часть угаритского языка (древний представитель семитской семьи). В дальнейшем она может посодействовать не только дешифровке восьми (или около того) мёртвых языков, над которыми сломали голову лингвисты, но и усовершенствованию автоматизированных систем перевода вроде Google Translate. 

«Интуицию» исследователи заменили несколькими допущениями. Во-первых, компьютеру предложили известный язык, тесно связанный с угаритским. Им стал иврит. Во-вторых, была составлена карта частотности употребления алфавитных знаков в том и другом языке из расчёта, что часто употребляющийся символ одного языка, скорее всего, коррелирует с символом похожего языка, обладающим аналогичной частотностью. Здесь надо заметить, что угаритский и иврит пользовались различными системами письменности, но в данном случае это не имеет значения, важна лишь частотность знаков.

В-третьих, языки должны иметь по крайней мере несколько слов с общими корнями, как «main» и «mano» («рука», «кисть руки»), «homme» и «hombre» («человек», «мужчина») во французском и испанском. Наконец, система предполагает аналогичный состав слов в родственных языках. Например, русское слово «перегрузка» имеет префикс «пере» и суффикс «к». В английском языке ему соответствует слово «overloading» с префиком «over» и суффиксом «ing», а во французском — «surchargeant» (разбор этого слова по составу — ваше домашнее задание).

Система работает с данными уровнями соответствия раздельно. Она может начать, к примеру, с разработки нескольких гипотез на основании частности употребления алфавитных знаков. Затем с помощью вероятностного моделирования (стандартная функция искусственного интеллекта) она постарается определить, какие сочетания символов указывают на набор согласованных суффиксов и префиксов. Это позволит искать соответствия на уровне слов, а после этого ещё раз взяться за алфавит. «Мы производим итерацию сотни и даже тысячи раз, — говорит Бен Снайдер, — и каждый раз наши предположения имеют более высокую вероятность, поскольку выше согласованность между различными уровнями соответствия». В конце концов система достигает точки, когда результаты перестают улучшаться.

Спешим успокоить любителей сенсаций: угаритский уже расшифрован «вручную» (в противном случае исследователи не смогли бы оценить эффективность своей системы). Угаритский алфавит состоит из 31 буквы, и компьютер корректно связал 29 из них с ивритскими коллегами. Примерно треть угаритских слов имеют родственников на иврите, и система правильно определила 60% из них. «В неверных ответах компьютер ошибся всего одной буквой, и это очень хороший результат», — говорит г-н Снайдер.

Кроме того, по его словам, система пока не умеет работать с контекстной информацией для решения двусмысленности. Например, угаритские слова «дом» и «дочь» пишутся одинаково, и человек может легко понять из контекста, о чём идёт речь, а компьютер — нет.

Упомянутый Эндрю Робинсон, тем не менее, настроен скептически. Данный подход, по его словам, предполагает, что язык располагает алфавитом, который имеет соответствия в уже разгаданном языке. Почти наверняка ни один из недешифрованных языков не обладает такими подсказками. Кроме того, во многих древних надписях неясно, где заканчивается одно слово и начинается другое.

«У каждого языка есть свои проблемы, — соглашается Реджина Бардзилэй. — Скорее всего, для успешной расшифровки придётся подготовить свои методы». Но, отмечает она, на расшифровку угаритского языка понадобились годы, а новая система справилась за несколько часов. Хоть она и не способна заменить человека, этот мощный инструмент может стать очень хорошим помощником.

Новинка могла бы также расширить универсальность машинного перевода (Google Translate управляется «всего» с 57 языками). Многие онлайн-переводчики тоже пользуются сравнением параллельных текстов на разных языках. Новая система просто делает это намного лучше.

Подготовлено по материалам Массачусетского технологического университета.

На фото: Угаритская табличка с изложением судебного иска (XIII в. до н. э.).

Источник: www.computerra.ru 

Просмотров: 131

Сподели: facebook twiter


 
 

Вам необходимо войти в систему!

Войти в russkie.bg или регистрируйся в russkie.bg

 
 
 
 

Публикации

Болгары выбирают стабильность в работе перед возможностями карьерного роста

Болгары выбирают стабильность в работе перед возможностями карьерного роста

Возможности карьерного роста или же гарантированная стабильность доходов, динамичная рабочая среда или спокойная рутинность? Что является для болгар ведущим мотивом в выборе работы в нынешних экономических условиях и какие профессии и специальности являются наиболее предпочтительными? Ответ на эти и другие вопросы дает Всемирное исследование движения талантов за 2011 год, в котором участвует и Болгария. В нашей стране исследование проведено одним из ведущих в стране интернет-сайтов поиска и предложения работы – jobs.bg.

все публикации >

Интервью

Росен Плевнелиев: “Я буду президентом энергетической эффективности и зеленого развития”

Росен Плевнелиев: “Я буду президентом энергетической эффективности и зеленого развития”

Новоизбранный президент Росен Плевнелиев, который вступит в должность в конце января 2012 г., объявил на днях, что собирается быть “президентом энергетической эффективности и зеленого развития”. Своей сильной привязанностью к зеленому мышлению он поделился на церемонии вручения отличий “Зеленая Болгария” министерства охраны окружающей среды и водных ресурсов.

все интервью >


 
 

Интересные факты

София с точки зрения карикатуриста Явора Попова

София с точки зрения карикатуриста Явора Попова

Невоздержанные клаксоны, летящие окурки, нестабильные и выбрасывающие вверх фонтаном воду тротуарные плитки, пассажиры-хамы в городском транспорте и другие странности городской жизни привлекают взор художника Явора Попова. Все они оживают в его карикатурах, «подмигивающих» нам из странички молодого творца в Фейсбуке. Эта страничка называется «РЭС – Руководство по эксплуатации Софии».

ЕЩЕ >

Юридические советы

спрашивает:

Информация для граждан Российской Федерации, проживающих на территории Республики Болгария

RTL Consult:

УВАЖАЕМЫЕ ГРАЖДАНЕ РОССИЙСКОЙ ФЕДЕРАЦИИ! В соответствии с Федеральным законом Российской Федерации «О выборах депутатов Государственной Думы Федерального…

Все юридические вопросы и ответы >

Задать вопрос >

На вопросы читателей отвечают специалисты юридической компании RTL-Consult


 
European Educational Alliance RUSMEDIA НАШИ European Medical Alliance НАШИ ТВ
Недвижимост Болгарии


Радио Болгария                           БНР
Архив

Новые объявления

Новые темы форума

 

2011 11 23

Русская газета в Болгарии, Комсомольская правда

Ждем колумнистов-публицистов, интервьюеров, редакторов

2011 11 17

Разное

Спасите двухмесячных котят

2011 10 24

Место встречи изменить нельзя...

Приглашаем в Студию Красоты

посети RUSFORUM >

 

реклама

   

prazdnik

 

14 февраля - День Святого Валентина (День всех влюбленных)
День святого Валентина стали праздновать в Болгарии сравнительно недавно. Но он быстро пришелся по вкусу всем: и молодым, которые с удовольствием нашли повод продемонстрировать свои чувства друг к другу, и бизнесменам, которые усмотрели в празднике...

14 февраля - Трифон Зарезан - праздник виноградарей
Своими корнями праздник уходит в античные времена, когда болгарские земли заселяли племена фракийцев, более всех богов почитавших Диониса — бога вина и виноградных лоз. Пришедшие в VII веке в северо-восточную часть Балканского полуострова предки...

26 февраля - Прощеное воскресенье
Прощеное воскресение или, как в Болгарии его называют, «Прошка» или «Сирни заговезни», предваряет начало Великого поста перед Пасхой. Еще за неделю до «Прошки» начинаются шествия кукеров - ряженых под зверей или под традиционные образы (старухи,...

 

prazdnik