В.В. Бойков, II.Л. Жукова

 

ИГРОВЫЕ ВОЗМОЖНОСТИ СОВРЕМЕННЫХ ИНТЕЛЛЕКТУАЛЬНО-ЛИНГВИСТИЧЕСКИХ КОМПЬЮТЕРНЫХ

ПРОГРАММ

 

Современные интеллектуальные компьютерные программы (оптического распознавания текстов «OCR», текстовые редакторы и др.) применяются профессиональными переводчиками литературных произведений, позволяя, по крайней мере, свести до минимума затраты времени на такие рутинные операции, как, набор текста, его компоновка, выявление орфографических и грамматических ошибок.

Что касается программ машинного перевода, то использование их наиболее актуально для тех, кто эпизодически занимается переводами текстов из самых разных областей научных и прикладных знаний (медицина, математика, информатика, техника, экономика, коммерция, право и т.д.), когда практически невозможно владеть чрезвычайно широким спектром специфических терминов. Чаще всего это – преподаватели иностранных языков, большинство из которых в лучшем случае ограничиваются использованием в своей практической деятельности обучающих программ. В то же время многие из них имеют смутное и зачастую превратное представление о значительно более широких возможностях компьютерной техники.

Такое положение сложилось не только из-за крайне низкой обеспеченности учебных заведений компьютерами, но, главным образом, по причине ограниченных финансовых возможностей специалистов приобрести компьютер в личное пользование. Немалую роль сыграло и то обстоятельство, что системы машинного перевода в значительной мере скомпрометировали себя сами. Еще каких-нибудь 5-6 лет назад выполненный компьютером перевод вызывал снисходительную улыбку, а то и откровенный смех, поскольку ограниченная лексика, практически полное отсутствие грамматики позволяли получить лишь мало пригодный к использованию подстрочник.

Однако разработчики программ машинного перевода настойчиво и довольно успешно из года в год повышают их качество. В настоящее время на российском рынке программных продуктов можно встретить такие системы машинного перевода: «PARS» (Харьков), «SOCRAT» (Москва) и «STYLUS» (С.-­Петербург, PROMT). Программы имеют следующие технические характеристики: «PARS» – занимает 25 Mb на жестком диске, «SOCRAT» – 5 Mb, «STYLUS» – 15 Mb.

При столь различных показателях программы позволяют в большинстве случаев получить практически один и тот же результат. Однако для текстов повышенной сложности все же лучше использовать программу «STYLUS», несмотря на то, что «SOCRAT» имеет и более простой интерфейс, и способность автоматического распознавания языка, на котором вводится текст, a «PARS» выдает несколько вариантов перевода слова. Все три программы позволяют пользователю самостоятельно пополнять лексический состав словарей.

Если иметь в распоряжении хотя бы самый простой ручной сканер, программу OCR (предпочтительно «GUNEIFORM 2.95-beta», которая распознает русский, английский, немецкий, французский и смешанные англо-русские тексты), то в комплексе с любой из упомянутых выше программ и текстовым редактором «WORD» можно существенно снизить затраты времени на перевод.

Возможные при этом лексические затруднения легко преодолимы, если учесть, что имеется ряд мощных компьютерных систем (например, «POLYGLOSSUM-II», «LINGVO»), позволяющих подключить множество различных словарей. Популярная система «CONTEXT» «знает» морфологию как русского, так и английского языка, благодаря чему узнает и переводит слова в любой грамматической форме. Включая более 250 000 словарных статей (почти 3 миллиона узнаваемых слов) «CONTEXT» может переводить не только отдельные слова, но и устойчивые словосочетания.

Для учащейся молодежи и тех, кто изучает английский язык самостоятельно, большую помощь может оказать словарь «ALPHABYT», который выдает не только перевод русского слова и его международную транскрипцию, но и хорошо поставленным голосом с безупречным произношением проговаривает это слово. Программа «TEXTASSISTENT DICTIONARY» содержит синтезатор английской речи, читает и произносит не только отдельные слова, но и большие тексты, позволяя выбрать по желанию пользователя женский или мужской голос и изменить тембр от детского дисканта до хриплого баса. При этом можно установить приемлемый темп речи.

Рассмотрим пример практического применения двух программ «GUNEIFORM» и «STYLUS-3».

Копирование и ввод в компьютер аутентичных текстов, отпечатанных мелким и недостаточно четким шрифтом, схожим по начертанию с компьютерным масштабируемым шрифтом «ARIAL», производилось одновременно на русском и английском языках ручным сканером «GENIUS» из книги «Баргузинский заповедник – The Bargusin Reservation» (М., 1973).

Таблица 1

 

Результаты распознавания текстов

 

Темным глубоким бархатон одевает тайга склоны Баргузинского мребта, занимая бопьше половииы пло­щади заповедникъ. И по эначенинэ своему для жизни животных тайга занимает главное несто. Горная тайга – царство кедра и пикты, тенного баргузинского соболя. Жизнь эверька, да и иногих других обитателей тайгн, связана с кедрон, который дает нн и стоп, и кров. Выяснение этих связей во всей полноте – одна иэ основнык задач работников заповедника. Леса эа­щищают склоны гор от сныва, на­каппивают влагу дождей и снега и недленно отдают ее Байкалу. Один­надцать рек, ннвжество ручьев и илнэчей, пронизывая тайгу, несут свои воды в «славное море» – Бай­кал. Чистотой и прозрачностью сво­ей Байкал обязан именно лесан, адевающим склоны прибрежных гор.

 

(Слов 102, символов 639)

 

Taiga occupying more than a half of the reservation territory, dresses in velvet the slopes of the Barguzin ridge. And in its value for the life of the animals taiga tal<es tihe main p1все. Mountain taiga is <g> kingdom of cedars and firs, of a dayk Barguzin каше. The lite of the little animal as well as the lives of many otherinhabit-gnts o! The taiga is connected with cedars which give them food and shellter. Clavi(ication of these relations in its fulness is оде of the main targets of the reservation workers. Forests protect slopes of the mountains fypm floods, they accuMUlate moisture of rains and snow and give it slowly to Baikal. Eleven rivers, a large number of brool<s and welUs penetrating through taiga carry their waters to the «glorious Sea» – Baikal. For his purity and transparency Baikal is obliged mainly to forests, which cover slopes of coastline mountains.

(Слов – 151, символов – 737)

 

 

Система затруднялась отличать «л» от «п», «м» от «н», «з» от «э», символ «к» система представила как сочетание символов «i» и «<», вместо символа «f» получалось или «t» или «!», слово «sable» превратилось в кириллицу «каше» и т.д. (в таблице 1 нераспознанные символы подчеркнуты). Всего в русском тексте неправильно распознаны 27 символов (4,2%), в английском – 22 (2.8%). Если же ли минский и русский тексты распознавать раздельно, то, как показала проверка, процент неправильно распознанных символов в английском тексте уменьшается почти в два раза, оставаясь практически на прежнем уровне для русского текста.

Проверка на других текстах не показала какого-либо различия в распознавании символов кириллицы и латиницы. При прочих равных условиях результаты зависят только от качества полиграфии и могут быть значительно лучше, чем приводятся здесь, вплоть до 100 процентного распознавания символов. Вероятно, при наборе использовались литеры с разной степенью изношенности (книга отпечатана в Германии), что невозможно обнаружить невооруженным глазом при чтении текста книги.

Таблица 2

 

Тексты после устранения погрешностей распознавания

 

Темным глубоким бархатом одевает тайга склоны Баргузинского хребта, занимая больше половины пло­щади заповедника. И по значению своему для жизни животных тайга занимает главное место. Горная тайга – царство кедра и пикты, темного баргузинского соболя. Жизнь зверька, да и многих других обитателей тайги, связана с кедром, который дает им и стол, и кров. Выяснение этих связей во всей полноте – одна из основных задач работников заповедника. Леса за­щищают склоны гор от смыва, на­капливают влагу дождей и снега и медленно отдают ее Байкалу. Один­надцать рек, множество ручьев и ключей, пронизывая тайгу, несут свои воды в «славное море» – Бай­кал. Чистотой и прозрачностью сво­ей Байкал обязан именно лесам, одевающим склоны прибрежных гор.

 

(Слов 102, символов 634)

 

Taiga occupying more than a half of the reservation territory, dresses in velvet the slopes of the Barguzin ridge. And in its value for the life of the animals taiga takes the main place. Mountain taiga is a kingdom of cedars and firs, of a dark Barguzin sable. The life of the little animal as well as the lives of many other inhabitants of the taiga is connected with cedars which give them food and shelter. Clarification of these relations in its fulness is one of the main targets of the reservation workers. Forests protect slopes of the mountains from floods, they accumulate moisture of rains and snow and give it slowly to Baikal. Eleven rivers, a large number of brooks and well as penetrating through taiga carry their waters to the «glorious Sea» – Baikal. For his purity and transparency Baikal is obliged mainly to forests, which cover slopes of coastline mountains.

(Слов – 151, символов – 733)

 

 

Текстовый редактор «WORD» выделил подчеркиванием, как ошибочные, три слова – их нет в словаре этого редактора. Два из них –географические названия, которые при желании легко ввести в словарь, а третье – «fullness» это – не что иное, как орфографическая ошибка в оригинальном тексте упомянутой выше книги, которая должна быть исправлена перед переводом.

Таблица 3

 

Машинный перевод текстов

By dark deep velvet the taiga slopes Баргузинского хребта dresses,

borrowing(occupying) than halves of area of reserve there are more. And on meaning(importance) for life of animals the taiga borrows(occupies) a main place. A mountain taiga – empire кедра and пихты, dark баргузинского of a sable. The life зверька, and many others обитателей of a taiga, is connected with кедром, which gives them and table, and кров. Finding out of these communications(connections) in all completeness – one of the basic tasks of the workers of reserve. The woods protect slopes of mountains from смыва, accumulate a moisture of rains and snow and slowly give back to its(her) Baikal. Eleven rivers, set ручьев and keys, penetrating a taiga, bear(carry) the waters in «the famous sea» – Baikal. By cleanliness and transparency Baikal is obliged just to woods dressing slopes of coastal mountains.

(Слов – 144, символов – 746)

 

Taiga занимающий больше чем половина территории резервиро­вания, украшает в бархате наклоны Barguzin горного хребта. И в ценности для жизни животных taiga берет главное место. Гора taiga королевство кедров и елей, темного Barguzin sable. Жизнь небольшого животного также как жизней многих другие жители taiga связаны с кедрами, которые дают им продовольствие и защиту. Разъяснение этих отношений в обилии – одна из главных целей рабочих резервирования. Леса за­щищают наклоны гор от наводнений, они накапливаются, влажность идет дождь и снег и давать это медленно Baikal. Одиннадцать рек, большое количество ручьев и хорошо как, проникающего через taiga несут их воды к «великолепное Море» – Baikal. Для его чистоты и прозрачности Baikal обязан главным образом лесам, которые закрывают (охватывают) наклоны гор береговой линии.

(Слов – 119, символов – 723)

 

 

Такие слова, как хребет, кедр, пихта, кров, Baikal, taiga, sable и некоторые другие (в таблице 3 подчеркнуты), остались непереведенными – их не оказалось в словарях программы. В английском переводе программа сохранила в структуре предложения свободный порядок слов, присущий русскому языку. В результате по существу выдается построчный перевод, который неточно передает смысл оригинала. В тех случаях, когда слово осталось непереведенным на английский язык отсутствуют артикли и предлоги. При этом нарушается функция соотнесения слов внутри предложения. Между тем, стоит только ввести в словарь программы недостающее слово, как указанная погрешность перевода исчезает. Вопреки грамматическим правилам глагол to be, выступающий в роли связки, в тексте перевода отсутствует и предложение оказывается без сказуемого.

Таким образом, машинные переводы пока еще далеки от совершенства. В общем случае, если требуется получить безукоризненный перевод, пользователь программы должен очень хорошо владеть не только языком оригинала и языком, на который осуществляется перевод, но и иметь достаточно глубокие познания в той или иной специфической области. Однако тогда, когда специалисту узкого профиля требуется лишь уяснить смысл иноязычного текста, более важным является понимание специальной терминологии. В противном случае невозможно понять текст не только на чужом, но и на родном языке.

В 1998 году российские разработчики выпустили программы машинного перевода для профессионалов: «PROMT 98», и «SOCRAT 98 professional»; переводчики для дома: «MAGIC GOODY» и «SOCRAT personal»); программы, специально предназначенные для использования в сети Internet: «WEB VIEW» и «SOCRAT INTERNET».

Новинки имеют значительно более широкие возможности, чем предыдущие версии, но и аппаратные требования для них на порядок выше. Для «PROMT 98» требуется как минимум PENTIUM-100 и 16 Mb оперативной памяти. В то же время для «SOCRAT 98» достаточно компьютера 486 модели с 8 Mb оперативной памяти,

Помимо английского, «PRОMT 98» может работать с немецким и французским языками. К обеим системам можно подключать дополнительные словари (для «PROMT 98» разработано около 50 словарей по самой, разнообразной тематике). Хотя «SOCRAT 98» имеет только 7 словарей, зато эта программа автоматически распознает тематику текста и подключает соответствующий словарь.

Система «WEB VIEW» может осуществлять поиск в сети Internet по клавиатурному набору запроса на русском языке. Программа переводит его на английский язык и направляет на один из поисковых серверов. Ответ выдается на любом из двух языков.

Заслуживает внимания система «MAGIC GOODY», которая может переводить и проговаривать текст на русском и английском языках, а также воспринимать через микрофон команды голосом, но это уже экзотика – «для дома, для семьи».

Стремительный темп совершенствования и создания интеллектуальных и, в частности, лингвистических компьютерных программ открывают все более широкие возможности для их пользователей и, пожалуй, единственный недостаток этого естественного процесса состоит в необходимости постоянно успевать за этим темпом.

 

(0,34 п.л.)