Научная статья Особенности автоматизированного перевода
Код роботи: 1385
Вид роботи: Наукова стаття
Предмет: Перекладознавство (Переводоведение)
Тема: Особенности автоматизированного перевода
Кількість сторінок: 8
Дата виконання: 2016
Мова написання: російська
Ціна: безкоштовно
У статті розглядаються особливості машинного перекладу. Визначено потенційні недоліки автоматизованого перекладу та запропоновано стратегії їх вирішення. Автор пропонує алгоритмічну модель перекладу в якості основи для системи автоматизованого перекладу.
The article deals with peculiarities of computer assisted translation, specifies potential drawbacks of computer aided translation and suggests the strategy of their overcoming. The author highlights the algorithmic pattern as the basis of the computer assisted translation system.
1. Мирам Г.Э. Переводные картинки. Профессия переводчик / Геннадий Эдуардович Мирам – К : Эльга Ника-Центр, 2001. – 332 с.
2. Shapiro T., Dawson G. / Junior Achievement Applied Economics // T. H. Shapiro, G. G. Dawson. – USA : Junior Achievement Inc., 1993. – 227 p.
Компьютеры достаточно прочно вошли в нашу жизнь. И практически тяжело представить, где еще не применяются компьютеры: и в процессе исследования Земли, и при лечении больных, и в процессе обучения. Стал компьютер помощникам и для людей, занимающихся переводом. И не только как печатная машинка. Существует множество электронных словарей, других программ, которые могут использовать переводчики. К таким программам можно отнести и электронные переводчики, которые по замыслу их разработчиков должны облегчить труд представителей этой профессии и по возможности помочь другим людям, не владеющим иностранным языком, перевести любой текст, информацию.
В наше время уже можно говорить не просто о программах переводчиках, а о системах машинного перевода.
Системы автоматического перевода в какой-то степени облегчают процесс перевода и сокращают время на его осуществление. Сейчас существуют несколько широко
применяемых компьютерных программ-переводчиков, такие как STYLUS, PROMPT, MAGIC GOODY и др. Каждая из этих программ обладает своими преимуществами и недостатками: в одной больше слов и словосочетаний, в другой – меньше объем памяти и т. д. Следует отметить, что компьютер конечно же имеет перед человеком определенные преимущества: он практически неутомим, обладает огромной памятью, ограниченной лишь особенностями машины или программы. Однако зачастую системы машинного перевода показывают свою недостаточность, а порою – и несостоятельность перевода.
Даже самые совершенные системы машинного перевода делают ошибки. Некоторые из них отражают недостатки самих систем, но большая часть – это отражение незаметной линии раздела между логическим и интуитивным переводом.
Рассмотрим алгоритмическую модель перевода, на основе которой создается так называемая переводящая система.
Причина расхождения между общими теориями и моделированием перевода состоит в том, что в теориях перевода имеются точные определения основных параметров процесса перевода – это единицы перевода и правила преобразования единиц исходного текста в единицы переводимого текста. Другими словами, отсутствует определение того, какую протяженность текста мы переводим за один раз и по каким правилам это мы делаем. Единицей перевода может быть слово, несколько слов, даже предложение, а для алгоритмической модели такое разнообразие неприемлемо.
Чтобы построить действующую алгоритмическую модель перевода, нужно описать единицы исходного текста, соответствующие единицы выходного текста и все те преобразования, с помощью которых из единиц исходного текста получаются соответствующие модели выходного текста и сам текст.
Используя множество текстов, словарные соответствия и известные правила английской и русской грамматики и описывая их с помощью алгоритмов (т. е. определенной последовательности), можно построить общую алгоритмическую модель перевода с английского языка на русский и на ее основе разработать систему машинного перевода. Выбор правильного перевода на основе значения самого слова исходного текста и его окружения осуществляется с помощью так называемых семантических моделей, которые являются обязательной составной частью общей модели перевода. Такая алгоритмическая модель машинного перевода состоит из следующих блоков:
1) блок морфологического анализа исходного текста;
2) блок лексического анализа исходного текста;
3) блок синтаксического анализа исходного текста;
4) блок семантического анализа исходного текста;
5) блок преобразования исходных синтаксических структур в выходные;
6) блок синтаксического синтеза;
7) блок семантического синтеза;
8) блок синтеза текста перевода.
Возьмем для анализа работы машинного перевода перевод с английского на русский специальный текст, сделанный одной из популярных систем перевода (Magic Gooddy):
Government planning agencies decided how goods and services would be produced in command economies.
Система машинного перевода переводит текст таким образом:
Агентства планирования правительства решили, как товары и услуги будут произведены в экономике (экономии) команды.
Более корректный перевод данного предложения, сделанного переводчиком:
Государственные плановые учреждения решали, как товары и услуги будут произведены в командной экономике.
Вот еще один наглядный пример из контекста:
In command economies factories, other productive resources are government-owned.
Система машинного перевода выдаст на экран следующее:
В фабриках экономии (экономики) команды другие производительные ресурсы, правительственно находящиеся в собственности.
Речь идет о том, что при командной экономике фабрики, другие производительные ресурсы находятся в государственной собственности.
Разбирая этот текст, его смысл более или менее понятен. Однако необходимо человеку сделать некоторые изменения (коррекцию), т. к. в большинстве случаев нельзя оставлять версию машинного перевода, а необходимо проанализировать текст перевода, где-то изменив его. Неточности машинного перевода происходят вследствие того, что словосочетания и их переводы не известны переводящему аппарату, и невозможно заложить в словарь системы все словосочетания. Принцип выделения словосочетаний также не известен, и мы их выделяем интуитивно на основе множества признаков.
Прежде, чем рассмотреть машинный перевод других словосочетаний, надо определиться с тем, что такое словосочетание. Словосочетание отличается от слов, просто стоящих рядом в тексте, тем, что его общее значение (и естественно перевод) отличается от отдельных его составляющих. Причем по форме оно, как правило, не отличается от отдельных слов. Рассмотрим в качестве примера сочетание command economy (командная экономика, а не экономика команды). Это словосочетание, как и большинство других, не отличается от отдельных слов, стоящих рядом.
Перевести правильно словосочетание в специальном тексте можно если:
1) знать тематику текста (на нашем случае это “Командная экономика ”) и на этом основании сделать вывод о возможности присутствия в нем специальных терминов и необходимости их специального перевода);
2) знать эти термины и их перевод.
Машина не знает ни того, ни другого. Таким образом, машина не может отделить словосочетание от других слов, а человек узнает и поэтому понимает и переводит в общем случае правильно, так как человек делает это на основании ранее полученных знаний и опыта. Если человек не знает какое-либо словосочетание, то он его не поймет, и, следовательно, не переведет. Одно и то же словосочетание может иметь несколько значений. Как же человек определяет нужное значение? Тут вступает в силу один из элементов аналитического аппарата переводчика, присущий машинам в ограниченной степени. Это анализ контекста. В сочетании с имеющимися знаниями контекст как бы подсказывает человеку, что те или иные слова составляют понятийное целое и не должны восприниматься в отдельности.
Продолжим анализ машинного перевода небольшого текста:
“An April 1998 report” – апрель 1998 сообщение) – эти недостатки алгоритма синтаксического анализа переводчик вряд ли сделает.
С выбором переводимых эквивалентов дело обстоит проще. В общем случае мы выбираем подходящий эквивалент, опираясь на ближайшее окружение слова, более широкий контекст и тематику текста. В некоторых случаях мы можем объяснить тот или иной выбор, однако далеко не всегда мы четко представляем себе основания для выбора эквивалента – определенных правил просто не существуют и поэтому такую процедуру нельзя алгоритмизировать. Часто мы выбираем эквивалент интуитивно, и в этом существенное отличие переводчика-человека от машины. При выборе эквивалента мы можем сказать, что этот выбор определяется ближайшим окружением, контекстом и тематикой. В случае же стиля (правильного подбора и сочетаемости слов в тексте) мы не можем утверждать и этого. Формальные основания стиля не известны, и здесь мы полагаемся исключительно на интуицию.
Подводя итоги, можно сказать что:
- компьютерные системы перевода имеют определенные преимущества перед человеком: имеют большой словарный запас, могут работать достаточно продолжительное время без перерыва.
- человек, в отличие от компьютера, хотя и имеет меньший словарный запас (по сравнению с машиной) обладает лучшей способностью принимать правильные решения на основе интуиции. Он принимает их на основе ранее накопленных знаний и опыта, так как человек – это самообучающаяся система, постоянно пополняющая свои знания и исправляющая допущенные ошибки.
- чтобы не уподобляться машине переводчик должен все время учиться, приобретая определенные навыки, совершенствоваться и систематизировать свои знания иностранного и родного языков.
Итак, что системы машинного перевода можно рекомендовать для использования только в крайних случаях, если нет возможности обратиться к специалисту, и где не требуется точный перевод. При переводе технической документации, контрактов следует прибегнуть к помощи человека-переводчика.