Проблемы автоматизации перевода математической литературы с английского языка на русский (48211)

Посмотреть архив целиком

III научно-практическая конференция школьников

по математике, её приложениям и информационным технологиям

«Поиск»




Учебно-исследовательская работа

«Проблемы автоматизации перевода математической литературы с английского языка на русский »





Ученицы 9 класса

Гиназии №71 г. Гомеля

Барановой Валерии Викторовны


Научный руководитель —

Горский С.М.,

учитель информатики









Гомель, 2008


Содержание

Введение

1. Пересчет размерностей

2. Импликации в английских научно-технических текстах

3. Математические штампы

Заключение

Список использованных источников

Приложение 1


Введение


Обилие математической литературы вынуждает искать способы автоматического перевода, но низкое качество программ-переводчиков вынуждает использовать технику перевода «машина-человек», то есть в начале текст обрабатывает программа, а затем его корректирует человек, что существенно снижает затраты на перевод.

К сожалению, современные программы-переводчики, такие как Prompt, не поддерживают формат TeX, ставший стандартом представления математических текстов. Так же совершенно не поддерживается передача символов, названий функций, имен собственных, ставших традиционными для русскоязычной математической литературы.

Данная работа пытается восполнить этот пробел на стадии допереводческого анализа текста. В первом разделе работы обсуждаются вопросы передачи формул (пересчет при необходимости). Второй раздел посвящен импликациям в математических текстах, что так же не учитывается программами-переводчиками. В третьем разделе показывается, что при переводе математического текста можно применять технологию Translation Memory, и приведены основные математические штампы [Сосинский].

Исследования, связанные с данной работой позволили написать несколько программ на языке Perl для анализа и частичного выполнения перевода. Недостаток объема текста не позволяет их рассмотреть подробно. Перечислим данные программы:

1. Программа для передачи символов, имен собственных, названий функций, названий теорем и т. п., сокращений.

2. Программа для анализа диалекта английского языка (British English или American) поскольку это влияет на перерасчет формул.

3. Программа для нахождения комментариев в текстах программ и указания, можно ли производить перевод переменных. Данная программа актуальна, поскольку в языках программирования типа Perl, Python невозможно отличить комментарии от программы, не зная синтаксиса комментариев (На Perl даже сочиняют поэмы).

4. Программа для поиска импликаций в тексте для облегчения редактирования машинного перевода.


1. Пересчет размерностей


Рассматриваются примеры пересчета размерностей при переходе от британской системы единиц к метрической либо к международной системе (СИ). Эта операция – не простая и ответственная, особенно когда в исходном тексте размерность величины представлена неправильно или необычно, либо когда нужно определить численный коэффициент в полуэмпирической расчетной формуле. Приведем обоснование терминов, использованных при рассмотрении примеров.

Обычный пересчет размерности

Такой пересчет размерности сводится к перемножению всех составляющих ее единиц измерения, каждая из которых умножена на свой коэффициент пересчета. В нижеследующей таблице приведены коэффициенты пересчета наиболее ходовых единиц измерения из британской системы единиц в международную. Аналогичные таблицы существуют для пересчета британских единиц в метрические и метрических единиц в международные.


Наименование величины

Значение (Х) величины в британской системе

Коэффициент пересчета из британской системы единиц в СИ

Результат пересчета, представленный в СИ

Длина

Х foot (ft)

0,3048

0,3048 Х м

Площадь

Х foot square (ft2)

0,3048 × 0,3048

0,0929 Х м2

Объем

Х cubic foot (ft3)

0,30483 = 28,317 × 10-3

28,317 × 10-3 Х м3

Масса

Х pound of mass (lbm)

0,4536

0,4536 Х кг

Время

Х second (s)

1

Х сек, или Х с

Сила

Х pound of force (lbf)

4,448

4, 448 Х Н

Скорость

Х f/s

0,3048/1 = 0,3048

0,3048 Х м/с

Работа

Х lbf x ft

4,448 × 0,348 = 1,356

1,356 Х Нм

Давление

Х lbf/in2 (psi)

4,448/(0,0254)2 = 6895

6895 Х Н/м2


Например, в исходном тексте говорится, что рабочее давление резервуара равно 980 psi. В СИ это давление записывается как 6,757 МПа (пересчет: 6895 × 980 Н/м2 = 6757100 Н/м2  6,757 МПа).

Конечно, таблица отражает лишь малую часть практических случаев. Взять хотя бы длину. В английском языке для ее измерения кроме фута широко используются дюйм, ярд, миля, мил, микродюйм, и, следовательно, количество сочетаний с использованием единиц измерения длины в размерностях велико. Кроме системных единиц измерения существует множество внесистемных (или «ведомственных»). Например, помимо системной международной единицы измерения давления Паскаль (т.е. Н/м2), в русской технической литературе используются кгс/см2 = кГ/см2, кГ/м2, атм. (атмосфера), торр (мм ртутного столба), бар (приблизительно равен атмосфере и точно равен 100 кПа), пьеза, миллиметр водяного столба.

Определение размерности путем ее анализа

Рассмотрим пример. В статье по обработке металлов резанием приводится таблица значений удельной работы резания Ut, причем размерность этой величины имеет вид h.p./in3/min. Такая неочевидная запись размерности недопустима, поскольку ее можно понять как (h.p./in3):min и как h.p.(in3/min).

Чтобы перед пересчетом определить правильную запись размерности, переводчик рассуждает следующим образом: h.p. — мощность, т.е. работа в единицу времени; если ее поделить на in3, получим удельную мощность (т.е. мощность, затрачиваемую на единицу объема металла); чтобы из удельной мощности получить удельную работу, нужно удельную мощность помножить на время. Таким образом, правильная запись должна выглядеть как (h.p./in3min, или h.pmin/in3.

Определение размерности путем оценки значения величины

В статье, посвященной расчету градирни, дается пример:

As an example, if l = 35 deg, T1= 520 deg, approach = 16.5 deg, then P = 0.47 and ψ = 4.9.

В этом примере I – разность начальных температур воды и воздуха в радиаторной градирне, T1 – температура воздуха на входе в градирню, a approachтемпературный напор на холодном конце. Спрашивается, в каких градусах — Фаренгейта, Цельсия, Рэнкина или Кельвина – даны значения параметров?

Первая и третья величины суть температурные разности, поэтому удобнее для проверки выбрать вторую величину, то есть T1. Если даже принять температуру воды на выходе из градирни совпадающей с T1 (на самом деле она, как мы видим, выше на 16,5°С), то ясно, что вода при давлении, близком к атмосферному, не может существовать при 520°F (т.е. 271°С), поскольку она закипает при 100°С., cследовательно, градусы Фаренгейта и Цельсия отпадают, и температура T1 взята по термодинамической шкале Кельвина либо Рэнкина.

Проверяем «градусы» Кельвина (точнее кельвины):


520 К = 520 – 273 = 247°С > 100°С,


а это значит, что кельвины не подходят. Остается проверить градусы Рэнкина: 520°R = 520 × 0,555–273 = 16°С. Этот результат вполне правдоподобен, а значит все температурные параметры даны в градусах Рэнкина, которые нужно, конечно, перевести по всей статье в кельвины, т.е. в единицы принятой в России термодинамической шкалы Кельвина.

Пересчет численного коэффициента в расчетной формуле

Рассмотрим подробно, как этот коэффициент пересчитывается. В статье по усталостному разрушению металлов приведена формула, по которой определяется длина усталостной трещины при известных числе циклов усталостного нагружения и интенсивности напряжений в металле:


da/dn= 1.42·10-13(ΔК)2.02.


Здесь а – длина трещины в дюймах [in];

п – число циклов [cycle];

da/dn – приращение длины трещины за один усталостный цикл [in/cycle];

К – коэффициент интенсивности напряжений [psi·√in] = (lb/in2in1/2;

К – размах (двойная амплитуда) коэффициента интенсивности напряжений (с той же размерностью, что и у К).

1,42·10-13численный коэффициент, который при пересчете из британской системы единиц в метрическую меняет свое значение. Это-то значение мы и должны определить – иначе российские инженеры не смогут пользоваться формулой.






Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.