Зачем Гуглу функциональность "Предложить лучший вариант перевода"

natalia-yasmin

 В переводчике: http://translate.google.com/translate_t?text=Text.&hl=ru&langpair=en|ru ?
Как могут использоваться предложенные варианты?

Dasar

грубо: в следующий раз, когда google уведит эту же фразу он переведет ее так, как ты задал.

yolki

для меня, или для всех остальных?
А если переводчики будут противоречить друг другу?

Bibi

вас много, ребята

natalia-yasmin

 На таком уровне понятно, и в справке есть: http://www.google.ru/intl/ru/help/faq_translation.html#quality
И там же написано: "Кроме того, чтобы улучшить качество, нам необходимы большие объемы двуязычных (параллельных) текстов. Если у вас есть большие объемы параллельных текстов для двух или нескольких языков и вы готовы предоставить их, сообщите нам об этом."
Но как фактически происходит самообучение?
Ещё интересная ссылка, двухлетняя: http://www.rol.ru/news/it/soft/05/08/25_002.htm

Система машинного перевода Google впервые приняла участие в конкурсе программ-переводчиков. И победила во всех тестах, поставив абсолютный рекорд по качеству перевода за пять лет проведения подобных конкурсов.
Для оценки программ использовались самые сложные и актуальные направления перевода: с арабского на английский и с китайского на английский. По каждому из них перевод осуществлялся на выборке из 100 текстов, полученных с новостных лент Agence France Presse и Xinhua News Agency. В наличии имелись тексты как на оригинальном, так и на английском языке, что позволило автоматизировать проверку результатов работы систем машинного перевода.
Для автоматической оценки результатов применялась система статистической оценки совпадений BLEU, которая измеряет количество совпадений в текстах на двух языках. Чем больше совпадений - тем выше оценка. Итоговый результат находится в пределах от 0 (нет совпадений) до 1 (абсолютная идентичность). Алгоритм оценки BLEU очень похож на то, как, собственно, и работает самообучаемая система перевода Google, которая настраивается на любой язык после "скармливания" ей определенного объема переведенных текстов вместе с оригиналами.
В этом году система Google поставила абсолютные рекорды состязаний, показав результат 0.5137 для арабско-английского перевода и 0.3531 для китайско-английского. Всего в конкурсе принимали участие 20 программ из 7 стран.
А здесь, похоже, есть видеоответ на исходный вопрос: http://googlerussiablog.blogspot.com/2007/04/google-tech-talk.html (выложен на Ютуб, естественно :) )

pilot

Эти жулики до сих пор не сделали выбор вариантов перевода.
Они по цепочке из 5 слов предлагают самый часто встречающийся перевод. Могли бы предлагать 2 или 3 или 5 вариантов перевода. Как Google Suggest.
Потому как в большинстве случаев предложенный вариант перевода можно оценить плохо зная язык на который переводишь.
+ некоторые вещи переводятся не однозначно
+ в русском, например, языке порядок слов не так жестко фиксирован и сама идея спорна
На том techtalk'е я их про это спрашивал — сказали делают софтину такую.
PS: вообще русское отделение Гугла странное.
Какие-то 5 человек которые непонятно чем занимаются, в блоге записи раз в месяц, про techtalk обычно в прошедшем времени.
Интересно, получается ли у них набирать 200 человек в год, как собирались. Имхо, нереально.

slonishka

там же вроде одних только мгушнегов больше пяти?

nikita270601

существенно больше!

Helga87

форумчан и то около 5

pilot

Впечатление оставляют такое.
Говорю же, что ответить на вопрос "чем занимаются" не могут (я не секреты спрашивал, а в общих словах хотя бы). Только "у нас столько проектов что мы очень крутые".
googlerussia.blogspot.com до сих пор under construction — хоть бы ссылку повесили куда смотреть.
Обещали в блоге отвечать на вопросы течтолков из записок — не смогли.

Helga87

Говорю же, что ответить на вопрос "чем занимаются" не могут (я не секреты спрашивал, а в общих словах хотя бы). Только "у нас столько проектов что мы очень крутые".
Ну, а почему ты думаешь, что ответ на вопрос "чем занимаются" не является секретом?

pilot

Они "пиарятся"? Пиарятся. Хотят чтобы хорошие программисты к ним работать шли.
В большой компании есть куча негроработ, куча разных работ, и ни один нормальный человек за слово "Google" работать к ним не пойдет.
Мне вот не все равно какие программы писать и чем заниматься.
Google достаточно большой уже чтобы тупить не хуже Miscrosoft, IBM или Oracle. А в них работать идти не хочется.

Helga87

Поскольку примерно раз в три месяца можно устроить себе смену проекта, каждый занимается тем, что ему больше интересно. Насчет тупой работы — в Москве достаточно много исследовательских и глобальных проектов. Локализации (что обычно и считается "тупой" работой) уже довольно мало.
Оставить комментарий
Имя или ник:
Комментарий: