Байки из локализаторской: краткая история машинного перевода, часть 1

article-localization-tales-machine-translation-part-1-imgАвтор: АННА КИСЕЛЁВА

Вместо вступления

На прошедшем в конце июня 2015-го Форуме переводчиков России произошел любопытный эпизод. Один из участников дискуссии о программных средствах контроля качества, представительный пожилой мужчина, начал агрессивно высказываться о бесполезности и ущербности «всех этих программ», а потом и обвинять ведущих в том, что они не гуманитарии и поэтому никогда не поймут, что программа по самой сути своей несет переводу гибель. В аудитории нашелся еще один гуманитарий, и страсти начали закипать. Положение спасла я, взяв микрофон и высказав свое мнение, что программные средства контроля качества никогда не заменят редактора, да и не предназначены для этого.

Потом ко мне подошел один из участников дискуссии и процитировал меня так, как услышал. Оказывается, я «сказала», что машинный перевод никогда не заменит человека.

Неожиданно.

Пришествия машинного перевода с нетерпением ожидают корпоративные заказчики и панически боятся коллеги. Но насколько обоснованы эти надежды и страхи? Быть может, нас действительно ждет уродливое будущее, где бессмертные строки Чехова будут переводиться машиной на уровне «вся ваша база принадлежать нам», а специалисты с мировым именем отправятся просить милостыню? Или же действительно можно будет одним нажатием кнопки точно и красиво переводить гигабайты, не тратя ни гроша? Что нас ждет? И главное — когда?

Джорджтаунский эксперимент: «Через три года у нас будет машинный перевод!»

Надо сказать, этому напряженному ожиданию уже не один год и даже не один десяток лет. Машинный перевод — это «праздник, которого ждут со дня на день»… аж с 1954 года. Именно тогда состоялся знаменитый Джорджтаунский эксперимент — первая в истории демонстрация работающего машинного переводчика. Эксперимент имел оглушительный успех, был широко разрекламирован IBM и наполнил карманы исследователей бессчетными деньгами, а их сердца — бешеным энтузиазмом. Казалось, на горизонте появились очертания новой «Энигмы».

Перфокарта с Джорджтаунского эксперимента.

Перфокарта с Джорджтаунского эксперимента.

Чтобы понять заразительность этого энтузиазма, обратимся к личности одного из главных участников событий — профессора Джорджтаунского университета Леона Достерта. Лингвист по образованию, личный переводчик Эйзенхауэра, после войны он был назначен ответственным за переводческую деятельность на Нюрнбергском процессе. На этом посту Достерт создал первую в мире крупномасштабную систему синхронного перевода, которую на следующий год внедрил в ООН. Оборудование для обеих систем предоставила IBM, с чьим президентом Томасом Уотсоном Достерт дружил с середины 30-х годов.

Именно опыт работы с электронным оборудованием в переводческой индустрии и привел Достерта — к тому времени директора Института языков и лингвистики при Джорджтаунском университете — на первый конгресс по машинному переводу, состоявшийся в Массачусетском технологическом летом 1952 г.

А тут машинистка пробивает перфокарту.

А тут машинистка пробивает перфокарту.

Поначалу Достерт отнесся к идее автоматизации перевода скептически, но к концу конференции резко изменил свое мнение, окрыленный новыми возможностями. Будучи по натуре практиком, он решил не ждать, когда наконец теория сделает все необходимые шаги, а немедленно поставить маленький, но настоящий эксперимент, который подтвердит или опровергнет жизнеспособность машинного перевода. За содействием он, естественно, обратился в IBM.

И вот 8 января 1954 г. Томас Уотсон и Леон Достерт явили миру первый в истории машинный переводчик. Вычислительная машина IBM 701 перевела с русского на английский шестьдесят предложений по общей тематике и органической химии. Словарь автопереводчика составлял 250 слов, использовалось шесть грамматических правил. Русские тексты в латинской транскрипции вводились в компьютер на перфокартах, которые прямо при зрителях пробивала машинистка.

В последующие дни в Штатах не было ни одной уважающей себя газеты, которая не процитировала бы слова Достерта: «Хотя сейчас еще нельзя вложить в приемный лоток книгу на русском и получить на выходе книгу на английском, через 3-5 лет мы получим работающий машинный перевод на нескольких языках, пригодный для важных областей человеческой деятельности».

Сейчас многие считают, что Джорджтаунский эксперимент принес больше вреда, чем пользы, резко завысив ожидания публики. И когда прошло целое десятилетие гигантских финансовых вливаний, а машинный переводчик так и не заработал, маятник качнулся в обратную сторону. Да так, что мало не показалось никому.

Перфоратор для электронно-вычислительных машин. Я такие еще застала на школьном УПК, но они уже выглядели пережитками прошлого... зато на перфокартах было так удобно делать заметки!

Перфоратор для электронно-вычислительных машин. Я такие еще застала на школьном УПК, но они уже выглядели пережитками прошлого… зато на перфокартах было так удобно делать заметки!

Великое Закрытие и итоги первого бума

К 1960-м годам обнаружились фундаментальные проблемы машинного перевода.

Например, ученые недооценили многозначность слов и важность контекста. Для перевода машине требовалось знать, о чем вообще речь, иначе появлялись совершенно идиотские ошибки. Общеизвестным примером стал перевод на русский и обратно фразы «the spirit is willing but the flesh is weak» («дух крепок, но плоть слаба»), превратившейся в результате в «the vodka is good but the meat is rotten» («водка хорошая, но мясо протухло»).

Кислородное голодание
Машине был неведом ни здравый смысл, ни история человечества, ни контекстная связь между словами. В одной из управленческих теорий подобные вещи носят меткое название «кислород»: очевидное условие, забытое именно по причине очевидности.

Время шло, деньги текли, а обещанного результата так и не было, и в какой-то момент случилось то, что всегда случается в такое время — проверка.

Устав ждать результатов, правительство США в 1964 г. сформировало комиссию по изучению перспектив машинного перевода, известную как комиссия ALPAC. Перед ней поставили задачу — оценить результаты работ и дать рекомендации по дальнейшему финансированию. Комиссия проработала два года, изучила гору материала, провела десятки экспериментов и в итоге опубликовала разгромный отчет (попутно разработав одну из первых методологий оценки качества перевода).

ЭВМ IBM 701, однотипная с той, на которой проводили Джорджтаунский эксперимент, и будущий президент США Рональд Рейган (тогда снимался в телерекламе General Electric).

ЭВМ IBM 701, однотипная с той, на которой проводили Джорджтаунский эксперимент, и будущий президент США Рональд Рейган (тогда снимался в телерекламе General Electric).

Вердикт был неутешителен: машинный перевод оказался дороже, хуже и медленнее ручного, а машинный перевод без последующего редактирования (именно тогда и прозвучало хорошо знакомое нам сейчас слово «постредактура») — вообще никуда не годным.

Авторы отчета не смягчали выражений: «Хотя перевод текстов общенаучной тематики с помощью компьютера и существует, полезного машинного перевода нет. Мало того, нет и немедленных или хотя бы предсказуемых перспектив его появления».

Один из выводов отчета ALPAC заключался в том, что дальнейшее развитие машинного перевода тормозится прежде всего состоянием лингвистики. Комиссия рекомендовала забросить машинный перевод и спонсировать: а) лингвистику как таковую, причем не как прикладные исследования, а как науку — т.е. не требуя от нее немедленной отдачи, и б) усовершенствование процесса перевода и разработку практических методов оценки его качества.

Отчет ALPAC многие критиковали как однобокий и близорукий, но так или иначе, правительство вняло его рекомендациям — и закрыло проект, в который к тому моменту успело вложить 20 миллионов долларов (130 млн. в ценах 2015 г.), без какой-либо надежды получить эти деньги обратно. Примеру США последовали и другие западные страны, за редкими исключениями. Ситуацию усугубила начавшаяся в 1970-е годы глобальная «зима ИИ», когда закрылось финансирование и по другим направлениям, связанным с искусственным интеллектом.

Не всё впустую
Деньги правительство в конце концов вернуло: один из множества разнообразных проектов по ИИ и МП, которые правительство США когда-то финансировало, оказался успешным и уже в 90-е годы окупил все остальные.

…Но действительно ли все эти миллионы были выброшены на ветер?

"Отец современной лингвистики", профессор MIT Ноам Хомский в 1968 г.

«Отец современной лингвистики», профессор MIT Ноам Хомский в 1968 г.

Уже в 1956 г. активный участник работ по машинному переводу в МИТе Ноам Хомский разработал иерархию формальных языков, а через год выпустил свою знаменитую книгу «Синтаксические структуры», осуществившую переворот в лингвистике. Иерархия Хомского положила начало идее алгоритмических языков и сейчас известна каждому программисту.

В 1964 г. был запущен машинный переводчик GAT (Georgetown’s Automatic Translator). Он был установлен в МАГАТЭ и в Европейской комиссии по атомной энергии (EURATOM), где кое-как проработал до 1976 года, переводя научную литературу с русского.

GATкое качество
По отзывам, «качество перевода было отвратительным по сравнению с ручным, но для наших целей — быстро просканировать документы и определить их содержание и уровень интереса — система GAT была вне конкуренции по сравнению с единственно возможными другими вариантами: дорогой и медленный ручной перевод или вообще никакого».
Философ, по-прежнему профессор MIT Ноам Хомский среди участников митинга "Захвати Уолл-Стрит" (2011). Хомского шатало изрядно, правда, он еще до того, как стать гением лингвистики, был юным анархистом.

Философ, по-прежнему профессор MIT Ноам Хомский среди участников митинга «Захвати Уолл-Стрит» (2011 г.). Хомского шатало изрядно, правда, он еще до того, как стать гением лингвистики, был юным анархистом.

В 1968 г. Питер Тома, участник проекта GAT, разработал еще один машинный переводчик — SYSTRAN, доживший до наших дней и регулярно обновляемый. В 1973 г. он использовался для переводов с английского на русский в рамках проекта «Союз-Аполлон», а в 1976 г. был приобретен Еврокомиссией. В 2010 г. SYSTRAN стал первым движком машинного перевода, реализовавшим гибридный подход.

Уже во время «зимы ИИ» появился TAUM-METEO — специальный машинный переводчик для прогнозов погоды. Он был запущен в 1977 г. и проработал до 2001 г., переводя около 80 тысяч слов в день, или 30 млн слов в год.

Кроме того, в рамках проектов по машинному переводу велись работы и по оптическому распознаванию текста (чтобы обойтись без машинистки), и по распознаванию речи, тоже попавшие под каток. Результаты тех работ широко используются в нынешних сканерах и системах голосового управления.

Продолжение следует…

ОБ АВТОРЕ
AKiselevaАнна Киселёва — ветеран локализации видеоигр. Профессиональный переводчик, закончила МГЛУ. В индустрии с 1999 года, сначала как переводчик, потом как редактор, потом как менеджер проектов. Начинала в «Фаргусе» переводчиком Planescape: Torment. С 2004 по 2014 гг. – в . Руководила локализацией таких разноплановых игр, как Fallout 3 и Sid Meier’s Railroads!, Devil May Cry 4 и Mafia 2, Tearaway и Wolfenstein: The New Order. Контент-менеджер и старший редактор локализации TES 5: Skyrim, которую считает своим высшим достижением.

Сейчас Анна — глава отдела локализаций агентства переводов «ТрансЛинк».

  • Nerd_Sp

    1954 — Через три года у нас будет машинный перевод
    2000е —
    http://cs419019.vk.me/v419019654/58f3/twP9b4zBhhA.jpg

  • Vortex

    https://pp.vk.me/c626229/v626229342/106a6/gt7Fsm6y3qQ.jpg

  • Helso

    Ну неужели так сложно научить переводчик переводить?? Чтобы он не нёс околесицу. Загрузить туда все правила языка, это что так сложно? Машины же переводят языки популярные, с правилами, которые всем известны, не с инопланетного же! Идиотизм какой-то.

  • Konstantin Obvintsev

    Благодарю, хорошая статья.

  • Ulris Ventis

    http://cs.pikabu.ru/images/previews_comm/2013-12_4/13874754296684.png

  • Ulris Ventis

    Это крайне сложно. Даже человеку местами бывает непросто подобрать подходящий синоним, и словарь с кучей синонимом не всегда в этом помощник. Можешь поверить, машине, которая может оперировать только — часто используемые, близкие по смыслу, это вообще недостижимо. Гугл переводчик как-то предлагал помочь ему с вариантами переводов меняя отдельные слова, или выбирая варианты, которые ближе к сути. И он все равно косячит страшно.
    Стоит начать даже не с вопроса — почему сложно научить машину переводить, а с более будничного — ЛЮДИ до сих пор не могут нормально переводить, не зная крылатых выражений, не желая изучать слэнг и не пытаясь врубаться в смысл.

  • Vortex

    Главный признак такого перевода — легко можно дословно воспроизвести фразу на языке оригинала)

  • Ulris Ventis

    Это уж точно, но зато на коробке написали, что там «перевод». А уж какой был жесткий перевод помню Knight of the old republic..

  • zebroid

    Очень познавательно, спасибо. Ждем добавки))

    ЗЫ Кстати, гугл переводчик справился с названием статьи на 4 — перевод на английский и обратно))

    Байки из lokalizatorskoy: краткая история машинного перевода, часть 1

  • piedpiper

    Очень интересно, жду прододжение!

  • piedpiper

    Я вообще думаю это нереально, а оказывается люди вон бьются с этим с 54 года.

  • wintergirl

    Самая первая и основная причина упомянута в статье: машина не видит контекст.

  • Иван Ефимов

    По идее с развитием нейросетей, машина сможет понять конеткст сравнив перевод с тысячями других похожих вариантов и их переводами. Мне кажется проблема скорее с тем, что перевод так или иначе нужно адаптировать, но опять таки простой текст можно сравнить с другими подобными и найти правильный перевод, но чем сложнее текст, тем меньше похожих вариантов есть у сети и тем сложнее сделать правильный перевод.

  • wintergirl

    Кстати, с крылатыми выражениями у машины может и получше быть, чем у людей. Пару раз попадались ситуации, когда от перевода отдельных слов получался набор этих самых слов, а при подсовывании онлайн-переводчику фразы на выходе получалась осмысленная фраза. Правда, для этого все равно желательно человеку знать что вот эти несколько слов — фразеологизм и переводить их нужно вместе.

  • Victor Serpentus

    Если коротко — да, очень сложно. Если хотите подробнее, читайте внимательнее данную статью и ищите другие статьи по теме, их очень-очень много в открытом доступе.

  • zmiyko

    Вот так всегда, на самом интересном месте!

  • Aeglor

    https://uploads.disquscdn.com/images/9521853a5c1b321055856fe022011452a48ccd5572f087dbdaae1109deab893f.jpg

  • Людям правила по десять лет загружают — не всегда помогает.

  • Луч света в темном царстве.

  • reader

    В любом случае перевод должен кто-то редактировать. Поправленный хорошим редактором машинный перевод будет вполне «съедобен». Так что проблема не так велика, как кажется. Ну, и у машинного перевода есть ещё один мощный плюс — он дешевле.

  • Anna Kiseleva

    Да, на найронные сети у меня лично много надежд. В первом варианте статьи было и про них, и про Минского с его теоремой о неполноте возможностей персептрона, и про то, что Хопфилд обошел это через двадцать лет объединив персептроны в сеть. Но потом решила, что и так объем зашкаливает.

  • nourdal

    Уррра! Анна Киселёва вернулась!!! 🙂
    Как всегда, жутко интересно! Ждём продолжения!

  • nourdal

    :)) Потрачено.

  • Anna Kiseleva

    Об этом во второй части — и да, она готова.

  • Сложно, так как дело не в правилах.

  • Irx

    Именно так гугл переводчик и работает. Пока выходит не очень, хотя и получше, чем промты и стилусы прошлых поколений.

  • LaDecaux

    Нашел аж целую страничку в ВК с подобными скринами. (В гугле вбейте- Приколы перевода субтитров GTA:San Andreas )

    https://uploads.disquscdn.com/images/1bfb2e8d3482395c545d7c6ed40869f01862fe23f2926769dfb7885a66292bb5.jpg https://uploads.disquscdn.com/images/998b190edaad7046a27dc484de707d61b4df8bca8e5ca2688d7f25d3bf825483.jpg

  • Ulris Ventis

    Или еще проще — San andreas промт. ))
    http://s020.radikal.ru/i715/1310/8a/64cf754b29fd.jpg

  • NikSan

    Кому нужны эти нелепые статьи о локализациях, лучше запилите анонс стрима, или рецензию на индю в которую играет только рецензент, или, на худой конец, ещё один отчёт о «захватывающем» киберспорте по LoL (вот жеж LoL).
    А если серьёзно, ребят, неужели всё настолько плохо что приходящий человек Анна Киселёва одной своей статьёй перекрывает все ваши сомнительные достижения за полгода. Интересно как выглядят заседания вашей креативной группы:
    — Что бы нам такого сделать чего ещё никто не делал?
    — Может быть стримы, это так свежо и оригинально.
    — Гениально, просто гениально. А что бы гениальность пёрла со всех щелей будем устраивать опросы по поводу и без, сделаем даже опрос про опросы, что бы всем казалось что мы умнее чем есть на самом деле…
    — А может будем просто писать оперативные рецензии по «горячим» проэктам, то есть заниматься, так сказать, своей профильной деятельностью…
    — Не знаю кто ты, но ты уволен, сука, слышишь, ТЫ УВОЛЕН. Боже мой, кто взял этого парня, и придёт же в голову такое.

  • Oleg Kubaneishvili

    Пару месяцев назад я узнал об одной программе — Visual Novel Reader. Как правило, ею пользуются те, кто читает визуальные новеллы на японском или английском языке. Но это не простой машинный переводчик, который выводит текст поверх оригинального. У сей штукенции есть несколько любопытных особенностей. Во-первых, имеется два режима: один предназначен для создания стандартного машинного перевода, а вот другой пишет над каждым словом его возможное значение на русском. Во-вторых данная ПОшка позволяет не просто создать собственный перевод, но и синхронизировать его online, благодаря чему другие пользователи могут получить доступ к вашей работе и даже отредактировать ее. Ко всему прочему, VNR способен запоминать некоторые фразы и впоследствии использовать их в собственном автоматическом переводе.
    Лично мне такой концепт кажется крайне интересным. И я думаю, что ему смогут найти применение как в любительской, так и в профессиональной деятельности.

  • joik-best

    На правах рекламы?

  • humvee3d

    Анна, спасибо за статью! Очень познавательно.

  • Nekto

    Блин!!! гениально!!! прям стихи!!! Воу

  • Для работы над переводами лучше использовать memoQ. Она не без тараканов, и интерфейс у нее чересчур перегруженный местами (плюс, плохо дружит с retina-дисплеями в high DPI), но она экономит мне тонну времени при работе над проектами с большим глоссарием или кучей повторяющихся фраз.

  • Anna Kiseleva

    Я б сказала — не только в правилах. Правила тоже иногда могут делать разницу, не зря первые машинные переводчики все были сделаны по модели RBMT.

  • Anna Kiseleva

    Лично я предпочитаю Традос. У него есть пара фишек, которых у мемоку пока что нет. Но в реальности — с чем дали, с тем и работаем. Традос в чем-то удобнее, мемоку в целом гибче.

  • Anna Kiseleva

    (стесняюсь и раскланиваюсь) Спасибо, будет.

  • mad_yojik

    Ну, допустим в случае с видеоиграми и фильмами — контекст вообще зачастую в видео, а не в текстовке. Поэтому машина его тупо и не видит даже.

  • Anton Shvyrkov

    А что никто Надмозгов не вспомнил? Это ж наше всё! 🙂

  • Anton Shvyrkov

    Статья очень понравилась! Жду продолжения.

  • Гуманитарий сбежал, ловите его!!!

  • Читать такие материалы — одно удовольствие.

  • Flava Flav

    https://uploads.disquscdn.com/images/4cf2ffb78f6eb5cddfa729d7059dcdcae7bf6697ed586f8f15779801824ec883.png

  • Lima Zulu

    Статья, бесспорно, отличная, но можно в ленте на неё превью со ссылкой оставить, а не целиком?

  • Done.

  • Fish Owl

    Анна, вопрос: как вы относитесь к переводчикам без профильного образования, которые утверждают, что существует некое «пассивное» владение языком. Когда как собака — всё понимаю, но ничего на языке с которого перевожу толком сказать не могу. Но всё равно перевожу.

    Такое возможно?

  • Krik_iddqd

    Это плохой «гуманитарий». Если бы это был хороший гуманитарий, то понимал бы суть проблемы уже даже при поверхностном взгляде и при отсутствии даже какой либо технической подкованности.

  • Vortex

    Это рэпчик…

  • Reitzteil

    > с чем дали, с тем и работаем

    Наверное, не «с чем дали», а «что дали»?

  • Chazm

    У второго КОТОРА.
    А в обратном переводе промтовщины есть свое извращенное удовольствие.

  • JC Denton

    А в России бы комиссии просто занесли денег и продолжили бы заниматься бесполезной деятельностью, тратя на это миллиарды рублей. ))))

  • JC Denton

    Прошу прощения, что влажу в дискуссию. Но учитывая, что перевод по сути является сопоставлением толкования слов, имеющихся в разных языках — не зная язык источника, его перевести в принципе невозможно.

  • JC Denton

    Наверное потому, что язык человеком не воспринимается как набор правил, а «чувствуется». Машина не может видеть контекст, воспринимать фразу в целом, абстрактно от правил. Блин, в статье же написано все. Ты читал вообще?

  • JC Denton

    Просто под столом. Под эту картинку можно столько всего интересного привести. Шедевральный фильм. ))

  • JC Denton

    В случае с такими статьями объем вообще значения не имеет. Читается на одном дыхании. Не стесняйтесь, Анна!

  • JC Denton

    По сути, учитывая продолжительность человеческой жизни, — это и есть практически нереально. А если еще принять тот факт, что последний 50 лет был дикий скачок скорости обработки информации — понимаешь, что все еще более грустно. Потому как дело то скорее всего не в скорости обработки информации, а в ошибке в фундаментальных теориях или в принципе неспособности придумать нужные алгоритмы на данном этапе развития человечества.

  • JC Denton

    Я всегда ржу, когда мне на работе сотрудницы рассказывают, как их детей в школе заставляют учить два иностранных языка. Обычно я на это отвечаю: «для начала родной язык бы выучили». Примерно из той же оперы.

  • JC Denton

    Ну да. Ведь часто получается нормальная исходная фраза. )))

  • Fish Owl

    Ну так вот есть персонажи, которые утверждают что язык оригинала понимают, даже книги сложные на нем читают, но при этом не могут написать даже простенькие фразы без ошибок, потому что знание языка у них «пассивное». Интересное мнение профи — возможно ли такое в принципе.

  • Boroda

    Мне кажется, даже очень старый промт получше будет. А вот стилус ужас, это да.

  • Anna Kiseleva

    Не соглашусь — разве что если назвать ошибкой в фундаментальных теориях просто их непроработанность.

    Помните, как Ньютон и Лейбниц изобрели интеграл, не зная пределов? И как потом матан развивался сверху вниз: от интегралов к пределам, потом к множествам и лишь потом к аксиоматике числа. Вот-вот.

  • inFamous

    Лучшая рубрика.

  • Anna Kiseleva

    Мы с вами в чем-то такие же… эээ… гуманитарии. Блин. Ну что такое. Было слово, означало специализацию, а теперь прям как оскорбление!

  • Anna Kiseleva

    Кстати надо бы рассказать еще и о парадоксе Моравека: чем труднее что-то осваивает человек, тем легче обучить этому машину…

  • Anna Kiseleva

    Не придирайсо, я вообще с телефона.

  • Anna Kiseleva

    Я сама такой была довольно долго, несмотря на профильное образование — когда переучивалась на английский. Для перевода НЕ требуется активное владение исходным языком. Требуется активное владение языком перевода плюс навык перевода как такового, т.е. «прочел — понял — рассказал своими словами». А владения исходным языком достаточно пассивного, но на очень высоком уровне.

    Не зря тесты, такие как IELTS или TOEFL, измеряют отдельно reading comprehension и отдельно умение говорить или писать на языке. И оценки бывают очень отличные друг от друга.

  • Anna Kiseleva

    Профи такое видел в зеркале.

  • Anna Kiseleva

    Кстати знаешь, что им в итоге все деньги отбило? Система снабжения войск. Они окупили все затраты на ИИ с начала времен уже за первую иракскую кампанию.

  • Ulris Ventis

    Да, это на самом деле так и выглядит. Когда продолжительное время не занимался никакими переводами до отдельной просьбы, то вернутся к этому сходу было затруднительно сразу, пока мозг привык к процессу. Вообще конечно мозг иначе в этом момент функционирует.
    Но зато с общением и восприятием никаких проблем в помине не было.

  • Anna Kiseleva

    А вот пишется…

    Кстати у меня странное чувство, что мы когда-то успели перейти на ты. Или путаю?

  • xcb zxv

    Скорее не развивался, а консолидировался. Существенный прогресс в науке редко происходит в том стиле, как принято его преподавать, от теорем к доказательствам, основную роль играет интуиция.

  • Flava Flav

    А как это связано с переводами? Система снабжения союзных войск в смысле?

  • Dima Trushin

    У меня двоюродная сестра — носитель двух языков. Но если на русском она и говорит, и понимает и все, что угодно делает, то на втором — только понимает, а говорить и писать не может. У ее матери, кстати, оба языка активные. И подобных примеров знаю много, даже когда люди — носители трех языков с разным уровнем «активности владения».
    Да, на самом деле не только у языков есть активное и пассивное владение. Например бывает активное или пассивное владение знаниями. Скажем, в науке часто бывает, что человеку можно объяснить сколь угодно сложные вещи, и он даже будет способен обучить им других, но сам никогда не сможет создать что-то серьезное.

  • Dima Trushin

    На самом деле не очевидно, что само понятие контекста необходимо. Скажем вероятностный подход вполне себе работает.

  • Dima Trushin

    Хотелось бы глянуть на полную версию текста, ну как мини DLC к статье. 🙂

  • Jekyll Grim Payne

    При всем обилии возможностей Традоса, на данный момент Memsource мне представляется значительно более перспективным проектом. Он легкий, может работать в облаке, имеет абсолютно прозрачный интерфейс и функционал (Традос же чудовищно громоздкий, и куча вещей в нем сделана неудобно), плюс Memsource представляет собой целую облачную экосистему, где воедино объединено создание проектов, выдача заданий, работа переводчика, работа редактора, и все это с возможностью бесшовно переходить с устройства на устройство, без необходимости волноваться о том, что можно потерять файл, что что-то где-то могло не сохраниться, с легким подключением любых ТМ и ТБ в два щелчка. И стоит это все копейки (хотя Традос даже официальная служба поддержки периодически рекомендует тянуть с торрентов). И клиент почти ничего не весит.
    Но, конечно, иногда приходится следовать чужим требованиям 🙂 Если жестко стоят вопросы секьюрности, с облаком могут работать не дать, например.

  • Jekyll Grim Payne

    Я могу сказать, что немало переводчиков, с которыми мне приходилось работать, довольно плохо, например, говорят и пишут на иностранном языке, хотя переводят при этом хорошо. Именно поэтому в характеристике переводчика должно всегда фигурировать направление перевода, и оно, может, например, быть Ru-En, а En-Ru не быть. Скажем, если студия занимается переводами и с отечественного языка на иностранные, то такими заданиями будут заниматься только те сотрудники, которые прошли тест на способность переводить на иностранный. То есть, это два разных навыка.

  • Fish Owl

    Я конечно на английском изъясняюсь не так быстро и свободно, как на русском. И без проверки граматики в ворде ошибок больше наделаю. Но вот это вот пассивное владение а-ля «все понимаю, сказать не могу» всегда было тайной за семью печатями.

  • Fish Owl

    ну то есть не могли общаться даже на форумах про игрушки, например?

  • Anonymous Incognito

    Это вопрос экономики.
    По сути, что нам надо? Нам необходима алгоритмизация языка. Кто этим будет заниматься? Никто.
    То есть ок, гугл. Но ему потребуется делать это для каждого языка и очевидно желания у него нет. В остальном нам нужен бизнес план, кто в конечном итоге будет платить.

  • Windigo

    Да что тут тайного? Запас слов + восприятие контекста = всё понимаю. А незнание правил = сказать не могу.

  • JC Denton

    Работает, но часто не так как надо.

  • JC Denton

    Нет, не успели. Видимо Вы не застали холивар по поводу обращения в интернете — особенно в местечковых сайтах. Если обидел, прошу прощения и откланиваюсь.

  • JC Denton

    Так все-таки на «ты»? Я не против. 😉

  • JC Denton

    Ну все верно. Если у них именно понимание языка не уровне образов — то так может быть. Только переводу это никак не поможет, пока не будет технологии скачать образ из его мозга напрямую. Русский язык же понимают практически все Россияне. Фильмы смотрят, музыку слушают. А как писать начинают — так за голову взять можно… Также и с иностранным. Поэтому все и смеются над любителями субтитров, когда такой любитель вообще язык не знает. Это уже обратная ситуация. Ведь человек этот не воспринимает ни игру слов, ни эмоции — он тупо перекладывает на речь персонажа русские слова. По хорошему субтитры годы просто на ходу словарный запас слегка незаполненный подкорректировать.

  • Myacutka

    >рецензию на индю, в которую играет только рецензент
    Куда лучше стримить блокбастер, в который не играет только твоя бабуля(и только потому что парализована).
    Сразу видно приоритеты, кому нужны эти игры? Главное — кто будет стримить.

  • Myacutka

    Да это же… гугл транслейт оффлайн версия! Немыслимое!

  • LinDze

    Интересно, спасибо.
    Машинный перевод в гражданской сфере будет ценен до тех пор, пока пока люди будут отдавать ему предпочтение независимо от каких-либо других факторов

  • Anna Kiseleva

    Да нет, я вас значит спутала с кем-то из виртуальных знакомых по аг.ру. Что же до холивара — и слава богу, что не застала…

  • Anna Kiseleva

    Мемсорс сырой af. Я пыталась добиться у поддержки, где у них регулярные выражения в поиске-замене, получила шикарный ответ: «В планах развития». Прописывание и распознавание тегов похоже на УГ, в экселе установленный флажок «распознавать HTML» означает запрет на другие методы парсинга, клиентский редактор иногда не докоммичивает и надо принудительно делать Upload (о чем нигде не сказано)… И нет подсветки случая, когда текст в ячейке отличается от текста в ТМ. Сейчас Мемсорс — сырой облачный вариант Memoq.

  • Anna Kiseleva

    В моем случае — было много чтения, много переводов и абсолютно не с кем поговорить. Я потом нанимала репетитора, чтобы «разговориться», и он офигевал от моего словарного запаса.

  • Anna Kiseleva

    Я тем более не против!

  • Anna Kiseleva

    Создание качественного машинного переводчика равносильно созданию полноценного ИИ. Тематика исследований пересекалась столько раз, что это стало чуть не общим местом.

  • mplain

    >> Положение спасла я
    >> Оказывается, я «сказала», что машинный перевод никогда не заменит человека. Неожиданно.

    Чот как-то мелочно… не проникся уважением к автору с первый строк…

  • Anna Kiseleva

    А есть случаи, когда ему нет альтернативы. Это чаты, лоты на аукционе и прочие ситуации, когда через минуту текст станет неактуален.

  • Appleman

    Имхо, словарный запас — это «мясо», которое нарастает или усыхает в зависимости от объёма языковой практики, любой. А вот «кости» — это грамматика языка.

  • Anna Kiseleva

    эээ… шо, правда?

  • Anna Kiseleva

    Алгоритмизация языка — подход RBMT-движков, и он себя исчерпал еще до зимы ИИ. Сейчас более перспективен гибридный подход: RBMT + SMT (статистический МП), да если еще и нейронную сеть с этими правилами и статистикой поставить в Интернет обучаться…

  • lek.sys

    Познавательно, спасибо автору.
    Есть вопрос один, для тех кто в теме. Проводились ли вообще какие-нибудь тестирования систем машинных переводов? Чтобы с полноценным разбором полученных результатов, выставлением оценок и т.п. Что сейчас наиболее актуально: Google, Промт, может что-то еще?

  • Minamikaze

    Для перевода критично важно только владение тем языком, на который переводишь. Всё остальное приложится.

  • Pavel Nikolenko

    http://cs.pikabu.ru/images/big_size_comm/2013-09_1/13782259788932.jpg

  • Minamikaze

    Кстати, по поводу машинных переводов. Иногда по долгу службы приходится использовать их, когда в документе на английском внезапно всплывают небольшие фрагменты на других языках (или когда документ изначально переводной и в качестве перевода я сомневаюсь). Так вот интересно, что, скажем, с итальянского или немецкого (который я в принципе знаю, но для эксперимента пару раз тоже пробовал) Гугл вполне пристойно переводит на английский. Само собой, тексты не художественные, в основном договора и отчётность – но с переводом на русский (который явно до сих пор делается через английский) не сравнить. Иногда и не поймёшь, человек это был или машина. Так что в канцелярских документах прогресс точно есть.

  • Fish Owl

    странно то, что хотя бы парафразами вырванными из запомнившихся произведений общаться вполне можно.

  • Haksaw

    Ничего хорошего из этого не выйдет — от интернета и люди тупеют, а ИИ так и подавно =)

  • LinDze

    просто плохо обозначил границы, отделавшись «гражданской сферой».
    это ведь часть будущего которым людей пугают, то есть вариант с повальной роботизацией: если перевести абсолютно всё на роботов, то попросту некому будет покупать товары и возникает резонный вопрос «для кого это всё?» и т.д.

  • Anonymous Incognito

    А что, ИИ у нас уже в зиме?

    Вообще, я бы решал эту задачу хотя бы на уровне ворда с его проверкой орфографии. Мне кажется попытка сделать универсальный переводчик на пару порядков сложнее, чем подготовить базу для «решения» простейших конструкций. А там, где машина сталкивается с непреодолимыми трудностями просто подчеркнуть красным для живого редактора.

    Разумеется статистический анализ и нейронные сети выглядят очень перспективным делом, но и гораздо более сложным. Поскольку это уже практически обучение робота языку. Хотя было бы забавно давать текст абзацами (а не отдельными предложениями), и, чем черт не шутит, заставить его еще и со стилями управляться.

    Кстати тут забавная проблема у машины, про которую я сразу не подумал. Человек-переводчик уже в совершенстве (ну… в сравнении с машиной уж точно) владеет родным языком. Тут вот в соседней ветке интересный подход к теме, когда ты владеешь русским, понимаешь иностранный, но недостаточно, чтобы на нем писать.
    С этой точки зрения, «тривиальная» задача сделать перевод/алгоритмы-фигитмы на самом деле оказывается задачей «написать текст на заданную тему», что несколько снижает мой энтузиазм.

  • Иван Ефимов

    Вообще да. Если подумать, то и в книгах часть текста может опираться на предыдущие события, таким образом меняя контекст.

  • inFamous

    Вне конкуренции.

  • Myacutka

    Такую статью можно и на гиктаймс. Во!

  • Dima Trushin

    Человек тоже как попало переводит часто. Проверено на детях.

  • laennium

    Первой картинке уже много лет, вторую вот только нашел

    https://uploads.disquscdn.com/images/9afd732cc27bd1a70c408984907ff524e7a6d36f0ba6a78a8da3b09caec14474.jpg

    https://uploads.disquscdn.com/images/329c52f0ded88a2866d5f3f8182ac03910f13771e838097c6b49ad979736f9ce.jpg

  • Dima Trushin

    Это значит, что у тебя восприятие и воспроизведение языка тренировались одинаково, что логично, если ты получил знания на уроках школы, университета, и тд вне языковой среды (ну или уровень владения такой низкий, что ты не видишь разницы). Если же ты внезапно начнешь жить среди носителей, то пассивный навык будет развиваться крайне стремительно по сравнению с активным (который может вообще не развиваться) и ты через пару лет будешь как умная собака — понимаешь, а сказать не можешь.
    Если интересно, то одна из основных причин такой разницы — ты не знаешь нужного языкового шаблона для выражения мысли. Скажем, если прочитаешь что-то по-английски, то перевести не проблема, ибо все необходимые конструкции языка мозг выдает автоматом. А на чужой язык так не получится, так как ты точно не уверен в конструкции. Можешь потестить себя на переводе фраз вроде «хочу, чтобы ты спел», «смеркалось», «известно, что это правда» и т.д. А потом открой текст английской книжки (скажем Алиса в стране чудес в оригинале) и начни переводить. Сразу увидишь, что фразы, которые ты не мог перевести на английский, будут возникать при переводе на русский. Казалось бы, ты же не мог перевести их в ту сторону, а обратно получилось.

  • Wolf_Plague

    Пессимисты преувеличивают сложности машинного перевода. Вот, например, вполне приемлемый результат.

    https://www.youtube.com/watch?v=vWyEkp9-9OA

  • Ulris Ventis

    Это отстой, а не результат, который невозможно использовать. И любая попытка на данный момент машине доверить перевод смысла текста на другой язык — пока что обречена на провал. И это пока речь идет про самый примитивный разговорный диалог как в твоем примере.

  • Wolf_Plague

    Это было толстое петросянство, обожемой…

    Если говорить о серьезно впечатляющем результате работы машины с языком и пониманием контекста разговора, то лучше SHRDLU я еще не видел:

    https://en.wikipedia.org/wiki/SHRDLU#Excerpt

  • mad_yojik

    Ну в книге — теоретически можно залить всю «стену текста» в переводчик, а с видео такого даже в теории не сделаешь.

  • Тимур

    Она а) авторская, б) на крайне живую и знакомую каждому игроку тему, в) написана грамотным и интересным человеком. РП пока не смогла придумать рубрики лучше, увы. Точнее было что-то, но разово и заглохло, а тут уже полгода вроде читаем или даже больше.

  • Тимур

    Кстати да, мне всегда казалось особенным извращением стримить то, во что все поиграют — ну кто это будет смотреть? Наверное те, кому вообще пофиг на что стрим смотреть. Остальные в это время играть будут.

  • Ulris Ventis

    фу-х, ну слава богу.) Нынче не поймешь.

  • Ivan Red

    Анна, спасибо за статью. Как всегда, крайне интересно.

  • JC Denton

    Дети вообще много чего делают как попало. Им просто гулять хочется. И играться. )))

  • Reitzteil

    Это для вас не оправдание. 🙁

  • Anna Kiseleva

    Вы мне щас всю вторую часть перескажете, а публиковать я что буду, а?

  • Anna Kiseleva

    Если бы. У нас носителей русского языка целый вокзал бомжей, почему-то я им не буду давать переводы.

    Еще нужен навык перевода все-таки и пассивное владение исходным языком на том уровне, на котором он используется в тексте. А то пишут мне тут:
    You got some motherfuckin’ nerve. — Ты какой-то, мать твою, нервный.

  • Anna Kiseleva

    Есть организация TAUS которая только этим и занимается. Там очень многое зависит от настроек движка и словаря, не только от используемого алгоритма.

  • Anna Kiseleva

    Я таки надеюсь, что ты не в мой адрес 🙂

  • Anna Kiseleva

    Там очень многое зависит от языковой пары — не разбиралась почему, но там и сходство/несходство грамматики играет рояля, и наполненность корпуса текстов.

  • Anna Kiseleva

    Там такая гора заметок в Evernote, что хватит и еще на один рассказ 🙂

  • Anna Kiseleva

    Может, и опять в зиме, по крайней мере Бостром и Армстронг пишут, что манера избегать упоминаний об ИИ в заявках на гранты до сих пор сохраняется.

  • Pavel Nikolenko

    😀 И в мыслях не было! Просто я хотел проиллюстрировать знаменитым «ПОТРАЧЕНО», но опоздал. Поэтому вот.

  • Minamikaze

    Однако же этому можно научить. А вот если человек тупо своим собственным языком не владеет – а такое я встречаю сплошь и рядом – то учи его переводить, не учи, а на выходе один фиг будет что-то совершенно невразумительное: ошибки орфографические, синтаксические, да просто логические, наконец. В особо тяжёлом и запущенном случае на выходе можно такую шизофазию получить, что лучше бы машина переводила. Само собой, под владением я подразумеваю всё же нечто большее, чем трёп на бытовом уровне. Можно быть носителем языка, но при этом совершенно им не владеть.

  • Minamikaze

    Да, само собой. Но немецкий>английский (благо я знаю оба, есть возможность проверить) в текстах моей специфики получается действительно неплохо. Итальянский>английский я в полной мере могу оценить только на выходе, но его иногда даже править не нужно – машина даже соблюдает правильную грамматическую структуру английского, которая отличается и в итальянском, и в немецком. Плюс у меня серьёзное подозрение, что тексты, которые я получаю от заказчиков, связанных с Италией, именно там на английский и переводятся, после чего уже я их получаю.

  • Windigo

    Ну если адово ломаный язык считать «общаться можно», то да.
    Я со стыдом вспоминаю как сам проходил период «всё понимаю, сказать не могу» и то какую откровенную херню выдавал при попытках что-то сказать.
    Плюс вспомнить перевод иностранного слова на родной гораздо проще, чем с родного на непонятный.

  • Gudini

    Достаточно изобрести Искусственный интеллект как в фантастических фильмах.
    Тогда сотни профессий станут ненужны-)

  • Anna Kiseleva

    Вот да. Про «удручающе низкое владение родным языком» я уже писала. Хоть все бросай и иди в школу преподавать литературу. Потому что у меня такие мысли реально бывают…

  • Anna Kiseleva

    (с ужасом) включая профессию человека…

  • Minamikaze

    И литературу, и русский. Охотно бы преподавал, благо диплом соответствующий есть. Только по нашим современным программам преподавать эти предметы бессмысленно, а отходить от программы можно на 5%…

  • Anna Kiseleva

    Как для кого, для сайлонов конечно 🙂

  • Santjago

    То необычное ощущение, когда лайкнуть хочется и саму статью, и три четверти комментариев под ней.

  • Nekto

    В том и суть, специализацию оно не обозначало. Пеша про себя любимого «гуманитарий»- всегда хочется добавить пару абзацев, что же это (понятие) всё таки означает. Широкое, красивое, весомое. Но специализацию, увы и ах- не означает. Вот и скатилось до оскорбления… обозначающее: жидкого, не делающего конкретно ничего, балабола; много мнящего о себе. Очень сгущая краски, конечно. Однако, часто именно так и воспринимают(

    Историк/преподаватель истории; давно не работающий по специальности; со школы не ладящий с пунктуацией.

    P.S. И ещё раз спасибо за рубрику. ждем.

  • Wei

    И не потому что единственная!

  • Выдумщик

    правда, продолжайте, пожалуйста.

  • Eugeny Sivakoff

    Роскошно!

  • Jekyll Grim Payne

    Ну, с тегами, как по мне, справляется он весьма успешно, я никаких проблем с этим не увидел. Аплоад действительно надо иногда делать, но это куда меньшая проблема, чем редактор, где можно что-то потерять, не сохраняя постоянно изменения вручную (при этом локально все сохраняется автоматически). Про подсветку не понял — если найден не-перфект мэтч с ТМ, то отличающиеся слова сегмента будут как раз подсвечены в колонке CAT. Или речь о чем-то другом?
    Про бедный поиск — это да, тут полностью согласен. Я им тоже написал несколько предложений, но пока ничего не движется. Однако его простота и комплексность для меня обычно перевешивают неудобства. Но для конкретных задач действительно могут лучше подойти другие инструменты.

  • Transhobbit

    Начинала в «Фаргусе» переводчиком Planescape: Torment. Помнит кто этот перевод? Я бы такого портфолио постыдился.

  • no account

    Там, скорее, проблема не подобрать фразу (в конце концов можно ведь забить распространённые выражения), а определить контекст текста: тупо из головы «They were red» — «Они были красными (цвет)», «Они были рыжими (волосы)», «Они были Красными (коммунистами)», либо вообще что-то совсем странное (Наверняка я в примере где-то скосячил — он просто для иллюстрации).

    А анекдот, что кошка родила 3 рыжих котят и одного афроамериканца, уже по-моему хрестоматийный.

  • Fish Owl

    не помню уже как именно я изъяснялся в 01 году на английском и насколько это ломано было, но вполне хватало чтобы состоять в буржуйском клане по Mechcommander и даже изображать там из себя в взрослого мужика (самому на тот момент было 13 где-то)

  • LinDze

    Каприка будет с вами не согласна!
    Да и стоит ли городить огород ежели сайлоны захотят стать людьми и всё начнётся сначала?

  • Dima Trushin

    Мне season pass на всю серию, пожалуйста.

  • Avery

    Если задача изначально слабо поддается формализации (машинный перевод «в лоб» слово-в-слово в данном случае «неправильная» формализация), то и задача программистов усложняется до уровня очень тяжело решаемой.

    Даже если предположить, что к переводу слов добавить энное число «зашитых» в программу переводов фразеологизмов, поговорок и иже с ними, охинея все равно полезет. Даже если ранжировать приоритеты выбора перевода фразы на основе статистического анализа больших объемов данных, это не будет панацеей.

    И как правильно замечено в статье, научный текст, который изначально более формализован, чем гетто-сленг из ГТА и даже просто художественной литературы, имеет более высокое качество машинного перевода.

  • Anna Kiseleva

    Так они в итоге и уперлись в то, что лингвистика оказалась слабо поддающейся формализации. Человеческие языки ведь даже не всегда контекстно-зависимые.

  • Anna Kiseleva

    Если после перфект-мэтча текст меняли, отметка 100% все равно никуда не девается. Неудобно жутко, когда в файле плясало два переводчика и каждый тянул в свое, а мне потом редактировать.

  • Anna Kiseleva

    All this has happened before, and all this will happen again — да-да, сайлоны на Земле успели забыть, что они сайлоны 🙂

  • Семен Семеныч

    «Положение спасла я»
    дальше не читал

  • Devire

    И то правильно. Много букофф-то, зачем себя напрягать.

  • Семен Семеныч

    автор спасла мир, вот и замечательно. а буквы дело десятое.

  • Trrz

    я жопоголик, мне нужен жопоголь

  • LinDze

    есть ещё хороший рассказ на данную тематику — For a Breath I Tarry и игра, которая пусть и не дотягивает и не развивает идеи, но несколько схожа по духу с данным рассказом — Механоиды.

  • Lorgun

    Анна, спасибо за статью. Как всегда великолепно, увлекательно и познавательно.
    С нетерпением ждем продолжения ^__^

  • Lorgun

    https://uploads.disquscdn.com/images/a6e05d7126a788666608e0c944377f83963d53b39e9f45348c589f00b37455d4.jpg

  • Lorgun

    https://uploads.disquscdn.com/images/76b9bc08dbb6efd6f4807babc3bf9318e3d6e193dce0d7244b6f0b2521833ded.jpg

  • Aldur

    А о переводе чего речь прозаического или поэтического текста ? Если в первом случае переводчик протискивается в узкие рамки установленные самим автором то во втором может иметь честь и наглость разделить с ним славу в соавторстве, подумайте и решите сможет ли программа заменить собой, и сможет ли тягаться с лучшими переводами Бориса Пастернака .

  • default blank

    Тема крайне интересная. На мой взгляд.

    Для того чтобы создать грамотный перевод, необоходимо построить систему которая будет взаимоотносить исключимости смыслов. Так, (например) в некоторых статьях по мат. лингвистике, (которые я читал) язык описывается так: чистый язык — язык в котором ни одно слово нельзя выразить через другое (кроме случаев его наличия или отсутствия), грязный язык — деградирующий язык в котором слова возможно выразить через другие. Деградацию языка возможно описать математически и формализация деградативности языка не так сложна. Проблема стоит в формализации чистого языка вследствии того что его возможности шире нежли возможности компьютера. Просто так отсутствие всех слов не найдешь. Его можно искать через взаимоотношение различных структур языка — букв (звуков), слов, абзацев, предложений. Можно пробовать, как предлагал в свое время Лейбниц, воспринимать язык структурально, то есть как сочетание смыслов, филосовских концепций, настроений и логик, формирующихся как на «руническом» уровне так и на уровнях фразы, абзаца, текста. Иным словом, нам достаточно создать некоторые структурные (возможно плавно-переменные в мере их незаконченности) шаблоны и методы их многоуровневой языковой интерпретации, выбирающей наиболее мягко (или немягко (если требуется, возможны любые критерии)) близкие по соответствию на всех уровнях структурирования тексты из спектра всех предлагаемых комбинаций.

    То есть, условно говоря, текст будет переводится на некий структурный язык, а из него уже на другие. Но проблема состоит в том что для подобного перевода необходима машина (или метод) вмещения которая будет столь же широка сколь все смысловые концепции передаваемые через язык.

    А онлайн нейросети действительно интересны. В конце концов почему человеку не работать мерилом того что ему нужно, а машине быть всего лишь «мягким пластилином». 🙂

  • default blank

    Тема крайне интересная. На мой взгляд.

    Для того чтобы создать грамотный перевод, необоходимо построить систему которая будет взаимоотносить исключимости смыслов. Так (например) в некоторых статьях по мат. лингвистике (которые я читал) язык описывается так: чистый язык — язык в котором ни одно слово нельзя выразить через другое (кроме случаев его наличия или отсутствия), грязный язык — деградирующий язык в котором слова возможно выразить через другие. Деградацию языка возможно описать математически и формализация деградативности языка не так сложна. Проблема стоит в формализации чистого языка, вследствии того что его возможности шире нежли возможности компьютера. Просто так отсутствие всех слов не найдешь. Его можно искать через взаимоотношение различных структур языка — букв (звуков), слов, абзацев, предложений. Можно пробовать, как предлагал в свое время Лейбниц, воспринимать язык структурально, то есть как сочетание смыслов, филосовских концепций, настроений и логик, формирующихся как на «руническом» уровне так и на уровнях фразы, абзаца, текста. Иным словом, нам достаточно создать некоторые структурные (возможно плавно-переменные в мере их незаконченности) шаблоны и методы их многоуровневой языковой интерпретации, выбирающей наиболее мягко (или немягко (если требуется, возможны любые критерии)) близкие по соответствию на всех уровнях структурирования тексты из спектра всех предлагаемых комбинаций.

    То есть, условно говоря, текст будет переводится на некий структурный язык, а из него уже на другие. Но проблема состоит в том что для подобного перевода необходима машина (или метод) вмещения которая будет столь же широка сколь все смысловые концепции передаваемые через язык.

    А онлайн нейросети действительно интересны. В конце концов, почему человеку не работать мерилом того что ему нужно, а машине быть всего лишь «мягким пластилином». 🙂

  • MaxP

    Хрень пишете, Семэн семэныч. Читать научитесь.

  • Семен Семеныч

    ты автор статьи? нет. ты понял о чем комментарий? нет. ты сказал что-то по сути? нет. научись не лезть в чужой разговор.

  • MaxP

    А Анна в курсе, что Вы с ней разговор ведёте?

    Хотя… Как я мог не догадаться? Вы про разговор с самым умным и приятным человек — с собой?

    «нет. ты сказал что-то по сути?»
    Нет, но Вы! Высказанная Вами суть раскалённым языком пламени вырывается из чрева истины, о да!

    P.S. Прошу простить мою прямоту и фамильярное обращение к Вам на Вы. Ваши предложения с точками, но без заглавных букв выдают в Вас чувствительную натуру с изысканными манерами.

  • izn

    эх, вот бы булетшторм перевести знатно

  • izn

    ахаххаха, это невозможно! Из-за многообразия переводов одного и того же слова и контекста. В том же гугле переводишь в одну сторону потом в другую и получаешь бред

  • zakonnic

    > Иерархия Хомского положила начало идее алгоритмических языков и сейчас известна каждому программисту.
    Каждый программист негодует когда говорят, что что-то известно каждому программисту.

    Оххх-хо, как обычно, о статьях Анны неоднозначные впечатления. Узнаваемая манера, суждения, поданные как факты, вики-стайл. Но тема интересная, да.
    Вообще, сейчас в нейросетях и машинном обучении происходит бум, это хорошо заметно на распознавании изображений (самое веселое думаю многие уже попробовали — https://quickdraw.withgoogle.com). Думаю до лингвистики тоже дело дойдет.

  • Anna Kiseleva

    Знаете, мне вдвойне приятно, когда человек меня критикует настолько аккуратно и деловито, как вы. Постараюсь учесть насчет «каждому программисту», а насчет остального хотелось бы увидеть примеры: судя по всему, я делаю одни и те же ошибки, не замечая их.
    (ну и почему узнаваемая манера — это плохо?)

  • zakonnic

    Вы меня ставите в трудное положение. В этом суть, да?)

    Я конечно не могу назвать авторскую манеру ошибкой, все пишут как пишется, но кое-что резануло глаз. Во-первых оценочные высказывания про каких-то людей. Даже если не напрямую, то они подразумеваются. Обвинять — плохо, агрессия — плохо, «еще один гуманитарий» — вообще как ругательство. А вот спасать положение — хорошо. Получается немного сплетен в духе «ну мы то с вами понимаем», немного саморекламы. Меня этим не испугать, но вон кто-то «дальше не читал» — потеряли целого читателя!

    Во-вторых спорные суждения. Не хочу искать, просто помню что ощущение внутреннего несогласия мелькало в том числе и в предыдущих статьях. С Хомским самое яркое — это глубоко теоретические знания, и я например только заглянув в википедию вспомнил, что 10 лет назад писал интерпретатор для КС-грамматик. Аж отлегло) Это не говоря о сомнениях в причастности этой теории к созданию первых языков, которые вырастали из практических задач…
    Тем не менее, тут ни к чему не призываю. Статью можно запросто испортить, пытаясь сделать «политкорректной» или угодить читателю.

    Ну и про вики-стайл, хотелось бы видеть больше авторского мнения, анализа, каких-то оценок от вас именно по теме (а не про неизвестных нам людей). Вторая часть в этом смысле лучше, но тоже местами походит на техническую статью.

    Вот такие мысли, если говорить о критике. С новым годом)