Коронавирус в България и по света
Коронавирус в България и по света
С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK
19 15 юли 2011, 15:20, 6916 прочитания

The horse went into the river*

Онлайн инструментите за превод на текстове имат амбицията да изместят човешкия фактор. Засега обаче това е по-скоро пожелание

  • LinkedIn
  • Twitter
  • Email
  • Качествената журналистика е въпрос на принципи, професионализъм, но и средства. Ако искате да подкрепите стандартите на "Капитал", може да го направите тук. Благодарим.

    Дарение
    Плащането се осъществява чрез ePay.bg
"Неизвестният летящ обект лети в небесата, то можеше да бъде магия?"
Тази крилата фраза се роди покрай последния клип на Take Тhat Kidz, а произходът й очевидно не е български. Всъщност това е текст, преведен с някой от многобройните онлайн инструменти, налични в интернет - например Google Translate, Bing Translator или тяхна сродна услуга. И докато в началото на съществуването си тези помощници в междуезичната комуникацията допускаха много по-глупави грешки, то сега те еволюират рязко. В момента дори имат амбицията да изместят човешкия фактор при превода на текстове. Това поне засега е по-скоро в сферата на добрите пожелания, отколкото на реалността, поне що се касае до превода на по-сложни и специализирани текстове, но напредъкът е очевиден.

Въпреки смешните грешки, които допускат, броят на този тип услуги се увеличава, а съвсем наскоро на пазара се появи и още една, в която има и българско участие - iTranslate4. В разработката на проекта, тръгнал от унгарската компания "Морфолоджик", участва и българската фирма "Скайкод". Тя заедно с консорциум от общо 9 европейски компании започват да работят по създаването на единна европейска търсачка. Финансирането на проекта е 2 млн. евро, 50% от които са осигурени от Брюксел. Сумата трябва да стигне за съществуването на сайта до март 2012 г. След това обаче предстои стартирането на бизнес частта му, свързан с предлагането на услуги за превод от и на над 40 езика, който ще е осигурен от различни преводачески агенции в рамките на Европа.


Технологията

Предимството на iTranslate4 пред останалите му конкуренти е фактът, че онлайн инструментът за машинен превод агрегира резултати и на други негови конкуренти (например Google Translate), като същевременно развива и своя собствена технология. Всъщност в момента онлайн услугите за търсене залагат на два различни метода за адаптирането на текст между различни езици - статистически и rule-based model (или синтактичен). Разликата между двете технологии е на концептуално ниво, а логично и двата си имат и предимства, и недостатъци.

При статистическия машинен превод (използван от Google Translate) се използват масиви от текстове, преведени от хора на два различни езика - например от заседанията на канадския парламент, които се водят едновременно на френски и английски език. Осъществяването на самия превод става чрез анализ на различните думи, фрази и словосъчетания от страна на "машината", която намира най-близките им съответствия в съответните текстови масиви и ги превежда на база наличната информация. При т.нар. rule-based модел машината прави същото, което и човекът преводач - започва със синтактичен анализ на изречението и открива различните му компоненти като подлог, глагол и т.н. и впоследствие ги превежда. И докато при първия модел проблемът е, че софтуерът невинаги успява да уцели точната фраза за превод, то при втория "машината" може и да не налучка правилното значение на думата на база контекста на изречението.



Машинните преводи имат и още една особеност - преводът на текст не е директен. Тоест, ако искате да преведете от български на полски, адаптацията на текста не се осъществява директно между двата езика, а минава едно междинно ниво, което в най-честия случай е английски. Това допълнително носи затруднения и е предпоставка за допускане на грешки първо при превода от български на английски, а впоследствие - и при превода от английски на полски (както е в посочения пример). Така само Google Translate работи с над 2500 езикови двойки, тъй като търсачката поддържа превод от и на 58 различни езика.

Конкуренцията не спи

И докато проектът на лидера в онлайн търсенето вече се справя доста прилично и с преводите на не толкова разпространени езици като българския, то отговорът на конкуренцията в лицето на Брюксел не закъсня. Така в интернет се появи iTranslate4, който предлага машинен превод на всички европейски езици. Ако трябва да сме точни - на официалните езици на ЕС, както и на още 9 езика от Европа и 10 от целия свят (арабски, китайски, иврит, хинди и др.). И освен че предоставя собствен алгоритъм за търсене, сайтът сравнява преводите и с други машини за търсене. Така той позволява на потребителите да се ориентират сами в това коя от всички адаптации на съответния текст е най-вярна.

"Проектът започна официално през март миналата година и ще продължи до март 2012 г.", разказва Лъчезар Джеков от "Скайкод", координатор на проекта от българска страна. Всичко тръгва от Унгария, където е централизирано управлението на iTranslate4, водено от Института за лингвистични изследвания към Унгарската академия на науките. Другите компании, включили се в разработването на инструмента за машинен превод, са словенската "Амебис", германските "Лигуатек" и ПРОМТ, френската "Систран" и т.н. Целта е да се създаде реална алтернатива на съществуващите в момента подобни инструменти, която да залага и на социален елемент - потребителите могат да оценяват всеки превод и да добавят по-подходящ, с което да помагат при адаптацията за следващите потребители.

"Технологията на машинния превод има доста да еволюира, докато стигне ниво, при което поне частично да може да се отмени човешката намеса", разказва Джеков. Въпреки това дори и наличните в момента инструменти са достатъчни, за да се постигне добро ниво на превод, стига потребителят да иска просто да разбере смисъла на написаното, без да влиза в детайли. Именно това е и идеята на iTranslate4. Сайтът обаче разчита и на свой бизнес модел, който ще помага на потребителите, които искат да влязат в тези детайли, но нямат достатъчно познания по съответния език.

"В момента работим по бизнес страната на iTranslate4, като целта ни е да предлагаме професионален превод от преводачески агенции в целия ЕС", обяснява Джеков. Планът трябва да е готов до няколко седмици, за да започне реализацията му. Идеята е сайтът да генерира достатъчно приходи до март 2012 г., за да се самоиздържа.  Все още не е ясно обаче колко точно ще струва издръжката на iTranslate4, както и дали ще успее да се справи със задачата да оцелее само на базата поръчки на преводи през платформата.

А що се касае до технологията на машинния превод - пред нея предстоят интересни дни, които според Джеков най-вероятно ще доведат до създаването на хибриден модел. Той ще съчетава както статистическия, така и синтактичния метод - т.е. компютърът наистина ще се стреми да мисли като човек, когато адаптира текстове. И тогава няма да се опитва да търси запаметена в огромна база данни текстове фраза, нито ще се опитва да налучка кое значение на думата трябва да използва.

------
*Шеговит буквален превод на поговорката "Уйде коньо у реката"
  • Facebook
  • Twitter
  • Зарче
  • Email
  • Ако този материал Ви е харесал или желаете да изразите съпричастност с конкретната тема или кауза, можете да ни подкрепите с малко финансово дарение.

    Дарение
    Плащането се осъществява чрез ePay.bg
Етикети: Google ЕС интернет

Прочетете и това

Коронавирусът - най-важните въпроси и отговори 18 Коронавирусът - най-важните въпроси и отговори

Основните факти, които трябва да се знаят за глобалната пандемия

27 мар 2020, 40466 прочитания

Слънце за 3D принтерите Слънце за 3D принтерите

Кризата с коронавируса най-накрая даде истинска цел на триизмерното принтиране

27 мар 2020, 1044 прочитания

24 часа 7 дни
 
Капитал

Абонирайте се и получавате повече

Капитал
  • Допълнителни издания
  • Остъпки за участие в събития
  • Ваучер за реклама
Още от "Технологии" Затваряне
DIGITAL|K измина 30 пъти разстоянието до Луната

Next-DC и Komfo създават онлайн игри в подкрепа на събитието на "Капитал" за влиянието на цифровите технологии

Още от Капитал
Корпоративни карти за 3.5 млн. евро

Българската стартираща компания Payhawk привлече нова инвестиция за 3 млн. евро и общо досега е получила 3.5 млн. евро.

Режим домашен офис или какво разказват хората за живота в епидемия из Европа

Няколко души споделиха пред "Капитал" какъв е новият ритъм на живот в Испания, Англия, Австрия, Германия и Франция и какви са техните опасения за бъдещето

Битката за икономиката също е битка за живот

Какво предприемат държавите в Европа и какво може да направи България

За маската на един лекар

Българската здравна система посреща най-сериозното си изпитание през последните десетилетия в недобра форма

В началото бе поп културата

"Пророческите" филми, книги и песни, които помагат на света да осмисли случващото се

Моне за всеки ден

Изложба преживяване в ново пространство за дигитални арт събития в Барселона ни потапя във вселената на Клод Моне

X Остават ви 0 свободни статии
0 / 10