Намерени в превода
Абонирайте се за Капитал

Всеки петък икономически анализ и коментар на текущите събития от седмицата.
Съдържанието е организирано в три области, за които Капитал е полезен:

K1 Средата (политическа, макроикономическа регулаторна правна)
K2 Бизнесът (пазари, продукти, конкуренция, мениджмънт)
K3 Моят капитал (лични финанси, свободно време, образование, извън бизнеса).

Абонирайте се за Капитал

Намерени в превода

Намерени в превода

Пътят на логиката при използването на чужд език

11363 прочитания

© Надежда Чипева


Горещ летен ден е, а Данаил Пенев (18 г.) и Тина Владимирова (16 г.) превеждат от езика улва, използван от индианците в Никарагуа. Никой от тях двамата не говори улва, но са им дадени няколко преведени думи – suulu, suukilu, suumanalu, mismatu, miskatu, лък, котката ти, кучето ми, лъкът ни, котката му, за да намерят коя на коя съответства. Двете деца трябва разберат логическите връзки между думите, за да успеят да си служат с напълно непознатия език.

Именно това е и целта на математическата лингвистика – да изобрази явленията в естествените езици с методите на математиката. А крайната цел – програми за машинен превод, гласови асистенти, проверка на правопис и граматика и др. Тази година Международната олимпиада по компютърна лингвистика се провежда в Благоевград.

От 20 до 24 юли у нас ще дойдат ученици от тридесет държави от цял свят. Състезанието се провежда за трети път в България и може би една от причините е, че сме водещи в тази област – на трето място след Русия и САЩ. Българските ученици досега са вземали 10 златни, 11 сребърни и 17 бронзови медала. Националните ни отбори са два – по четирима души в отбор, а най-малкият участник е в осми клас. Форматът на олимпиадата е пет задачи за шест часа.

"Освен че развиват логическото си мислене, участниците в международните олимпиади и медалистите получават повече шансове за приемане в престижни университети по цял свят", казва Александър Велинов, ръководител на българския национален отбор. А у нас винаги е имало традиция на математическа лингвистика "благодарение и на професор Руслан Митков, който в момента е директор на Института по информация и компютърна обработка на езика в Улвърхамптънския университет във Великобритания". Младежите от националните отбори през годините също се доказват в цял свят – например Кристиян Костадинов от София завършва в Оксфорд, Кристиян Георгиев от Пловдив в момента е в Mасачузетския технологичен институт.

Александър не издава какви задачи да очакват учениците на олимпиадата тази година, само споделя колко е трудно да се направят задачи на език, който да не е близък до нито един от езиците, които знаят участниците от тридесетте страни.

Тина е от София, учи в СМГ и се занимава с математическа лингвистика от три години. "Най-много ми харесва, че няма нужда от предварителна подготовка, иска се само логическо мислене – задачите са си самодостатъчни." Миналата година тя участва на международната олимпиада в Пекин. "Паднаха се много тежки теми, а една от най-трудните беше писана от българина Иван Держански – трябваше да открием роднинските връзки на език, който вече не се използва в Китай." Тина не се връща с медал, но завързва приятелства с участници от Чехия, САЩ, Словения, остров Ман и няма търпение да види някои от тях тази година.

Освен че ходи два пъти в седмицата на кръжока по лингвистика, Тина свири на пиано и изнася концерти. През останалото време кара ролери. Не обича да има свободно време, или "по-скоро не съм свикнала, ако ми се освободят няколко часа, все гледам да прочета нещо ново, уча се да програмирам, въпреки че май съм закъсняла… Много от моите съученици от СМГ програмират от пети клас". И все пак смята, че ще се насочи към информатиката, когато кандидатства след две години.

Междувременно Тина печели състезания и медали на националните олимпиади, участва в летни и зимни лагери, на които решават задачи и участват в лекции, и се възхищава как е възможно някои езици да съдържат числа само до 27, а други, като ескимоските – толкова думи за бяло. "Очевидно езикът разкрива много за културата и начина на живот на носителите му." Понеже тази година олимпиадата ще е в България, имаше задачи с македонски диалект и ромски говор от Сливен.

"Лингвистиката наистина ме влече и сигурно ще е много интересно да работя по проект като този на Google за машинен превод."

Данаил също би се занимавал с практическо приложение на математическата лингвистика. Току-що е разбрал, че е приет в Университета в Глазгоу, където ще учи компютърни науки. Завършва езикова гимназия във Варна. Доскоро тренира джиу джицу, а в момента прекарва времето си в търсене на квартира в Глазгоу. "Много се радвам, че ще поживея самостоятелно и ще разширя светогледа си.

Всъщност едно от нещата, които много ми харесват в математическата лингвистика, е отборът, лагерите, преподавателите – има неформално общуване, говорим си на малко име, по всяко време питаме за нови неща." На състезанията по математическа лингвистика идват хора от съвсем различни области на науката. "На подбора за националния отбор една моя учителка по история реши всичко за тридесет минути, без да се е подготвяла, просто има логическо мислене." Данаил иска да се върне в България, след като завърши университета, и да бъде доброволец в организирането на олимпиадите. "И по време на ваканциите ще идвам да помагам."

Горещ летен ден е, а Данаил Пенев (18 г.) и Тина Владимирова (16 г.) превеждат от езика улва, използван от индианците в Никарагуа. Никой от тях двамата не говори улва, но са им дадени няколко преведени думи – suulu, suukilu, suumanalu, mismatu, miskatu, лък, котката ти, кучето ми, лъкът ни, котката му, за да намерят коя на коя съответства. Двете деца трябва разберат логическите връзки между думите, за да успеят да си служат с напълно непознатия език.

Именно това е и целта на математическата лингвистика – да изобрази явленията в естествените езици с методите на математиката. А крайната цел – програми за машинен превод, гласови асистенти, проверка на правопис и граматика и др. Тази година Международната олимпиада по компютърна лингвистика се провежда в Благоевград.


Благодарим ви, че четете Капитал!

Вие използвате поверителен режим на интернет браузъра си. За да прочетете статията, трябва да влезете в профила си.
Влезте в профила си
Всеки потребител може да чете до 10 статии месечно без да има абонамент за Капитал.
Вижте абонаментните планове

2 коментара
  • 1
    manin avatar :-|
    manin

    Иван Держански, а не Иван Дражански.

  • 2
    greenhrast avatar :-|
    greenhrast

    но са им дадени няколко преведени думи –
    suulu, suukilu, suumanalu, mismatu, miskatu,
    лък, котката ти, кучето ми, лъкът ни, котката му
    ---
    още колко жокера ще им трябват за да преведат:
    - Баби, на ти трънки, на.
    - Бабинати, трънкина!!!
    :-)))

    Публикувано през m.capital.bg


Нов коментар

За да публикувате коментари,
трябва да сте регистриран потребител.


Вход

Още от Капитал

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. OK