Адным з кірункаў лінгвістычнай навукі, што сёння перажывае бурнае развіццё ва ўсім свеце, з’яўляецца прыкладная і матэматычная лінгвістыка. Спецыялісты ў гэтай галіне запатрабаваныя і на айчынным, і замежных рынках працы. Многія дысцыпліны, якія адносяцца да спецыяльнасці, на сёння не маюць дакладна вызначанай тэрміналагічнай базы і дакладна акрэсленага прыкладнога інструментара, не ўсюды вызначаны нават дакладныя межы даследавання. Таму для атрымання актуальных ведаў спецыялістам неабходна не толькі вывучаць навукова-практычную літаратуру, якая пастаянна абнаўляецца, але і абавязкова ўдзельнічаць у практычных праектах.
У Беларусі прыкладная лінгвістыка – галіна параўнальна маладая, але ўжо досыць добра сябе зарэкамендавала. Навучанне па спецыяльнасцях, якія адносяцца да дадзенай галіны, прапануюць усе вядучыя ВНУ краіны. З 1988 года на філалагічным факультэце БДУ існуе кафедра прыкладной лінгвістыкі, якая рыхтуе студэнтаў па напрамках спецыялізацый «Руская мова як замежная» і «Камп’ютарная лінгвістыка». На тэму вопыту работы ў сферы прыкладной лінгвістыкі мы пагутарылі з таленавітым маладым вучоным, выпускніцай філалагічнага факультэта БДУ, аспіранткай Санкт-Пецярбургскага дзяржаўнага ўніверсітэта Кацярынай Косаравай.
— Скажыце, чым быў абумоўлены Ваш выбар на карысць заняткаў камп’ютарнай лінгвістыкай і якім быў шлях да дадзенага рашэння?
— Шлях быў доўгім і цярністым. Усё пачалося тут, на філалагічным факультэце БДУ, куды я паступіла на спецыяльнасць “Рамана-германская (італьянская) філалогія», якую скончыла з чырвоным дыпломам. Рашэнне займацца прыкладной лінгвістыкай я прыняла пазней, на 3 курсе, калі пачыналася спецыялізацыя. Навуковым кіраўніком у мяне быў дацэнт кафедры прыкладной лінгвістыкі Барковіч Аляксандр Аркадзьевіч, які пазнаёміў мяне з корпуснай лінгвістыкай. Затым я паступіла ў магістратуру БДУ і адначасова вучылася па праграме «Сеткавага ўніверсітэта» ў магістратуры Санкт-Пецярбургскага дзяржаўнага ўніверсітэта, дзе пазнаёмілася з прафесарам Рыгорам Якаўлевічам Мартыненкам, які выкладаў статыстыку і пасля стаў маім навуковым кіраўніком. На мой погляд, мне вельмі пашанцавала: Рыгор Якаўлевіч – чалавек, шырока вядомы сваімі працамі па статыстыцы, лінгвістыцы тэксту, стыляметрыі; акрамя таго, як любы таленавіты чалавек, ён таленавіты ва ўсім – вядомы як лірыка-драматычны тэнар і пісьменнік. Мой навуковы кіраўнік і прывёў мяне ў той праект, у якім я зараз працую.
-Раскажыце пра свой праект і ў агульным – пра Вашу дзейнасць.
-У асноўным я займаюся прыкладной навукай. У праекце «Адзін маўленчы дзень» (рус. «ОРД» – «Один речевой день»), створаным на базе філалагічнага факультэта Санкт-Пецярбургскага дзяржаўнага ўніверсітэта, мы займаемся тым, што вывучаем вуснае паўсядзённае маўленне. Кіраўніком праекта з’яўляецца прафесар кафедры рускай мовы Багданава Наталля Віктараўна. Акрамя мяне, у праекце працуюць і іншыя спецыялісты па прыкладной лінгвістыцы – з веданнем праграмавання і статыстыкі. Але ў асноўным нашы спецыялісты – гэта спецыялісты па рускай мове.
-Як гэта было – «уліцца» ў такі сур’ёзны праект?
-Няпроста, хоць прывёў мяне туды, як я ўжо адзначыла, вельмі заслужаны чалавек. Шчыра кажучы, калі прыйшла першы раз, проста сядзела моўчкі ўбаку. Шмат чаго было незразумела ў абмеркаваннях, і мучыла думка «вось зараз далучуся да гутаркі – і абавязкова скажу якое-небудзь глупства». Але, думаю, з гэтым сутыкаюцца многія людзі, якія прыходзяць у новую сферу. Вядома ж, гэта ўдалося пераадолець, але пазней сталі ўзнікаць цяжкасці ўжо спецыфічнага характару: напрыклад, прыйшлося навучыцца казаць не «слова», а «словаўжыванне». А потым – не «словаўжыванне», а «токены». А потым яшчэ высветлілася, што на адной канферэнцыі трэба ўжываць адно слова, на іншай – іншае. Але і з падобнымі момантамі атрымалася справіцца і паспяхова дапамагаць у правядзенні канферэнцый – вось, напрыклад, летам 2015 года наш калектыў правёў міжнародную навуковую канферэнцыю «Галасы горада: моўная варыятыўнасць і камунікатыўная разнастайнасць».
-Вы вывучаеце паўсядзённае маўленне сваіх супрацоўнікаў або таксама маўленне іншых людзей? Ці ёсць якія-небудзь цэнзы ў падборы аўдыторыі – узроставыя, палавыя, сацыяльныя?
-Спачатку мы сапраўды працавалі толькі з маўленнем нашых супрацоўнікаў, маўленнем студэнтаў, магістрантаў, выкладчыкаў, то бок у асноўным філолагаў. Цяпер жа праект стаў маштабным, і мы запісваем людзей розных узростаў і прафесій у розных сітуацыях паўсядзённай камунікацыі. Акрамя таго, мы сочым за тым, каб суадносіны дадзеных у нашым корпусе суадносіліся са статыстыкай. Гэта значыць, напрыклад, якія статыстычныя суадносіны мужчын і жанчын у горадзе, такія ж павінны быць і па інфармантах. Статыстычную інфармацыю атрымліваем з адкрытых крыніц інстытутаў, якія займаюцца дадзенай праблемай – напрыклад, Федэральнай службы дзяржаўнай статыстыкі.
-Раскажыце пра методыку збору і апрацоўкі дадзеных.
-Збор дадзеных мы ажыццяўляем па методыцы бесперапыннага 24-гадзіннага запісу. Інфарманту выдаецца дыктафон, ён уключае яго і ходзіць з ім увесь дзень, запісваючы сваё маўленне. Затым ён дае запіс нам, мы яго расшыфроўваем, прыбіраем усе асабістыя дадзеныя, а з расшыфровак ствараем корпус. А ўжо на аснове дадзенага корпуса праводзяцца разнастайныя даследаванні: па сацыялінгвістыцы, лексікалогіі, сінтаксісе, фанетыцы і г. д. Бачыцца таксама перспектыва прымянення нашых дадзеных для паляпшэння якасці праграм для распазнання і сінтэзу маўлення.
-Наколькі шырокі кірунак Вашай дзейнасці?
-Пакуль мы запісваем толькі носьбітаў рускай мовы і на абмежаванай тэрыторыі. Нашы інфарманты – гэта жыхары Пецярбурга і Ленінградскай вобласці. Падобных даследаванняў для рускай мовы, наколькі мы ведаем, на сёння не існуе.
-Ці ёсць планы па пашырэнні?
-Ёсць. Плануецца, напрыклад, вырашыць няпростую задачу: пачаць запіс і аналіз маўлення рускамоўных замежнікаў. Можна таксама пашыраць геаграфію запісу. У Расіі наш праект можа быць вельмі маштабным.
-Замежнікі, якія пражываюць у Санкт-Пецярбургу, набываюць нейкія асаблівыя рысы?
-Па маіх асабістых назіраннях, так. У тых замежнікаў, што вывучаюць рускую мову там, ёсць асаблівасці і ў моўнай, і ў культурнай асіміляцыі.
-Ці плануецца збор дадзеных на іншых мовах, акрамя рускай?
-Пакуль не. Першапачатковая мэта нашай працы складаецца ў вывучэнні менавіта рускага паўсядзённага маўлення.
-Якіх рэсурсаў, на Ваш погляд, сёння не хапае Вашаму праекту? Ці ёсць да каго звярнуцца па дапамогу?
-Адчуваецца перш за ўсё недахоп часавых рэсурсаў, а таксама чалавечых рэсурсаў для выканання руціннай працы па расшыфроўцы велізарных аб’ёмаў дадзеных. Што тычыцца кансультацый, то нам, на шчасце, ёсць да каго звярнуцца. У прыватнасці, у Санкт-Пецярбургу існуе Цэнтр маўленчых тэхналогій, які займаецца вывучэннем маўлення, а таксама распрацоўвае рознае праграмнае забеспячэнне.
-Вы казалі, што ў перспектыве магчымае прымяненне дадзеных Вашага корпуса для паляпшэння праграм распазнавання і сінтэзу гаворкі. Скажыце, ці ведаеце Вы пра лабараторыю, якая існуе ў нашай Акадэміі навук і займаецца дадзенай праблемай?
-Так, я ведаю пра Лабараторыю распазнавання і сінтэзу маўлення Нацыянальнай акадэміі навук Беларусі. Больш за тое, адна з маіх калег па магістратуры БДУ працавала менавіта там і, мяркуючы па яе расповедах, была задаволена навуковым узроўнем працы. Калі ў нас і ў кіраўнікоў дадзенай лабараторыі знойдзецца нейкі ўзаемны інтарэс, то цалкам магчымае прымяненне вынікаў нашай працы для паляпшэння іх прадуктаў.
-Вы ўдзельнічаеце ў праекце «Адзін маўленчы дзень» зыходзячы з чыста навуковых або таксама матэрыяльных інтарэсаў?
-З самага пачатку майго ўдзелу ніякай матэрыяльнай зацікаўленасці для мяне не прадугледжвалася ў прынцыпе – так што з навуковых. Зараз нашы даследаванні падтрымліваюцца грантам Расійскага навуковага фонду, што дазваляе нам меркаваць аб запатрабаванасці гэтага кірунку ў навуцы. Трохі адыходзячы ад тэмы, хачу адзначыць, што грант – гэта наогул выдатны інструмент для таго, каб заахвочваць маладых вучоных. Бо ўдзел у гранце маладых вучоных з’яўляецца дадатковым плюсам пры разглядзе заявак – і такім чынам ствараецца неабходнасць прыцягнення спецыялістаў. Наяўнасць грантаў – гэта паказчык таго, што навукоўцаў шануюць.
-Хочацца даведацца трохі пра складанасці ў працы. Скажыце, ці не дае пагрэшнасці тое, што чалавек загадзя папярэджаны, што яго запісвае дыктафон?
-Спачатку – магчыма. Чалавек памятае, што яго запісваюць, і некаторы час імкнецца сачыць за сваім маўленнем. Але ўжо праз некалькі хвілін ён забывае пра гэта. А хадзіць яму з дыктафонам ўвесь дзень.
-А ці няма, скажам, такога моманту: чалавек чуе свой голас у запісе, яму не падабаецца, як ён гучыць – і ён адмаўляецца даваць дадзеныя?
-Наколькі я ведаю, такой праблемы не ўзнікала. Перад запісам інфармант атрымлівае ўсю цікавую для яго інфармацыю пра праект і будучае выкарыстанне яго запісу, праходзіць інструктаж, падпісвае распрацаваную юрыстамі згоду на запіс. Звычайна інфарманты не праслухоўваюць самі запіс перад перадачай нашым супрацоўнікам. Пасля фрагменты гэтых запісаў з’яўляюцца ў адкрытым доступе ў асноўным у друкаваным выглядзе – у тым ці іншым артыкуле. Прайграванне менавіта аўдыязапісу – і тое толькі малой яго часткі – можна пачуць толькі ў дакладах на навуковых канферэнцыях.
-У Вас напружаны графік працы?
-Як калі. Я атрымліваю файл для расшыфроўкі, калі ёсць час – працую над ім. Хаця толькі на гэты тып працы, на поўную і падрабязную расшыфроўку, сыходзіць вельмі шмат часу – па 30 гадзін у тыдзень, на дысертацыю ўсё ж час застаецца.
-Ці валодаеце Вы якімі-небудзь дадатковымі навыкамі, неабходнымі для працы? Ці хочаце чымсьці авалодаць?
-Пакуль што валодаю толькі мінімальнымі навыкамі. Напрыклад, магу зрабіць разлік статыстыкі па матэматычных формулах. Акрамя таго, вядома ж, трэба навучыцца праграмаваць, без гэтага не абыдзецца.
-А як філолагу даюцца такія дысцыпліны? І ці важны ў гэтым пытанні гендарны аспект?
-Цяжка даецца. Мне, як філолагу, які не разлічваў на філфаку вывучаць і здаваць матэматыку – тым больш, неабходнасць у яе вывучэнні стала нечаканым паваротам. Але мне цікава гэта рабіць. Што тычыцца гендарнага аспекту, то спачатку мне здавалася, што мужчынам усё гэта даецца лягчэй. Але, назіраючы за сваімі калегамі, дзяўчатамі і жанчынамі, у тым ліку і за студэнткамі, убачыла, што і яны таксама выдатна спраўляюцца.
-Яны больш матываваныя ці больш здольныя?
-Мне здаецца, яны больш уседлівыя.
-Напэўна, Ваша праца таксама патрабуе велізарнай уседлівасці?
-Так, праца вельмі карпатлівая. Акрамя расшыфровак, для сваёй працы я таксама складаю сістэму дыферэнцыраваных частотных слоўнікаў, базай для якіх служаць тыя словы, якія сустракаюцца ў запісах. Агульны аб’ём дадзеных слоўнікаў налічвае амаль 250 тысяч слоў, і мне, акрамя ўсяго іншага, неабходна зняць з іх аманімію. На дадзены момант зняла яе прыкладна з 200 тысяч слоў. Але зразумела, што гэта не мяжа, і тэарэтычна корпус можна павялічваць да бясконцасці – наколькі дазваляе багацце рускай мовы. З майго матэрыялу складаецца агульны частотны слоўнік, які таксама ў далейшым можа быць дыферэнцыраваны па сацыяльных, узроставых, палавых прыкметах інфармантаў або, дапусцім, па часцінах мовы.
-Раскажыце яшчэ трохі пра практычны выхад Вашай дзейнасці.
-Ён можа быць самы разнастайны. Пакуль непасрэдны выхад нашай працы – гэта канкрэтныя артыкулы і манаграфіі па той ці іншай праблеме, звязанай з нашай дзейнасцю. Але магчымыя і іншыя варыянты. Вось просты прыклад: у нас ёсць структураваны корпус, дыферэнцыраваныя слоўнікі і статыстычныя дадзеныя наконт суадносін мужчын і жанчын сярод насельніцтва. Зрабіўшы разлікі, мы можам даведацца, як гавораць мужчыны і як гавораць жанчыны, якія словы яны часцей ужываюць. Безумоўна, канкрэтна ў дадзеным пытанні ўжо маюцца некаторыя напрацоўкі ў іншых праектах. Увесь вопыт, звесткі пра якія ёсць у адкрытым доступе, мы пастараемся ўлічыць у нашай працы.
-Якім праграмным забеспячэннем Вы карыстаецеся для аптымізацыі сваёй працы?
-Розным. Сярод іх, напрыклад, праграма ELAN.
-Што гэта за праграма?
-ELAN – праграма, створаная нямецкімі спецыялістамі, знаходзіцца ў інтэрнэце ў адкрытым доступе. Яе магчымасці дазваляюць загрузіць якое-небудзь аўдыя або відэа ў сваю базу – і на «гукавой дарожцы» стварыць неабходныя «слаі», у якія карыстальнік запісвае тэкст. Напрыклад, ёсць слой, дзе цалкам пішацца тая ці іншая фраза. А далей – слой, дзе гэта фраза аналізуецца з пункта гледжання сінтаксісу, слой для фанетыкі, слой для нейкіх сваіх каментароў. Дадатковая зручнасць гэтай праграмы ў тым, што, у адрозненне ад папулярных прайгравальнікаў, у ёй існуюць пашыраныя магчымасці для таго, каб праслухаць той ці іншы фрагмент некалькі разоў. Не трэба шмат разоў націскаць на паўзу: дзеліш спачатку запіс на асобныя фразы, а затым адслухоўваеш кожную асобна і запаўняеш слаі, выкарыстоўваючы прынятую ў нашым корпусе разметку. Але варта сказаць, што нават пры выкарыстанні праграмных сродкаў праца досыць складаная: хвіліна запісу расшыфроўваецца гадзіну часу.
-Прабачце, проста цікава: ці не ўзнікае пры Вашым аб’ёме працы «прафесійнай дэфармацыі»?
-Ну, сур’ёзнай – хутчэй не, але ёсць забаўная асаблівасць. Атрымліваеш, дапусцім, паўгадзінны аўдыязапіс на расшыфроўку. А, як я ўжо сказала, на кожную хвіліну сыходзіць па гадзіне. Зразумела, што ўсё робіцца не за адзін дзень, а за некалькі. І вось пасля некалькіх дзён такой працы ты непрыкметна для сябе пачынаеш размаўляць кароткімі дакладнымі фразамі – без лішніх паўз, без хезітацый. А калі чуеш кагосьці, тут жа ў думках пачынаеш разбіваць яго маўленне на асобныя фразы – і пры гэтым у думках кажаш сабе: «вось тут паўза – значыць, трэба ставіць слэш; а вось тут доўгая паўза – два слэшы». І пры гэтым думаеш: «Чаму людзі так жудасна размаўляюць? Няўжо складана размаўляць павольна і выразна?» (Смяецца)
-Улічваючы аб’ём працы і яе спецыфіку, таксама хочацца задаць пытанне, якое часцей задаюць у пачатку інтэрв’ю: як Вашы знаёмыя ставяцца да Вашай дзейнасці?
-Бацькі і сябры вельмі мяне падтрымліваюць. Сярод знаёмых сустракаюцца такія, хто лічыць аспірантуру марнай тратай часу і сіл, і такія, хто ціха зайздросціць. Але адно пытанне цікавіць абсалютна ўсіх: чым я буду займацца пасля заканчэння аспірантуры. Пакуль і для мяне самой гэта вялікае пытанне, хаця зараз яно вельмі актуальнае. Трэба лепш разабрацца ў сабе, у сваіх прыярытэтах у навуковай сферы і проста ў жыцці.
-Што, на Вашу думку, важнейшае для жанчыны – кар’ера ці сям’я?
-Мне цяпер здаецца, што сям’я. Раней былі сумневы і ваганні на гэты конт. Але паступова прыйшло ўсведамленне таго, што сям’я важнейшая. Калі шмат працуеш, і пры гэтым увесь час жывеш адзін, разуменне неабходнасці блізкага чалавека побач прыходзіць само. Студэнты, з якімі зараз жыву ў інтэрнаце, часам пытаюць мяне: «А ты не думала, што можна выйсці замуж, нараджаць дзяцей? Табе ж праз два гады трыццаць споўніцца». Я не перажываю, але калі раптам стане выбар паміж кар’ерай і сям’ёй, то зроблены ён будзе адназначна на карысць сям’і. Хоць у маім выпадку ён наўрад ці стане: спецыфіка маёй працы прадугледжвае дыстанцыйнае супрацоўніцтва, ды і ў прынцыпе спецыяльнасць настолькі шырокая, што пры неабходнасці можна знайсці працу ў любым месцы.
-А на хобі час застанецца?
-Думаю, так. У вольны час вышываю крыжыкам. А яшчэ я шмат падарожнічаю.
-Хацелася б даведацца: вось Вы да моманту канчатковага сыходу ў прыкладную лінгвістыку атрымалі таксама веды, якія непасрэдна не адносяцца да абранай сферы. Скажыце, ці знаходзіцца ім нейкае прымяненне?
-Знаходзіцца – і самае непасрэднае. Акрамя навуковай дзейнасці ў мяне ёсць вопыт выкладання італьянскай, французскай, англійскай моў, рускай мовы як замежнай, а таксама досвед працы перакладчыкам. Гэта значыць, па сутнасці, усе мае філалагічныя пачынанні былі даведзены да пэўнага лагічнага этапу. Усё ж такі дыплом – гэта не «статусная рэч», гэта атрыбут адказнасці за падрыхтоўку. Прайшоўшы ўсе этапы, я дакладна разумею, што я ведаю, а чаго не ведаю, у якой галіне маю права выступаць экспертам.
-А дзе сёння, акрамя Вашай сферы дзейнасці, найбольш неабходны прыкладны лінгвіст?
-Дакладна вызначыць, дзе больш, а дзе менш ён неабходны, я, мабыць, не змагу. Але, наколькі я ведаю, спецыялісты майго профілю сёння вельмі запатрабаваныя ў сферы працы з тэкстам у інтэрнэце. Напрыклад, яны займаюцца даследаваннем водгукаў пра дзейнасць той ці іншай кампаніі. Статысты, дапусцім, складаюць дынаміку станоўчых і адмоўных водгукаў. Акрамя таго, прыкладныя лінгвісты вельмі патрэбныя ў корпуснай лінгвістыцы. У машынным перакладзе. Ды і проста ў перакладзе: на мой погляд, усе добрыя перакладчыкі сёння павінны валодаць адмысловым праграмным забеспячэннем – напрыклад, тым жа Trados.
-Раскажыце трошкі пра гэту праграму.
-Trados – гэта сістэма аўтаматызаванага перакладу. Калі апісаць сцісла прынцып яе працы, то гэта прыкладна наступнае: ты робіш пераклад тэксту пэўнай тэматыкі, загружаеш тэкст перакладу і арыгінала ў праграму. З часам гэтых тэкстаў становіцца больш, і атрымліваецца своеасаблівы індывідуальны корпус карыстальніка. Матэрыялы корпуса выкарыстоўваюцца праграмай для таго, каб карыстальнік, прапаноўваючы ёй новы тэкст той жа тэматыкі для перакладу, атрымліваў аўтаматычны пераклад з уласных жа перакладзеных раней фраз. Дадзеная праграма асабліва добрая для аўтаматычнага перакладу стандартызаваных тэкстаў – напрыклад, з юрыдычнай сферы.
-І апошняе пытанне: на што, на Ваш погляд, неабходна зрабіць упор тым і «камп’ютарным», і «некамп’ютарным» філолагам, якія хочуць прыйсці ў Вашу сферу?
-Тым, хто хоча прыйсці ў камп’ютарную лінгвістыку і добра валодае прыкладнымі праграмамі, вялікім плюсам будзе веданне моў праграмавання. Такія «здвоеныя» спецыялісты ў нашай сферы вельмі запатрабаваныя. Тым жа, хто хоча прыйсці ў дадзеную сферу са «стандартнымі» для філолага ці лінгвіста ведамі, сур’ёзны ўпор неабходна зрабіць на вывучэнне замежных моў. Але і тым і іншым трэба добра разбірацца ў лінгвістычнай тэрміналогіі і сучаснай тэрміналагічнай базе абранай імі галіны даследавання. Для тых, хто хоча займацца прыкладной лінгвістыкай фундаментальна, абавязковае добрае веданне агульнай тэорыі мовы.
Сяргей МАЕЎСКІ