Основні положення щодо діяльності лексикографічної лабораторії LEXILAB

Факультет романо-германських мов

Лексикографічна лабораторія

LEXILAB

ОСНОВНІ ПОЛОЖЕННЯ ЩОДО ДІЯЛЬНОСТІ

Лексикографічна лабораторія функціонує при кафедрі лінгвістики факультету романо-германських мов Національного університету “Острозька академія”.

Тема досліджень лабораторії: «Лексикографічні та корпусні технології опису мовної системи», державний реєстраційний номер 0109U007879.

Основні завдання LEXILAB: дослідження, впровадження та методичний супровід змісту, методів, технологій та засобів сучасної лексикології, лексикографії та корпусної лінгвістики, а саме:

– накопичення текстового матеріалу (створення корпусів) для забезпечення прикладами лексикографічні роботи та для навчальних і перекладацьких цілей;

– створення фонду електронних та друкованих словників різних типів;

– включення в навчальний процес факультету романо-германських мов наукового доробку LEXILAB у зміст спецкурсів, наукових семінарів, наукових робіт студентів, аспірантів;

– вивчення вітчизняного і зарубіжного досвіду розвитку науково-дослідницьких систем у сфері лексикології, лексикографії, корпусної лінгвістики, термінознавства та термінографії; поширення педагогічних інновацій та новітніх освітніх технологій, досягнень науки та передових ідей в практику;

– створення словників одного чи декількох письменників, словників авторів одного літературного напрямку чи часового періоду, навчальних словників для ВНЗ та шкіл, термінологічних словників та лексикографічних баз даних для систем автоматичного перекладу та електронних словників;

– створення студентських проблемних груп “Лексикографічні аспекти дослідження сучасної англійської (німецької, французької, іспанської, польської, української) мови” та “Мовна екологія та лінгвокраїнознавство”, члени яких братимуть участь у наукових студентських конференціях, виконуватимуть та захищатимуть дипломні роботи з цього напрямку, організовуватимуть, проводитимуть та відвідуватимуть семінари-практикуми з вказаних напрямків.

Структура LEXILAB: у лабораторії працюють науковці, аспіранти, пошукувачі, студенти, які формують:

Галузеву раду – мовознавці, які безпосередньо працюють з мовним матеріалом:

Яворська Галина Михайлівна, доктор філологічних наук, професор

Коцюк Леся Миколаївна, кандидат філологічних наук, доцент

Крайчинська Галина Вацлавівна, кандидат філологічних наук, доцент

Новоселецька Світлана Володимирівна, кандидат психологічних наук, доцент

Ковальчук Інна В’ячеславівна, кандидат психологічних наук, доцент

Поліщук Вікторія Леонідівна, аспірант

Береза Тарас Андрійович, перекладач, письменник, упорядник двомовних словників та електронних авторських видань

Панасюк Діна Вячеславівна, пошукувач

Тишко Олена Василівна, пошукувач

Пелипенко Ольга Олександрівна, старший викладач

Міжгалузеву раду – науковці та спеціалісти з інших галузей знань, які залучаються в залежності від мети певного проекту.

Діючі проекти лабораторії LEXILAB:

Створення енциклопедичного словника-довідника лінгвістичних термінів і понять. – керівник проекту Коцюк Л.М.
Створення спеціалізованих лексикографічних баз даних Multiterm автоматичної системи перекладу TRADOS (сфера комп’ютерних систем та мереж, страхування, Google). – керівник проекту Коцюк Л.М.
Створення корпусів текстів. – керівник проекту Коцюк Л.М.
Організація навчально-методичних семінарів «Корпуси текстів у лінгвістичних дослідженнях», «Ефективне використання словників», «Новинки у сфері лексикографії».
Проект “Інноваційні словники” – керівник Береза.Т.А.

ПРОЕКТ ЕНЦИКЛОПЕДИЧНОГО СЛОВНИКА-ДОВІДНИКА ЛІНГВІСТИЧНИХ ТЕРМІНІВ І ПОНЯТЬ (ЕЛЕКТРОННА ТА ПАПЕРОВА ВЕРСІЇ)

Актуальність та новизна проекту

Українська лінгвістична термінографія представлена досить бідно. Результатом діяльності слугують такі роботи:

1) на сайті лінгвістичного порталу Mova.info представлено лінгвістичну енциклопедію, яка складається всього з двох розділів «Події» та «Особи», Вікіпедія – сторінка «Лінгвістика» все ще відноситься до категорії сторінок, які потрібно доробити; 2) на окремих сайтах можна знайти закладки, де пропонується глосарій або словник лінгвістичних термінів, зазвичай невеликого обсягу (http://znatok.ua/ua/terms, http://www.franko.lviv.ua/faculty/intrel/tpp/glossary.htm – короткий словник перекладацьких та лінгвістичних термінів, http://www.tnpu.edu.ua/subjects/83/17/Etnolingvodudaktuka/First.htm – як додаток до підручника «Етнолінгводидактична культура вчителя-словесника», http://dls.kherson.ua/Dls/default.aspx?module=document&m=64&d=2723 – практичний словник-мінімум лінгвістичних термінів);

3) паперові словники, зазвичай застарілі, не вміщують терміни, які з’явилися з появою нових галузей лінгвістики (Ганич Д. І., Олійник І. С. Словник лінгвістичних термінів. — К.: Вища шк. Головне вид-во. — 1985; Єрмоленко С.Я., Бибик С.П., Тодор О.Г. Українська мова. Короткий тлумачний словник лінгвістичних термінів / За ред. С.Я. Єрмоленко. – К.: Либідь, 2001. – 224 с.; Кротевич Є., Родзевич Н. Словник лінгвістичних термінів / За заг. ред. С.В. Кротевича. – К.: Вид-во АН УРСР, 1957. – 236 с.; Словник лінгвістичних термінів / Укл.: Левицький В.В., Іваницька М.Л., Іваницький Р.В. – Чернівці: ЧДУ, 1996. – 29 с.

Як видно, сучасні українські словники лінгвістичних термінів ставлять перед собою скромну мету, обмежені обсягом матеріалу та не завжди включають в себе новостворені терміни науки про мову. Абсолютно очевидним є те, що перелічені довідники не можуть задовольнити потреби українських мовознавців та спеціалістів суміжних наук в компактному, достатньо авторитетному та такому, який задовольняє вимоги сучасного мовознавства, словнику лінгвістичних термінів. Укладання такого словника – нагальна потреба української лінгвістики. Простий перекладний словник не здатний повністю вирішити це завдання, а може запропонувати тільки попередній компромісний вихід. Редакційна колегія пропонованого словника пропонує крім тлумачень різними галузями лінгвістики задіяти ще й його переклад.

Переваги

Будь-який словник наукової термінології є втіленням певної наукової думки. Саме в силу цієї обставини перевагами “Словника-довідника лінгвістичних термінів” серед інших як вітчизняних, так і зарубіжних видань такого типу визначаються тим, що тлумачення термінів подаються з оригінальних праць науковців із зазначенням автора та праці, а наявність відповідників цього терміну в англійській мові дає можливість крім тлумачення дізнатися про відповідник даного терміна в термінологічній системі іншої мови.

Крім того, пропонується створення бази даних для можливості користування словником у електронному вигляді, зокрема у навчальній системі Moodle, розділі ВІКІ.

ПРОЕКТ СТВОРЕННЯ СПЕЦІАЛІЗОВАНИХ ЛЕКСИКОГРАФІЧНИХ БАЗ ДАНИХ MULTITERM ДЛЯ АВТОМАТИЧНОЇ СИСТЕМИ ПЕРЕКЛАДУ TRADOS

Стан виконання проекту:

1. Підписано угоду з перекладацькою агенцією «Лінгвістичний центр» (м. Львів) про співпрацю.
2. Та основі перекладів, здійснених вищеназваною агенцією, створено базу даних MULTITERM для автоматичної системи перекладу TRADOS – комп’ютерних термінів, які використовуються корпорацією Dell для опису своєї продукції.
3. Розпочато створення бази даних термінів продукції SONY.

ПРОЕКТ СТВОРЕННЯ КОРПУСІВ ТЕКСТІВ

АНОТАЦІЯ ПРОЕКТУ

Проект передбачає роботу над створенням корпусів текстів:

а) корпус української англійської мови – пошук та впорядкування усних та письмових (друкованих) текстів, представлених англійською мовою українцями (учнями шкіл, студентами, перекладачами, підручники для навчання англійської мови та ін.) у вигляді корпусу;

б) корпус міжнародної української мови – пошук та впорядкування усних та письмових текстів, представлених українською мовою іноземцями-не громадянами України (росіянами, поляками, канадцями та ін.) у вигляді корпусу;

с) корпус спеціалізованого наукового мовлення (напрямку «Філологія») – пошук та впорядкування у вигляді корпусу наукових статей, надрукованих у збірниках, затверджених ВАК України як фахові з напрямку «Філологія»;

ПРОБЛЕМАТИКА ДОСЛІДЖЕННЯ (РОЗРОБКИ):

Об’єктом розробки є усні та письмові (друковані) тексти, представлені: англійською мовою українцями (напрямок а)), українською мовою іноземцями-не громадянами України (напрямок б)); наукові статті, надруковані у збірниках, затверджених ВАК України як фахові з напрямку «Філологія» (напрямок с).

Предметом розробки є корпусні технології представлення мовної системи.

Проблема, що вирішується: створення перших в Україні корпусів текстів, які стануть автентичним джерелом для подальших наукових досліджень сучасної української мови, англійської мови як іноземної, спеціалізованого наукового мовлення.

МЕТА І ОСНОВНІ ЗАВДАННЯ ПРОЕКТУ

Метою проекту є впровадження корпусних технологій представлення різних текстів сучасної української та англійської мови, а також створення лексикографічного продукту з використанням корпусних технологій.

Практичні задачі, на вирішення яких спрямовано проект: створення корпусів текстів:

а) Корпус Української Англійської Мови (КУАМ) – пошук та впорядкування усних та письмових (друкованих) текстів, представлених англійською мовою українцями (учнями шкіл, студентами, перекладачами, підручники для навчання англійської мови та ін.) у вигляді корпусу;

б) Корпус Міжнародної Української Мови (КМУМ) – пошук та впорядкування усних та письмових текстів, представлених українською мовою іноземцями-не громадянами України (росіянами, поляками, канадцями та ін.) у вигляді корпусу;

с) Корпус Спеціалізованого Наукового Мовлення (КСНМ) (напрямку «Філологія») – пошук та впорядкування у вигляді корпусу наукових статей, надрукованих у збірниках, затверджених ВАК України як фахові з напрямку «Філологія»;

Значимість проекту для розв’язання економічних і соціальних проблем: оскільки лінгвістичне дослідження не залежно від історичного періоду і рівня розвитку мовознавчої науки ґрунтується на мовному матеріалі, а корпусні методики уможливлюють збір, опрацювання, зберігання великих за обсягом текстових масивів та забезпечують межову швидкість екстрагування лінгвальної інформації з них, то побудова спеціалізованих електронних корпусів текстів для національної мови є не лише бажаною, але й необхідною для здійснення як класичних досліджень мови на базі кількісно іншого мовного матеріалу, який забезпечує корпус, так і вивчення, аналіз, опис мови у контексті нових напрямків. Важливо, що корпусно-базовані дослідження мови через обсяг аналізованого матеріалу (мільйони слововживань) і технічні можливості корпусного інструментарію здатні виявити такі мовні реалії, про які донедавна вчені навіть не підозрювали. Лексикографічні ж дослідження, базовані на корпусах, приносять користувачам словників факти про реальне функціонування мови.

СУЧАСНИЙ СТАН ПРОБЛЕМИ

У межах класичної лінгвістичної традиції збір мовних даних завжди був і залишається складним технічним завданням, оскільки йдеться про ручне довготривале опрацювання письмових текстів, опитування інформаторів, анкетування, створення традиційних лексичних картотек тощо. Існують також інші проблеми, пов’язані з традиційним збором мовного матеріалу, зокрема його поновлення, пошук необхідних одиниць у кількамільйонних картотеках, віддалений доступ, або взагалі відсутність його у, так званих, неелектронних базах. Комп’ютерні технології, прийшовши у лінгвістику, запропонували свої технічні можливості для оформлення, зберігання і пошуку мовного матеріалу на машинних носіях, який може бути організований як база даних, машинний фонд або, останнім часом, корпус текстів. Про популярність та інтенсивність розвитку корпусної лінгвістики свідчить як чимале число теоретичних і технологічних праць, підручників так і самих корпусів. Йдеться про праці Х. Кучери (Francis, Kucera 1979), У. Френсиса (1983), Д.Байбера (Biber 1990, 1992) Дж. Синклера (Sinclair 1994), В. Тойберта (Teubert 2000), Ґ. Кеннеді (Kennedy 1998), Н. Іде (2000), М. Банька (Bańko 1994-1996; 2003), T. Ерявця (Erjavec 2001), Й. Гаїча (Hajič 1998), А. Баранова (2001), С. Шарова (2002), В. Рикова (2001а, 2001б), Л. Ричкової (2002, 2003) та ін. Для лінгвоукраїністики побудова корпусів перебуває на початковому етапі розвитку та базується як на теоретичних положення, розроблених для інших національних мов, зокрема для англійської (Brown Corpus, British National Corpus), французької (FRANTEXT), чеської (Českэ Nбrodnн Korpus), польської (Korpus Państwowego Wydawnictwa Naukowego) та російської (Большой корпус русского языка, Национальный корпус русского языка), так і на працях українських комп’ютерних лінгвістів, які розглядають проблеми співзвучні з проблематикою корпусного мовознавства, Т. Грязнухіної (1983), Н. Дарчук (2000), Є. Капріловської (2003), Н. Клименко (1990), В. Перебийніс (1981) В. Русанівського і Н. Клименко (1995), Пещак (1999) та ін. Українським мовно-інформаційним фондом НАН України під керівництвом О. Демської-Кульчицької вже створено Український національний корпус та у тестовому режимі працює Корпус текстів української мови. Створення корпусу української англійської мови є вкладом до міжнародного проекту International Corpus of Learner English, який діє при Центрі англійської корпусної лінгвістики, Бельгія. На даний час представлено підкорпуси 19 різних країн (E2 French, E2 German, E2 Swedish… ), серед яких української англійської не має.

МЕТОДИ, ЗАСОБИ, ПІДХОДИ, ІДЕЇ, РОБОЧІ ГІПОТЕЗИ, ЯКІ ПРОПОНУЮТЬСЯ ДЛЯ ВИРІШЕННЯ ЗАВДАНЬ ПРОЕКТУ

Планується, що стосовно обсягу Корпус Української Англійської Мови (КУАМ), Корпус Міжнародної Української Мови (КМУМ) та Корпус Спеціалізованого Наукового Мовлення (КСНМ) будуть середніми і при їх побудові виконуватиметься така стратегія укладання: 1) нижня статистична межа кожного з їх підкорпусів в 200 тис. слововживань; 2) можливість перманентного поповнення корпусів текстовими даними; 3) без обмежень на верхню статистичну межу. За структурою пропоновані корпуси матимуть вигляд „генеральний корпус – система підкорпусів”. Для КУАМ вважаємо за доцільне спеціалізувати підкорпуси за хронологією, усним чи писемним представленням. Для КМУМ підкорпуси спеціалізуватимуться за географічним принципом та хронологією, для КСНМ – за сферами науки. Усі пропоновані корпуси характеризуватимуться як: а) дослідницькі: орієнтовані на широкий клас лінгвістичних завдань; б) фрагментні: будуються з текстових фрагментів, тобто уривків текстів, відібраних за попередньо детермінованими засадами відбору текстових даних до корпусу; в) мішані: передбачено введення текстових фрагментів обидвох варіантів реалізації мовної системи – писемних і усних (за винятком КСНМ, де представлятимуться тільки друковані фрагменти); г) динамічні: передбачають константне поповнення множини корпусних текстів; ґ) синхронно-діахронні: охоплює текстовий матеріал, організований як система підкорпусів генерального; д) специфічного мовлення: з урахуванням територіальної специфіки та сфер застосування; е) мономовні: тексти, що увійшли до корпусу є результатом мовної діяльності носіїв однієї мови; є) морфологічно анотовані: усі текстові дані розмічені до рівня слова і кожне слово передбачає маркування частиномовної належності та відповідних морфологічних значень.

ОЧІКУВАНА НАУКОВА ТА НАУКОВО-ТЕХНІЧНА ПРОДУКЦІЯ:

В результаті роботи планується отримати корпуси, призначені для таких сфер застосування: а) морфолого-синтаксична, де передовсім визначатимуться квантитативні характеристики слів з різним лексико-граматичним значенням в українській мові як іноземній та українському варіанті англійської мови мові як синхронно (аналіз одного певного підкорпусу), так і діахронно (аналіз підкорпусів різних періодів); вивчити структуру і лексико-граматичну семантику різних частин мови; встановити максимальну vs мінімальну vs оптимальну довжину речень, порядок слів у реченні, дослідити функціонування активних і пасивних конструкцій в динаміці та ін; б) лексикографічних – де факто лексикографія детермінувала корпусний принцип організації даних природної мови, але лише поява машиночитаних корпусів реально уможливила швидке виконання лексикографічних завдань, про що, зокрема, говорять Т. Макенрі й А. Вилсон: „лінгвіст, який має до своєї диспозиції корпус або інше машиночитане зібрання текстів, може викликати всі приклади на всі необхідні слова або фрази з багатомільйонних текстових корпусних ресурсів впродовж кількох секунд” (McEnery, Wilson 1996, 43), що дозволяє укладання словників і їх перегляд набагато швидше, ніж у, так званий, докорпусний період, і таким чином, подання сучасної інформації про мову. Крім того, виходячи з корпусних можливостей, можна поглибити або розширити словникові дефініції, оскільки корпус забезпечує значно більше число реальних мовних прикладів, які можна легко пересортовувати і об’єднувати у групи для здійснення того чи іншого аналізу. Не кажучи уже про можливість, за умови використання даних моніторного корпусу, фіксувати терміни та неологізми, розширювати або звужувати значення слова або баланс між вживанням лексичних одиниць, залежно від стилю і жанру конкретного тексту;

в) контрастивний аналіз варіантів української та англійської мов (наприклад, діаспорний варіант української мови та українська мова, вивчена поза межами країни), що може зумовити його використання у мовному пануванні, формуванні мовної політики, організації антинівеляційного захисту сучасної української мови.

г) методики викладання української та мови як іноземної та методики викладання англійської мови для українців, де корпусні дані та можливість швидкого різнорівневого пошуку забезпечать дидактичний матеріал для аналізу і засвоєння граматичних та лексичних знань учнями і студентами, а, крім того, завдяки здатності викликати комбінації слів, а не індивідуальні слова, учень або студент має змогу детальніше вивчити синтагматичні реляції між різними мовними одиницями.

Загалом, як засвідчують досягнення корпусно-базованих досліджень у англо-саксоністиці, романістиці, германістиці, частині славістики, корпусно-базовані дослідження мають ряд переваг щодо класичних, реалізованих без корпусу текстів і корпусного інструментарію. Це, по-перше, швидкість екстрагування та сортування / пересортування великої за обсягом лінгвальної інформації. По-друге, великі обсяги інформації. По-третє, набір даних, які уможливлюють дослідження як мовної системи, так і її реалізації у достатньо широкому синхронно-діахронному спектрі. По-четверте, можливість багатократного звертання до корпусу з найрізноманітнішими запитами за інтра- та екстралінгвальною інформацією про українську мову. І, по-п’яте, забезпечення межової точності та надійності зберігання всієї інформації, яку містить текст.

ОЧІКУВАНЕ ВИКОРИСТАННЯ ОТРИМАНИХ РЕЗУЛЬТАТІВ:

Створені корпуси стануть автентичним джерелом проведення вибірки у загальних та контрактивних лінгвістичних дослідженнях, дослідженнях з методики викладання мови, лексикографії та термінознавства на всіх рівнях написання наукових робіт: від випускних бакалаврських до докторських дисертацій. Також вони слугуватимуть основою різноманітних досліджень при підготовці публікацій у вітчизняних виданнях, у виданнях з Переліку ВАК України, у виданнях, що входять до наукометричних баз даних (Scopus та інші); при підготовці монографій (в тому числі вітчизняних, академічних чи закордонних видавництв), підручників та навчальних посібників (в тому числі з грифом МОН України). Теоретичні засади та методика створення корпусів стануть у пригоді при розробці та впроваджені нових циклів лабораторних робіт, нових лекційних курсів тощо в навчальному процесі.

Стан виконання проекту:

Розпочато збір студентських есе (40 шт.). Вони внесені до бази даних з метою створення корпусу української англійської.
Налагоджено співпрацю з Центром Англійської Корпусної Лінгвістики, (Бельгія) та обговорено етапи роботи та вимоги до корпусу української англійської мови, який увійде до Міжнародного Корпусу Студентської Англійської (ICLE). У межах цього проекту відбувається співпраця з Лабораторією комп’ютерної лінгвістики Київського лінгвістичного університету.

ПРОЕКТ “ІННОВАЦІЙНІ СЛОВНИКИ”

Новаторська серія “Інноваційні Словники” започаткована у 2006 р. Керівник проекту – Тарас Береза.

Серія “Інноваційні Словники” – це новаторська розробка у галузі прикладної лінгвістики, створена з метою популяризації українського слова та вивчення англійської мови. Проект органічно поєднує найкращі компоненти програмного забезпечення та лінгвістичного матеріалу, що робить її невід’ємною частиною сучасного лінгвістичного простору.

Серія “Інноваційні Словники” – унікальний науково-популярний електронний продукт, що надає користувачам можливість швидкого пошуку та ефективного використання необхідного матеріалу.

Серія “Інноваційні Словники” – започаткована у лютому 2006-го року і налічує наступні продукти:

«Швидка перекладацька допомога» (у співпраці з Лінгвістичним Центром, м. Львів).
«Так кажуть» Перший українсько-англійський англо-український словник народної мудрості.
Практичний англо-український словник фразеологічних синонімів
Виняткове зібрання краєвидів у прозі «Яка краса!»: Класика. Бестселери. Улюб-лене.
Виняткове зібрання характерів у прозі: Трилери. Драми. Детективи.
Українсько-англійський юридичний словник. Усталені звороти.
Українсько-англійський економічний словник. Усталені звороти.
Електронний посібник для вивчення англійської мови.
Collocations/Словосполучення
Антологія світового афоризму

Програмне забезпечення та зручний інтерфейс забезпечують максимальну зручність, навігацію та ефективність користування словниками Серії. Усі продукти Серії доступні авторизованим користувачам на сторінці www.folk-dictionary.com

ОРГАНІЗАЦІЯ НАВЧАЛЬНО-МЕТОДИЧНИХ СЕМІНАРІВ «КОРПУСИ ТЕКСТІВ У ЛІНГВІСТИЧНИХ ДОСЛІДЖЕННЯХ», «ЕФЕКТИВНЕ ВИКОРИСТАННЯ СЛОВНИКІВ», «НОВИНКИ У СФЕРІ ЛЕКСИКОГРАФІЇ».

Стан виконання проекту:

1. У межах навчально-методичного семінару кафедри англійської мови та літератури проведено семінар на тему «Ефективне використання словників на заняттях з практики англійської мови»
2. В рамках міжнародної наукової конференції «Міжкультурна комунікація: Мова – Культура – Особистість» проведено семінар на тему: «Використання інтернет-ресурсів корпусної лінгвістики при навчанні мові»
3. У навчальний план факультету романо-германських мов введено курс «Корпусна лінгвістика» та «Актуальні питання прикладної та комп’ютерної лінгвістики»
4. Введено написання дипломних та курсових проектів за прикладними темами лабораторії.

Завідувач лабораторії доц. Коцюк Л.М.

лексикографія, лабораторія

Пн	Вт	Ср	Чт	Пт	Сб	Нд
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Залишити відповідь Скасувати коментар