Чмара Юлия Георгиевна СОВРЕМЕННАЯ ЛЕКСИКОЛОГИЯ И КОРПУСНАЯ ЛИНГВИСТИКА УО "Брестский государственный университет им. А.С. Пушкина"
Научные исследования в рамках различных лингвистических направлений зачастую имеют объектом своего исследования лексический состав языка, текст или собрание текстов и подразумевают сначала подбор материала, а затем анализ и обработку больших лексических, текстовых объёмов с целью выявления некоторых языковых закономерностей. Традиционные лингвистические методы анализа лексики, текста позволяют выполнить все вышеперечисленные задачи, но их невысокая эффективность обуславливает всё более частое использование методов компьютерного анализа, который позволяет сократить работу лингвиста, при этом значительно увеличив объём обрабатываемых данных, а также избежать неточности и ошибки в подсчётах [1]. Таким образом, компьютерный анализ лексического состава языка, текста делает возможным установление языковых закономерностей, основанных не на теоретических, но на эмпирических данных. В рамках корпусной лингвистики под «корпусом» понимают «унифицированный, структурированный и размеченный массив языковых (речевых) данных в электронном виде, предназначенный для определённых филологических и, более широко, гуманитарных изысканий» [2]. Преимущество применения корпусного анализа текста, лексики заключается в большой степени объективности исследования: такие функции как подбор, разметка, анализ лексики, текстов и выявление соответствий выполняются автоматически. Таким образом, задачей исследователя является не анализ материала, а обработка полученных данных, выведение языковых закономерностей и подведение итогов. В зависимости от используемых корпусов и программ, методы корпусного анализа позволяют решать ряд задач в рамках лингвистических, социологических и исторических дисциплин. Так, корпус позволяет производить поиск лексических и грамматических языковых единиц и отбор слов, словоформ, грамматических категорий и словосочетаний. При поиске словоформ функция морфологического дескриптора позволяет проанализировать искомую единицу исходя из грамматических категорий слова. Возможен поиск искомой словоформы во всех или в определённых параметрами контекстах. Данная функция применяется в практическом аспекте исследования для сбора фактического материала и для составления теоретической базы исследования (словарей, грамматик, справочных пособий). Смежная функция конкорданса (по А.С. Герду, – «упорядоченный список словоформ с указанием всех вхождений в заданный массив текстов») позволяют проследить употребление языковой единицы в контексте фиксированной длины, проанализировать совместное употребление искомых словоформ. Одной из основных функций лингвистического корпуса является возможности получения лингвостатистических данных о частоте использования тех или иных форм, слов или словосочетаний, то есть определить частотность употребления. Данная функция позволяет определить различия семантики синонимов, установить контексты, характерные для синонимичных слов, а также разграничить жанровые и стилистические особенности и оттенки значений лексических единиц. В социолингвистическом исследовании частотность позволяет определить употребляемость языковой единицы определённой социальной, возрастной, гендерной группой. В историческом аспекте данная функция позволяет проследить этимологию и изменение семантики языковой единицы. Следствием частотного анализа текста является выделение статистики. Таким образом, в исследовании с применением корпусного анализа основанием научной гипотезы служат точные и конкретные эмпирические данные [3]. Приведём пример растительной номинации «берёза». Известно, что берёза растёт на большей части территории нашей страны, таким образом, славянский народ чтит, бережно относится к данному виду растений и восхваляет его в произведениях, как устного народного творчества, так и в художественной литературе. Проанализировав корпус растительной номинации «берёза», мы можем утверждать, что, действительно, основной сферой употребления данной лексической единицы выступают художественные и публицистические тексты. А также такие известные русские писатели как В.К. Арсеньев, М.М. Пришвин, Н.П. Вагнер и многие другие наиболее часто использовали данную лексическую единицу в своих произведениях. Каждый текст корпуса сопровождается паспортизацией или метаразметкой, то есть полным библиографическим описанием. В зависимости от вида корпуса метаразметка может содержать также и данные о стилистической и исторической принадлежности текста или же лексической единицы. Данная функция может быть использована в научных исследованиях по социолингвистике, лингвокультурологии, психолингвистике, стилистике. Основной возможностью корпусного анализа является функция создания собственного подкорпуса (выборка форм по заданным параметрам поиска). Ввод параметральных данных, характерных для конкретного исследования позволяет составить собственный лингвистический корпус, который может служить как инструментом анализа имеющегося текста, так и собственной эмпирической базой исследования. Говоря о лексикологии, важно отметить то, что данная дисциплина занимается изучением слова как единицы словарного состава языка (лексики) и всей лексической системы языка. Лексика выступает центральным уровнем организации системы языка, наиболее детально и массово отображающий изменения в смысловых областях общества, а также общесистемные перестройки в языке. Особую значимость имеют лексические данные для построения системной картины функционирования и развития языков, в том числе выявления процессов формирования их систем. Исследуя лексику как систему, лексикология имеет в виду взаимодействие между значениями слов и понятиями. В лексикологии слово рассматривается, прежде всего, с точки зрения значения, смысла и связей этого слова с другими словами. Понятия чаще всего интернациональны, тогда как значения слов национальны. Лексикология изучает закономерности функционирования и развития словарного состава языка, разрабатывает принципы стилистической классификации слов, нормы литературного словоупотребления в его соотношении с просторечием, вопросы профессионализмов, диалектизмов, архаизмов, неологизмов, нормализации лексикализованных словосочетаний. Лексикология рассматривает словарный состав языка (лексику) с точки зрения того, что представляет собой слово, как и что оно выражает, как оно меняется. Также следует отметить то, что к лексикологии примыкает фразеология, которую зачастую включают в лексикологию в качестве особого раздела [4]. Приведём пример английской растительной номинации «oak» – «дуб». Для британцев дуб имеет особенно важное значение. Известно, что он произрастает на большей части территории Британии. В культуре кельтов дуб считался особо священным деревом, посвященным друидам. Так, высказывалось предположение, что само слово «друид», возможно, происходит от корня «дру», что означает «дуб». Дуб почитали за его особую прочность и долговечность; некоторые видели в нём земное воплощение всемирного «Древа Жизни», связующего мир смертных с потусторонним миром. Дубы неизменно ассоциировались с небесами, и многие кельтские рельефы и статуи, найденные в археологических раскопках, как оказалось, сделаны из древесины дуба, что само по себе показывает, каким почитанием пользовалось это дерево [5]. Так, с точки зрения лексикологии важно то, что «oak is a large tree which bears acorns and typically has lobed deciduous leaves» [6]. Исходя из выше представленного примера, можно сделать вывод о том, что лексикология изучает лексический состав языка изнутри, изучает своего рода внутреннюю оболочку слова, связанную со значением, смыслом, связью слов с другими словами, в то время как корпусная лингвистика занимается исследованием внешней оболочки лексических единиц, как, например, частотностью их употребления и составление на основе этого определённой статистики, также корпусная лингвистика может строить данные о стилистической и исторической принадлежности текста или же той и иной лексической единицы. Корпусная лингвистика, которая в настоящее время находится в стадии становления, предоставляет новые методы, исследовательские приёмы и результаты для более полного описания лексического слоя современного языка. Основополагающие принципы, заложенные в этом направлении российскими учёными, как П.Н. Денисовым и В.А. Татариновым получают, с одной стороны, решающее подтверждение, а с другой – развиваются в результате применения новых информационных технологий. Таким образом, корпусная лингвистика даёт современному исследователю удобные инструменты не только для решения прикладных задач, но и для более глубокого понимания основных законов лексикологии, лингвистики в целом, в чём собственно и заключается взаимосвязь данных дисциплин.
1. Богданова, С.Ю. Возможности корпусной методологии в решении лингвистических задач / С.Ю. Богданова. – Иркутск : Вестник ИГЛУ. – № 2 (18). – 2012. – C. 47-50. 2. Захаров, В.П. Поисковые системы Интернета как инструмент лингвистических исследований / В.П. Захаров // Русский язык в Интернете : Сб. статей. – Казань : Отечество, 2003. – C. 48-59. 3. Герд, А.С. Автоматизация в лексикографии и словари-конкордансы / А.С. Герд // Филологические науки, 1981. – № 1. – C. 72-78. 4. Основы лексикологии [Электронный ресурс]. – Режим доступа : http://otherreferats.allbest.ru/languages/00218221_0.html. – Дата доступа : 05.03.2016. 5. Кельтская мифология [Электронный ресурс]. – Режим доступа : http://www.bibliotekar.ru/encCelt/68.htm. – Дата доступа : 05.03.2016. 6. Oxford Advanced Learner’s Dictionary of Current English [Электронный ресурс] / J. Turnbull. – Режим доступа : http://www.oxforddictionaries.com/definition/english/fruiter. – Дата доступа : 05.03.2016.
|