Файл: Анализ языковой сложности русскоязычных учебных пособий по лингвистике.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 30.10.2023
Просмотров: 237
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
ГЛАВА 2 РАЗРАБОТКА СЛОВАРЯ НА ПРИМЕРЕ ПРЕДМЕТНОЙ ОБЛАСТИ «ИСТОРИЯ ЮЖНОГО УРАЛА»
Предметная область «История Южного Урала» занимается изучением регионов, народностей, артефактов Южного Урала в различные периоды.
В научном плане, история Южного Урала занимает важное место, так как Урал представляет собой невиданное количество археологических объектов.
В последнее время проводится огромное количество исследований и археологических раскопок на территории Южного Урала. Результаты этих работ имеют огромный вес и вносят большой вклад в общую историю России. Уникальность найденных артефактов вызывает создание специальной терминологии. Терминология данной предметной области обладает большим
количеством специальных терминов.
Таким образом, понимать научные работы по данной предметной области довольно сложно, так как необходимо знать огромное количество терминов, что образует преграду для академиков и студентов в этой области.
Задачей данной работы является разработка методологии и ее конкретной реализации многофункционального словаря и ее иллюстрациия на примере построения электронного словаря через инструмент «Field Works Language Explorer 9». Подобный словарь может быть использован студентами, может служить основой для переводческого словаря, и может быть использован в разных аспектах. Многофункциональность подобного словаря обуславливает
предоставление различной информации. Таким образом, в него будет включено много лингвистической и экстралингвистической информации
Многофункциональность подобного словаря обуславливает включение в него как лингвистической так и экстралингвистическая информации, в связи с этим нами были выделены следующие словарные зоны:
1 – Название термина; 2 – Часть речи;
3 – Концептуальная категория термина; 4 – Дефиниция термина;
5– Пример употребления термина в контексте;
6 – Изображение объекта обозначенного термином.
Поставленные задачи обуславливают следующую методологию исследования, которая будет включать следующие этапы:
В качестве материала исследования был составлен корпус текстов по предметной области «История Южного Урала», в который вошел текст девятого тома научной работы “История Южного Урала”, написанного историками Южно-Уральского Государственного Университета и Института истории и Археологии Уральского отделения Российской академии наук.
В 9-м томе содержится восемь очерков в которых кратко изглагаются этапы исторического развития Южного Урала, эти очерки написаны в соответствии с предшествующими восьми томами «Истории Южного Урала». Этот корпус текстов
был обработан ланакий, с помощью которого было выявлено, что общий объем содержит 70719 словоупотреблений из которых 27534 разные, что говорит о высокой степени сжатости лексики данной
предметной области.
Инструмент LanaKey позволяет сортировать лексику по разным параметрам или их сочетанию. Поскольку контент предметной области чаще всего отображается именно именными лексическими группами, были автоматически выделены именные группы от одного до 4-х. Также мы считаем наиболее важными многокомпонентные термины, поэтому ланакий был задан определенной формулой.
Термины отобраны по релевантности, которая задается в окнах config parameters. Релевантность для 1гр терминов = F. Релевантность для n гр
=F+n*100, где F-частота, n- количество компонент (слов в термине), 100- произвольный коэффициент, чтобы придать больший вес многокомпонентным NP. Лексемы автоматически сведены к одной самой частотной выделенной лексеме и общая релевантность лексемы дана в квадратных скобках.
Результат обработки показан на скриншоте интерфейса (рисунок 2.3.1), где показана формула и часть списка полученных терминов отсортированных по показателю релевантности.
Рисунок 2.3.1 – Результат обработки
Выделенная лексика была вручную отсортирована, результатом чего являются термины, характерные для данной предметной области. Аналогичным образом были обработаны отдельные разделы общего корпуса, посвященные различным историческим периодам. Так как данное издание
делится на главы по историческим периодам, для разбиения общего корпуса на подкорпусы послужили главы:
Из каждого подкорпуса по описанной методике была выделена соответствующая ему лексика. Из полученных сырых списков были извлечены только лексемы релевантные контенту предметной области которые мы дальше называем терминами.
Проведенный анализ показал, что различные подкорпусы различаются насыщенностью терминов, например в первом 142, в четвертом 332.
Списки 100 наиболее релевантных терминов для каждой главы представлены в приложении (Приложение 1).
Распределение самых релевантных терминов по периодам можно увидеть на таблице (таблица 2.3.1). В таблице показан фрагмент отнесенных по релевантности терминов. В данной таблице рядом с указанием периода указан объем соответствущего ему корпуса в круглых скобках.
Таблица 2.3.1 – Фрагмент таблицы релевантности терминов для каждого периода
Данные списки выделенной терминологии
определяют вокабуляр будущего словаря.
Далее был проанализирован список терминов для каждого подкорпуса и термины разнесены по различным концептуальным классам с учетом исторического периода и отображения аспектов деятельности жизни людей. Для каждой главы был создан отдельный набор концептуальных классов, так как каждая глава может обладать классами, присущими только ей. Разный набор концептуальных классов может свидетельствовать о прогрессе в обществе.
В процессе отнесения терминов к различным концептуальным классам было выявлено, что некоторые термины могут быть отнесены к нескольким концептуальным классам. Это может быть вызвано несколькими явлениями.
Например, если термины имеют разные значения то это концептуальная многозначность. Термин топор может отнестись к категориям инструмент и оружие. Для отнесения определенного случая к определенной категории нужно обратить внимание на контекст.
В противном случае, термин может быть концептуально многозначен или концептуально синкритичен. Примером этого может послужить термин военная изба, так как он может быть отнесен как к категории Постройки, так и к категории Военное дело. Выбор отнесения термина к определенной категории в подобных случаях в большей степени зависит от исследователя.
Концептуальная синкритичность – наличие у единицы двух и более непротиворечивых концептуальных значений в контексте или вне его [Зиновьева, 2020, 11].
В результате этого была проведена категоризация терминологии каждой главы по созданным
-
Значение предметной области
Предметная область «История Южного Урала» занимается изучением регионов, народностей, артефактов Южного Урала в различные периоды.
В научном плане, история Южного Урала занимает важное место, так как Урал представляет собой невиданное количество археологических объектов.
В последнее время проводится огромное количество исследований и археологических раскопок на территории Южного Урала. Результаты этих работ имеют огромный вес и вносят большой вклад в общую историю России. Уникальность найденных артефактов вызывает создание специальной терминологии. Терминология данной предметной области обладает большим
количеством специальных терминов.
Таким образом, понимать научные работы по данной предметной области довольно сложно, так как необходимо знать огромное количество терминов, что образует преграду для академиков и студентов в этой области.
-
Постановка задачи и методология исследования
Задачей данной работы является разработка методологии и ее конкретной реализации многофункционального словаря и ее иллюстрациия на примере построения электронного словаря через инструмент «Field Works Language Explorer 9». Подобный словарь может быть использован студентами, может служить основой для переводческого словаря, и может быть использован в разных аспектах. Многофункциональность подобного словаря обуславливает
предоставление различной информации. Таким образом, в него будет включено много лингвистической и экстралингвистической информации
Многофункциональность подобного словаря обуславливает включение в него как лингвистической так и экстралингвистическая информации, в связи с этим нами были выделены следующие словарные зоны:
1 – Название термина; 2 – Часть речи;
3 – Концептуальная категория термина; 4 – Дефиниция термина;
5– Пример употребления термина в контексте;
6 – Изображение объекта обозначенного термином.
Поставленные задачи обуславливают следующую методологию исследования, которая будет включать следующие этапы:
-
Определение вокабуляра словаря с категоризацией частей речи; -
Концептуальная категоризация выделенной терминологии; -
Поиск дефиниций; -
Выделение контекстов; -
Иллюстрирование.
-
Определение вокабуляра словаря
В качестве материала исследования был составлен корпус текстов по предметной области «История Южного Урала», в который вошел текст девятого тома научной работы “История Южного Урала”, написанного историками Южно-Уральского Государственного Университета и Института истории и Археологии Уральского отделения Российской академии наук.
В 9-м томе содержится восемь очерков в которых кратко изглагаются этапы исторического развития Южного Урала, эти очерки написаны в соответствии с предшествующими восьми томами «Истории Южного Урала». Этот корпус текстов
был обработан ланакий, с помощью которого было выявлено, что общий объем содержит 70719 словоупотреблений из которых 27534 разные, что говорит о высокой степени сжатости лексики данной
предметной области.
Инструмент LanaKey позволяет сортировать лексику по разным параметрам или их сочетанию. Поскольку контент предметной области чаще всего отображается именно именными лексическими группами, были автоматически выделены именные группы от одного до 4-х. Также мы считаем наиболее важными многокомпонентные термины, поэтому ланакий был задан определенной формулой.
Термины отобраны по релевантности, которая задается в окнах config parameters. Релевантность для 1гр терминов = F. Релевантность для n гр
=F+n*100, где F-частота, n- количество компонент (слов в термине), 100- произвольный коэффициент, чтобы придать больший вес многокомпонентным NP. Лексемы автоматически сведены к одной самой частотной выделенной лексеме и общая релевантность лексемы дана в квадратных скобках.
Результат обработки показан на скриншоте интерфейса (рисунок 2.3.1), где показана формула и часть списка полученных терминов отсортированных по показателю релевантности.
Рисунок 2.3.1 – Результат обработки
Выделенная лексика была вручную отсортирована, результатом чего являются термины, характерные для данной предметной области. Аналогичным образом были обработаны отдельные разделы общего корпуса, посвященные различным историческим периодам. Так как данное издание
делится на главы по историческим периодам, для разбиения общего корпуса на подкорпусы послужили главы:
-
Южный Урал в каменном веке; -
Южный Урал в начале эпохи металлов. Бронзовый век; -
Южный Урал в эпоху ранних кочевников; -
Эпоха Великового переселения и ранее Средневековье Южного Урала; -
У истоков южноуральских народов. Южный Урал в эпоху золотой орды (IX— начало XV века); -
Южное Зауралье (первая треть XV — конец XIX века); -
Горнозаводская политика России и заводы Южного Урал(1734-1900).
Из каждого подкорпуса по описанной методике была выделена соответствующая ему лексика. Из полученных сырых списков были извлечены только лексемы релевантные контенту предметной области которые мы дальше называем терминами.
Проведенный анализ показал, что различные подкорпусы различаются насыщенностью терминов, например в первом 142, в четвертом 332.
Списки 100 наиболее релевантных терминов для каждой главы представлены в приложении (Приложение 1).
Распределение самых релевантных терминов по периодам можно увидеть на таблице (таблица 2.3.1). В таблице показан фрагмент отнесенных по релевантности терминов. В данной таблице рядом с указанием периода указан объем соответствущего ему корпуса в круглых скобках.
Таблица 2.3.1 – Фрагмент таблицы релевантности терминов для каждого периода
Данные списки выделенной терминологии
определяют вокабуляр будущего словаря.
-
Концептуальная категоризация выделенной терминологии
Далее был проанализирован список терминов для каждого подкорпуса и термины разнесены по различным концептуальным классам с учетом исторического периода и отображения аспектов деятельности жизни людей. Для каждой главы был создан отдельный набор концептуальных классов, так как каждая глава может обладать классами, присущими только ей. Разный набор концептуальных классов может свидетельствовать о прогрессе в обществе.
В процессе отнесения терминов к различным концептуальным классам было выявлено, что некоторые термины могут быть отнесены к нескольким концептуальным классам. Это может быть вызвано несколькими явлениями.
Например, если термины имеют разные значения то это концептуальная многозначность. Термин топор может отнестись к категориям инструмент и оружие. Для отнесения определенного случая к определенной категории нужно обратить внимание на контекст.
В противном случае, термин может быть концептуально многозначен или концептуально синкритичен. Примером этого может послужить термин военная изба, так как он может быть отнесен как к категории Постройки, так и к категории Военное дело. Выбор отнесения термина к определенной категории в подобных случаях в большей степени зависит от исследователя.
Концептуальная синкритичность – наличие у единицы двух и более непротиворечивых концептуальных значений в контексте или вне его [Зиновьева, 2020, 11].
В результате этого была проведена категоризация терминологии каждой главы по созданным