Файл: Анализ языковой сложности русскоязычных учебных пособий по лингвистике.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 30.10.2023

Просмотров: 221

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Это связано с тем, что автоматизация повысила точность. В то время он предлагал упрощенное решение.

В другом исследовании изучалась его полезность для ВВС США. Это произошло на фоне финансовых опасений по поводу упущений в общении. Они утверждали, что предложения должны учитываться в материалах для чтения для взрослых. Они также подняли другие факторы. Читателю общего интереса может понравиться упрощенный документ. Кто-то, читающий целенаправленно, может справиться с трудным текстом.




ARI им пригодился своей скоростью. Для технических текстов ключевыми являются скорость и эффективность.

Эти исследования подчеркивают важность ясности. Это означает охват более широкой аудитории. В этом случае удобочитаемость является жизненно важной с финансовой точки зрения. ARI помог определить, где улучшить ресурсы для стажеров.

Формула SMOG

SMOG расшифровывается как «Simple Measure of Gobbledygook».

Это структура читабельности. Он измеряет, сколько лет образования необходимо среднему человеку, чтобы понять текст. Лучше всего подходит для текстов из 30 предложений и более. Это была длина текста, отобранного при создании формулы.

Индекс SMOG был создан клиническим психологом Г. Гарри Маклафлином. Он хотел создать простую формулу удобочитаемости. Тот, в который вошли многосложные слова - слова с несколькими слогами. Он поставил перед собой задачу найти самый надежный расчет. Свою формулу он назвал «смехотворно простой».

Когда он был впервые опубликован в 1969 году, его простота поначалу вызывала сомнения. Но было доказано, что это отличная мера, и она используется до сих пор.

Маклафлин также назвал его SMOG в честь индекса FOG Роберта Ганнинга. SMOG также является данью уважения родному городу Маклафлина. Лондон пострадал от Великого смога из-за сильного загрязнения воздуха в начале 1950-х годов. Использование таких терминов, как «туман» и «смог» в исследованиях удобочитаемости подчеркивает необходимость повышения ясности письма.

SMOG оценивает количество лет обучения, необходимое среднему человеку, чтобы понять любой текст. Это известно как SMOG Grade. Маклафлин предложил рассчитать это, используя произведение, состоящее из 30 или более предложений, и выполнив следующие действия:

  • Считаем десять предложений в начале текста, 10 в середине и десять ближе к концу, всего 30 предложений.

  • Подсчет каждого слова из трех и более слогов

  • Извлечение квадратного корня из числа и округление его до ближайших 10

  • Добавляя три к этой цифре


Последняя цифра указывает уровень чтения.

Если формула кажется удивительно простой, это потому, что так оно и есть. Статистик, который посмотрел на более раннюю версию статьи, подумал, что это «надуманная». Он не мог поверить, что этот метод настолько прост.

Тем не менее, SMOG был подкреплен исследованиями. Особенно в медицинской литературе.

Индекс SMOG был создан в докомпьютерную эпоху с использованием трудоемкой ручной выборки. Readable анализирует текст в целом, повышая эффективность и точность.

Хотя SMOG широко используется, здравоохранение является сектором, в котором он используется в основном. Его структура измеряет полное понимание. Медицинскому использованию формулы способствовали исследования. В исследованиях рассматривались различные формулы и их полезность в здравоохранении.

Например, в одном тематическом исследовании, посвященном оценке онлайн-информации о болезни Паркинсона, SMOG был назван «золотым стандартом». Их исследование было вызвано увеличением числа пациентов, использующих Интернет для получения медицинских ресурсов.

Конечно, пациенты менее грамотны в медицинских терминах, чем медицинские работники. В результате они обычно изо всех сил пытаются их понять. Их внимание было сосредоточено на интересах потребителей. Они использовали несколько разных формул, но обнаружили, что их предпочтительным показателем является SMOG.

По крайней мере, часть населения с болезнью Паркинсона регулярно пользуется Интернетом. Ясность – это необходимость. Точные формулы, такие как SMOG, гарантируют это. Исследование показало, что многим людям трудно понять ресурсы. Они также отмечают, что удобочитаемость в печатном виде является давней проблемой.

Врачам в Великобритании было приказано писать пациентам на «простом английском языке». Это означает использование коротких предложений и отказ от медицинского жаргона.

Эта разработка является серьезным изменением в написании медицинских писем. Традиционно пациенты переписывались в письмах между врачом и терапевтом. Теперь врачам рекомендуется писать напрямую своим пациентам, используя простой язык. Это сократило количество встреч, которые пациенты проводят со своими врачами для объяснения терминов. Легко увидеть прямое положительное влияние улучшения читаемости на NHS. Экономия времени и денег.

Четкость вашего сообщения является ключом к пониманию аудитории. Вот почему так важны усилия Маклафлина, направленные на то, чтобы помочь людям улучшить их доступность.



Формула Нью Дейла-Чолла

Оценка удобочитаемости Нью-Дейла-Чолла сравнивает текст с рядом слов, которые считаются знакомыми четвероклассникам. Чем больше незнакомых слов используется, тем выше уровень чтения. Это аналогичная система Spache. Spache имеет меньший список знакомых слов и больше подходит для маленьких детей. Оба они рассчитываются по одному и тому же принципу. Знакомство со словами — важный аспект читабельности. Чем ниже балл, тем читабельнее текст для четвероклассника.

Тест был создан Эдгаром Дейлом и Жанной Чолл. Первоначально он был опубликован в 1948 году. В то время он содержал 763 слова. Он был обновлен в 1995 году, чтобы расширить список слов до более чем 3000 слов. Формула впервые была предложена в статье. «Формула прогнозирования читабельности».

Список слов был пересмотрен как формула Нью-Дейла-Чолла. Как было указано в 1995 году, первоначальный список содержал только основные формы глаголов и существительных. В пересмотренной версии учитывается множественное число и время.

Новый тест Дейла Чалла учитывает количество слов и предложений. Кроме того, слова вне списка слов («трудные» слова) сравниваются со знакомым списком слов. Если в тексте более 5% сложных слов, оценка корректируется. Он становится выше исходного балла. На момент создания расчет Дейла-Чолла занимал больше времени. Он использовал образец из 100 слов. Затем его сравнили со списком New Dale-Chall из 3000 слов. Необходимо было рассчитать среднюю длину предложения, а также процент незнакомых слов.

Если вы являетесь преподавателем начальной школы или пишете для аналогичного доступного уровня, мы рекомендуем использовать NDC в качестве дополнительной оценки. Для справки, вот список общих слов, используемых в формуле.

Формула Нью-Дейла-Чолла может гарантировать, что текст подходит для четвероклассников. Тем не менее, он также имеет значение моталки. Это связано с тем, что удобочитаемость признается важной для доступности. Например, в руководящих принципах правительства Великобритании говорится, что контент должен быть удобочитаемым для детей в возрасте 9 лет. Это так, чтобы его можно было легко понять. Это относится не только к детям, но и к людям с дополнительными потребностями в обучении. Поскольку читабельность и доступность идут рука об руку, это важно.

Используя структуру удобочитаемости New Dale-Chall, писатели могут охватить широкую аудиторию.

Преимущество оценки New Dale-Chall заключается в том, что в ней используется знакомый элемент слова. Для общего применения формула Флеша-Кинкейда является самой популярной и уважаемой формулой. Чтобы нацелить свое письмо на начальный уровень, выберите NDC.


Обзор лингвистических пособий

Как исследователь, я отобрал три учебника по введению в языкознание для проведения анализа. Каждый из учебников представляет собой ценный источник информации, который может помочь студентам понять основы языкознания. Для анализа я создал корпус текста из 5000 слов для каждого учебника, который будет использован в дальнейшем.


Учебники, выбранные для анализа, представляют введение в языкознание и охватывают основные аспекты данной области. Ниже представлена информация об авторах и содержании каждого учебника:

"Введение в языкознание" авторства Ю.С. Маслова: Этот учебник является введением в основные концепции и методы языкознания. Ю.С. Маслов является известным лингвистом и профессором, специализирующимся в области теоретической лингвистики и семиотики. В книге освещаются такие темы, как фонетика, морфология, синтаксис, семантика и прагматика. Он представляет основные теоретические концепции, используя примеры из русского языка.

"Введение в языкознание" авторства Г.С. Зенкова и И.А. Сапожниковой: Этот учебник также представляет введение в основные принципы языкознания. Г.С. Зенков и И.А. Сапожникова являются опытными лингвистами и преподавателями. Книга охватывает различные аспекты языка, такие как фонетика, морфология, синтаксис, семантика и стилистика. Они также рассматривают взаимосвязь языка и культуры. В учебнике представлены разнообразные примеры и задания для практического применения теоретических материалов.

"Введение в языкознание" авторства О.Н. Чарыковой и И.А. Стернина: Этот учебник также предназначен для введения в языкознание и предлагает систематический подход к изучению языка. О.Н. Чарыкова и И.А. Стернин являются известными специалистами в области лингвистики и преподают на соответствующих кафедрах. Книга охватывает широкий спектр тем, включая фонетику, морфологию, синтаксис, семантику, стилистику и прагматику. В учебнике также представлены практические упражнения и примеры из разных языковых систем.

Оценка сложности учебных текстов


Как исследователь, для анализа текста из учебников я использовал сайт readability.io. Этот онлайн-инструмент предоставляет возможность оценить уровень языковой сложности текста на основе различных формул удобочитаемости, включая Формулу Flesch-Kincaid, Индекс Колман-Лиау, Automatic Readability Index, SMOG (Simple Measure of Gobbledygook) и Формулу Дэйла-Чейла.


В начале процесса я открыл веб-браузер и перешел на сайт readability.io. Там я обнаружил поле ввода текста, где я мог вставить текст из одного из выбранных учебников. Я скопировал и вставил текст из первого учебника в это поле.

Затем я нажал кнопку "Анализировать", чтобы сайт начал анализировать текст. В течение нескольких секунд сайт обработал текст и выдал результаты анализа.

На странице результатов я увидел различные показатели, основанные на выбранных формулах удобочитаемости. Каждая формула предоставляла свой результат, который помогал мне понять сложность текста на основе различных метрик, таких как средняя длина предложений, сложность слов и т. д. Я обратил внимание на числовые значения каждого показателя, а также на их интерпретацию, которая была предоставлена на сайте.

Кроме числовых результатов, сайт readability.io также предоставлял дополнительную информацию о тексте, например, средний возраст, соответствующий уровню понимания текста, и рекомендации по улучшению удобочитаемости.

Я продолжил этот процесс для каждого из учебников, вставляя тексты из них в поле ввода и повторяя анализ на сайте readability.io. Это позволило мне сравнить уровни языковой сложности каждого учебника на основе результатов, полученных с помощью различных формул удобочитаемости.
Ниже приведены результаты анализа:



Рисунок 1 Результаты проведенного анализа на 1 корпусе



Рисунок 2 Результаты проведенного анализа на 2 корпусе



Рисунок 3 Результаты проведенного анализа на 3 корпусе

Далее я рассортировал результаты в таблицу для сравнения:



Рисунок 4 Индикаторы читаемости текста



Рисунок 5 Расчётные показатели

Анализируя таблицу с результатами анализа учебников по введению в языкознание, можно выделить следующие основные данные:

  • Уровень сложности: Все учебники имеют достаточно сложный уровень читабельности, что указывает на то, что они предназначены для студентов, обладающих определенным уровнем языковых навыков. Средняя оценка читабельности составляет около 14-15, что подтверждает высокий уровень сложности текстов.

  • Количество слов и предложений: Каждый из учебников содержит 5000 слов, что указывает на сравнимый объем материала, представленного в них. Однако, количество предложений может немного варьироваться, что может свидетельствовать о разном стиле и структуре текстов.

  • Сложные слова: Процент сложных слов в текстах колеблется от 16.66% до 20.72%. Это говорит о том, что учебники активно используют специализированную терминологию и лексику, которая может быть непривычной для начинающих студентов. Это требует дополнительного внимания и объяснения со стороны преподавателя.

  • Среднее количество слов на предложение: Среднее количество слов на предложение варьируется от 11.9 до 13.59. Более длинные предложения могут содержать более сложные концепции и идеи, что требует от студентов умения анализировать и связывать информацию.

  • Распределение слов по слогам: В таблице представлена информация о количестве слов, содержащих более 4 слогов и до 4 слогов. Это позволяет нам оценить наличие сложной лексики и многосложных слов в текстах, что может повлиять на сложность понимания и усвоения материала.