ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2020
Просмотров: 2333
Скачиваний: 19
[Решение задачи:
Мне на день рождения подарили секундомер, а я не знаю, что с ним делать. Прибор, конечно, нужный, но непонятно зачем. Если бы сейчас было лето, я бы бегал с ним стометровку или другую дистанцию, и замерял бы время. А сейчас другой сезон — зима. По улицам с секундомером не побегаешь. Лучше бы мне часы подарили, а то я всегда тороплюсь и всегда опаздываю. В моих стрелки сломались. Бабушка мне говорила: «Не спеши, людей насмешишь». В общем, в этом году секундомер мне не понадобится. Да и вообще секунды слишком маленькие интервалы, важнее минуты или часы. Я вчера в школу на час опоздал, меня не пустили, и секундомер бы не помог. А вообще, из часовых механизмов самый полезный таймер.
Исходя из значений, данных в тексте:
Синонимия:
нужный – полезный;
спешить – торопиться.
Антонимия:
зима – лето;
торопиться – не спешить.
Гипонимия:
механизм – прибор, часы, секундомер, таймер;
прибор – часы, секундомер, таймер;
время – год, день, час, минута, секунда, сезон, лето, зима;
интервал – год, день, час, минута, секунда, сезон, лето, зима;
сезон – лето, зима;
дистанция – стометровка.
Меронимия:
механизм, прибор, часы, секундомер – стрелка;
год, сезон, лето, зима, день, час, минута – секунда;
год, сезон, лето, зима, день, час – минута;
год, сезон, лето, зима, день – час;
год, сезон, лето, зима – день;
год – сезон, лето, зима. ]
16. Исходные данные: Таблица распределения терминов в трех текстах.
Программные средства: Excel
Задание: Вычислить весовые коэффициенты терминов в трех текстах по формуле
[Решение задачи:
Открыть таблицу д/TF*IDF
tfij – частотность терминов; N – количество всех документов (3); n – количество документов, где термин t встречается хотя бы 1 раз
N = n – коэффициент нулевой.
Stop-слова получают нулевой коэффициент. Те слова, что отражают смысл текста получат высокие коэффициенты]
17. Проведите сравнительный анализ двух словарей (словарная статья – politics, policy).
[Решение задачи:
слово, транскрипция, дефиниция (обычно сначала как сущ., может приводиться мн.ч. слова, значения, примеры использования), фразы с данным словом, откуда произошло (не всегда) – на основе I-словаря.]
18. Провести сравнительный анализ BNS и НКРЯ.
[Решение задачи:
BNC – закрытый корпус, т.е. не обновляется. В нем ровно 100 млн. слов (1980-93), создан в 1996 году. Расположение на сайте: слева – панель ввода параметров поиска: Отображение – список, диаграмма, KWIC, сравнение;
Строка запроса – слово, коллокаты, список ч.р.;
Жанры – разговорный, фантазия, журнал, газета, неучебный, учебный, разное, поджанры;
Сортировка и пределы – частота, релевантность, по алфавиту; частота, информация.
справа – окно результатов: сверху – данные о количестве и жанры; снизу – предложения с коллокатами, в виде таблицы. Результаты выводятся в этом же окне. Можно сохранить результаты.
НКРЯ – постоянно обновляется. В нем более 200 млн. слов, запущен в 2003 году. Последнее обновление: 08.05. Можно переключиться на англ.Расположение на сайте: слева – главная страница; список корпусов: основной, синтаксический, газетный, параллельный, обучающий, диалектный. поэтический, устный, акцентологический, мультимедийный, исторический; использование корпуса.
справа – критерии поиска: ввод слова; лексико-грамматический поиск: слово. грамм. признаки, семант. признаки, доп. признаки, словообразование; расстояние для другого слова.
Результаты поиска открываются в новом окне. Выводится объем всего корпуса: документов, предложений, слов; искомое слово, заданное в запросе; Сколько найдено документов, вхождений; сами результаты в виде списка под номером – название источника, кол-во примеров, примеры. Если надпись [омонимия снята], значит слово проверено. Результаты можно сохранить. Можно также включить KWIC-список.]
19. Проведите лексикографический анализ словаря.
[Решение задачи:
Анализ словаря
-
Установить тип словаря (толковый, этимологический и т.д.), проанализировать его структуру (из каких разделов состоит)
-
Выписать список сокращений и их объяснение
-
Составить список приложений
-
Проанализировать несколько словарных статей и их структуру: каким шрифтом пишутся слова; как дается произношение; в каких случаях и с какой целью используются сокращения; каков способ передачи семантики слова (например, сравнение); есть ли примеры иллюстрирующие значение слова в контексте; как указывается происхождение слова; как отмечается стилистический статус слова; приводятся ли синонимы и антонимы; указаны ли производные слова
-
Какая информация в словарной статье является основной, а какая дополнительной.]
20. Ниже даны предложенные на языке Самоа (остров на юге Тихого океана) и соответствующие им предложения на английском:
ek kum chuchu – the train is coming
ek namas chuchu – the train is very big
nek kum niva chuchu – the train isn’t coming
ek chuchu – it’s a train
Как бы вы сказали на языке Самоа «It’s not a train»:
nek chuchu niva
ek niva chuchu
nek niva chuchu
[Решение задачи:
Отрицательные предложения в этом языке начинаются с ‘nek’. Последнее слово всегда ‘chuchu’. Следовательно, ответ: nek niva chuchu.]
1 Универсалии – тривиальные черты языка: согласных больше, чем гласных, но в речи это уравновешивается большей частотностью гласных; в языке не могут быть только знаменательные слова, должны быть также и указательные (дейктические). Фреквенталии – частотные, специфические черты каждого языка.