Файл: вопросы Гак 2013 (с ответами).doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.12.2020

Просмотров: 2239

Скачиваний: 18

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

[Решение задачи:

Мне на день рождения подарили секундомер, а я не знаю, что с ним делать. Прибор, конечно, нужный, но непонятно зачем. Если бы сейчас было лето, я бы бегал с ним стометровку или другую дистанцию, и замерял бы время. А сейчас другой сезонзима. По улицам с секундомером не побегаешь. Лучше бы мне часы подарили, а то я всегда тороплюсь и всегда опаздываю. В моих стрелки сломались. Бабушка мне говорила: «Не спеши, людей насмешишь». В общем, в этом году секундомер мне не понадобится. Да и вообще секунды слишком маленькие интервалы, важнее минуты или часы. Я вчера в школу на час опоздал, меня не пустили, и секундомер бы не помог. А вообще, из часовых механизмов самый полезный таймер.

Исходя из значений, данных в тексте:

Синонимия:

нужный – полезный;

спешить – торопиться.

Антонимия:

зима – лето;

торопиться – не спешить.

Гипонимия:

механизм – прибор, часы, секундомер, таймер;

прибор – часы, секундомер, таймер;

время – год, день, час, минута, секунда, сезон, лето, зима;

интервал – год, день, час, минута, секунда, сезон, лето, зима;

сезон – лето, зима;

дистанция – стометровка.

Меронимия:

механизм, прибор, часы, секундомер – стрелка;

год, сезон, лето, зима, день, час, минута – секунда;

год, сезон, лето, зима, день, час – минута;

год, сезон, лето, зима, день – час;

год, сезон, лето, зима – день;

год – сезон, лето, зима. ]


16. Исходные данные: Таблица распределения терминов в трех текстах.

Программные средства: Excel

Задание: Вычислить весовые коэффициенты терминов в трех текстах по формуле

[Решение задачи:

Открыть таблицу д/TF*IDF

tfij – частотность терминов; N – количество всех документов (3); n – количество документов, где термин t встречается хотя бы 1 раз

N = n – коэффициент нулевой.

Stop-слова получают нулевой коэффициент. Те слова, что отражают смысл текста получат высокие коэффициенты]


17. Проведите сравнительный анализ двух словарей (словарная статья – politics, policy).

[Решение задачи:

слово, транскрипция, дефиниция (обычно сначала как сущ., может приводиться мн.ч. слова, значения, примеры использования), фразы с данным словом, откуда произошло (не всегда) – на основе I-словаря.]


18. Провести сравнительный анализ BNS и НКРЯ.

[Решение задачи:

BNC – закрытый корпус, т.е. не обновляется. В нем ровно 100 млн. слов (1980-93), создан в 1996 году. Расположение на сайте: слева – панель ввода параметров поиска: Отображение – список, диаграмма, KWIC, сравнение;

Строка запроса – слово, коллокаты, список ч.р.;

Жанры – разговорный, фантазия, журнал, газета, неучебный, учебный, разное, поджанры;

Сортировка и пределы – частота, релевантность, по алфавиту; частота, информация.

справа – окно результатов: сверху – данные о количестве и жанры; снизу – предложения с коллокатами, в виде таблицы. Результаты выводятся в этом же окне. Можно сохранить результаты.

НКРЯ – постоянно обновляется. В нем более 200 млн. слов, запущен в 2003 году. Последнее обновление: 08.05. Можно переключиться на англ.Расположение на сайте: слева – главная страница; список корпусов: основной, синтаксический, газетный, параллельный, обучающий, диалектный. поэтический, устный, акцентологический, мультимедийный, исторический; использование корпуса.


справа – критерии поиска: ввод слова; лексико-грамматический поиск: слово. грамм. признаки, семант. признаки, доп. признаки, словообразование; расстояние для другого слова.

Результаты поиска открываются в новом окне. Выводится объем всего корпуса: документов, предложений, слов; искомое слово, заданное в запросе; Сколько найдено документов, вхождений; сами результаты в виде списка под номером – название источника, кол-во примеров, примеры. Если надпись [омонимия снята], значит слово проверено. Результаты можно сохранить. Можно также включить KWIC-список.]


19. Проведите лексикографический анализ словаря.

[Решение задачи:

Анализ словаря

  1. Установить тип словаря (толковый, этимологический и т.д.), проанализировать его структуру (из каких разделов состоит)

  2. Выписать список сокращений и их объяснение

  3. Составить список приложений

  4. Проанализировать несколько словарных статей и их структуру: каким шрифтом пишутся слова; как дается произношение; в каких случаях и с какой целью используются сокращения; каков способ передачи семантики слова (например, сравнение); есть ли примеры иллюстрирующие значение слова в контексте; как указывается происхождение слова; как отмечается стилистический статус слова; приводятся ли синонимы и антонимы; указаны ли производные слова

  5. Какая информация в словарной статье является основной, а какая дополнительной.]


20. Ниже даны предложенные на языке Самоа (остров на юге Тихого океана) и соответствующие им предложения на английском:

ek kum chuchu – the train is coming

ek namas chuchu – the train is very big

nek kum niva chuchu – the train isn’t coming

ek chuchuits a train

Как бы вы сказали на языке Самоа «Its not a train»:

nek chuchu niva

ek niva chuchu

nek niva chuchu

[Решение задачи:

Отрицательные предложения в этом языке начинаются с ‘nek’. Последнее слово всегда ‘chuchu’. Следовательно, ответ: nek niva chuchu.]

1 Универсалии – тривиальные черты языка: согласных больше, чем гласных, но в речи это уравновешивается большей частотностью гласных; в языке не могут быть только знаменательные слова, должны быть также и указательные (дейктические). Фреквенталии – частотные, специфические черты каждого языка.