Добавлен: 28.03.2023
Просмотров: 103
Скачиваний: 3
Описание задания
Задания для выполнения приведены ниже, максимальное количество баллов за правильное выполнение всех заданий – 49 баллов.
Распределение баллов следующее:
Задание 1 – 9 баллов максимум.
Задание 2 – 10 баллов максимум.
Задание 3 – 15 баллов максимум.
Задание 4 – 15 баллов максимум.
Сдаваемый на проверку файл должен иметь следующее название файла:
ККЗ_МКА_ФамилияИО_номер группы.
Задание 1
Файл Облигации.XLS содержит значения следующих переменных:
Дата – текущая дата.
10 - летние облигации – значения учетной ставки 10-летних облигаций Министерства финансов США (процентное изменение по отношению к величине учетной ставки на момент закрытия предыдущих торгов).
DJIA - значения индекса Доу Джонса на момент закрытия предыдущих торгов.
- Постройте график (один) временных рядов для ежедневных значений индекса, его ежедневных процентных изменений.
- Вычислите основные статистические характеристики переменных.
- Определите ежедневные изменения индекса DJIA, выраженные в процентах. Насколько соответствуют этим данным правила областей (правило трёх сигм (3σ))?
Динамика индекса Доу-Джонса представлена на рисунке:
Статистические характеристики переменных рассчитаны с помощью модуля Анализ данных ???? Описательная статистика. Результат приведен в таблице
Статистические характеристики переменных
Показатели |
10-летние облигации |
DJIA |
Среднее |
3,8368 |
8197,5798 |
Стандартная ошибка |
0,0179 |
40,5361 |
Медиана |
3,89 |
8257,61 |
Стандартное отклонение |
0,1387 |
311,3640 |
Дисперсия выборки |
0,0192 |
96947,5259 |
Эксцесс |
-0,8605 |
-0,6989 |
Асимметричность |
-0,5476 |
-0,4464 |
Интервал |
0,55 |
1202,67 |
Минимум |
3,54 |
7524,06 |
Максимум |
4,09 |
8726,73 |
Сумма |
230,21 |
483657,21 |
Счет |
60 |
59 |
Среднее значение по 10-летним облигациям за период составило3,837. Медиана – 3,89. Это означает, что в половине случаев значение учетной ставки было ниже этого уровня, а в половине – выше. Поскольку среднее значение и медиана близки по значению, это говорит о том, что совокупность однородна. Разница между минимальным и максимальным значением учетной ставки за период составила 0,55. Стандартное отклонение равно 0,1387, т.е. величина учетной ставки отклоняется от среднего значения на 0,1387. Коэффициент вариации (отношение стандартного отклонения к среднему значению) равно 3,6%, т.е. совокупность данных является однородной.
Среднее значение индекса Доу-Джонса за период равно 8197,58, медиана – 8257,61. Близость этих показателей говорит о том, что совокупность однородна. Стандартное отклонение равно 311,36, т.е. отдельные значения индекса отклоняются от средней величины в среднем на 311,36. Разница между наибольшим и наименьшим значением за период составила 1202,67. Коэффициент вариации равен 3,8% (311,36/8197,58*100%). Это говорит о количественной однородности совокупности.
Среднее значение ежедневных изменений индекса Доу-Джонса равно 0,16%, стандартное отклонение – 1,38%.
Проверим правило трех сигм:
Ни одно значение не выходит за пределы интервала -3,96%–4,29%, т.е. данные соответствуют правилу «трех сигм».
Задание 2.
Для анализа финансовых расчетов с филиалами торговой компании за последние 4 месяца (файл Торговая компания.XLS) собрана информация об операциях поставки товаров, а именно, Филиал№, месяц, категория товара, сумма поставки, сумма поступившей оплаты. Необходимо исследовать данные с помощью инструментария Excel, а так же:
А) создайте сводную таблицу для вычисления количества операций по каждому филиалу и по каждому месяцу (по всем категориям)
Б) создайте сводную таблицу для вычисления общих сумм поставок по каждому филиалу за каждый месяц. Используя полученные данные, постройте соответствующие временные ряды для каждого филиала.
В) постройте гистограмму для поступивших оплат для трех категорий поставки.
Рассчитаем, какой удельный вес имеет каждый филиал в общем доходе компании
Структура доходов компании по филиалам
№ филиала |
Сумма оплаты, тыс. руб. |
Удельный вес филиала в общем доходе, % |
1 |
38883 |
11,1% |
2 |
81003 |
23,1% |
3 |
57057 |
16,2% |
4 |
63921 |
18,2% |
5 |
43017 |
12,2% |
6 |
24531 |
7,0% |
7 |
43004 |
12,2% |
Всего: |
351416 |
100,0% |
Наибольшую долю в оплате имеет филиал 2 (23,1%), а наименьшую – филиал 6 (7,0%).
Средний размер оплаты по филиалу равен 50202,29 тыс.руб.
Среднемесячное значение оплаты за период равно 87854,5 тыс. руб. (табл. 3).
Сумма оплаты по месяцам
Месяц |
Сумма оплаты, тыс. руб. |
В % к среднему значению |
Март |
85828 |
97,7% |
Апрель |
92599 |
105,4% |
Май |
52338 |
59,6% |
Июнь |
120653 |
137,3% |
Самый высокий уровень оплаты наблюдается в июне (137,3% от среднего уровня), а самый низкий – в мае (59,6%). Таблица отражает неравномерность объемов продаж по месяцам.
Таблица 4
Структура денежных поступлений по категориям товара
Категория товара |
Сумма оплаты, тыс. руб. |
Удельный вес, % |
Галантерея |
29757 |
8,5% |
Парфюмерия |
60762 |
17,3% |
Текстиль |
260897 |
74,2% |
Всего: |
351416 |
100,0% |
Из таблицы 4 видно, что наибольший удельный вес в доходах компании имеют поступления от продаж и текстиля (74,2%). Второе по значимости место занимает парфюмерия (17,3%).
Сводная таблица по количеству операций:
№ филиала |
Март |
Апрель |
Май |
Июнь |
Общий итог |
1 |
5 |
4 |
2 |
4 |
15 |
2 |
9 |
4 |
6 |
9 |
28 |
3 |
4 |
4 |
4 |
2 |
14 |
4 |
7 |
3 |
5 |
7 |
22 |
5 |
3 |
5 |
3 |
3 |
14 |
6 |
2 |
5 |
3 |
2 |
12 |
7 |
5 |
4 |
2 |
11 |
|
Итого |
35 |
29 |
25 |
27 |
116 |
За анализируемый период было проведено 116 операций. Больше операций было совершено в марте (35), меньше всего – в мае (25). Наибольшее количество операций пришлось на филиал 2 (28), наименьшее – на филиал 7 (11).
Сводная таблица по сумме поставок
№ филиала |
Март |
Апрель |
Май |
Июнь |
Общий итог |
1 |
1550 |
764 |
232 |
1403 |
3949 |
2 |
1474 |
1686 |
1291 |
3426 |
7877 |
3 |
2449 |
1750 |
1037 |
941 |
6177 |
4 |
2080 |
1048 |
1027 |
3189 |
7344 |
5 |
253 |
1574 |
1255 |
693 |
3775 |
6 |
1276 |
595 |
649 |
232 |
2752 |
7 |
1651 |
2088 |
423 |
4162 |
|
Итого |
10733 |
9505 |
5914 |
9884 |
36036 |
Из таблицы видно, что общая величина поставок по всей компании за период составила 36036 тыс. руб. Наибольший объем поставок наблюдается по филиалу 2 (7877 тыс. руб.), наименьший – по филиалу 7 (2752 тыс. руб.)
Динамика величины поставок по филиалам
Величина оплаты по категориям товаров:
Наибольшая величина денежных поступлений приходится на текстиль, вторая по значимости категория – парфюмерия. Наименьшая величина оплаты наблюдается по галантерее.
Задание 3
Владелец ресторана европейской кухни заинтересовался особенностями заказов, принимаемых на выходные. Он стал записывать количество заказов на различные виды блюд. Предположим, что владельца ресторана интересует также, заказывают ли посетители десерт. Он решил записывать значения еще двух переменных: пол посетителя и заказывал ли он говядину. Результаты этих исследований приведены ниже.
Заказ десерта |
Мужской |
Женский |
Всего |
Да |
96 |
224 |
320 |
Нет |
40 |
240 |
280 |
Всего |
136 |
464 |
600 |
Заказ говядины |
|||
Да |
71 |
116 |
187 |
Нет |
65 |
348 |
413 |
Всего |
136 |
464 |
600 |
Подготовьте модель (Excel: относительные, абсолютные ссылки) и вычислите:
1. Какова вероятность того, что первый же клиент закажет десерт?
2. Какова вероятность того, что первый клиент не закажет говядину?
3. Какова вероятность того, что первый клиент закажет десерт или говядину?
4. Какова вероятность того, что первый клиент окажется женщиной и не закажет десерт?
5. Какова вероятность того, что первый клиент закажет десерт и говядину?
6. Какова вероятность того, что первый клиент окажется женщиной и не закажет десерт?
7. Предположим, что первый клиент, у которого официант принял заказ, оказался женщиной. Какова вероятность того, что она не закажет десерт?
8. Предположим, первый же клиент заказал говядину. Какова вероятность, что он закажет и десерт?
9. Являются ли пол клиента и заказ десерта статистически независимыми?
10. Являются ли заказ десерта и заказ говядины статистически независимыми?
- Вероятность того, что первый же клиент закажет десерт, равна отношению числа ответов «Да» по десерту к общему числу заказов:
- Вероятность того, что первый клиент не закажет говядину:
- Вероятность того, что первый клиент закажет десерт или говядину равна произведению вероятностей этих заказов:
- Вероятность того, что первый клиент окажется женщиной и не закажет десерт, рассчитывается по формуле умножения вероятностей:
- Вероятность того, что первый клиент закажет десерт и говядину, также вычисляется как произведение вероятностей:
- Вероятность того, что первый клиент окажется женщиной или не закажет десерт, можно рассчитать как разницу между 1 и вероятностью того, что клиент будет мужчиной и закажет десерт:
- Вероятность того, что женщина не закажет десерт, равна:
- Вероятность того, что клиент, заказавший говядину, закажет и десерт:
- Являются ли пол клиента и заказ десерта статистически независимыми? Нет, не являются.
Статистическая независимость признаков проверяется с помощью критерия χ2 Пирсона:
где: и – соответственно эмпирические и теоретические частоты по группам.
Критерий χ2 равен:
Табличное значение χ2 для уровня значимости 0,05 и числа степеней свободы k=2-1=1 равно 3,841. Поскольку фактическое значение критерия превышает табличное, это означает, что между признаками существует стохастическая связь.
- Являются ли заказ десерта и заказ говядины статистически независимыми. Нет, не являются
Табличное значение χ2 для уровня значимости 0,05 и числа степеней свободы k=2-1=1 равно 3,841. Поскольку фактическое значение критерия превышает табличное, это означает, что между признаками существует стохастическая связь.
Задание 4
В рабочей книге PIZZA.XLS содержатся данные о 36 порциях пиццы: стоимость в долларах, количество калорий и количество жира в граммах для трех категорий продуктов: сырной пиццы из пиццерии (тип 1), сырной пиццы из супермаркета (тип 2) и острой пиццы из супермаркета (тип 3).
Используйте инструмент Сводные таблицы и функции вычисления статистических характеристик.
Вычислите распределение частот и процентное распределение для стоимости, калорий и жирности.
Постройте кривую распределения (полигон накопленных процентов) для стоимости, калорий и жирности.
Изучите аналитически и графически взаимосвязь переменных.
Какие выводы можно сделать о стоимости, количестве калорий и жирности каждой из разновидностей пиццы?
Распределение частот для стоимости, калорий и жирности можно построить с помощью инструмента «Гистограмма» из пакета «Анализ данных».
Распределение пиццы по стоимости
Цена |
Частота |
Частость, % |
Накопленная частость, % |
от 0,54 до 0,816 |
5 |
13,9% |
13,9% |
от 0,816 до 1,092 |
16 |
44,4% |
58,3% |
от 1,092 до 1,368 |
8 |
22,2% |
80,6% |
от 1,368 до 1,644 |
4 |
11,1% |
91,7% |
от 1,644 до 1,92 |
3 |
8,3% |
100,0% |
Итого: |
36 |
100,0% |
- |