Файл: Российской федерации федеральное государственное автономное образовательное учреждение высшего образования.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.12.2023
Просмотров: 378
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
86
Последующая обработка полученных изображений путем наложения их друг на друга с помощью специально разработанной программы (автор
Гармашов С. И., рис. 3, б) позволила достаточно быстро определять разме- ры включений и скорость их движения, отображать измеренные данные в графическом виде. а б
Рис. 3. Интерфейсы программ для видеосъемки процесса термомиграции включений в прозрачных кристаллах (а) и обработки полученных цифровых фотографий (б)
Геометрия формы мигрирующего включения несет в себе информа- цию об анизотропии межфазной энергии и затрудненности межфазных
87 процессов. Эта информация может быть извлечена путем анализа экспери- ментальных данных о форме включений на основе теоретических моделей.
Однако зачастую в этих моделях делается упрощающее допущение об од- нородности градиента температуры в области включения, что, вообще го- воря, не всегда соответствует действительности. Насколько справедливо такое допущение и насколько будут велики ошибки обработки экспери- ментальных данных, если принять такое допущение, можно выяснить пу- тем совместного решения уравнений тепло- и массопереноса в двумерной
(как минимум) области с подвижными границами. Компьютерная про- грамма (рис. 4) для решения этой задачи была разработана при активном участии студента 4-го курса Хатламаджияна Юрия, которому потребова- лось сопрягать свою часть программы, моделирующей двумерный тепло- перенос, с программой Константиновой Марии о моделировании двумер- ного массопереноса в области с подвижными границами.
Рис. 4. Интерфейс программы для моделирования двумерного теплопереноса в жидких включениях при их миграции в кристалле
88
Другим видом экспериментов, результативность которых повышается благодаря применению информационных технологий, является получение пленок разлагающихся соединений. Дело в том, что при синтезе таких пленок оказывается важным одновременный контроль напряжения на ре- зистивном нагревателе, температуры испаряемого вещества, температуры подложки и состояния конденсата на последней. Использование видео- съемки цифровой камерой в вакууме в сочетании с измерением упомяну- тых параметров режима с помощью программно-аппаратного комплекса, разработанного Терехиным Кириллом и Макиняном Норайром, позволила подобрать необходимые условия для получения пленок сульфойодида сурьмы (SbSI), широко используемого в качестве датчика газов, влажно- сти, излучений, вибраций [6, 7]. Интерфейс программной части измери- тельного комплекса приведен на рис. 5. Следует заметить, что этот ком- плекс применяется также для контроля температурного режима нестацио- нарной термомиграции.
Рис. 5. Интерфейс программы для автоматизации контроля режимов экспериментов по синтезу пленок разлагающихся соединений
Описанные выше программы активно используются при проведении научных исследований в лаборатории по исследованию физики процессов кристаллизации физического факультета ЮФУ, являются частью выпуск- ных работ студентов-соавторов доклада и находятся в постоянном совер- шенствовании. В докладе будут представлены и обсуждены научные ре- зультаты, полученные с помощью разработанных программ.
89
Литература
1. Леммлейн, Г. Г. Перемещение жидкого включения в кристалле в направлении к источнику тепла [Текст] / Г. Г. Леммлейн // Докл.
АН СССР. – 1952. – Т. 85. – № 2. – С. 325–328.
2. Pfann, W. G. Temperature gradient zone melting [Text]/ W. G. Pfann // Jour- nal of Metals. – 1955. – V. 7, Iss. TP 4021E. – P. 961–964.
3. Лозовский, В. Н. Зонная перекристаллизация градиентом температуры полупроводниковых материалов [Текст] / В. Н. Лозовский, Л. С. Лунин,
В. П. Попов. – М.: Металлургия, 1987. – 232 с.
4. Гершанов, В. Ю. Нелинейные нестационарные эффекты в процессах массопереноса [Текст] / В. Ю. Гершанов, С. И. Гармашов – Ростов н/Д:
Изд-во Южного федерального университета, 2014. – 114 с.
5. Garmashov S. I. A model of shapes of liquid cylindrical inclusions migrating through a non-uniformly heated crystal: Fundamentals and applications for studying crystallization and dissolution [Text] / S.I. Garmashov //J. Cryst.
Growth. – 2021. – V. 574. – 126312.
6. Mistewicz K. SbSI Nanosensors: from Gel to Single Nanowire Devices
[Text]/ K. Mistewicz , M. Nowak, R. Paszkiewicz, et al. // Nanoscale Res.
Lett. – 2017. – V. 12. – P. 97.
7. Toron B. SbSI composites based on epoxy resin and cellulose for energy har- vesting and sensors - the influence of SbSI nanowires conglomeration on pie- zoelectric properties [Text] / B. Toron, P. Szperlich, M. Koziol // Materials. –
2020. – V. 13. – P. 902.
90
РАЗРАБОТКА СИСТЕМЫ НАКОПЛЕНИЯ БОЛЬШОГО
ОБЪЁМА ПЛОХО СТРУКТУРИРОВАННЫХ ДАННЫХ,
НА ПРИМЕРЕ ПРОЕКТА "АТЛАС НКО"
Гуфан К. Ю., Борус А. И.
ФГАОУ ВО Южный федеральный университет,
Институт математики, механики и компьютерных наук
им. И. И. Воровича,
г. Ростов-на-Дону
E-mail: gufan@sfedu.ru, borus@sfedu.ru
На данный момент некоммерческий сектор экономики является слабо структурированным и изолированным от общества, что значительным об- разом замедляет его развитие. Этому способствуют следующие проблемы:
разрозненность источников информации о некоммерческих органи- зациях (НКО);
большой объем и сложность обработки информации;
финансовые барьеры для получения достоверной информации.
Все это влечет значительные сложности в принятии управленческих решений о финансировании, взаимодействии и вовлечении НКО в соци- альные преобразования из-за отсутствия достоверных и оперативных дан- ных для оценки их благонадежности, а также большое количество случаев мошенничества в сфере благотворительной деятельности и т. п.
Оптимальным решением данных проблем является исследование до- ступных наборов открытых данных о СО НКО с последующим их объеди- нением в единую базу, доступную в открытом доступе. Таким образом, как государство, так и сами НКО, смогут проводить необходимую аналитику по структуре сектора, а также формировать конкретные выводы об эффектив- ности деятельности СО НКО, что станет мощным толчком для развития.
В рамках исследовательской работы были поставлены и выполнены следующие задачи:
исследование наборов открытых данных о СО НКО, разработка ал- горитмов и способов их сбора и обработки;
разработка специальной программной системы учѐта деятельности
НКО;
создать эталонный реестр социально-ориентированных некоммерче- ских организаций (СО НКО).
Исследование наборов данных и разработка алгоритмов позволили оценить общее количество некоммерческих организаций в федеральных округах и их регионах, выявить действующие на данный момент НКО, по- лучить реквизиты некоммерческих организаций, сведения об их руковод- стве и учредителях, полученных грантах и субсидиях, оценить количество
91 организаций по видам их деятельности, как согласно организационно- правовой форме Минюста РФ, так и по видам экономической деятельно- сти, а также информацию о социальных медиаресурсах организации. По- мимо этого, была собрана бухгалтерская отчетность приблизительно для половины организаций, что позволяет оценить эффективность использова- ния финансовых ресурсов НКО.
Программная система учѐта деятельности некоммерческих организа- ций предназначена для систематического выполнения алгоритмов сбора и обработки данных о деятельности СО НКО (рисунок 1), помощи в построе- нии аналитических выводов о деятельности некоммерческих организаций и формирования в будущем рейтинга организаций некоммерческого сектора.
Рис. 1. Схема программной системы учѐта деятельности некоммерческих организаций
Подсистема сбора была реализована с использованием высокоуровне- вого языка программирования Python, имеющего множество библиотек сбора, обработки и анализа данных с веб-сайтов, а также библиотеки
Selenium, позволяющей имитировать действия пользователя на сайте. По- лучение данных осуществляется с ресурсов:
"unro.minjust.ru",
"rosstat.gov.ru", "nko.economy.gov.ru" и аналогичных, содержащих необхо- димую для работы информацию. Получение данных из открытых источни- ков в сети Интернет производится автоматически с заданной периодично- стью. Для полученных данных выполняется предобработка, после чего они сохраняются в формате JSON. Хранение данных осуществляется в файло- вой системе и подсистеме, реализованной на технологии ElasticStacks, бла- годаря чему можно надежно и безопасно сохранять данные из любого ис- точника, а затем проводить поиск, анализ и визуализацию в режиме реаль-
92 ного времени. Подсистема обработки и верификации также была реализо- вана с использованием языка Python, что обусловлено его популярностью и удобством в работе с большими объемами данных.
В результате проделанной работы сформирован эталонный реестр со- циально-ориентированных некоммерческих организаций (СО НКО).
Он включает в себя 455566 организаций, среди которых 199575 организа- ций на данный момент продолжают свою деятельность. Полученный ре- естр позволяет провести полноценный анализ деятельности организаций, например, для периода с 2002 года по 2021 год, составить график динами- ки открытия и закрытия (рисунок 2).
Рис. 2. Динамика открытия и закрытия НКО с 2002 г. по 2021 г.
За данный период средний ежегодный прирост НКО составляет около
15000 организаций, при среднем ежегодном закрытии около 12000.
Наибольшая часть организаций связана со сферой социального обслужи- вания, поддержки и защиты граждан, а наименьшая с поддержкой проек- тов в области культуры и искусства.
В дальнейшем полученные результаты будут дополняться, в соответ- ствии с обновлениями в источниках информации, а также будут использо- ваны для разработки цифровой платформы "Атлас НКО", которая будет содержать исчерпывающую, открытую информацию о деятельности всех
СО НКО России.
Литература
1. Python Web Scraping – Краткое руководство. (2018). Получено
20.10.2021 г., из CoderLessons.com.
93 2. Главная – Система поддержки СО НКО. (б.д.). Получено 12.10.2021 г., из Система поддержки социально ориентированных некоммерческих ор- ганизаций: http://nko.economy.gov.ru/
3. Митчелл, Р. (2016). Скрапинг веб-сайтов с помощью Python (изд. 1-е).
Москва: ДМК Пресс.
4. Открытые данные. (б.д.). Получено 19.10.2021 г., из Система раскрытия информации о некоммерческих организациях: https://openngo.ru/opendata/.
5. Открытые данные. (б.д.). Получено из Федеральная служба государственной статистики: https://rosstat.gov.ru/opendata?division=
&tag=&updated_from=&updated_to=&search=%D0%B1%D1%83%D1%85
%D0%B3%D0%B0%D0%BB%D1%82%D0%B5%D1%80%D1%81%D0%
BA%D0%B0%D1%8F&search_by_name=on&sort=asc&per_paghttps://rosst at.gov.ru/opendata?division=&tag=&updated_from=&u
6. Портал государственных услуг. (б.д.). Получено 04.09.2021 г., из
Министерство юстиции
Российской
Федерации: http://unro. minjust.ru/NKOs.aspx.
7. Предоставление данных бухгалтерской отчетности по запросам пользователей – Система исполнения услуг и межведомственного взаимодействия. (б.д.). Получено 04.11.2021 г., из Предоставление данных бухгалтерской отчетности по запросам пользователей: https://www.gks.ru/accounting_report.
8. Предоставление сведений из ЕГРЮЛ/ЕГРИП в электронном виде. (б.д.).
Получено 18.09.2021 г., из Федеральная Налоговая Служба: https://egrul.nalog.ru/index.html
9. Проекты. (б.д.). Получено 16.09.2021 г., из Фонд президентских грантов: https://президентскиегранты.рф/public/application/cards
10. Ресурс БФО. (б.д.). Получено 05.10.2021 г., из Государственный
Информационный Ресурс Бухгалтерской (Финансовой) Отчетности: https://bo.nalog.ru.
11. Сѐмин, П. О. (сентябрь 2020 г.). Big Data и интеллектуальная собственность: системное исследование скрейпинга в рамках общей методологии интернет-права. (Е. А. Ястребова, & В. А. Корнеев, Ред.)
Журнал Суда по интеллектуальным правам (№ 3 (29)), с. 60–76..
94
1 ... 5 6 7 8 9 10 11 12 ... 28
КЛАСТЕРНЫЙ АНАЛИЗ В МОДИФИЦИРОВАННОЙ ЗАДАЧЕ
МАРКОВИТЦА ДЛЯ ОПТИМАЛЬНОГО ПОРТФЕЛЯ
Данилова Н. В., Житников Д. И.
ФГАОУ ВО «Южный федеральный университет»,
Институт математики, механики и компьютерных наук
им. И. И. Воровича
E-mail: nvdanilova@sfedu.ru, zhitnikov@sfedu.ru
Аннотация
Рассматривается проблема нахождения оптимального портфеля. Ре- шению данной проблемы в различных еѐ постановках посвящено много статей, что говорит об еѐ актуальности. Для решения задачи производится разбиение выборки случайных доходностей активов на кластеры с после- дующим построением эллипсоида в каждом кластере. В качестве алгорит- ма кластеризации используется дихотомический метод максимального правдоподобия. Для построения эллипсоида используются выборочный средний вектор и выборочная ковариационная матрица; радиус рассчиты- вается исходя из предположения, что элементы выборки имеют нормаль- ный закон распределения. Приводится пример расчѐта оптимального портфеля, использующий реальные значения векторов возврата. При этом часть выборки используется для нахождения выборочных средних и выбо- рочных ковариационных матриц кластеров, оставшаяся часть выборки ис- пользуется для верификации портфеля.
Введение
Проблема нахождения оптимального портфеля является актуальной, начиная с публикации в 1952 году работы Марковитца [1] и до настоящего времени. Задача заключается в выборе оптимального вектора (портфеля)
n
i
x
x
x
n
i
i
n
i
i
,...,
1
,
1
,
1 1
Возврат портфеля x вычисляется как среднее
x
R
x
R
E
,
,
,
R – век- тор случайных возвратов активов, входящих в портфель,
ER
R
, риск это дисперсия:
x
Сx
x
R
D
,
,
,
C – ковариационная матрица:
T
T
R
R
ERR
C
. Здесь
.,. – скалярное произведение. Портфель следует выбирать таким образом, чтобы возврат был как можно больше, а риск как можно меньше. По своей структуре задача об оптимальном портфеле отно- сится к задачам с векторным критерием. Под решением задачи с вектор- ным критерием обычно понимается множество не улучшаемых стратегий – множество Парето. Один из вариантов вычисления Парето-оптимальных портфелей заключается в скаляризации векторного критерия:
95
x
Cx
x
R
,
,
max
, (1)
1 1
n
i
i
x
В целевую функцию входит параметр
с заранее определенным множеством значений. Проблема заключается в том, что вероятностная мера P , по которой вычисляются среднее значение и дисперсия – неиз- вестна. Вместо неизвестной меры мы можем использовать обучающую выборку
N
R
R
R
V
,...,
,
2 1
, на основе которой можно сформировать пред- ставление о вероятностной мере. Для эмпирической меры
R
– выборочное среднее, С – выборочная ковариационная матрица. Подстановка
R
и C в
(1) позволяет найти решение, зависящее от выборки. Это решение не явля- ется устойчивым по отношению к изменению выборки.
Один из способов получения устойчивого решающего правила – это найти множество возможных значений выборочных средних –
K
R
R ,...,
1
и соответствующее множество значений выборочных ковариационных мат- риц –
K
C
C ,...,
1
. Основная идея заключается в том, что несколько наборов средних и ковариационных матриц будут характеризовать выборку лучше, чем один набор. Задача (1) трансформируется в задачу
,
,
,
min max
x
x
C
R
x
i
i
i
x
(2)
1 1
n
i
i
x
Для получения множества значений выборочных средних и множе- ства значений выборочных ковариационных матриц предлагается разбие- ние выборки на кластеры. В качестве алгоритма разбиения выборки на два кластера предлагается алгоритм максимального правдоподобия [2], в каче- стве разбиения выборки на K кластеров предлагается дихотомический ал- горитм [3].
Также в данной статье предлагается рассмотреть следующую поста- новку задачи об оптимальном портфеле:
R
x
i
EL
R
i
x
,
min min max
, (3)
,
1 1
n
i
i
x
i
i
i
i
i
r
m
R
m
R
M
R
EL
,
:
1
При этом предполагается, что
i
EL
R
P
. В задаче (3)
i
EL
– эл- липсоид,
i
M
– симметричная матрица. Смысл задачи заключается в том,