Файл: Понятие больших данных и области применения 15 Большие данные (Big Data, биг дата).pptx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.12.2023
Просмотров: 34
Скачиваний: 4
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Свойства методов Data Mining
53
Классификация методов Data Mining
54
Подход к обучению математических моделей Data Mining
55
Статистические методы Data Mining
Кибернетические методы Data Mining
Классификация по задачам
56
Описательные методы
Прогнозирующие методы
Мнение экспертов о Data Mining
57
Aberdeen Group: " Data Mining - технология добычи полезной информации из баз данных. Однако в связи с существенными различиями между инструментами, опытом и финансовым состоянием поставщиков продуктов, предприятиям необходимо тщательно оценивать предполагаемых разработчиков Data Mining и партнеров.
Herb Edelstein: «Недавнее исследование компании Two Crows показало, что Data Mining находится все еще на ранней стадии развития. Многие организации интересуются этой технологией, но лишь некоторые активно внедряют такие проекты. Удалось выяснить еще один важный момент: процесс реализации Data Mining на практике оказывается более сложным, чем ожидается».
Проблемы, ограничения и критические вопросы Data Mining
58
- Data Mining не может заменить аналитика
- Сложность разработки и эксплуатации приложения Data Mining
- Квалификация пользователя
- Извлечение полезных сведений невозможно без хорошего понимания сути данных
- Сложность подготовки данных
- Большой процент ложных, недостоверных или бессмысленных результатов
- Высокая стоимость
- Наличие достаточного количества репрезентативных данных
Перспективы технологии Data Mining
59
• выделение типов предметных областей с соответствующими им эвристиками, формализация которых облегчит решение соответствующих задач Data Mining, относящихся к этим областям;
• создание формальных языков и логических средств, с помощью которых будут формализованы рассуждения и автоматизация которых станет инструментом решения задач Data Mining в конкретных предметных областях;
• создание методов Data Mining, способных не только извлекать из данных закономерности, но и формировать некие теории, опирающиеся на эмпирические данные ;
• преодоление существенного отставания возможностей инструментальных средств Data Mining от теоретических достижений в этой области
Data Mining
Области, где применения технологии Data Mining, скорее всего, будут успешными, имеют такие особенности
:
- требуют решений, основанных на знаниях ;
- имеют изменяющуюся окружающую среду;
- имеют доступные, достаточные и значимые данные ;
- обеспечивают высокие дивиденды от правильных решений.
60
Data Mining
61
Международная конференция по Knowledge Discovery Data Mining (International Conferences on Knowledge Discovery and Data Mining).
Среди наиболее известных WWW-источников - сайт www.kdnuggets.com , который ведет один из основателей Data Mining Григорий Пиатецкий-Шапиро.
Периодические издания по Data Mining: Data Mining and Knowledge Discovery, KDD Explorations, ACM-TODS, IEEE-TKDE, JIIS, J. ACM, Machine Learning, Artificial Intelligence.
Материалы конференций: ACM-SIGKDD, IEEE-ICDM, SIAM-DM, PKDD, PAKDD, Machine learning (ICML), AAAI, IJCAI, COLT (Learning Theory).
Краудсорсинг
Краудсорсинг
63
Краудсорсинг — привлечение к решению какой-либо проблемы большой группы людей
В 2003 году Луис фон Ах (Luis von Ahn) вместе со своими коллегами впервые предложил понятие "человеческих вычислений
в 2006 году термин "Краудсорсинг" (crowdsourcing) был сформулирован редактором журнала "Wired" Джеффом Хау (Jeff Howe)
Краудсорсинг
64
Краудсорсинг - это мобилизация ресурсов людей посредством информационных технологий с целью решения задач, стоящих перед бизнесом, государством и обществом в целом.
Классификация Краудсорсинга*
65
I. По сфере жизни (бизнес, социальный, политический)
II. По типу решаемых задач (создание продукта (контента), голосование, поиск решения, поиск людей, сбор информации, сбор мнений, тестирование, служба поддержки, сбор средств - Краудфандинг).
Классификация Краудсорсинга*
*http://crowdsourcing.ru/article/what_is_the_crowdsourcing
Классификация Краудсорсинга
66
По сфере жизни:
- Бизнес
2) Социальный или общественный
3) Политический или государственный
Классификация Краудсорсинга
67
По типу решаемых задач:
- Создание продукта (контента)
99designs, TopCoder, Witmart, Tongal, Audiodraft
2) Голосование
3) Поиск решения
Kaggle, CrowdFlower, InnoCentive, Academy of Ideas, Wazoku
4) Поиск людей, например - Liza Alert
5) Сбор информации, например - Zooniverse
6) Сбор мнений, например - Chaordix, Innopinion и AnswerTap
7) Тестирование, например uTest,
8) Сбор средств - Краудфандинг
Преимущества Краудсорсинга
68
1) Большой охват
2) Вовлечение пользователей
3) Разнообразие выбора
4) Единственно возможный вариант
5) Фиксированные сроки
6) Экономия финансовых ресурсов
Краудсорсинг в России
69
СПАСИБО ЗА ВНИМАНИЕ!