Файл: Понятие больших данных и области применения 15 Большие данные (Big Data, биг дата).pptx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.12.2023

Просмотров: 34

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Свойства методов Data Mining

53

Классификация методов Data Mining

54

Подход к обучению математических моделей Data Mining

55

Статистические методы Data Mining

Кибернетические методы Data Mining

Классификация по задачам

56

Описательные методы

Прогнозирующие методы

Мнение экспертов о Data Mining

57

Aberdeen Group: Data Mining - технология добычи полезной информации из баз данных. Однако в связи с существенными различиями между инструментами, опытом и финансовым состоянием поставщиков продуктов, предприятиям необходимо тщательно оценивать предполагаемых разработчиков Data Mining и партнеров.

Herb Edelstein: «Недавнее исследование компании Two Crows показало, что Data Mining находится все еще на ранней стадии развития. Многие организации интересуются этой технологией, но лишь некоторые активно внедряют такие проекты. Удалось выяснить еще один важный момент: процесс реализации Data Mining на практике оказывается более сложным, чем ожидается».

Проблемы, ограничения и критические вопросы Data Mining

58
  • Data Mining не может заменить аналитика
  • Сложность разработки и эксплуатации приложения Data Mining
  • Квалификация пользователя
  • Извлечение полезных сведений невозможно без хорошего понимания сути данных
  • Сложность подготовки данных
  • Большой процент ложных, недостоверных или бессмысленных результатов
  • Высокая стоимость
  • Наличие достаточного количества репрезентативных данных



Перспективы технологии Data Mining

59

• выделение типов предметных областей с соответствующими им эвристиками, формализация которых облегчит решение соответствующих задач Data Mining, относящихся к этим областям;

• создание формальных языков и логических средств, с помощью которых будут формализованы рассуждения и автоматизация которых станет инструментом решения задач Data Mining в конкретных предметных областях;

• создание методов Data Mining, способных не только извлекать из данных закономерности, но и формировать некие теории, опирающиеся на эмпирические данные ;

• преодоление существенного отставания возможностей инструментальных средств Data Mining от теоретических достижений в этой области

Data Mining

Области, где применения технологии Data Mining, скорее всего, будут успешными, имеют такие особенности
:

- требуют решений, основанных на знаниях ;

- имеют изменяющуюся окружающую среду;

- имеют доступные, достаточные и значимые данные ;

- обеспечивают высокие дивиденды от правильных решений.

60

Data Mining

61

Международная конференция по Knowledge Discovery Data Mining (International Conferences on Knowledge Discovery and Data Mining).

Среди наиболее известных WWW-источников - сайт www.kdnuggets.com , который ведет один из основателей Data Mining Григорий Пиатецкий-Шапиро.

Периодические издания по Data Mining: Data Mining and Knowledge Discovery, KDD Explorations, ACM-TODS, IEEE-TKDE, JIIS, J. ACM, Machine Learning, Artificial Intelligence.

Материалы конференций: ACM-SIGKDD, IEEE-ICDM, SIAM-DM, PKDD, PAKDD, Machine learning (ICML), AAAI, IJCAI, COLT (Learning Theory).

Краудсорсинг

Краудсорсинг

63

Краудсорсинг — привлечение к решению какой-либо проблемы большой группы людей

В 2003 году Луис фон Ах (Luis von Ahn) вместе со своими коллегами впервые предложил понятие "человеческих вычислений

в 2006 году термин "Краудсорсинг" (crowdsourcing) был сформулирован редактором журнала "Wired" Джеффом Хау (Jeff Howe)

Краудсорсинг

64

Краудсорсинг - это мобилизация ресурсов людей посредством информационных технологий с целью решения задач, стоящих перед бизнесом, государством и обществом в целом.

Классификация Краудсорсинга*

65

I. По сфере жизни (бизнес, социальный, политический)

II. По типу решаемых задач (создание продукта (контента), голосование, поиск решения, поиск людей, сбор информации, сбор мнений, тестирование, служба поддержки, сбор средств - Краудфандинг).

Классификация Краудсорсинга*

*http://crowdsourcing.ru/article/what_is_the_crowdsourcing

Классификация Краудсорсинга

66

 По сфере жизни:
  • Бизнес

  • 2) Социальный или общественный

    3) Политический или государственный

Классификация Краудсорсинга

67

 По типу решаемых задач: 
  • Создание продукта (контента)

  • 99designs, TopCoder,  Witmart,  Tongal, Audiodraft

    2) Голосование

    3) Поиск решения

     KaggleCrowdFlowerInnoCentiveAcademy of Ideas, Wazoku

    4) Поиск людей, например - Liza Alert

    5) Сбор информации, например - Zooniverse

    6) Сбор мнений, например -  ChaordixInnopinion и AnswerTap

    7) Тестирование, например  uTest,

    8) Сбор средств - Краудфандинг

Преимущества Краудсорсинга

68

1) Большой охват

2) Вовлечение пользователей

3) Разнообразие выбора

4) Единственно возможный вариант

5) Фиксированные сроки



6) Экономия финансовых ресурсов

Краудсорсинг в России

69

СПАСИБО ЗА ВНИМАНИЕ!