Файл: Министерство образования республики беларусь белорусский государственный университет.docx
Добавлен: 02.12.2023
Просмотров: 49
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Во-вторых, хотя t-SNE вводит сильное отталкивание между непохожими точками данных, которые моделируются малым попарным расстоянием, эти отталкивания не становятся бесконечно большими. В этом отношении t-SNE отличается от UNI-SNE, где сила отталкивания между очень непохожими точками данных пропорциональна их попарному расстоянию в низкоразмерном представлении, что может привести к тому, что непохожие точки данных сильно отдаляются друг от друга.
В целом, t-SNE акцентирует внимание на (1) моделировании несходных данных с помощью больших парных расстояний и (2) моделировании похожих данных с помощью маленьких парных расстояний. Более того, благодаря этим характеристикам функции стоимости t-SNE (и приблизительной инвариантности масштаба распределения Стьюдента), оптимизация функции стоимости t-SNE намного проще, чем оптимизация функций стоимости SNE и UNI-SNE. Конкретно, t-SNE вводит дальнодействующие силы в низкоразмерное представление, которые могут снова сблизить две (кластеры) похожие точки, которые рано разошлись в процессе оптимизации. SNE и UNI-SNE не имеют таких дальнодействующих сил, в результате чего SNE и UNI-SNE должны использовать имитационное отжигание для получения разумных решений. Вместо этого дальнодействующие силы в t-SNE облегчают идентификацию хороших локальных оптимумов без прибегания к имитационному отжигу.
-
Применение
Метод t-SNE широко применяется в машинном обучении и анализе данных для визуализации сложных многомерных данных. Он может использоваться для визуализации исходных данных в различных областях, таких как компьютерное зрение, биоинформатика, обработка естественного языка, финансы и т.д.
Например, t-SNE может использоваться для визуализации изображений, чтобы увидеть, какие изображения визуально близки друг к другу и образуют кластеры. Он также может быть использован для анализа геномных данных, чтобы понять, какие гены сильно коррелируют друг с другом и могут быть объединены в группы.
Кроме того, t-SNE может быть использован для поиска аномалий в данных, таких как обнаружение необычных транзакций в финансовых данных или выявление необычных поведенческих паттернов в клиентских данных.
Таким образом, метод t-SNE имеет широкий спектр применения в различных областях, где необходимо анализировать сложные многомерные данные и визуализировать их для лучшего понимания.
-
Программная реализация метода на Python
Cписок литературы
-
[Электронный ресурс] - https://machinelearningmastery.ru/an-introduction-to-t-sne-with-python-example-5a3a293108d1/. -
[Электронныйресурс]- https://www.researchgate.net/publication/228339739_Viualizing_data_using_t-SNE -
Stochastic Neighbor Embedding Geoffrey Hinton and Sam Roweis Department of Computer Science, University of Toronto 10 King’s College Road, Toronto, M5S 3G5 Canada -
Visualizing Data using t-SNE Laurens van der Maaten TiCC Tilburg University P.O. Box 90153, 5000 LE Tilburg, The Netherlands -
J.A. Cook, I. Sutskever, A. Mnih, and G.E. Hinton. Visualizing similarity data with a mixture of maps. In Proceedings of the 11th International Conference on Artificial Intelligence and Statistics, volume 2, pages 67–74, 2007.