Добавлен: 05.07.2023
Просмотров: 29
Скачиваний: 2
Введение
Свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека, наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ.
Компьютеры рассчитывают, вычисляют и выполняют программы. Вот и подумаем, как сделать программу, способную рассчитать необходимую последовательность действий для реализации наших желаний. В каком виде в компьютер попадет наша задача — через клавиатуру, через микрофон, или с датчиков вживленных в мозг — это не важно, это дело вторичное. Если мы сможем компьютер заставить выполнять желания написанные текстом, то после мы можем поставить ему задачу, что бы он сделал программу, которая так же выполняет желания, но через микрофон.
1. Аннотирование
Если, например, найти с помощью Google изображения улиц и обработать их посредством алгоритма автономного транспортного средства, результат, вероятно, не позволит предпринять никаких действий. Потребуется человек, который перед передачей данных модели составит аннотации данных или создаст метки. На каждой фотографии человеку необходимо будет пометить обочины дороги, каждый пожарный гидрант и телефонный столб, каждого человека и многое другое. Но это получается ,что будет только один маршрут без каких либо изменений ,например: других участников дорожного движения(пешеходов и других транспортных средств),появление ям на дороге и т.д. Так же была, как то производилась компания Volvo по поводу остановки, если водитель заснул, там было много датчиков движения , а так же камер ,что бы компьютер в машине мог увидеть препятствие и затормозить ,но это все не всегда выходило.
Для создания модели автономного транспортного средства организация, вероятно, захочет пойти дальше, чем позволяют сделанные человеком аннотации или метки. Она может воспользоваться семантической сегментацией, при которой каждый пиксел изображения получает метку. Если модель должна делать нечто столь важное, как управление транспортным средством, необходимо, чтобы ИИ знал об обстановке как можно больше.
Процесс аннотирования особенно важен для обеспечения качества и точности данных. Поэтому используемые для аннотирования инструменты должны адекватно применять человеческий интеллект. Еще до расстановки меток организации захотят в первую очередь подумать над своими подходами к сбору данных.
2. Дополнение данных
При отсутствии совершенного набора данных для вашего алгоритма обычно производится пополнение имеющегося набора данными. Рассмотрим модель для распознавания речи (такую, Алиса в яндексе или навигатор). Если мы находимся на проезжей части или в метро ,где много всяческих помех, то зачистую воспринимает наши команды ошибочно и выдает нам неправильные данные.
3. Перенос обучения
Если вы пытаетесь создать алгоритм МО для коммерческого приложения, велика вероятность, что набора данных для вашего случая не существует. Рассмотрим модель для выявления сломанных частей тела с помощью рентгеновского аппарата. Общедоступных снимков больных, вероятно, будет немного. Перенос обучения позволяет использовать имеющиеся модели. Возможно, удастся использовать имеющуюся модель, обученную правилам распознавания границ объектов на уровне пикселов и общей идентификации компонентов изображений на других наборах данных.
Вместо того, чтобы обучать свою модель на миллионах изображений, вы можете удалять слои имеющейся модели, пока не достигнете подходящей точки отсчета. Затем обработать ее по алгоритму, который идентифицирует определенные пикселы. Можно переобучить модель для лучшего распознавания тонкостей рентгеновских снимков. В процессе переобучения вы разработаете подходящую для вашего случая нейронную сеть.
4. Итерации
Хотя это трудно себе представить, но можно запросто собрать слишком много данных. При обучении модели самое правильное — работать итеративно. Если у вас 1 тыс. рентгеновских снимков, используйте их в первую очередь. Обучив модель, вы будете увидите, работает она или нет. Допустим, вашей целью является 85%-ная точность. Если вы этого уже добились, нет нужды собирать дополнительные данные.
Даже если у вас нет доступа к большому набору данных, лучше всего создавать модель итеративно. Возьмем данные, для которых необходимо составить аннотации или создать метки. Вы можете использовать имеющиеся данные с метками для обучения модели, которая сама разметит дополнительные данные. Когда вы пропустите размеченные данные через модель, та создаст собственную нейронную сеть и, в конечном итоге, повысит степень достоверности вашего алгоритма.