Оглавление
Сеть изображений
-
Обзор проекта ImageNet
- ImageNet – это база данных изображений с ручными комментариями и ограничивающими рамками.
- Содержит более 20 000 категорий, с типичной категорией, состоящей из сотен изображений.
- Доступна в открытом доступе, но не включает сами изображения.
- Проводит ежегодный конкурс ILSVRC для программ распознавания объектов и сцен.
-
Значение для глубокого обучения
- Сверточная нейронная сеть AlexNet достигла 15,3% ошибки в 2012 году, что значительно ниже, чем у конкурентов.
- Использование GPU во время обучения стало ключевым для революции в области глубокого обучения.
- AlexNet превзошла программу Microsoft в 2015 году, используя более 100 слоев.
-
История создания базы данных
- Идея ImageNet возникла в 2006 году, Фей-Фей Ли хотел улучшить данные для ИИ.
- Ли начал работу с Принстонским университетом и использовал Amazon Mechanical Turk для классификации изображений.
- В 2009 году база данных была представлена на конференции CVPR.
-
Набор данных
- ImageNet использует краудсорсинг для аннотаций на уровне изображения и объекта.
- Категории в ImageNet основаны на WordNet, но могут быть слишком “возвышенными” для некоторых задач.
- Существуют различные подмножества ImageNet, включая ILSVRC 2012-2017 с 1000 классами.
-
История создания проекта ImageNet challenge
- ILSVRC стремится к “демократизации” ImageNet, сотрудничая с PASCAL VOC.
- Ежегодное соревнование ILSVRC использует “урезанный” список из 1000 категорий.
- В 2010-х годах достигнут значительный прогресс в обработке изображений, с AlexNet, достигшей 16% ошибки в 2012 году.
-
Предвзятость в ImageNet
- Исследование показало наличие предвзятости в ImageNet и WordNet на разных уровнях классификации.
- ImageNet работает над устранением предвзятости в своих данных.