Тези Автоматична класифікація зображень за кольоровим наповненням
Код роботи: 1837
Вид роботи: Тези
Предмет: Сучасні інформаційні технології (СІТ)
Тема: Автоматична класифікація зображень за кольоровим наповненням
Кількість сторінок: 4
Дата виконання: 2017
Мова написання: українська
Ціна: безкоштовно
1. Пестунов И.А., Синявский Ю.Н. Алгоритмы кластеризации в задачах сегментации спутниковых изображений // Вестн. КемГУ. — № 2, т. 4, 2012. — С. 110-124.
Завдяки розвитку обчислювальної техніки і інформаційних технологій аналіз великих обсягів інформації (тексти, зображення, статистичні дані) можна виконувати автоматично. Останнім часом актуальними стали задачі, які виникають у зв’язку з аналізом зображень у робототехніці, військовій промисловості, автомобілебудуванні, кіновиробництві, в комп’ютерних іграх тощо. При цьому використовують спеціально модифіковані методи нейронних і нечітких мереж, різноманітні алгоритми кластеризації [1], які дають можливість класифікувати зображення, знаходити в них певні закономірності, формувати з них репрезентативні вибірки.
Існує також задача, докорінно відмінна від стандартних задач аналізу зображень, — визначення естетичного рівня (наскільки “радують око”) фотографій. Як правило, такі фотографії одержують професійні фотографи, художники чи здатні грамотно обробляти зображення аматори. Задача може виникнути, наприклад, у туристичній агенції, яка хоче розмістити на сайті якісні фотографії користувачів і при цьому відбір здійснює із кількох тисяч фотографій. Процес бажано зробити автоматичним. У такій задачі вагому роль відіграють кольори і їхнє співвідношення, а образи і форми менше значущі. Оскільки фотографії є растровими зображеннями, то обробляються пікселі. Крім того, оскільки фотографії мають розміщуватися на сайті і відображатися на екрані, то вони кодуються з використанням моделі RGB і зберігаються у форматі .jpg з глибиною кольору 24 біти.
Відповідно до розробленого алгоритму вхідне зображення спочатку за допомогою кластеризації приводиться до векторного вигляду, а потім на основі аналізу одержаного вектора воно класифікується як естетичне чи не естетичне. На етапі кластеризації виділяються дві специфічні кількісні ознаки, які найкраще характеризують фотографію: значення яскравості зображення і “відстань” між кольоровим зображенням (усе зображення характеризується 3-компонентним вектором середніх значень насиченостей базових кольорів моделі RGB) і його напівтоновим 8-бітовим аналогом (характеризується середнім значенням параметра відтінку сірого кольору).
Для знаходження величини розсіювання і контрастності кольорів початкове зображення кластеризується на 3, 7, 15 і 30 кластерів, і для кожної групи кластерів визначається середня відстань між їхніми центрами. Коефіцієнт лінійної залежності (кутовий коефіцієнт лінійного рівняння регресії) між кількістю кластерів і середньою відстанню між ними, а також площа під графіком цієї залежності (чим менша площа, тим менш естетична фотографія) визначають міру контрастності зображення, тобто наскільки багато різних і далеких один від одного кольорів містить фотографія.
Для обробки було взято 308 фотографій, приблизно порівну з альбомів на сторінках відомих фотохудожників і з альбомів, у які звичайні користувачі розміщують свої фотографії для знайомств. Найкращі результати класифікації (частка фотографій, класифікованих як естетичні, становить 75,3%) дав метод опорних векторів порівняно з методами логістичної регресії, random forest і gradient boosting.
Результати запропонованого алгоритму визначення естетичного рівня фотографій можна покращити, якщо збільшити обсяг вибірки в 3-5 разів і дещо модифікувати алгоритм, додавши до вектора нові специфічні кількісні ознаки.