Вчені з Каліфорнійського університету в Берклі порівняли можливості комп'ютера і людей в розпізнаванні зображень людини на прикладі картин іспанського художника Пабло Пікассо (Pablo Picasso). Результати досліджень учених доступні в препринті на ресурсі arXiv.org.
Людський зір здатний побачити людей у найнесподіваніших формах. Фахівці вирішили з'ясувати межі цієї навички на прикладі кубізму - одного з найвпливовіших мистецьких напрямків першої половини XX століття. Основною рисою кубізму є представлення тривимірних об'єктів на двовимірній площині. При такому підході цільний об'єкт розпадається на фрагменти, і його сприйняття глядачем зводиться до «синтезу примітивів». Свого розквіту мистецтво досягло в картинах Пікассо, Жоржа Брака (Georges Braque) і Хуана Гріса (Juan Gris).
Вчені попросили групу з 18 чоловік оцінити за шкалою від одиниці до п'яти ступінь абстрактності 218 зображень з картин Пікассо. Кожній людині при цьому діставалися 146 випадково вибраних картин з 218, так що кожна їх них була оцінена 14 або 15 разів.
Також фахівці просили випробовуваних окреслити прямокутниками кордони зображень людини і порівнювали такі з результатами, одержуваними за допомогою чотирьох комп'ютерних алгоритмів. Найстаріші алгоритми, Dalal і Triggs, роблять оцінку фотографій з орієнтації країв зображень. Дані підходи мають недоліки, пов'язані з виникненням помилок при змінах в людській позі.
З метою їх усунення вчені придумали третій алгоритм, який розбиває вихідний прямокутник із зображенням на частини і стежить за можливою зміною їх взаємного розташування. Це дозволяє враховувати різні положення людської пози. Останній алгоритм, створений вченими, заснований на застосуванні теорії штучних нейронних мереж. Він використовує підходи, аналогічні вживаним для розпізнавання людських облич.
Вчені порівняли можливості людей і комп'ютерів в розпізнаванні людських образів в творіннях Пікассо. Люди з точністю 0,804 змогли правильно визначити зображення людини. Комп'ютери, що реалізують четвертий алгоритм, змогли це зробити з точністю 0,315, третій - з 0,444.
Вчені дійшли висновку, що випробовувані визначають зображення аналогічно підходу з використанням третього алгоритму. Люди, також як і програми, що використовують третій алгоритм, зі збільшенням ступеня абстракції гірше справлялися з визначенням зображення людини. На думку експертів, їх порівняння можливостей людей і машин може знайти застосування в створенні майбутніх алгоритмів комп'ютерного зору.
|
|
|
|