Главная » Статьи » Психология и педагогика

Векторное кодирование в детекторных механизмах восприятия узловых элементов контурных изображений


Введение. Как известно, паттерн возбуждений на сетчатке является крайне зашум-
ленным и в малой степени дифференцированным. Однако уже на этом уровне обработки 
зрительной информации такие физиологические механизмы, как латеральное торможе-
ние, способствуют особому выделению контурных элементов изображения за счет при-
легающих участков. Сложно посчитать это случайностью: в самом деле, детектирование 
контура жизненно необходимо для восприятия формы предметов и теней, отбрасывае-
мых ими. Но сводится ли к этому информация, потенциально заложенная в контурном 
рисунке? 

Исследования Гузмана и Уолца, проведенные в MIT в рамках проекта «глаз – ру-
ка», убедительно показывают, что точки пересечения линий контуров – так называемые 
узловые точки – налагают ряд ограничений на пространственные свойства объектов, то 
есть являются своего рода признаками удаленности. Ограничения эти носят характер не 
вероятностный (по частоте встречаемости изображений объектов с подобной диспози-
цией узлов), а абсолютный, продиктованный законами проекции трехмерного простран-
ства на плоскость сетчатки (или диссектора, если речь идет о компьютерном зрении). К 
примеру, пространственная ориентация куба задается его вершинами, а вершины как раз 
и представлены на сетчатке в виде узловых элементов. Используя знания о возможности 
совмещения тех или иных узлов, программа Гузмана может не только распознать объек-
ты на достаточно сложной трехмерной сцене, но и с высокой степенью точности указать 
их пространственное положение относительно «наблюдателя». Программа Уолца рабо-
тает еще эффективнее за счет добавления знании о тенях и ограничениях, накладывае-
мых последними на пространственную структуру картины. 

Наше исследование было посвящено изучению характерных механизмов зритель-
ного восприятия узлов. Для этой цели мы взяли три класса узловых элементов: «вилки», 
«стрелки» и «Т-образные фигуры». Рядоположенные «вилка» и «стрелка» напоминают 
иллюзию Мюллера-Лайера (заметим, что современное объяснение этой иллюзии также 
производится  через  обращение  к  признакам  удаленности!). «Т-фигуры»  представляют 
собой отрезок, к центру которого подходит другой отрезок под некоторым углом до 90°. 
Все  три  типа  узлов  подразумевают  вариативность  линейных  и  угловых  соотношений 
(т.е. пространственные ограничения узла не изменятся, если будет изменена длина од-
ной из линий или угол между ними – разумеется, при условии сохранения типа узла). 
Методика. Стимульный материал. Всего испытуемым предъявлялось 27 различ-
ных зрительных стимулов (по девять вилок, стрелок и Т-фигур). Между собой стимулы 
каждого типа различались по углу (который варьировался упорядоченно в зависимости 
от номера стимула с шагом приблизительно в 10°) и по ориентации направляющей (сти-
мулы были в случайном порядке повернуты на угол произвольной величины). Послед-
нее было сделано с целью элиминировать фактор утомляемости и усложнить задачу ис-
пытуемого. 

Процедура  исследования.  Испытуемому  предъявлялось 702=27Ч26 пар  стимулов. 
Ему предлагалось сравнить их и вынести количественное суждение о мере сходства по 
девятибалльной шкале (от 1 – «совершенно одинаковые» до 9 – «ничего общего»). Ис-
пытуемых просили не обращать внимания на разницу в ориентации стимулов, величине 
и т.п. Таким образом, в каждой серии испытуемый два раза (с целью устранения про-
странственной  ошибки)  сравнивал  между  собой  все  пары  стимулов.  Пары  стимулов 
предъявлялись  в  случайно-сбалансированном  порядке,  процедура  исследования  была 
автоматизирована.  Предъявление  каждой  пары  стимулов  занимало 2000 мс;  между 
предъявлением и ответом давалась пауза 500 мс. Таким образом, вся процедура занима-
ла около 40 минут. Шкала 1–9 была представлена компьютерной клавиатурой; все испы-
туемые были ранее знакомы с компьютерной техникой. 

Результаты и обработка. По вышеописанной методике были собраны двенадцать 
матриц  субъективных  расстояний  между  стимулами  для  пяти  различных  испытуемых 
(некоторые из них прошли по 2 или 3 серии). Дальнейший сбор данных оказался излиш-
ним: корреляции по Пирсону между этими матрицами составляли в среднем 0,95 и нико-
гда не опускались ниже 0,8. Это показало значительную регулярность ответов испытуе-
мых. 

Для обработки результатов мы использовали метод многомерного шкалирования 
(ММШ, MDS). Был сделан выбор в пользу метрического варианта, так как наши данные 
были  достаточно  дифференцированы.  Эмпирически  были  получены  свидетельства  об 
эвклидовости пространства стимулов (взято p=2 в метрическом уравнении Минковского 
– Эвклидова метрика). Шкалировалась усредненная матрица субъективных различий. 
Используя данные о stress, мы остановились на трехмерном пространстве для представ-
ления стимулов. Это значит, что существуют три механизма, обеспечивающих субъективное 
различение стимулов как внутри каждой из предъявляемых групп, так и между ними. 

Геометрическое представление стимулов показывает, что они лежат на поверхно-
сти  сферы  в  трехмерном  пространстве  с  вариативностью  радиуса  последней  не  более 
6%.  Сферичность  пространства – очень  важный  признак,  указывающий  на  механизм 
векторного  кодирования.  Вращение  пространства  относительно  плоскостей  позволило 
выдвинуть  содержательную  интерпретацию  осей  координат (Эвклидово  пространство 
инвариантно  относительно  поворота  осей  координат,  что  следует из  его  метрического 
уравнения). 

Сферичность  пространства  делает  удобным  использование  полярных  координат: 
так как все точки приблизительно равноудалены от центра, модуль можно считать кон-
стантным. Из этого следует, что положение точки в каждой плоскости определяется ее 
углом относительно начала координат. Регрессионный анализ позволил установить зна-
чимую (R2>0,8)  линейную  или  логарифмическую (в  зависимости  от  плоскости  и  типа 
стимулов) зависимость угла в полярных координатах от физического угла. 

Контрольный опыт. Сравнение стимулов внутри каждой группы (3 матрицы для 
«вилок», 4 – для «стрелок» и 5 – для «Т-фигур») подтвердило регулярность ответов ис-
пытуемых и привело к выделению двумерных пространств «вилок» и «стрелок», а также 
трехмерного пространства «Т-фигур», которые являлись подпространствами вышеопи-
санного. Закономерности, установленные в этих сериях, повторяли приведенные выше. 
Основной вывод. Зрительная система человека использует механизм векторного 
кодирования при опознании и различении узловых элементов контурных изображений. 
В частности, это доказывается сферичностью полученного субъективного пространства, 
из чего следует наличие нормировки векторов возбуждений при восприятии контуров.
Категория: Психология и педагогика | (22.01.2013)
Просмотров: 676 | Рейтинг: 0.0/0