К расчету топологической пластичности ядерных нейронных сетей
А.Ю. Дорогов
Санкт-Петербургский государственный электротехнический университет “ЛЭТИ” им В.И.Ульянова (Ленина)
Abstract – In the article the quantitative evaluation of topological plasticity neural networks is considered. The exact formulas and asymptotic evaluations are obtained. The example of calculation of topological plasticity degree is indicated.
Ядерные нейронные [1,2] сети относятся к многослойным сетям прямого распространения. Наполнение класса осуществляется за счет целенаправленного ограничения связей между нейронами. К классу ядерных сетей принадлежат как многослойные классические персептроны, так и быстрые нейронные сети [3], со структурой подобной алгоритмам БПФ. Между двумя полярными классами лежит множество нейронных сетей, структуру которых можно варьировать в зависимости от целевого приложения. Выбор подходящей структуры является наиболее сложной задачей при проектировании ядерной сети. Поэтому определяющую значимость имеют количественные оценки проектируемых структур. Одна из таких оценок – “топологическая пластичность” – рассматривается в настоящей работе.
Идеология ядерных сетей основана на понятии нейронного ядра. Нейронное ядро можно рассматривать как однослойный персептрон малой размерности. Нейронные ядра локализуются в пределах нейронного слоя и имеют непересекающиеся рецепторные поля. На рис.1 показан пример двухслойной ядерной нейронной сети, где каждая вершина соответствует формальному нейрону. Показанный граф полностью определяет топологию связей нейронной сети, поэтому данное представление будем называть топологической реализацией. Каждое ядро на структурном уровне характеризуется размерностью рецепторного поля и числом входящих в него нейронов, т.е. определяется парой чисел
Для ядерной нейронной сети достаточным структурным описанием может служить ориентированный граф, в котором каждая вершина соответствует одному нейронному ядру, а дуги отвечают операторам межъядерных связей. Такой граф называются структурной моделью ядерной сети. На рис.2 показан пример структурной модели для топологической реализации, представленной на рис.1. На графе структурной модели показаны веса вершин и веса дуг. Вес вершины
Обратный переход от структурной модели к топологической реализации неоднозначен, что можно трактовать как свойство топологической пластичности ядерной нейронной сети. Степень топологической пластичности будем оценивать мощностью множества топологических реализаций отвечающих данной структурной модели.
Рассмотрим метод расчета степени топологической пластичности на примере двухслойной ядерной нейронной сети. Обозначим нейронные слои символами
где
Все множество топологий рецепторного поля можно получить, произвольным образом выбирая разбиения множества
Для расчетов обычно используют информационную меру
которая называется информацией разбиения [5]. Аналогичные рассуждения для аксоновых полей выходного слоя приводят к выражению:
где
Рассмотрим теперь топологию межслойного перехода. Обозначим через
ранговую матрицу, определяющую межслойные связи. Поскольку рецепторные поля не пересекаются, то
Выполнены также условия:
Топология аксоновых полей слоя
которая подобна ранговой матрице
Если собрать все подмножества
которая определяет длину орбиты топологий межслойного перехода. Суммируя выражения (1)(2)(3) окончательно получим информационную оценку степени топологической пластичности двухслойной сети:
В качестве примера выполним расчет для структуры нейронной сети, показанной на рис.2.
Таким образом, степень топологической пластичности для данной структурной модели будет равна
где
Используя это приближение для выражения (1) получим:
где
энтропия разбиения. Аналогично из формул (2)(3) получим:
На основе полученных выражений нетрудно определить условия, при которых топологическая пластичность будет принимать максимальные значения. Поскольку функция энтропии принимает максимальные значения при равенстве слагаемых суммы, то максимум пластичности будет достигнут при выполнении условий:
для любых
Для рассмотренного примера
Подставляя эти значения в формулы (4) получим:
Представленный в данной статье метод расчета топологической пластичности позволяет сравнивать между собой структурные модели ядерных нейронных сетей. Интуитивно можно предположить, что чем выше степень топологической пластичности, тем выше способность нейронной сети адаптироваться к внутренней структуре данных, и, следовательно, тем выше способность нейронной сети к обучению.
Литература
Site of Information
Technologies Designed by inftech@webservis.ru. |
|