Технические нервные системы. Глава 5

5. Реализация обучаемых систем управления

5.1. Варианты физической реализации обучаемых систем управления

Принципы построения и работы обучаемых систем управления могут быть реализованы на основе различных физических принципов. Эти системы могут быть оптическими, электрическими, механическими, гидравлическими, пневматическими и т.д. Кстати, можно найти аналогию в работе большинства (если не всех) существующих систем с работой обучаемых систем управления. Например такая механическая система, как замок и ключ может рассматриваться как механическая обучаемая система, в которой положение пластин замка (они играют роль рецепторов), при которой он открывается, определяют целевую ситуацию, а участки профиля ключа аналогичны весовым коэффициентам. Наложение целевой ситуации на эти весовые коэффициенты дает выход, результат – замок открывается. Формирование требуемого профиля ключа в этом примере – своего рода процесс обучения. Программируемые системы управления (ЧПУ) – тоже можно рассматривать как частный случай обучаемых систем с единственным датчиком (рецептором) времени, у которой для каждого такта (отрезка времени) программного цикла – свои весовые коэффициенты для исполнительных двигателей, определяющие движение всего управляемого механизма, робота или станка.

Математическая модель обучаемой системы управления, основной частью которой является расчет весовых коэффициентов признаков образов ситуаций, имеет самостоятельное значение, т.к. позволяет использовать дискретные системы (компьютеры, системы числового программного управления и др.) в режиме обучаемых систем. Это может быть использовано как для практического управления каким-либо объектом, так и для моделирования такого управления на компьютере. Такое моделирование позволяет выбрать ситуации обучаемой выборки, менять их и увидеть результат обучения, что ускоряет обучение реального объекта. И, что особенно важно для разработчиков и исследователей обучаемых систем управления, математическая модель позволяет изучать закономерности процесса обучения и работы таких систем. Так, многие результаты, представленные в данной работе, были получены благодаря использованию математической модели.
Программный вариант обучаемой системы управления может быть реализован как на универсальной вычислительной технике так и с использованием специализированных процессоров, предназначенных для расчета весовых коэффициентов в процессе обучения и для расчета выходных сигналов в ходе управления объектом.
К недостаткам использования цифровых технологий для реализации обучаемых систем управления можно отнести потери времени на опросы рецепторов и расчеты сигналов управления, а также относительно высокая стоимость таких систем, поэтому для реального управления объектами предпочтительнее аналоговые обучаемые системы.
Электрический аналоговый вариант – наиболее удобный и простой способ реализации обучаемых систем управления. Этот вариант и был использован нашей научной группой для первых практических реализаций. Роль весовых коэффициентов при этом могут выполнять, кроме резисторных элементов, элементы с зарядовой связью, электролитические и т.д. Роль рецепторов могут выполнять как элементы, изменяющие свои проводимости под внешним воздействием, так и активные элементы, перерабатывающие энергию внешнего воздействия в электрическую.
Весовые коэффициенты могут быть реализованы не только в виде электрической проводимости, но и в виде оптической, гидравлической или пневматической проводимости. Особенность таких систем в том, что они устойчивы к ионизирующим излучениям и электромагнитным полям, т.е. могут использоваться в таких условиях, как, например, при аварии на атомных электростанциях.
Рецепторы обучаемых систем управления могут изготавливаться чувствительными не только к видимому свету, звуку, силовому воздействию и другим традиционным внешним воздействиям, но и к ионизирующему излучению, радиоволнам, инфракрасному и ультрафиолетовому излучениям и другим видам внешнего воздействия, не воспринимаемого человеком. Это позволяет использовать объекты, оснащенные обучаемыми системами управления там, где человеку находиться опасно.

Рассмотрим некоторые разработанные варианты реализации обучаемых систем управления.
Оптический вариант обучаемой системы управления [76] характеризуется наглядностью того, что ее технический мозг, выполненный в виде фотопозитивов на прозрачной подложке, не содержит определенных образов, эталонов и т.д., а имеет некое абстрактное изображение, сформированное в результате многократного обучения (экспонирования и проявления) во всех ситуациях обучаемой выборки.
На рис.5.1 представлена схема обучаемого оптического устройства управления для отдельного исполнительного органа.

Рис.5.1. Схема оптической обучаемой системы управления для одного исполнительного двигателя

Устройство, реагирующее на некоторую ситуацию (зрительный образ 1), содержит два оптических канала – плюс-канал 2, содержащий последовательно оптически связанные первый объектив 3 с регулируемой диафрагмой 4, первый оптический затвор 5, первый блок 6 памяти и первый многоэлементный фотоприемник 7, и минус-канал 8, содержащий последовательно оптически связанные второй объектив 9 с регулируемой диафрагмой 10, второй оптический затвор 11, второй блок 12 памяти и второй многоэлементный фотоприемник 13. Устройство содержит также элемент 14 сравнения, входы которого подключены соответственно к выходам первого и второго фотоприемников 7, 13, а выход элемента сравнения является выходом 15 устройства.
Блоки 6 и 12 памяти представляют собой фотопозитивы на прозрачной подложке. Диафрагмы 4, 10 регулируемые, а фотозатворы 5, 11 нерегулируемые, т.е. их временная выдержка постоянна. Сигнал управления Е на выходе устройства подают на конкретный исполнительный орган (элемент перемещения). Для системы из нескольких исполнительных органов используют столько же пар оптических каналов с полным набором входящих элементов.
В процессе обучения используют память основную и ее непроявленный дубль. Основной памятью является фотопозитив на прозрачной подложке, экспонированный и проявленный. Дубль памяти представляет собой также позитив на прозрачной подложке, его снимают с того же основного фотопозитива путем, например, контактного экспонирования, но дубль не проявляют для того, чтобы была возможность откорректировать память путем наложения на нее в процессе обучения корректирующего изображения. После проявления дубль становится основной памятью.
Перед обучением производят дискретизацию рабочего цикла по отдельным исполнительным органам объекта управления, по ситуациям цикла и по элементам зрительного образа. Для этого выделяют из общего процесса движения (из многомерного пространства движения объекта управления) одномерное движение отдельного исполнительного органа, которое однозначно определяется скалярной величиной сигнала управления Е, формируемого на выходе 15 устройства. Непрерывное изменение видимой сцены на всем протяжении рабочего цикла условно разбивают на зрительные образы (ситуации) и нумеруют их. Зрительное поле (световое поле оптических каналов 2, 8) разбивают на отдельные участки и нумеруют их. Эти участки должны соответствовать апертурам соответствующих фотоэлементов многоэлементных фотоприемников 7, 13. Точно также условно необходимо разбить на такие же отдельные участки поле блоков 6, 12 памяти. Считается, что зрительные образы обоих оптических каналов в одной и той же ситуации одинаковы. Нумерация участков зрительного поля, полей блоков памяти и фотоэлементов многоэлементных фотоприемников обоих оптических каналов должна совпадать.
Устройство готово управлять исполнительным органом в том случае, если определены оптические проводимости C_j всех участков обоих блоков 6, 12 памятей, т.е. определены изображения фотопозитивов.
Фотографическая память обучаемого оптического устройства управления представляет собой не пространственный накопитель с программой действий, а оптический преобразователь, единственный на все случаи в работе объекта управления, который содержит совокупную информацию всего процесса обучения. В этой памяти могут накапливаться знания в виде абстрактного изображения для решения не одной, а многих задач: обученное для выполнения одних действий, устройство можно дообучить для выполнения других действий, третьих и т.д., т.е. можно расширять круг решаемых задач.
Одна и та же оптическая система управления может использоваться для решения нескольких задач, если использовать при обучении и работе мозаичные оптические фильтры с различной прозрачностью участков.

5.2. Варианты электрической реализации обучаемых систем управления

5.2.1. Обучаемая система управления с резисторной матрицей из подстроечных резисторов

Вариант выполнения обучаемой системы управления, в котором резисторные элементы матрицы технического мозга представляют собой подстроечные резисторы, является наиболее удобным для научно-исследовательских и учебных целей. Этот вариант позволяет непосредственно вмешиваться в работу отдельных элементов технического мозга, и именно на таком варианте проводились научные исследования, отраженные в данной работе.
В свое время (1990 год) этот вариант обучаемой системы управления предлагался ВУЗам и НИИ страны в качестве готового образца с установкой на промышленные роботы. Были разосланы рекламные материалы: краткое описание, технические характеристики и фотографии робота ТУР-10К, оснащенного обучаемой системой управления со зрением. Был осуществлен ряд газетных публикаций, а также проведены съемки передачи для телевидения (рис.5.2), в которой рассказывалось о достижениях и перспективах в развитии обучаемых систем управления.

Рис.5.2. Съемки робота ТУР-10К со зрением оператором Воронежского телевидения Александром Вайманом 22 февраля 1990 года

Эти материалы нашли отклик в ЦНИИМаше и привели к заключению хозяйственного договора об оснащении робота РМ-01 обучаемой системой.

5.2.2. Обучаемая система управления с резисторной матрицей, элементы которой выполнены в виде графитовых соединений

В ходе выполнения хозяйственного договора с ЦНИИМаш в 1991 году была разработана и изготовлена компактная обучаемая система управления (рис.5.3, 5.4), в которой роль резисторных элементов матрицы мозга выполняют графитовые дорожки, наносимые, например, карандашом на поверхность текстолитовых пластин и соединяющие строчные шины матрицы со столбцовыми шинами (рис.5.5).

Рис.5.3. Компактная обучаемая система управления с элементами
резисторной матрицы в виде графитовых дорожек

Рис.5.4. Основные элементы компактной обучаемой системы управления

Рис.5.5. Технический мозг обучаемой системы управления, элементы
матрицы которого выполнены в виде графитовых дорожек

Рис.5.6. Пластинка технического мозга и орудия его настройки

Интенсивность нанесения и ширина дорожки определяли ее проводимость. Эту проводимость легко изменять: увеличивать – карандашом и уменьшать – стиральной резинкой (рис.5.6). Настройка такой обучаемой системы аналогична настройке системы, технический мозг которой выполнен с использованием подстроечных резисторов.

5.2.3. Обучаемая система управления с резисторной матрицей, элементы которой выполнены из халькогенидных полупроводников

Использование халькогенидных полупроводников в обучаемых системах управления представляется очень перспективным как в качестве фоточувствительных рецепторов, так и в качестве резисторных элементов матрицы технического мозга [55 – 57]. Элементы из халькогенидных полупроводников имеют малые размеры и изменяют свою проводимость под воздействием электрических импульсов. Параметры импульсов могут изменяться в широких пределах. Эти импульсы не мешают работе системы, т.к. не сказываются на работе исполнительных двигателей из-за их инерционности, что позволяет реализовывать динамический метод обучения системы, т.е. обучение в процессе работы объекта управления.
Таким образом, использование халькогенидных полупроводников позволяет миниатюризировать обучаемые системы и автоматизировать процесс обучения, реализуя метод “вождения за руку”. На руке робота располагают кнопки из токопроводящей резины, включающие импульсы обучения соответствующего двигателя. Мощность импульсов зависит от усилия нажатия на кнопку. Располагаться кнопки должны таким образом, чтобы нажатие на них соответствовало бы требуемому направлению движения робота.
Большую роль в развитии этого направления сыграло сотрудничество нашей научной группы с группой кафедры полупроводников Рязанского радиотехнического института, руководимой Петровым Игорем Михайловичем. Сотрудниками кафедры полупроводников были проведены многочисленные исследования вольт-амперных характеристик элементов с различными параметрами по составу и размеру (рис.5.7).

Рис.5.7. Многоступенчатая вольтамперная характеристика халькогенидного элемента

Они же изготовили по нашему заказу две матрицы технического мозга. Одна из них (рис.5.8) изготовлена из отдельных резисторных элементов и с диодной развязкой, исключающей появление блуждающих токов в матрице.
Другая изготовлена напылением слоя полупроводника на строчные шины, на который, в свою очередь, были напылены столбцовые шины (рис.5.9).

Рис.5.8. Технический мозг на 40 рецепторов и 5 исполнительных двигателей,
резисторные элементы матрицы которого выполнены из халькогенидных полупроводников

Рис.5.9. Матрица технического мозга с резисторными элементами, выполненными из халькогенидных
полупроводников, изготовленная с использованием технологии напыления

Первая матрица была использована в качестве технического мозга обучаемой системы управления со зрением с сорока рецепторами сетчатки (рис.5.10) технического глаза и с пятью парами выходов на исполнительные двигатели (рис.5.11).

Рис.5.10. Сетчатка технического глаза на 40 рецепторов

Рис.5.11. Технический глаз на 40 рецепторов с техническим мозгом из халькогенидных полупроводников

Рис.5.12. Робот ТУР-10К с обучаемой системой управления, резисторная матрица
которой выполнена с использованием халькогенидных полупроводников

Для корректировки проводимостей халькогенидных элементов преобразующей матрицы был использован генератор импульсов Г5-54, формирующий импульсы частотой 0,001…100кГц, длительностью 0,5…1000мкс. Габаритные размеры генератора: 370х227х185 (рис.5.12).

5.3. Обучаемая система управления со зрением для промышленного робота PM-01 (PUMA)

23 марта 1990 года в Липецк приехали Богомолов Валерий Павлович – начальник лаборатории одного из отделов ЦНИИМаш и начальник сектора того же отдела Семенко Валерий Петрович. Мы показали им наш робот ТУР-10К, оснащенный техническим глазом, продемонстрировали поиск им заданного предмета, отслеживание траектории, уклонение от препятствий, коротко изложили принципы работы обучаемых систем. В тот же день гости составили техническое задание на установку обучаемой системы управления со зрением на робот PM-01 в лаборатории ЦНИИМаш и обучение его преследованию предмета, перемещающегося в пространстве. Согласно этому заданию была изготовлена обучаемая система с техническим глазом на 200 рецепторов и 6 исполнительных двигателей. В качестве рецепторов сетчатки технического глаза для робота PUMA были использованы двести фоторезисторов СФ3-1, которые были склеены между собой и залиты эпоксидной смолой (см. рис.5.13).

Рис.5.13. Стадии изготовления сетчатки технического глаза

Фоторезисторы изготовленной сетчатки были пронумерованы, как показано на рис.5.14:

Рис.5.14. Нумерация рецепторов сетчатки технического глаза

Расположение фоторезисторов, представленное на рис.5.13 позволяет более равномерно распределить фоточувствительные участки по площади сетчатки по сравнению с расположением в соответствии с которым светочувствительные участки располагаются в виде продольных линий (рис.4.2).
Далее, фоторезисторы сетчатки были разделены на четыре группы, как показано на рис.5.15 (рис.5.15,а – черным цветом выделена первая группа рецепторов; рис.5.15,б – черным цветом выделена вторая группа рецепторов; рис.5.15,в – черным цветом выделена третья группа рецепторов; рис.5.15,г – черным цветом выделена четвертая группа рецепторов).
Один из двух выходов каждого фоторезистора в отдельной группе был соединен с общей для данной группы шиной, предназначенной для подсоединения к источнику питания. Другой выход каждого фоторезистора отдельным проводком жгута (“зрительного нерва”) соединялся с отдельной строчной шиной резисторной преобразующей матрицы. Разделение рецепторов сетчатки на четыре группы позволяло обучать объект управления выполнению шестнадцати различных задач (поиска целей) за счет различных комбинаций включений питания групп рецепторов.

Рис.5.15. Группы рецепторов сетчатки технического глаза

Сетчатка вставлялась в корпус технического глаза, который имел сменный объектив, направляющий изображение на сетчатку. Конструкция корпуса позволяла менять расстояние между объективом и сетчаткой для наведения фокусного расстояния. Для проецирования изображения на сетчатку использовался фотообъектив “Гелиос-103” с углом зрения 45^о, с относительным отверстием 1:1,8 и фокусным расстоянием 53 мм.
В качестве резисторных элементов матрицы технического мозга были использованы подстроечные резисторы СП3-38в-0,125вт-2,2кОм-I номинальным сопротивлением 2,2 Ком. Матрица включала в себя 1200 (200х6: 200 – по числу выходов рецепторов технического глаза, 6 – по числу исполнительных двигателей) резисторов. Конструктивно матрица представляла собой четыре раскладывающиеся платы (см. рис.5.16).

Рис.5.16. Технический мозг и блок усилителей выходных
сигналов обучаемой системы управления робота РМ-01

С одной стороны каждая плата имела продольные проводящие дорожки, с другой стороны – поперечные. Подстроечные резисторы были напаяны на продольные дорожки, а контакты ползунов резисторов были соединены с поперечными дорожками, которые, в свою очередь, были соединены разъемами с выходами рецепторов технического глаза. Продольные дорожки были соединены с входами блока усилителей, выходные сигналы которых являлись управляющими для соответствующих электродвигателей робота.
В качестве блока питания постоянного тока обучаемой системы управления использовалась приставка выпрямительная Ш5.121.000 производственного объединения “Орловский завод УВМ имени К.Н.Руднева” (ТУ25-01.808-77) с выходным напряжением 9 и 12 вольт. Габариты выпрямительной приставки в мм: 135х80х70, масса – 0,85 кг, потребляемая мощность – 16 ВА.
В качестве блока питания постоянного тока усилителей выходных сигналов технического мозга использовались две спаренные выпрямительные приставки, обеспечивающие выходное напряжение от –12 до +12 вольт.
Комплект обучаемой системы управляющего зрения для робота PUMA в сборе показан на рис.5.17.

Рис.5.17. Обучаемая система управления с техническим глазом на 200 рецепторов
и выходами на 6 исполнительных двигателей

Регулирование доли сигнала управления двигателя от отдельного рецептора осуществляется смещением ползуна подстроечного резистора в ту или иную сторону от среднего нулевого положения.
Поскольку обучаемая система управляющего зрения является аналоговой системой, “родные” дискретные датчики положения подвижных частей руки робота были заменены на тахогенераторы (рис.5.18). Использовались тахогенераторы марки ТГП-1А. Кроме этого, платы управления приводами стойки “Сфера 36” были заменены на платы управления приводами, аналогичные тем, которые используются для управления приводами робота ТУР-10К. На их входы были поданы сигналы управления обучаемой системы и сигналы тахогенераторов, а выходы их были соединены с широтно-импульсными преобразователями стойки “Сфера 36” (рис.5.19).

Рис.5.18. Дискретные датчики положения робота PM-01 заменены на тахогенераторы ТГП-1А

Рис.5.19. Схема подключения обучаемой системы управления к роботу PM-01

В схеме использованы следующие обозначения: БУЭП – стойка блоков усилителей электропитания; БП – блок питания стойки “Сфера 36”; МУП – платы модуля управления приводами БУЭП робота ТУР-10К; ШИП – платы модуля широтно-импульсного преобразователя стойки “Сфера 36”; тг – выходы тахогенераторов; СО – технический глаз системы очувствления; МП – матрица-преобразователь обучаемой системы управления; БУ – блок усилителей обучаемой системы управления; 1 – питание рецепторов СО и усилителей ОСУ; 2 – выходные сигналы усилителей БУ и тахогенераторов; 3 – сигналы управления приводами.
Таким образом было осуществлено сопряжение аналоговой обучаемой системы управления с системой управления приводами робота PM-01.
Изготовленная система была закреплена на руке робота и выходы ее подсоединены к входам управления приводами робота (рис.5.20), при этом стойка ЧПУ (Сфера 36) была отключена.

Рис.5.20. Обучаемая система управления, установленная на робот PM-01

Для усиления выходных сигналов технического мозга и передачи их на входы плат модуля управления приводом двигателей робота использовались усилители, собранные по схеме, описанной в разделе 4.1.

Изготовленная система была закреплена на руке робота и выходы ее подсоединены к входам управления приводами робота (рис.5.21).

Рис.5.21. Робот PM-01, оснащенный обучаемой системой управления со зрением в действии

Работы по изготовлению обучаемой системы управляющего зрения и установке ее на робот PM-01 проводились по хозяйственному договору ? 96-90 между Липецким Домом Техники НТО и научно-производственным центром “Информатика” (для ЦНИИМаш) “Разработка обучаемой системы управления робота PM-01 для решения задач преследования и захвата подвижного объекта” от 01.01.1990 года (срок окончания договора: 01.11.1990г.). Затем работа была продолжена в соответствии с хозяйственным договором между Липецким политехническим институтом (ЛипПИ) и ЦНИИМаш “Совершенствование узлов и процесса обучения обучаемой системы управления” от 01.01.1991 года (срок окончания договора: 01.12.1991г.). Робот обучался решению задач преследования подвижного объекта, уклонения от подвижного объекта, а также решению задачи поиска и сборки узлов. В качестве дальнейшей цели работы планировалось предложить разработанную обучаемую систему управляющего зрения в качестве одного из вариантов системы управления манипулятора космического челнока “Буран” (рис.5.22).

Рис.5.22. Космический челнок “Буран” на стартовой площадке

Однако, сложное положение космической отрасли, в которой она оказалась в то время, не позволило нашим планам сбыться. Работы по “Бурану” были свернуты.

[Вернуться к оглавлению]

Site of Information Technologies
Designed by inftech@webservis.ru.