WWW.KNIGI.KONFLIB.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 
<< HOME
Научная библиотека
CONTACTS

Pages:     | 1 |   ...   | 14 | 15 || 17 | 18 |   ...   | 21 |

«ИНФОРМАЦИОННЫЕ СИСТЕМЫ КОНТРОЛЯ И УПРАВЛЕНИЯ В ПРОМЫШЛЕННОСТИ И НА ТРАНСПОРТЕ ШЕСТНАДЦАТЫЙ ВЫПУСК ИРКУТСК 2009 УДК 681.518.54 ББК 32.965 И 74 РЕДАКЦИОННАЯ КОЛЛЕГИЯ: ...»

-- [ Страница 16 ] --

Данный принцип обучающего управления тестируется в ходе моделирования и экспериментов. Для организации процесса обучения используется минимальная имитационная модель, не требующая сложных вычислений. Классификационная система, полученная при моделировании эволюционным путем, загружается в систему управления реального робота. В условиях эксперимента из десяти эволюционных модельных систем управления семь оказались успешными при управлении реальным роботом.

Ключевые слова: шагающие роботы, устойчивые походки, обучение с подкреплением, имитационное моделирование.

В последнее время большое внимание уделяется построению и организации управления сложными робототехническими системами с использованием эволюционных принципов [1, 2]. Эволюция системы управления на основе обучения требует значительного количества тестовых движений. Процедура обучения может проводиться на реальном роботе, но при использовании современных программно-аппаратных вычислительных средств требует значительного времени обучения.

Альтернативным путем является первичная разработка процедуры обучения на основе имитационного моделирования. В такой концепции, после обучения и успешного тестирования, эволюционная система управления загружается в программное обеспечение реального робота, и обучение продолжается в реальных условиях. В принципе, такой подход может существенно ускорить процесс обучения. С точки зрения эволюционного программирования, результаты имитационного моделирования могут рассматриваться как искусственный генетический материал, передаваемый в реальную систему управления.

Следует отметить, что эволюция системы управления в ходе компьютерных экспериментов является одной из центральных проблем эволюционной робототехники. До тех пор пока эта проблема остается нерешенной, применение идей эволюционной робототехники к управлению такими сложными системами, как многоногие шагающие машины или многопальцевые захватные устройства рук робота, нереалистично. В этой связи разработка и верификация упрощенных моделей, которые можно было бы включить в эволюционный цикл системы управления, представляется исключительно важным.

Разработка таких упрощенных моделей, основанных на комбинации принципов механики, искусственного интеллекта и, возможно, физиологии и вычислительной неврологии, требует определения некоторых базовых принципов. Один из таких принципов, а именно принцип минимальной имитации, был предложен и опробован на различных робототехнических системах в [3]. Необходимость минимальных имитационных моделей также подчеркивалась в [4], где предлагался эволюционный подход к управлению автономными мобильными роботами, основанный на применении нечеткой логики.

Настоящая статья также связана с разработкой и верификацией минимальных имитационных моделей. Статья построена следующим образом: шагающий робот и организация его управляющей схемы описывается в секции 1; минимальная имитационная модель строится в секции 2; Результаты моделирования обсуждаются в секции 3;

экспериментальная верификация представлена в секции 4; выводы формулируются в секции 5.

В экспериментах использовался робот OCT1-b, производимый компанией AAI Ltd (рис. 1). У робота восемь ног. Каждая нога имеет две дискретно управляемых степени подвижности (подъем/опускание ноги на угол и вращение в плоскости главного тела на угол ), снабженная двумя угловыми сенсорами и сенсорами перегрузки по току.

В дополнение: имеются пятнадцать световых сенсоров, восемь инфракрасных сенсоров близости и одиннадцать сенсоров антенных переключателей. Робот управляется от персонального компьютера через последовательный порт.

Предполагается, что робот может приобретать навыки ходьбы (устойчивые периодические походки) в ходе обучения достижения цели, представленной световым источником. Отдельные попытки достижения цели в процессе обучения называются эпизодами. Эпизоды обновляются всякий раз, когда робот достигает цели или когда число команд, отведенных на один эпизод, достигает установленного предела. В общем случае, задача обучения может быть последовательно декомпозирована на овладение навыками устойчивой ходьбы и навыками прямолинейного движения. Тем не менее, в данной работе мы комбинируем эти подзадачи в одну, оставляя задачу последовательного обучения для будущих исследований.

Для управления роботом в процессе обучения мы используем набор правил (if-then rules), называемые классификационной системой.

Математическое описание используемой системы приведено в [5].

Предполагается, что робот не имеет априорной информации о внешней среде, собственной внутренней модели и координатах цели. Основываясь на текущей сенсорной информации, система управления генерирует дискретные команды движения. Каждая нога управляется четырьмя командами (factory settings). Список команд (номера команд и значения командных углов) для четырех передних ног и четырех задних ног приведен в таблице 1.

№ Команды движения передних ног № Команды движения задних ног Будем считать, что текущая конфигурация робота определяется предыдущей командой. Общее число команд, 48 = 65536, довольно велико.

Можно показать, что (в грубом приближении) половина общего числа команд, соответствует неустойчивым конфигурациям.

Теоретически возможно определить точное число команд, соответствующих устойчивым конфигурациям, и организовать процесс обучения в пространстве этих команд. Однако в реальности явное описание и нумерация устойчивых конфигураций является хлопотным и, зачастую, не всегда практичным. В такой ситуации уместно строить процесс обучения в исходном пространстве управлений, определяемым общим числом команд.



В процессе обучения система управления самоорганизуется так называемыми сигналами подкрепления (reinforcement signals). Напомним, что if-then правила в классификационной системе имеют свою ценность, которая изменяется динамически. Достижение цели (источника света) определяет поощрение для всей цепочки правил (global reward), приведшей к нужному результату. Если робот двигается вперед, то ценность текущего правила (исполненной команды) увеличивается (local reward), а если назад, то уменьшается (local punishment). Команды, генерируемые системой управления, могут соответствовать устойчивым и неустойчивым конфигурациям. Устойчивость понимается в статическом смысле (конфигурация считается устойчивой, если центр тяжести тела, спроецированный на поверхность передвижения, лежит в контактном многоугольнике ног робота). Всякий раз, когда команда управления приводит к неустойчивой конфигурации, ценность соответствующего правила уменьшается.

Следует отметить, что точное моделирование динамики шагающего робота, включающее односторонние ограничения, накладываемые на движение ног в точках контакта с поверхностью, и учитывающее переменную структуру механической системы, все еще является затратным с вычислительной точки зрения [6]. Вследствие этого, процесс обучения, построенный на полной динамической модели, может быть чрезвычайно медленным и все преимущества имитационного подхода к обучению робота могут быть утеряны.

В таких условиях более перспективным представляется подход, в котором простая (и не обязательно точная) имитационная модель используется для первичного процесса обучения на компьютере.

Полученная эволюционным путем модельная система управления может быть впоследствии загружена в программное обеспечение реального робота. Такой подход был опробован в работе [3], где минимальная модель восьминогого робота была представлена описательными диаграммами.

В работе [7] использовалась простая кинематическая модель шестиногого робота. В экспериментах по управлению четырёхногого робота [8] была опробована минимальная модель, основанная на физиологических соображениях и ассоциируемая с виртуальным прыжком.

В этой секции мы строим относительно простую минимальную имитационную модель для робота ОСТ-1b, учитывающую обобщенные параметры (трение и податливость) контакта между ногой робота и поверхностью. В данной модели, на основе информации о состоянии робота и команде управления в момент времени t, определяются положение центра робота, и его ориентация в момент времени t + 1.

Определим nij как число ног робота на правой стороне тела, меняющих конфигурацию (номер команды в табл. 1) из состояния i в момент времени t, в состояние j в момент t + 1. Аналогичным образом определим число nij для ног робота на его левой стороне. Предполагается, что текущая команда управления приводит к устойчивой конфигурации.

При определении последующей конфигурации робота, ноги, которые не вступают в контакт с поверхностью, игнорируются. Кроме того, игнорируются ноги, которые в моменты времени t и t + 1 находятся в процессе переноса. Таким образом, ноги, переходящие из состояния i в состояние j не вносят вклад в движение тела робота, если i или i соответствуют 3-ей или 4-ой команде (табл. 1). Физически, это соответствует пренебрежению инерцией ног в процессе переноса.

Пусть u 0 будет элементарной виртуальной движущей силой ноги, когда она движется, поддерживая контакт с поверхностью. Пусть также v 0 будет элементарной виртуальной силой сопротивления ноги, когда она фиксирована. Для правой стороны робота определим движущую силу:

и силу сопротивления:

При определении эффективной правосторонней силы воспользуемся соображениями аналогичными модели кулоновского трения. Будем предполагать, что F r = 0 (движение не создается), если | f drv | f res. В ином случае определим:

Аналогичным путем, меняя индекс r на l в (1-3), можно определить эффективную движущую силу F l для левой стороны робота. Далее, определим общую силу F и момент M, действующих на тело робота, как:

Построив F и M, можно определить линейное перемещение в связанных с телом осях, и затем вращательное перемещение тела В уравнениях (6 и 7) cu и c определяют как линейную и вращательную податливости робота. Зная u и, можно определить положение центра робота и его ориентацию в момент времени t + 1 :

Безусловно, построенная минимальная имитационная модель является очень грубым приближением. В зависимости от контекста, можно называть ее эмпирической или виртуальной. В этой модели движение робота аналогично движению гребной лодки, представляемой простой неголономной системой, в которой исключены боковые перемещения.

Отметим, что модель (8–10) дается в кинематической формулировке, поэтому какие-либо динамические эффекты, связанные с балансировкой тела робота, также исключены.

Рис. 2. Чистая трансляция (слева) и вращение (справа) тела робота Рис. 3. Трансляция тела робота с одновременным вращением Пример 1. На рис. 2 и 3 стрелкой показаны переходы робота из текущей конфигурации в последующую. Для примера, показанного на левой стороне рис. 2, имеем n12 = 4, n21 = 0, n11 = 0, n22 = 0, n12 = 4, n21 = 0, n11 = 0, n22 = 0. По формулам (1–3) получаем F = 8u и M = 0, что соответствует чисто трансляционному движению тела.

Пример 2. Этот пример иллюстрируется рис. 2 (правая сторона). Здесь формулам (1–3) получаем F = 0 и M = 8u, что соответствует чисто вращательному движению тела.

Пример 3. Этот пример иллюстрируется рис. 3 (левая сторона). Здесь формулам (1–3) получаем F = 4u и M = 4u, что соответствует поступательному движению робота вперед, сопровождаемому поворотом тела робота вправо.

Пример 4. Этот пример иллюстрируется рис. 3 (правая сторона). Здесь Вычисления по (1–3) показывают, что F = 0 и M = 0 (движения нет) если с поворотом направо). F = v и M = 3v 4u если u v (движение вперед с поворотом направо).



Pages:     | 1 |   ...   | 14 | 15 || 17 | 18 |   ...   | 21 |
 



Похожие работы:

«Утверждаю Проректор по учебной работе _ С.В. Шалобанов _ 2007 г. ПРОГРАММА ДИСЦИПЛИНЫ по кафедре Эксплуатация автомобильного транспорта ОСНОВЫ ТЕОРИИ ТРАНСПОРТНЫХ СИСТЕМ Утверждена научно-методическим советом университета для направления подготовки в области транспортных средств. Специальность Организация перевозок и управление на транспорте (автомобильный) Хабаровск 2007 г. Программа разработана в соответствии с требованиями государственного образовательного стандарта, предъявляемыми к...»

«Положение о порядке проведения практики курсантов и студентов Ульяновского высшего авиационного училища гражданской авиации (института) Ульяновск 2012 Настоящее Положение о порядке проведения практики курсантов и студен­ тов Ульяновского высшего авиационного училища гражданской авиации (ин­ ститута) (далее - Положение о практике) определяет порядок организации, про­ ведения и руководства практикой, требования к содержанию и структуре про­ граммы практики, к отчетной документации по практике....»

«ШТАБ ГРАЖДАНСКОЙ ОБОРОНЫ СССР КОМИТЕТ ГИДРОМЕТЕОРОЛОГИИ ПРИ КАБИНЕТЕ МИНИСТРОВ СССР МЕТОДИКА ПРОГНОЗИРОВАНИЯ МАСШТАБОВ ЗАРАЖЕНИЯ СИЛЬНОДЕЙСТВУЮЩИМИ ЯДОВИТЫМИ ВЕЩЕСТВАМИ ПРИ АВАРИЯХ (РАЗРУШЕНИЯХ) НА ХИМИЧЕСКИ ОПАСНЫХ ОБЪЕКТАХ И ТРАНСПОРТЕ РД 52.04.253-90 САНКТ-ПЕТЕРБУРГ 2000 ИНФОРМАЦИОННЫЕ ДАННЫЕ РАЗРАБОТАН И ВНЕСЕН Ордена Трудового Красного Знамени Главной геофизической обсерваторией им. А.И. Воейкова и Штабом Гражданской обороны СССР с использованием результатов Государственного...»

«ES-TEN-0407 РЕВЕРСИВНЫЕ ВИБРОПЛИТЫ TEN Руководство по эксплуатации 1 TEN2540- TEN2550-TEN3040- TEN3050 СОДЕРЖАНИЕ 1 ВВЕДЕНИЕ...4 2 ПРАВИЛА ТЕХНИКИ БЕЗОПАСНОСТИ..4 2.1 БЕЗОПАСНОСТЬ ПРИ РАБОТЕ С ОБОРУДОВАНИЕМ. 2.2 БЕЗОПАСНОСТЬ ПРИ РАБОТЕ С ДВИГАТЕЛЕМ. 2.3 БЕЗОПАСНОСТЬ ПРИ ТЕХНИЧЕСКОМ ОБСЛУЖИВАНИИ 2.4 МАРКИРОВКИ. 3 УТИЛИЗАЦИЯ...7 4 ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ..7 4.1 ХАРАКТЕРИСТИКИ ДВИГАТЕЛЯ 4.2 ХАРАКТЕРИСТИКИ ВИБРОПЛИТЫ. 4.3 МАКСИМАЛЬНЫЙ НАКЛОН ПЛИТЫ В ПРОЦЕССЕ РАБОТЫ 4.4 АКУСТИЧЕСКИЕ И...»

«МИНИСТЕРСТВО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ ПИСЬМО от 10 марта 1995 г. № 431-ВК О СОГЛАСОВАНИИ ПРАВИЛ ПО ОХРАНЕ ТРУДА Правила по охране труда на автомобильном транспорте считать согласованными с Министерством труда Российской Федерации в редакции, изложенной в приложении к письму Департамента автомобильного транспорта Минтранса России от 08.02.95 № ДАТ-16/42. В.Ф. КОЛОСОВ Утверждены Приказом Министерства транспорта Российской Федерации от 13 декабря 1995 г. № 106 Согласованы письмом...»

«Глава IV ТРАНСПОРТ И ПУТИ СООБЩЕНИЯ 1 1. Ж Е Л Е З Н О Д О Р О Ж Н Ы Й Т Р А Н С П О Р Т Как указано было ранее (гл. II, разд. 4), железные дороги не страховали своего имущества от огня. Правда, статистика акционерного страхования имеет в разделе экстерриториального имущества (т. е. не приуроченного к определенной губернии) рубрику железнодорожные, но ничтожный размер общей суммы (всего 288 млн. руб. на 1/1 1914 г. по всем видам имущества) и соотношение ее структурных частей убеждают нас в том,...»

«ФИНЛЯНДИЯ ШВЕЦИЯ НОРВЕГИЯ ДАНИЯ ж/Д И АВИАТРАНСПОРТ 3 СхЕМА ж/Д ВОКзАЛА В САНКТ-ПЕТЕРБУРГЕ Посадка на автобусы в санкт-Петербурге Автобусы Вокзал ДЛЯ АВИАТУРОВ вылет из аэропорта Шереметьево, терминал 2 (SVO-2) Встреча в аэропорту. Регистрация на международные рейсы начинается за 2 часа. Мы назначаем время встречи за 2,5–3 часа до вылета и настоятельно рекомендуем прибыть не позднее указанного времени. как проехать в аэропорт Шереметьево: на экспрессе с Савёловского вокзала. Железнодорожный...»

«ЧАСТЬ СИСТЕМЫ ПЛАНЕРА КНИГА 4 Гл9в а 36 КАТАЛОГ ДЕТАЛЕЙ И СБОРОЧНЫХ ЕДИНИЦ ПЕРЕЧЕНЬ ГЛАВ КАТАЛОГА Номер Наименование главы ВВЕДЕНИЕ Часть I - УКАЗАНИЯ ПО ОБЩЕМУ ОБСЛУЖИВАНИЮ Хранение самолета (наземное оборудование) 12 Часть 2 - ПЛАНЕР. Книга I Общие указания 20 21 Фюзеляж Часть 2 - ПЛАНЕР. Книга 2 Двери и люки 22 23 Окна Оперение 25 26 Пилоны • • Часть 2. - ПЛАНЕР. Книга 3 Крыло (включая раздел 24.43.00) 24 Часть 2 - ПЛАНЕР. Книга 4 Крыло (с раздела 24.51.00) 24 Часть 3 - СИСТЕМЫ ПЛАНЕРА....»

«rr.by СООБЩЕНИЯ. РАЗНОЕ Витебск 37 i КАК ПОДАТЬ ЧАСТНОЕ ОБЪЯВЛЕНИЕ В ГАЗЕТУ “ИЗ РУК В РУКИ”? ГАЗЕТА ЧАСТНЫХ ОБЪЯВЛЕНИЙ Условия приема на стр. 38 № 35(997) Витебск и Витебская область Рекламное издание СП “БЕЛПРОНТО”...»

«Посвящается 35-летию Иркутского государственного университета путей сообщения ИНФОРМАЦИОННЫЕ СИСТЕМЫ КОНТРОЛЯ И УПРАВЛЕНИЯ В ПРОМЫШЛЕННОСТИ И НА ТРАНСПОРТЕ СЕМНАДЦАТЫЙ ВЫПУСК ИРКУТСК 2010 УДК 681.518.54 ББК 32.965 И 74 РЕДАКЦИОННАЯ КОЛЛЕГИЯ: академик РАИН, д.т.н., профессор Ю.Ф. Мухопад (научный редактор); к.т.н., доцент Ю.И. Огородников (зам. научного редактора); к.т.н. Р.А. Сегедин (ученый секретарь); д.т.н., профессор А.П. Хоменко; д.т.н., профессор М.П. Дунаев (ИрГТУ); д.т.н., профессор...»






 
© 2013 www.knigi.konflib.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.