Самообучающийся искусственный интеллект. Google создала самообучающийся прохождению компьютерных игр искусственный интеллект

21.02.2019

Терморегуляторы — небольшие по размеру, но весьма практичные в быту устройства для контроля теплоотдачи. В зависимости от реальной потребности регуляторы температуры для батарей отопления увеличивают или сокращают объем теплоносителя. Согласитесь, это полезно и для самочувствия владельцев дома/квартиры, и для их кошельков.

Желающим приобрести терморегуляторы для оснащения радиаторов мы предлагаем ознакомиться с подробным описанием видов устройств регулировки отдачи тепла. Мы привели и сравнили их способы управления, принцип действия, стоимость, специфику монтажа. Наши рекомендации помогут выбрать оптимальную разновидность.

Представленную к рассмотрению информацию, собранную и систематизированную для будущих покупателей регуляторов тепла, мы дополнили наглядными фото-подборками, схемами, нормативными таблицами, видео.

Известно, что температура в разных комнатах дома не может быть одинаковой. Также необязательно постоянно поддерживать тот или иной температурный режим.

Например, в спальне ночью необходимо опускать температуру до 17-18 о С. Это положительно влияет на сон, позволяет избавиться от головных болей.

Галерея изображений

Оптимальная температура на кухне составляет 19 о С. Это связано с тем, что в помещении располагается много обогревательной техники, которая генерирует дополнительное тепло. Если в ванной комнате температура будет ниже 24-26 о С, то в помещении будет ощущаться сырость. Поэтому здесь важно обеспечить высокую температуру.

Если в доме предусмотрена детская комната, то ее температурный диапазон может меняться. Для ребенка до года потребуется температура 23-24 о С, для детей постарше достаточно будет 21-22 о С. В остальных комнатах температура может варьироваться от 18 до 22 о С.

Комфортный температурный фон подбирается в зависимости от назначения помещения и частично от времени суток

В ночное время можно понижать температуру воздуха во всех комнатах. Необязательно поддерживать высокую температуру в жилище в случае, если дом некоторое время будет пустовать, а также во время солнечных теплых дней, при работе некоторых электроприборов, генерирующих тепло и др.

В этих случаях установка термостата сказывается на микроклимате положительно — воздух не перегревается и не пересушивается.

Из таблицы видно, что в жилых комнатах в холодное время года температура должна составлять 18-23 о С. На лестничной площадке, в кладовой допустимы низкие температуры — 12-19 о С

Терморегулятор решает следующие проблемы:

позволяет создавать определенный температурный режим в комнатах разного назначения;
экономит ресурс котла, уменьшает количество расходных материалов для обслуживания системы (до 50%);
появляется возможность без отключения всего стояка производить аварийное отключение батареи.

Следует помнить, что с помощью термостата невозможно повысить КПД батареи, увеличить ее теплоотдачу. Сэкономить на расходных материалах смогут люди с индивидуальной системой отопления. Жители многоквартирных домов с помощью термостата смогут лишь регулировать температуру в комнате.

Разберемся, какие существуют , и как сделать верный выбор оборудования.

Виды терморегуляторов и принципы работы

Терморегуляторы разделяют на три вида:

механические , с ручной настройкой подачи теплоносителя;
электронные , управляемые выносным термодатчиком;
полуэлектронные , управляемые термоголовкой с сильфонным устройством.

Главное достоинство механических приборов — невысокая стоимость, простота в эксплуатации, четкость и слаженность в работе. Во время их эксплуатации нет необходимости использовать дополнительные источники энергии.

Модификация позволяет в ручном режиме регулировать , поступающего в радиатор, тем самым контролируя теплоотдачу батарей. Прибор отличается высокой точностью регулировки степени нагрева.

Существенный недостаток конструкции заключается в том, что в ней отсутствует разметка для регулировки, поэтому производить настройку агрегата придется исключительно опытным путем. С одним из методов балансировки мы ознакомимся ниже

Основные элементы регулятора механического типа — термостат и термостатический клапан

Механический терморегулятор состоит из следующих элементов:

регулятора;
привода;
сильфона, заполненного газом или жидкостью;

Электронные термостаты — более сложные конструкции, в основе которого лежит программируемый микропроцессор. С его помощью можно задавать определенную температуру в комнате путем нажатия нескольких кнопок на регуляторе. Некоторые модели многофункциональны, пригодны для управления котлом, насосом, смесителем.

Строение, принцип работы электронного прибора практически не отличается от механического аналога. Здесь термостатический элемент (сильфон) имеет форму цилиндра, его стенки гофрированы. Он заполнен веществом, которое реагирует на колебания температуры воздуха в жилище.

По время повышения температуры происходит расширение вещества, в результате чего на стенки образуется давление, что способствует движению штока, который автоматически закрывает клапан. При движении штока проводимость клапана увеличивается или уменьшается. Если температура снижается, то рабочее вещество сжимается, в результате сильфон не растягивается, а клапан открывается, и наоборот.

Сильфон обладают высокой прочность, большим рабочим ресурсом, выдерживают сотни тысяч сжатий на протяжении нескольких десятков лет.

Основной элемент электронного регулятора — термодатчик. В его функции входит передача информации о температуре окружающей среды, в результате чего система генерирует необходимое количество тепла

Электронные терморегуляторые условно разделяют на:

Закрытые терморегуляторы для радиаторов отопления не обладают функцией автоматического определения температуры, поэтому они настраиваются в ручном режиме. Отрегулировать возможно температуру, которая будет поддерживаться в комнате, и допустимые колебания температуры.
Открытые термостаты можно запрограммировать. Например, при понижении температуры на несколько градусов режим работы может измениться. Также возможно настроить время срабатывания того или иного режима, отрегулировать таймер. Используются такие приборы преимущественно в промышленности.

Электронные регуляторы работают от батареек или специального аккумулятора, который идет в комплекте с зарядкой. Полуэлектронные регуляторы идеально подходят для бытовых целей. Они идут с цифровых дисплеем, который отображает температуру помещения.

Принцип действия полуэлектронных устройств для регулировки теплоотдачи радиатором позаимствован из механических моделей, поэтому его регулировка осуществляется вручную

Газонаполненные и жидкостные термостаты

При разработке регулятора в качестве термостатического элемента могут использовать вещество в газообразном или жидком состоянии (например, парафин). Исходя из этого, приборы делят на газонаполненные и жидкостные.

Парафин (жидкий или газообразный) обладает свойством расширяться под действием температуры. В результате масса давит на шток, к которому подсоединен клапан. Шток частично перекрывает трубу, через который проходит теплоноситель. Все происходит автоматически

Газонаполненные регуляторы обладают высоким сроком службы (от 20 лет). Газообразное вещество позволяет более плавно и четко регулировать температуру воздуха в жилище. Приборы идут с датчиком, которые определяет температуру воздуха в жилище.

Газовые сильфоны быстрее срабатывают на колебания температуры воздуха в помещении. Жидкостные же отличаются более высокой точность в передаче внутреннего давления на подвижные механизм. При выборе регулятора на основе жидкого или газообразного вещества ориентируются на качество и срок службы агрегата.

Жидкостные и газовые регуляторы могут быть двух типов:

со встроенным датчиком;
с дистанционным.

Если радиатор подключен к рабочей системе отопления, то из него следует слить воду. Сделать это можно с помощью шарового крана, запирающего вентиля или любого другого устройства, блокирующего подачу воды из общего стояка.

После этого открывают клапан батареи, располагающийся в области места поступления воды в систему, перекрывают все краны.

После того, как из батареи была устранена вода, ее необходимо продуть, чтоб убрать воздух. Также это можно сделать с помощью крана Маевского

На следующем этапе выполняют снятие адаптера. Перед процедурой пол застилают материалом, хорошо поглощающим влагу (салфетками, полотенцами, мягкой бумагой и т.д.).

В комнату помещают термометр, затем отворачивают клапан до упора. В этом положении теплоноситель заполнит радиатор полностью, а значит, теплоотдача прибора будет максимальной. Через некоторое время необходимо зафиксировать полученную температуру.

Далее необходимо повернуть головку до упора в обратную сторону. Температура начнет понижаться. Когда термометр покажет оптимальные для помещения значения, то клапан начинают открывать до тех пор, пока не послышится шум воды и не произойдет резкий нагрев. В этом случае вращение головки прекращают, фиксируя ее положение.

Выводы и полезное видео по теме

В видео наглядно показано, как настроить терморегулятор и внедрить его в систему отопления. В качестве примера взять автоматический электронный регулятор Living Eco от бренда Danfoss:

Выбрать терморегулятор можно исходя из собственных пожеланий и финансовых возможностей. Для бытовых целей идеально подойдет механической и полуэлектронный агрегат. Любители smart-техники могут отдать предпочтение функциональным электронным модификациям. Установить приборы также возможно без привлечения специалистов.

Подразделение DeepMind корпорации Google выпустило алгоритм искусственного интеллекта AlphaGo Zero, который самостоятельно выучил правила игры го. На это ему понадобилось всего три дня, сообщается в статье, вышедшей в журнале Nature .

Компании DeepMind удалось создать самообучаемую программу AlphaGo Zero для игры в Го, для которой можно будет найти и другие применения. Что это значит для науки и для исследователей, рассказали эксперты, занимающиеся вопросами искусственного интеллекта.

Дочерняя компания Google DeepMind, занимающаяся развитием искусственного интеллекта, представила новую версию программы для игры в Го AlphaGo Zero. Новая программа играет значительно лучше старой, которая победила мирового чемпиона по игре в Го ранее в этом году, но, что более важно — она полностью самообучаема.

В DeepMind говорят, что теперь компания на один шаг ближе к созданию алгоритмов общего назначения, которые смогут решать сложнейшие научные проблемы – от создания новых лекарств до моделирования эффектов изменения климата

Специалисты из подразделения DeepMind отмечают, что искусственный интеллект способен обучаться многим наукам и стать специалистом в нескольких областях.

AlphaGo Zero впервые смог сам, без вмешательства человека, обучиться игре. Он победил искусственный интеллект версии 2015 года, который в прошлом году обыграл чемпиона по го из Южной Кореи Ли Се Дола.

Разработчики отмечают, что большинство алгоритмов искусственного интеллекта ограничены в использовании, так как могут решать лишь одну задачу. Однако их разработка способна превзойти человека в выполнении сразу нескольких задач.

Оригинальная AlphaGo продемонстрировала сверхчеловеческую способность игры в Го, но ей для этого потребовалась экспертиза людей-игроков. Для обучения использовалась база данных из более чем 100,000 “человеческих” партий в Го.

В AlphaGo Zero, для сравнения, были заложены только базовые правила Го. Все остальное было изучено с нуля. Как указано в статье в Nature, Zero выработала свои навыки, играя против себя.

Все начиналось со случайных ходов, но при каждой победе Zero обновляла свою систему и играла против себя снова и снова, миллионы раз.

После трех дней игры против себя Zero стала достаточно сильна, чтобы победить свою предыдущую версию, которая победила 18-кратного чемпиона мира Ли Се-дола. Zero победила во всех ста партиях.

Через 40 дней у Zero было 90% побед в игре против самой сложной версии программы AlphaGo. В DeepMind заявляют, что это делает Zero самым сильным игроком в Го в истории.

"Без использования человеческих данных и человеческой экспертизы – в любом виде – мы обошли границы человеческого понимания игры, – сказал ведущий программист AlphaGo Zero Дэвид Сильвер на пресс-конференции. – Следовательно, алгоритм способен создавать знания самостоятельно, просто на основе фундаментальных принципов. Это позволяет ему быть сильнее предыдущих версий".

Сильвер объяснил, что так как Zero играл против себя, он заново открыла стратегии Го, которые люди разрабатывали тысячелетиями.

“Она начала очень наивно, как и начинающий человек, но со временем она играла так, что её было сложно отличить от людей-профессионалов”.

Программа натыкалась на некоторые известные стратегии и варианты во время игры до того, как создать ещё неизвестные стратегии.

“Она обнаружила человеческие ходы, попробовала их, но потом нашла что-то ещё”, – сказал Сильвер.

DeepMind надеется, что, как и более ранние версии AlphaGo, Zero выступит в качестве вдохновения для профессиональных игроков, предлагая им новые ходы и стратегии для игры.

У Zero есть и другие важные преимущества перед ранними версиями. Во-первых, система требует меньше вычислительной мощности, запускаясь всего на четырех TPU (это специальные процессоры для ИИ, созданные Google), в то время как предыдущие версии использовали 48.

Во-вторых, так как Zero самообучаема, это показывает, что мы можем создать новейшие алгоритмы без зависимости от больших объемов данных.

Скептики, например, Джоффри Хинтон, предполагают, что машинное обучение может выполнять только одну задачу. Сбор данных и вычислений помогают приспособить машинное обучение под новые функции, но существующие темпы развития неустойчивы.

Последние исследования DeepMind демонстрируют, что существуют значительные улучшения, которые можно сделать, просто сосредоточив внимание на алгоритмах.

“Эта работа показывает, что комбинация существующих техник может привести дальше, чем многие эксперты могли подумать, даже хотя эти методы не новы”, – сказал Илья Суцкевер, директор по исследованиям в OpenAI. — Но в итоге важно то, что исследователи продолжают совершать улучшения в области, и не так важно, достигается ли эта цель разработкой новых методов или применением существующих методов необычными способами”.

В случае AlphaGo Zero особенно умным ходом оказался отказ от человеческой экспертизы. Сатиндер Сингх, профессор информатики, который написал сопроводительную статью к исследованию DeepMind в Nature, описывает работу как “элегантную” и выделяет её аспекты.

Сингх сказал, что это важная победа для сферы обучения с подкреплением, области ИИ, в которой программы учатся при помощи получения наград за достижение определенных целей, но не получают для этого никаких указаний.

Это более новая сфера работы, чем контролируемое обучение (когда программы получают данные с метками и учатся на них), но у неё больший потенциал. Сингх говорит, что чем больше машина может узнать без руководства человека, тем лучше.

“За последние пять-шесть лет обучение с подкреплением развилось из академического метода до более широкого влияния на мир, и DeepMind внес в это свой вклад”, – говорит Сингх. — Тот факт, что они смогли создать лучшего игрока в Го со значительно меньшим количеством данных и вычислительной мощности и намного быстрее – это большое достижение. Так как обучение с подкреплением – это большая часть ИИ, это значит, что это большой шаг вперед в целом”.

Где можно применить такие алгоритмы? Согласно сооснователю DeepMind Демису Хассабису, они могут обеспечить общество чем-то вроде мыслительного движка для научных исследований.

“Большая часть команды AlphaGo теперь переходит на другие проекты, чтобы попробовать применить эту технологию в других сферах”, – сказал Хассабис на пресс-конференции.

Он объясняет, что AlphaGo – это очень хорошая машина для поиска среди сложных данных.

В случае Zero эти данные сравниваются с возможными ходами в игре Го. Но так как Zero не запрограммирована понимать исключительно Го, она может быть перепрограммирована, чтобы открывать информацию в других областях: поиск лекарств, синтез белка, квантовая химия, физика частиц и создание материалов.

Хассабис предполагает, что потомка AlphaGo Zero можно будет использовать для поиска сверхпроводника при комнатной температуре, гипотетического вещества, которое проводит электрический ток без потери энергии, что позволяет создать необыкновенно эффективные энергетические системы (сверхпроводники существуют, но сейчас они работают при экстремально низких температурах).

Как и в случае Го, алгоритм начнет создавать сочетания разных данных, то есть, атомного состава различных материалов и их свойств, пока не обнаружит что-то, что упустили люди.

“Может быть, где-то существует сверхпроводник при комнатной температуре. Я мечтал о нем, когда в детстве читал книги по физике”, – говорит Хассабис. — Но комбинаций материалов очень много, сложно сказать, [существует ли такая вещь]”.

“Мы пытаемся создать алгоритмы общего назначения, и это просто ещё один шаг вперед, но это волнующий шаг”, – говорит Хассабис.

Пока что испытания, которые выявили бы многозадачность устройства, не проводились. Тем не менее, создатели самообучающегося искусственного интеллекта уверены, что через десять лет их детище будет играть роль научных экспертов и работать бок о бок с людьми.

Планируется, что программа будет использоваться в научной сфере в качестве полноценного члена команды или интерактивной энциклопедии.

Искусственный интеллект, созданный с помощью компьютерных программ, каждый пользователь встречал в компьютерных играх. Например, играя в шахматы компьютер, анализирует комбинации игрока и по своему алгоритму делает свой следующих ход. В играх искусственным интеллектом наделяют всех противников пользователя. На сегодняшний день компьютерные технологии позволяют с помощью искусственного интеллекта общаться с программами. А сам программный интеллект способен развиваться и усовершенствовать свои функции на практике. Одним словом сегодня программы способны эволюционировать.

Простая программа с искусственным интеллектом.

Начнем из самого простого примера. ChatMaster - программа с искусственным интеллектом умеет разговаривать с человеком с помощью чата. Главной особенностью на первый взгляд простой программы – самообучение. Чем больше вы общаетесь с программой, тем более растет ее словарный запас и умение подстрагиваться под собеседника при ведении диалога. Автор программы утверждает, что ему удалось создать программную модель человеческого мышления.

При начале работы программа может показаться «слабенькой». Но причина в том, что ее после первого запуска не стоит сразу тестировать на уровень интеллекта и сообразительности. Сначала к программе следует относиться как к 12-ти летнему ребенку, который через несколько часов будет общаться на уровне своего собеседника. Для этого словарный запас программы должен вырасти до с 3000 до 10 000 слов. После чего впечатление от работы с программой превышает все ожидания.

Невооруженным глазом заметно, что программа запоминает не только слова а и лингвистическую реакцию собеседника на поставленные фразы. При желании, можно корректировать ответы программы на свои варианты с помощью принудительного обучения. В этом же режиме можно запрещать запоминать отдельные фразы, введенные с опечатками. При желании можно экспортировать базы и обмениваться с друзьями для более быстрого обучения (при активном импорте / экспорте не забывайте делать резервные копии). В целом логика в программе хоть и своеобразная, но она есть и весьма развитая.

Улучшенное программное решение искусственного интеллекта.

Очень интересное программное решение в области искусственного интеллекта предложили разработчики из A.L.I.C.E. Они хорошо разбираются в искусственном интеллекте и активно занимаются разработкой программ в данной области. Чтобы ознакомится с их разработками, было создано онлайн-приложение для общения с капитаном Кирком (Captain Kirk) в режиме реального времени. Принцип приложение построен аналогично предыдущей программе, но есть приятная особенность. Программа отвечает на все написанные ей вопросы голосом вслух. Существенным недостатком программы является возможность общения исключительно на английском языке. Подобное приложение для общения на русском найти не удалось и очень жаль, что программисты не использовали такую функцию. Ведь существуют много программ для синтеза речи, которые преобразуют текст в звуковую речь с помощью технологии SAPI5. Жаль, что у программистов не возникало желания создать альтернативную программу с поддержкой русского языка. Ведь по сути это пока еще свободная ниша.

Общение с программой через микрофон относится к искусственному интеллекту.

Программа для общения с компьютером на русском языке называется – Попугай Гриша. В этой программе реализован, скорее всего, прототип искусственного интеллекта. Но задумка очень оригинальная. Дело в том, что основной отличительной чертой Попугая Гриши является возможность общения через микрофон и динамики (без использования клавиатуры).

В программе имеется дикторнонезависимый модуль распознавания речи. Именно анализ входящего звукового канала относит данную программу к искусственному интеллекту. Но, к сожалению, он способен распознать только несколько вопросов (только 46 фраз приведенные в справке). При запуске программы попугай спит. Как только вы заговорите через микрофон, он просыпается для начала диалога. Программная система распознания речи использует не информационные функции, а коммуникативные:

аппелятивная;
эмотивная;
метод превалирования.

Категориальный словарь диалога основан на семантических примитивах. Метод распознания речи выполняется не по лингвистическому содержанию, а по определению функции высказывания. Таким образом, при голосовом распознании речи пользователя определяется речевой акт, сценарий общения и сам диалог. Поэтому при общении с программой важно не словоупотребление, а коммуникативный акт. При распознании подбираются случайные сцены. Если входной сигнал отсутствует, на протяжении некоторого времени, попугай сам провоцирует пользователя на диалог. Сценарием поведения попугая можно управлять с помощью фраз и даже менять его характер на: грустный, обидчивый, веселый.

Для мобильных технологий более активно разрабатывают и внедряют программы с искусственным интеллектом. В этом можно убедиться с краткого видео обзора программы:

Компания Google занимается созданием искусственного интеллекта, способного обучаться прохождению компьютерных игр, вырабатывая для каждой из них собственные стратегии по итогам серий испытаний. Об этом сообщает The Guardian .

Искусственный интеллект или «агент», как его называют в Google, самостоятельно освоил 49 ретро-игр, для каждой из них предложив уникальную стратегию победы. В будущем эти разработки могут быть применены в области создания беспилотных автомобилей, цифровых ассистентах и научных исследованиях в области климата и космологии.

Это первый значительный шаг на пути к доказательству того, что подобные системы самообучения могут работать. Что они могут решать сложные задачи, которые даже человек находит трудными. Это детский шажок на пути к достижению этой грандиозной цели, но очень важный шажок.
Демис Хассабис, основатель DeepMind

Как отмечает The Guardian, разработанный DeepMind искусственный интеллект следует отличать от программы Deep Blue, обыгравшей Гарри Каспарова в шахматы в 1997 году, или компьютера IBM Watson, научившегося на равных с людьми принимать участие в интеллектуальном шоу «Jeopardy!» (российский аналог - «Своя игра»). В этих случаях правила игр были изначально заложены в программы, а тогда как детище DeepMind способно обучаться им самостоятельно.

При первом запуске игры агент DeepMind получает в своё распоряжение только информацию о расположении объектов на экране и счёте, а затем начинает случайным образом нажимать на кнопки, пытаясь определить, какие действия приводят к улучшению результатов, а какие - к проигрышу.

На то, чтобы освоить ретро-игру, у искусственного интеллекта уходит порядка 600 попыток и двух недель машинного времени. Во многих случаях агент придумал стратегии прохождения, которые исследователи даже не могли себе представить.

По результатам эксперимента искусственный интеллект освоил набор из 49 игр, включающих себя шутеры, гонки и сайд-скроллеры, на 75% от уровня опытного пользователя. В некоторых задачах агент превзошёл человека, а в некоторых - нет.

Как отмечают создатели искусственного интеллекта, подобно людям он обучается методом проб и ошибок, однако уступает человеческому мозгу в играх, где необходимо долгосрочное планирование, из-за отсутствия полноценной памяти. Именно создание такого рода буфера станет следующей целью для компании.

Специалисты DeepMind не разделяют главы Tesla Motors Элона Маска, одного из своих инвесторов, о том, что искусственный интеллект может быть опасен. По их мнению, технология сможет представить реальную угрозу для человечества только спустя десятилетия.

GAM - общая ассоциативная память (GAM) это система, которая сочетает в себе функции другого типа ассоциативной памяти (AM). GAM-это сеть, состоящая из трех слоев: входной слой, слой памяти и ассоциативный слой. Входной слой принимает входные вектора. Слой памяти сохраняет входные данные в похожие классы. Ассоциативный слой строит ассоциативные связи между классами. GAM можете хранить и вызывать двоичную или не двоичную информацию, строить ассоциации многие-ко-многим, хранить и вспоминать, как статические данные, так и временную последовательность информации. Может вспоминать информацию даже если имеет неполные входные данные или зашумленные данные. Эксперименты с использованием двоичных данных в режиме реального времени получая статичные данные и данные временных последовательностей показывают, что GAM является эффективной системой. В экспериментах с использованием человекоподобных роботов демонстрирует, что GAM может решать реальные задачи и строить связи между структурами данных с различными размерами (Ссылка на оригинал).

Новинка STAR-SOINN(STAtistical Recognition - Self-Organizing and Incremental Neural Networks) - для построения умного робота, мы должны развивать психическую систему автономного робота, которая последовательно и быстро учится у человека, его среды и Интернета. Поэтому мы предлагаем сеть STAR-SOINN - это ультрабыстрая, мультимодальная сеть обучающаяся в режиме реального времени и обладающая возможностью дополнительно обучатся через интернет. Мы провели эксперименты для оценки этого метода обучения и сравнили результаты с другими методами обучения. Результат показывает, что точность распознавания выше, чем система, которая просто добавляет условия. Кроме того, предлагаемый способ может работать очень быстро (примерно на 1 сек для изучения объекта, 25 миллисекунд, для узнавания объкта). Алгоритм смог выявить атрибуты «неизвестных» объектов путем поиска атрибутивной информации известных объектов. Наконец, мы решили, что эта система потенциально становится базовой технологией для будущих роботов.

SOIAM – модификация SOINN для ассоциативной памяти.

SOINN-PBR – модификация SOINN для создания правил с помощью условий если –> тогда (if-then)

AMD (Autonomous Mental Development) – робот с помощью этого алгоритма учиться решать различные задачи.

Блок схемы алгоритма SOINN можно посмотреть

Ссылка на журнал в формате pdf, где дается описание нескольких разновидностей сетей SOINN на английском и где я делал пометки на русском (журнал я запаковал в архив rar, исходный размер журнала 20 мб (читать онлайн), размер архива 13 мб (скачать архив).

Ссылка на еще один журнал в формате pdf, где дается описание нескольких разновидностей сетей SOINN на английском и где я делал пометки на русском (журнал я запаковал в архив rar, исходный размер журнала 4мб (читать онлайн), размер архива 2,5мб (скачать архив).

В русскоязычном интернете про сеть SOINN есть только пару статей о том, что робот работая по этому алгоритму сам находит решения поставленных задач и если ему не объяснили как решить задачу, то он подключается к интернету и ищет решение там. Но примеров работы алгоритма и кодов я не нашел. Только была одна статья на robocraft где приведен маленький пример работы базового алгоритма сети SOINN в связке с OpenCV. Если кто-то экспериментировал с сетью SOINN было бы интересно посмотреть на код, если возможно.

Еще в 2006 году был предложен метод постепенного (возрастающего) обучения, названый самоорганизующейся возрастающей нейронной сетью (SOINN), для того, чтобы попытаться осуществить неконтролируемое обучение (самообучение без учителя). SOINN хорошо справляется с обработкой нестационарных данных в режиме онлайн, сообщает о числе определенных кластеров и представляет топологическую структуру входных данных с учетом вероятности плотности вероятности распределения. Hasagawa, предложивший вариант сети SOINN, сравнивал результаты работы своей сети с GNG сетью (расширяющегося нейронного газа) и результат сети SOINN получался лучше чем у GNG.

С сетью SOINN была такие проблемы:
1. В связи с тем что она состояла из двух обрабатывающих слоев, что пользователь должен был принимать участие в работе сети. Пользователь должен был решить, когда остановить обучение первого слоя и когда начать приобретение знаний во втором слое.
2. Если группы имеют высокую плотность, то сеть хорошо справлялась с их распознаванием, но если сеть группы частично перекрывались, то сеть думала что это одна группа и объединяла их вместе.

Для решения этих проблем и упрощения архитектуры сети была предложена сеть на основе SOINN с увеличенной самоорганизацией и получила название ESOINN.

Краткий обзор SOINN.
Soinn состоит из сети с двумя слоями. Первый слой изучает плотность распределения входных данных и использует узлы и связи между ними для представления результата распределения данных. Второй слой ищет в первом слое данные с наименьшей плотностью распределения определяя для них группы и использует меньше узлов, чем первый слой, для предоставления топологической структуры изучаемых данных. Когда обучение второго слоя закончено, SOINN сообщает о числе найденных групп и относит входные данные к наиболее подходящей для него группе. Первый и второй слои работают по одинаковому алгоритму.

Когда на сеть подан входной вектор, она находит самый близкий узел (победитель) и второй самый близкий узел (второй победитель) к входному вектору. Используя пороговые критерии подобия, сеть определяет относиться ли входной вектор к той же самой группе как у победителя и второго победителя. Первый слой SOINN адаптивно обновляет порог подобия для каждого узла в отдельности, потому что критерий распределения входных данных заранее неизвестен.

Если некий узел i имеет соседние узлы, тогда порог подобия Ti вычисляется используя максимальное расстояние между этим узлом i и его соседними узлами.

Если дистанция между ξ и a1 или a2 больше чем порог подобия или тогда входной сигнал является новым узлом, добавим его в набор узлов А и перейдем к шагу 2 для получения следующего входного сигнала. Порог T рассчитывается используя формулу 1А или 1Б
4. Увеличиваем возраст всех связей соединенных с a1 на 1
5. Используем алгоритм 2 для того чтобы определить нужно ли создавать связи между узлами a1 и a2.
А) Если необходимо создавать связь: Если связь между узлами a1 и a2 существует, установим возраст этой связи равный 0; если связи между узлами a1 и a2 не существует, тогда создадим связь между узлами a1 и a2 и установим возраст этой связи равной 0.
Б) Если в создании связи нет необходимости: Если связь между узлами a1 и a2 существует, тогда удалим связь между узлами a1 и a2.
6. Обновим плотность победителя используя формулу 4.
7. Добавим 1 к локальному накопленному количеству сигналов ,
8. Подстроим вес вектора победителя и его топологических соседей фракциями и от общей дистанции входного сигнала.

для всех прямых соседей i узла a1
Подстройка происходит по такой же схеме как в SOINN чтобы подстроить скорость времени обучения и
9. Ищем связи, возраст которых больше чем предопределенный в переменной и удаляем такие связи.
10. Если количество входных сигналов в течение работы кратно параметру λ:
А) Обновим метку подкласса для каждого узла по алгоритму 1
Б) Удалим узлы полученные в результате шума следующим образом:
1. Для всех узлов набора А, если узел a имеет два соседа, и , тогда удалим узел a. – это количество узлов в наборе узлов А.
2. Для всех узлов в наборе А, если узел а имеет одного соседа и , тогда удалим узел а.
3. Для всех узлов набора А, если узел а не имеет соседей, тогда удалим узел а.
11. Если процесс обучения закончен, классифицируем узлы к различным классам используя алгоритм 3; потом сообщим количество классов, выходные прототипы векторов каждого класса и остановим обучающий процесс.
12. Перейдем к шагу 2 для продолжения неконтролируемого процесса обучения если обучение еще не закончено.

Используя алгоритм показанный выше, мы вначале находим победителя и второго победителя от входного вектора. Потом мы определяем нужно ли создать связь между победителем и вторым победителем и в зависимости от принятого решения соединяем или удаляем связь между этими узлами. После обновления плотности и веса победителя, мы обновляем метки подклассов после каждого λ периода времени обучения. Потом удаляем узлы, которые вызваны шумами. Здесь шум не зависит от λ а зависит только от входных данных. После того, как обучение закончено, мы классифицируем все узлы к различным классам. В процессе обучения нам не нужно хранить обученные входные вектора; мы видим что этот алгоритм способен реализовать онлайн обучение. После процесса обучения на сеть подаются входные данные и если сеть знает похожие данные, то новым данным будет присвоен класс похожих данных. Сеть будет обучаться новой информации если дистанция между новыми данными и победителем или вторым победителем больше чем порог подобия. Если дистанция между новыми данными и победителем или вторым победителем меньше чем порога подобия, это означает что входные данные были хорошо усвоены ранее и никаких изменений в сети в этом случае не происходит. Этот процесс делает алгоритм пригодным для возрастающего обучения; сеть изучает новую информацию без удаления ранее усвоенных знаний. Следовательно, нам не нужно перетренировывать сеть, если мы планируем изученные знания узнавать в будущем.

Эксперименты от создателей сети ESOINN

Экспериментальный набор данных .

Сначала мы использовали такой же экспериментальный набор данных № 1 как и Hasegawa для своей сети SOINN. Набор содержит два перекрывающихся Гаусовских распределения, два концентрических кольца и синусоидальную кривую. К этому набору данных было добавлено 10% шума. С таким набором данных, как в стационарной среде так и в нестационарной среде, двуслойная SOINN сообщает, что существует пять классов. Она дает топологическую структуру каждого класса. Стационарная среда предписывает чтобы паттерны выбирались случайно из всего набора данных для онлайн обучения сети. Нестационарная среда предписывает чтобы паттерны выбирались последовательно, не случайно, из пяти областей исходного набора данных № 1 для онлайн обучения сети (рисунок 1). Нестационарная среда используется для симуляции процесса возрастающего онлайн обучения.

Рисунок 1. Набор данных № 1

Рисунок 2. ESOINN стационарная среда набора данных № 1

Рисунок 3. ESOINN не стационарная среда набора данных № 1

Мы тестируем однослойную ESOINN с тем же набором данных. Мы установили параметр λ=100, =100, c1=0.001 и c2=1. Рисунок 2 показывает результат при стационарной среде; рисунок 3 показывает результат при нестационарной среде. В обоих средах ESOINN сообщала что существует пять классов и давала топологическую структуру каждого класса. ESOINN может хорошо реализовать такую же функциональность как и у SOINN для одинаковых экспериментальных наборов данных.
Потом мы использовали экспериментальный набор данных № 2 (рисунок 4), который включает в себя три перекрывающихся Гаусовских распределения, для тестирования как SOINN так и ESOINN. Мы добавили 10% шума к этому набору данных. В наборе данных плотность перекрытия области высокая, но используя картинку этого набора данных, зрительно все еще можно разделить его на три класса. При стационарной среде для тренировки сети мы выбираем образцы из набора данных случайным образом. При нестационарной среде образцы выбираются последовательно, не случайно, из трех классов. На первом этапе для тренировки сети мы в реальном времени выбираем образцы из класса 1. После 10000 циклов обучения, мы выбираем образцы только из класса 2. И после еще 10000 обучающих итераций, мы выбираем образцы из класса 3 и выполняем онлайн обучение. После того, как процесс обучения закончен, мы классифицируем узлы к различным классам и сообщаем результат.

Рисунок 4. Набор данных № 2

Рисунок 5. SOINN стационарная среда для набора данных № 2

Рисунок 6. SOINN не стационарная среда для набора данных № 2

Рисунок 5 и 6 показывают результат SOINN (сеть имела следующие параметры: параметр λ=200, =50, и c =1 и другие параметры, которые идентичны описанным нами в журнале Shen, F., & Hasegawa, O. (2006a). An incremental network for on-line unsupervised classification and topology learning. Neural Networks, 19, 90–106.) Для обоих сред SOINN не смогла разделить три класса с большой плотностью перекрытия.

Рисунок 7. ESOINN стационарная среда для набора данных № 2

Рисунок 8. ESOINN не стационарная среда для набора данных № 2

Рисунки 7 и 8 показывают результаты ESOINN (параметры сети были: параметр λ=200, =50, c1=0.001 и c2=1). Используемые предлагаемые нами усовершенствования для сети SOINN, ESOINN смогла разделить три класса с высокой плотность перекрытия. Система сообщила, что существует три класса во входном наборе данных и дала топологическую структуру для каждого класса. Эксперимент с экспериментальным набором данных № 2 показывает, что ESOINN может разделять классы с высокой плотностью перекрытия лучше, чем SOINN.

Реальные данные

Для использования реальных данных мы взяли 10 классов из AT&T_FACE набора данных; каждый класс включает в себя 10 примеров (Рисунок 9). Размер каждого изображения составляет 92х112 пикселей, с оттенком цвета на один пиксель 256 уровней серого. Особенности векторов таких изображений состоят в следующем. Первое, оригинальное изображение 92х112, повторной пробой приведено к изображению 23х28 использую интерполяцию ближайшего соседа. Потом использовался Гауссов метод для сглаживания изображения 23х28 с width=4, q=2 для получения 23х28 векторов признаков (рисунок 10)

Рисунок 9. Оригинальные изображения лиц

Рисунок 10. Вектор признаков из оригинальных изображений лиц

В стационарной среде, образцы выбирались случайно из набора данных. Для нестационарной среды на первом шаге в сеть подавались примеры из класса 1, после 1000 итераций обучения, на вход сети подавались примеры из класса 2 и так далее. Параметры сети были установлены: параметр λ=25, =25, c1=0.0 и c2=1.0. Для обоих сред, ESOINN сообщило что в оригинальном наборе данных существует 10 классов и дала прототипы векторов (узлы сети) каждому классу. Мы использовали эти прототипы векторов чтобы классифицировать оригинальные тренировочные данные к различным классам и сообщить об узнавании данных. По сравнению с SOINN, мы получаем практически такое же корректное соотношение узнавания данных (90% для стационарной среды и 86% для нестационарной среды).

Рисунок 11. Распределение числа классов

Для сравнения стабильности SOINN и ESOINN, мы провели 1000 тренировочных итераций для обоих сетей и записали частоту количества классов. На верхней панели рисунка 11 изображен результат SOINN, на нижней панели рисунка 11 – изображен результат ESOINN. Распределение числа классов для SOINN (2-16) гораздо шире, чем для ESOINN (6-14); причем частота вблизи числа 10 у SOINN намного меньше чем у ESOINN, что отражает то, что ESOINN более стабильна, чем SOINN.
Для второй группы реальных данных, мы использовали Optical Recognition of Handwritten Digits database (optdigits) (www.ics.uci.edu ˜mlearn/MLRepository.html) для тестирования SOINN и ESOINN. В этом наборе данных содержится 10 классов (рукописные цифры) написанных 43 людьми, написанные 30 людьми будут использоваться как тренировочный набор и написанные остальными 13 людьми – как тестовый набор. В тренировочном наборе содержится 3823 примера, а в тестовом наборе содержится 1797 примеров. Размерность образца составляет 64.

Рисунок 12. Результаты рукописных цифр. Сверху SOINN, снизу ESOINN

Во-первых, мы использовали тренировочный набор для тренировки SOINN (параметры установили λ=200, =50, и c =1.0 другие параметры описаны в другом нашем журнале). В обоих средах SOINN сообщила что существует 10 классов. Сверху, на рисунке 12, изображен типичный прототип результатов векторов SOINN. Потом мы использовали векторы результата SOINN для классификации тестовых данных. Корректность уровня распознавания для стационарной среды составил 92,2%; корректный уровень распознавания для нестационарной среды составил 90,4%. Мы произвели 100 циклов тестирования для SOINN. Количество классов колебалось от 6 до 13 для обоих сред (стационарной и нестационарной).
Мы использовали тренировочный набор для тренировки ESOINN. Для обоих сред (λ=200, =50, c1=0.001 и c2=1), ESOINN сообщила что существует 12 классов. Снизу на рисунке 12 изображены типичные прототипы результатов векторов ESOINN. ESOINN разделила цифру 1 на два класса и разделила цифру 9 на два класса потому, что на оригинальных изображениях цифр существует разница в написании цифры 1 и 1’ так и в написании цифры 9 и 9’. SOINN удалила те узлы, которые были созданы образцами 1’ и 9’. ESOINN смогла разделить эти перекрывающиеся классы цифр 1 и 1’ (9 и 9’), информация оригинального набора данных сохраняется хорошо.
Потом мы использовали результаты прототипов векторов ESOINN для классификации тестового набора дынных на классы. Корректный уровень распознавания для стационарной среды составил 94,3% и корректный уровень распознавания для нестационарной среды составил 95,8%. Мы провели 100 циклов тестирования для ESOINN. Количество классов колеблется от 10 до 13 для обоих сред.
Из экспериментов с реальными данными рукописных цифр, мы узнали что ESOINN может разделить перекрывающиеся классы лучше, чем SOINN. ESOINN дает больший уровень узнавания и работает более стабильно чем SOINN.

Заключение

В этой статье была предложена улучшенная разрастающаяся самоорганизующаяся нейронная сеть ESOINN, которая основана на базе SOINN. В отличие от двуслойной SOINN, ESOINN имеет только один слой. ESOINN хорошо справляется с задачей постепенного (возрастающего) изучения информации. В алгоритм ESOINN внесено условие определяющее необходимость создания связи между узлами, что помогло сети находить классы которые перекрывают друг друга. В ESOINN принята только вставка узлов между классов для реализации дополнительного обучения. По этой причине ESOINN легче находит решения и имеет меньше параметров чем SOINN. Используя некоторые методы сглаживания, ESOINN также более стабильна чем SOINN.

Существуют также и другие методы для разделения перекрывающихся классов, такие как Learning Vector Quantization (LVQ). Такие методы принадлежат к методам обучения с учителем и обязаны маркировать все тренировочные примеры. Однако приобретение помеченных данных в процессе обучения требует много ресурсов, в то время как образцы не помеченных данных получать легко и быстро. Даже если некоторые контролируемы методы обучения могут снимать необходимость в контроле за нахождение перекрывающих друг друга классов, все равно очень важно найти такие неконтролируемые методы обучения, которые не нуждаются в использовании помеченных данных. ESOINN и SOINN принадлежат к неконтролируемым методам обучения, которые сами могут оценить область перекрытия классов, где ESOINN хорошо справляется с поставленной задачей. Кроме того она легко находит перекрывающиеся области. Эта особенность делает ESOINN чрезвычайно полезной для некоторых реальных задач.

SOINN

Добавить метки