Охота на электроовец. Большая книга искусственного интеллекта - Марков Сергей Николаевич

Охота на электроовец. Большая книга искусственного интеллекта читать книгу онлайн
Новый этап в области компьютерных технологий часто называют очередной «весной искусственного интеллекта». Её начало обычно отсчитывают с момента появления нейронной сети, сегодня известной под названием AlexNet, успех которой в распознавании зрительных образов возвестил о начале «революции глубокого обучения». В результате этой революции машинам удалось превзойти человеческий уровень при решении множества задач. Сегодня уже мало кого удивляют победы машин над сильнейшими игроками в го, создание ими музыки и картин, предсказание нейронными сетями пространственной структуры белков и другие вещи, которые десять лет назад мы посчитали бы чудесами. Алгоритмы искусственного интеллекта (ИИ) быстро вошли в нашу жизнь и стали её неотъемлемой частью. Например, каждый раз, когда вы делаете фотографию при помощи смартфона, её обработку выполняет нейронная сеть.
На смену весне искусственного интеллекта приходит лето. Эта книга рассказывает о том, какие события в истории науки привели к началу этого лета, о современных технологиях ИИ и их возможностях, а также пытается приоткрыть завесу, скрывающую от нас мир ближайшего будущего.
Мифы и заблуждения об искусственном интеллекте, страхи, насущные проблемы, перспективные направления исследований — обо всём этом вы узнаете из «Большой книги искусственного интеллекта».
В 1983 г. Освальд Стюарт и Уильям Леви исследовали[1632] влияние на синаптическую пластичность относительной синхронизации в пределах нескольких миллисекунд потенциалов пре- и постсинаптического действия. Для этого они взяли два нервных пути, оканчивающихся в одном постсинаптическом нейроне, — «слабый» и «сильный», то есть с меньшей эффективностью и с большей, — и вызывали в них стимулы, варьируя время вызова импульса. Хотя им и удалось обнаружить в опытах существенную асимметрию: активация слабого нервного пути раньше сильного вызывала ДВП в слабом нервном пути, в то время как активация сильного нервного пути раньше слабого вызывала ДВД в слабом нервном пути, но авторы, как и многие другие исследователи в 1980-е гг., не усмотрели в этом явлении системы.
В 1990 г. немецкий исследователь Вольф Зингер и его коллеги сообщили[1633], что наступление ДВП или ДВД обусловлено гиперполяризацией или деполяризацией постсинаптического нейрона (напомним, что гиперполяризация — это смещение мембранного потенциала относительно потенциала покоя в более отрицательную сторону, а деполяризация — в положительную). ДВП происходит, если после стимуляции мембранный потенциал постсинаптического нейрона не достигает определённого порога («критический уровень деполяризации»), а ДВП происходит, если данный порог достигается, ввиду чего происходит последующая гиперполяризация.
Рис. 115. Зависимость мембранного потенциала от времени, прошедшего после стимуляцииЭто исследование привлекло внимание к более пристальному изучению постсинаптического нейрона, поскольку именно его мембранный потенциал является ключевым для ДВП или ДВД, которые необязательно зависят от поступления сигнала через входящий синапс[1634]. Четырьмя годами спустя Доминик Дебанн и его коллеги сделали[1635] ещё один шаг вперёд: они вначале направляли деполяризующие импульсы тока непосредственно в постсинаптический нейрон, меняя его мембранный потенциал, а потом стимулировали нервный путь. Их исследования показали, что при небольшой разнице по времени между искусственной деполяризацией и входными импульсами происходит ДВП, а при большой — ДВД. Это добавило к исследованию Зингера тот факт, что именно уровень деполяризации и гиперполяризации, вызванный каким-либо образом (даже искусственно), и определяет направление синаптической пластичности.
Наконец, в 1991 г. Роберто Малиноу провёл завершающее исследование. Он смог в тонком срезе гиппокампа выделить четыре пары пирамидальных нейронов CA3 и CA1, каждая из которых была связана через единственный синапс. Затем он, одновременно вызывая серии импульсов в пре- и постсинаптическом нейронах, получил ДВП в этих соединениях[1636]. Эта работа стала первой (спустя более сорока лет после выхода в свет ключевой работы Хебба!) прямой демонстрацией того, что синаптические связи между двумя нейронами могут изменяться, ведь здесь удалось полностью исключить влияние на ход эксперимента сторонних воздействий.
В наши дни продолжается активное изучение биологических механизмов, лежащих в основе ДВП и ДВД. В частности, учёные вырабатывают подходы, позволяющие рассчитывать эффективность каждого отдельно взятого синапса на основе данных микроскопии[1637], [1638], [1639].
Важной вехой в истории изучения механизмов ДВП и ДВД стало выступление Генри Маркрама на ежегодном собрании Общества нейронаук (Society for Neuroscience) в 1995 г. В ходе этого выступления Маркрам рассказал научной общественности о первом экспериментальном исследовании[1640], показавшем, что ДВП и ДВД зависят от разницы во времени возникновения одиночных импульсов, испускаемых пре- и постсинаптическими нейронами в моносинаптических связях между парами нейронов неокортекса. Водораздел, задаваемый относительной синхронизацией отдельных импульсов на временно́м масштабе в несколько десятков миллисекунд, определял направление (потенциация или депрессия) и степень изменения эффективности синаптической связи. Именно это выступление Маркрама (ныне директора Blue Brain Project и основателя Human Brain Project) стало моментом окончательного оформления STDP в качестве модели синаптической пластичности биологических нейронов и одновременно как алгоритма обучения импульсных нейронных сетей[1641], хотя сам термин STDP появился только в 2000 г. в работе[1642] Сена Сонга, Кеннета Миллера и Ларри Эбботта. Таким образом, спустя полстолетия после основополагающей работы Хебба его знаменитое «возбуждаются вместе — связываются вместе» [fire together, wire together] (соответствующее ДВП), как оказалось, можно дополнить ещё одним принципиальным афоризмом, предложенным Карлой Шатц: «Сработал несинхронно — потерял свою связь» [fire out of sync, lose your link][1643] (соответствующее ДВД).
Важными параметрами STDP являются конкретные значения временных интервалов синхронизации импульсов. В ходе экспериментов по обучению больших импульсных сетей для решения прикладных задач были созданы такие методы, как R-STDP (версия STDP, в которой обучение модулируется при помощи внешнего подкрепления, основанного на фазовой активности дофаминовых нейронов)[1644], TD-STDP (версия STDP, использующая метод временных разниц [temporal difference])[1645] и даже BP-STDP, а также другие похожие методы, эмулирующие работу метода обратного распространения ошибки за счёт особого подбора параметров STDP[1646], [1647], [1648]. Эти методы для ряда задач демонстрируют эффективность, сходную с эффективностью метода обратного распространения ошибки[1649], [1650], [1651].
5.3.7 Нейроморфные системы типа I. Перспективы
Одним из потенциальных преимуществ импульсных нейронных сетей является, по всей видимости, то, что они меньше подвержены так называемой проблеме катастрофической интерференции [catastrophic interference] или, как её ещё называют, проблеме катастрофического забывания [catastrophic forgetting][1652].
Суть этой проблемы заключается в том, что искусственные нейронные сети, обученные на некоторой выборке, имеют склонность внезапно полностью забывать ранее изученную информацию при попытке «доучить» их на другой выборке, содержащей прецеденты, с точки зрения человека отличающиеся от прецедентов в оригинальной выборке. Это существенно осложняет перенос обучения (знаний) [transfer learning] между близкими областями и создаёт проблемы при дообучении моделей [fine-tuning, дословно — тонкая настройка]. Впрочем, для классических нейронных сетей в настоящее время существует несколько рабочих рецептов, предназначенных для борьбы с этой проблемой (мы поговорим о них позже).
