Обучение спайковых нейронных сетей на основе минимизации их энтропийных характеристик в задачах анализа, запоминания и адаптивной обработки пространственно-временной информации
Диссертация
Спайковый нейрон — это модель нейрона, оперирующая с непрерывно поступающим многомерным потоком спайков как с потоком точечных событий. Простейшей моделью спайкового нейрона является так называемая модель Integrate-and-Fire, описываемая дифференциальным уравнением первого порядка. Если напряжение в некоторый момент времени пересекает установленный порог u (tk) = Th, то говорится, что нейрон… Читать ещё >
Содержание
- Глава 1. Обобщенная модель спайкового нейрона
- 1. 1. Описание спайковых последовательностей
- 1. 2. Метрика на пространстве паттернов
- 1. 3. Обобщенная модель спайкового нейрона
- 1. 4. Постановка задач обучения нейрона с помощью теории информации
- 1. 4. 1. Обучение обобщенного спайкового нейрона с учителем
- 1. 4. 2. Самообучение обобщенного спайкового нейрона
- 1. 4. 3. Обучение с подкреплением обобщенного спайкового нейрона
- 1. 5. Модель спайкового нейрона «Spike Multi Responses Model»
- Глава 2. Обучение спайкового нейрона с учителем
- 2. 1. Метод обучения с учителем с помощью снижения частной энтропии нейрона в дискретном времени
- 2. 2. Реализация методов обучения спайкового нейрона с учителем
- 2. 3. Задача соблюдения задержки между входным и выходным спайком
- 2. 4. Задача распознавания входных паттернов
- 2. 5. Временная автоассоциативная память
- 2. 5. 1. Графические обозначения для описания структуры спайковых нейронных сетей
- 2. 5. 2. Обучение временной автоассоциативной памяти
- 2. 6. Метод обучения с учителем с помощью снижения частной энтропии нейрона в непрерывном времени
- 2. 7. Зависимость изменения веса от разницы времен между спайками
- 2. 8. Сходимость алгоритма обучения с учителем
- 2. 9. Выбор параметров альфа-функций
- 2. 10. Оценка вычислительного ресурса при моделировании спайковых нейронов
- Глава 3. Самообучение спайкового нейрона
- 3. 1. Задача самообучения нейрона на основе снижения полной энтропии выхода нейрона
- 3. 2. Пример самообучения спайкового нейрона
- 3. 3. Комплексный метод обучения нейрона
- Глава 4. Обучение спайкового нейрона с подкреплением
- 4. 1. Спайковая нейронная сеть как система управления
- 4. 2. Модель нейрона управляющей спайковой сети
- 4. 3. Модулированное снижение информационной энтропии
- 4. 4. Описание тестового виртуального агента, управляемого спайковой нейронной сетью 112 4.4.1. Описание процесса обучения виртуального агента
- 4. 4. 2. Различные конфигурации управляющих сетей
- 4. 4. 3. Управление агентом в виртуальной среде большой размерности
- 4. 5. Описание тестовой модели робота-футболиста, управляемого спайковой нейронной сетью
- 4. 6. Адаптивное управление разнородными объектами при возникновении изменений во внешней среде
Список литературы
- Мартин Р., Николлс Дж., Валлас Б., Фукс П. От нейрона к мозгу. М.: УРСС, 2003 — 676 с.
- Rieke F., Warland D., Ruyter R. van Steveninck, Bialek W. Spikes: Exploring the Neural Code // Computational Neurosciences series —MIT Press, 1997 —416 p.
- McCuIIoch W. S., Pitts W. A logical calculus of ideas immanent in nervous activity // Bulletin of Mathematical Biophysics 1943. — Vol. 5 — P. 115−133.
- Rosenblatt F. The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain // Psychological Review.- 1958. Vol. 65 — No 6 — P. 386−408.
- Adrian E. D. The impulses produced by sensory nerve endings // J. Physiology Lond. 1926. -Vol.61 — P. 49−72.
- Kandel E. C.- Schwartz J. H. Principles of Neural Science New York: Elsevier, 3rd edition, 1991 — 1182 p.
- Hebb D.O. The Organization of Behavior New York: John Wiley & Sons — 1949. — 378 p.
- Hopfield J. J. Neural networks and physical systems with emergent collective computational abilitie // Proceedings of the National Academy of Sciences of the USA, 1982 Vol. 79 — No 8 — P. 2554−2558.
- Осовский С. Нейронные сети для обработки информации М.: Финансы и статистика, 2002. — 344 с.
- Rumelhart D.E., Hinton G.E., Williams R.J. Learning Internal Representations by Error Propagation // Parallel Distributed Processing. Parallel Distributed Processing Cambridge, MA, MIT Press, 1986. — Vol. 1. — P. 318−362.
- Chauvin Y.- Rumelhart D.E. Backpropagation: Theory, Architectures, and Applications New Jersey Hove, UK: Hillsdale, 1995. — 576 p.
- Neaupane K.- Achet S. Some applications of a backpropagation neural network in geo-engineering // Environmental Geology 2003. — Vol. 45 — No 4 — P. 567−575.
- Astion M.L., Wilding P. The application of backpropagation neural networks to problems in pathology and laboratory medicine // Arch. Pathol. Lab. Med. -1992. Vol. 116, 10, P. 995−1001.
- Бэстенс Д.-Э., ван ден Берг В.-М., Вуд Д. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. М.: ТВП, 1997. — 235 с.
- Mozer М. С., Hillsdale N.J. A focused backpropagation algorithm for temporal pattern recognition. // Backpropagation, Lawrence Erlbaum Associates -1995. P. 137−169.
- O’Reilly R. C., Munakata Y. Computational Explorations in Cognitive Neuroscience: Understanding the Mind by Simulating the Brain Cambridge, MA: MIT Press, 2000 — 512 p.
- Carr C. E., Konishi M. A circuit for detection of interaural time differences in the brain stem of the barn owl // J. Neuroscience 1990. — Vol. 70 — No 10 — P. 3227−3246.
- Bell C.C., Han V., Sugawara Y-, Grant K. Synaptic plasticity in a cerebellum-like structure depends on temporal order// Nature -1997. Vol. 387 — P. 278 — 281.
- Thorpe S., Fize D., Marlot C. Speed of processing in the human visual system//Nature 1996. -Vol. 381 — No 6582. — P. 520 — 522.
- Tovee M. J., Rolls E. T. Information encoding in short firing rate epochs by single neurons in the primate temporal visual cortex// Visual Cognition. 1995. — Vol. 2. — No 1. — P. 35 — 58.
- Johansson R.S., Birznieks I. First spikes in ensembles of human tactile afferents code complex spatial fingertip events // Nature Neuroscience. — 2004. Vol. 7. — P. 170 — 177.
- Mehta M. R., Lee A. K., Wilson M. A. Role of experience and oscillations in transforming a rate code into a temporal code // Nature. 2002. — Vol. 417. — P. 741−746.
- Bi G.Q., Poo M.M. Synaptic modifications in cultured hippocampal neurons: dependence on spike timing, synaptic strength, and postsynaptic cell type // Journal of Neuroscience. — 1998. Vol. 18. — No 24.-P. 10 464−10 472.
- Stein R. B. Some models of neuronal variability// Biophys. J. 1967. — Vol. 7. No 1. — P. 37−68.
- Feng J. Is the integrate-and-fire model good enough a review // Neural Networks. — 2001. — Vol. 14.-No 6.-P. 955−975.
- Izhikevich E. M. Dynamical Systems in Neuroscience: The Geometry of Excitability and Bursting The MIT Press, 2007 — 457 p.
- SpikeNet Technology Electronic resource. 2006. — Mode access: http://www.spikenet-technology.com.
- Hopfield J. J. Pattern recognition computation using action potential timing for stimulus representation // Nature -1995. Vol. 376. — P. 33 — 36.
- O’Keefe J. Hippocampus, theta, and spatial memory // Curr. Opin. Neurobiol 1993. — Vol. 3. — P. 917−924.
- Gerstner W., Kistler W.M. Spiking Neuron Models: Single Neurons, Populations, Plasticity -Cambridge University Press, 2002 480 p.
- Melamed O., Gerstner W., Maass W., Tsodyks M., Markram H. Coding and learning of behavioral sequences // Trends in Neurosciences 2004. — Vol. 27. — No 1. — P. 11−14.
- Saggie К., Keinan A., Ruppin E. Solving a delayed response task with spiking and McCulloch-Pitts agents // Advances in Artificial Life: 7th European Conference, ECAL 2003 Dortmund, Germany. 2003. — P. 199−208.
- Комарцова Л.Г., Максимов A.B. Нейрокомпьютеры: Учеб. пособие для вузов. М.: Изд-во МГТУ им. Н.Э.Ба^ана, 2004 — 399 с.
- Галушкин А.И. Нейрокомпьютеры и их применение. Книга 3. Нейрокомпьютеры. М.: ИПРЖР, 2000. — 528 с.
- Paquot Y., Duport F. Dambre J., Schrauwen В., Haelterman M., Massar S. Artificial intelligence at light speed: toward optoelectronic reservoir computing // Belgian Physical Society Magazine.-2001. Vol. 3. — P. 15−22.
- Thorpe S., Delorme A., Rullen R. Spike-based strategies for rapid processing //Neural Networks. -2001,-Vol. 14. P.715−725.
- Ponulak F. ReSuMe New supervised learning method for Spiking Neural Networks Electronic resource. — Poznan University of Technology, Institute of Control and Information Engineering, 2005. — Mode access: http://dl.cie.put.poznan.pl/~fp/.
- Legenstein R., Markram H., Maass W. Input prediction and autonomous movement analysis in recurrent circuits of spiking neurons // Rev Neurosci. 2003. — Vol. 14. — No 1−2. — P.5−19.
- Paolo E. Di. Spike-Timing Dependent Plasticity for Evolved Robots // Adaptive Behavior. 2002. -Vol. 10.-No3.-P.73−95.
- Damper R. I., French R. L. В., Scutt T. W. ARB IB: an Autonomous Robot Based on Inspirations from Biology // Robotics and Autonomous Systems -1998. Vol. 31.- No. 4. — P.247−274.
- Wiles J., Ball D., Heath S., Nolan C., Stratton P. Spike-time robotics: a rapid response circuit for a robot that seeks temporally varying stimuli // Australian Journal of Intelligent Information Processing Systems. 2010. — P.1−10.
- Floreano D., Zufferey J.-C., Mattiussi C. Evolving Spiking Neurons from Wheels to Wings // Dynamic Systems Approach for Embodiment and Sociality. 2003. — Vol. 6. — P. 65−70.
- Nolfi S., Floreano D. Synthesis of Autonomous Robots Through Evolution // Trends in Cognitive Sciences. -2002. Vol. 6. — No 1. — P.31−37.
- Florian R. V. Spiking Neural Controllers for Pushing Objects Around // Proceedings of the Ninth International Conference on the Simulation of Adaptive Behavior (SAB'06) 2006. — Vol. 4095 — P. 570−581.
- Castillo P.A., Rivas V., Merelo J.J., Gonzalez J., Prieto A., Romero G. G-Prop-II: Global Optimization of Multilayer Perceptrons using GAs // CEC 99. Proceedings of the 1999 Congress on Evolutionary Computation 1999. — P. 149−163.
- Bohte S.M., Kok J.N., Poutre J.A.L. SpikeProp: backpropagation for networks of spiking neurons // Proceedings of ESANN. 2000. — P. 419−424.
- Pfister J.P., Toyoizumi Т., Barber D., Gerstner W. Optimal Spike-Timing Dependent Plasticity for Precise Action Potential Firing in Supervised Learning // Neural computation 2006. — Vol. 18. -No6-P.1318- 1348.
- Bohte S.M., Mozer M.C. A computational theory of spike-timing dependent plasticity: achieving robust neural responses via conditional entropy minimization // SEN-E0505. 2005. — P.1−25.
- Toyoizumi Т., Pfister J.-P., Aihara K., Gerstner W. Optimality Model of Unsupervised Spike-Timing Dependent Plasticity: Synaptic Memory and Weight Distribution // Neural Computation. -2007.-Vol. 19.-No 3.-P. 639−671.
- Markowitz D.A., Collman F., Brody C.D., Hopfield J.J., Tank D.W. Rate-specific synchrony: using noisy oscillations to detect equally active neurons // Proc. Natl. Acad. Sci. 2008. — Vol.105. -No 24. — P.8422−8427.
- Кингман Дж. Пуассоновские процессы. — M.: МЦНМО, 2007. 136 с.
- Sutton R.S., Barto A.G. Reinforcement Learning: An Introduction. Cambridge: MIT Press, 1998.-432 p.
- Webster R. A. Neurotransmitters, Drugs and Brain Function. John Wiley and Sons, 2002. — 534 P
- Deutch A.Y., Bean A. J. Colocalization in Dopamine Neurons // Psychopharmacology: The Fourth Generation of Progress. New York, Raven Press, 1995. — P. 205−214
- Holmes P. V., Crawely J. Q. N. Coexisting Neurotransmitters in Central Noradrenergic Neurons. // Psychopharmacology: The Fourth Generation of Progress. New York, Raven Press- 1995. — P. 347 353
- Porr В., Worgotter F. Isotropic sequence order learning // Neural Computation. 2003. — Vol. 15. -No. 4.-P. 831−864.
- Wermter S., Christo P. Temporal Sequence Detection with Spiking Neurons: Towards Recognizing Robot Language Instructions II Connection Science. 2006. — Vol. 18. — No 1. — P.1 -22.
- Perkel D. H., Feldman M. W. Neurotransmitter release statistics: Moment estimates for inhomogeneous Bernoulli trials. Berlin//J. Math. Biol. 1979.-Vol. 7.-No I.-P. 31−40.
- Dunin-Barkovskii V. L., Osovets N. B. Neural network with formed dynamics of activity // Radiophysics and Quantum Electronics. 1994. — Vol. 37. — No 9. — P. 687−693.
- Szatmary В., Izhikevich E. M. Spike-Timing Theory of Working Memory // PLoS Comput. Biol. -2010-Vol. 6-No 8.
- Wills S. A. Computation with Spiking Neurons Electronic resource. PhD Disertation. -2004. -Access mode: http://ecs.victoria.ac.nz/twiki/pub/Courses/COMP4212010Tl/Readings/SebWilIsPhD-chapter3.pdf.
- Hopfield J. J., Brody C. D. Sequence reproduction, single trial learning, and mimicry based on a mammalian-like distributed code for time. Electronic resource. — 2010. — Access mode: http://arxiv.org/abs/0910.2660.
- Baudry M., Davis J. L., Thompson R. F. Advances in Synaptic Plasticity N.Y.: MIT Press, 1999.-335 p.
- Bi G., M. Poo. Synaptic modification of correlated activity: Hebb’s postulate revisited // Ann. Rev. Neuroscience 2001. — Vol. 24. — P.139−166.
- Стратонович P.JI. Теория информации M.: Сов. Радио, 1975 — 424 с.
- Antonelo Е. A., Schrauwen В., Stroobandt D. Mobile Robot Control in the Road Sign Problem using Reservoir Computing Networks // IEEE Int. Conf. on Robotics and Automation (ICRA) 2008. -P. 911−916.
- Queiroz M. S., Braga A., Bcrredo R. C. Reinforcement Learning of a Simple Control Task Using the Spike Response Model //Neurocomputing. 2006. — Vol. 70. — No. 1−3. — P. 14−20.
- Lee K., Kwon D.-S. Synaptic plasticity model of a spiking neural network for reinforcement learning //Neurocomputing.-2008.-Vol. 17.-No 13−15. P. 3037−3043.
- Florian R. V. A reinforcement learning algorithm for spiking neural networks // S YNASC '05 Proceedings of the Seventh International Symposium on Symbolic and Numeric Algorithms for Scientific Computing. -2005. P. 299−306.
- Burgsteiner H. Training networks of biological realistic spiking neurons for real-time robot control // Proceedings of the 9th International Conference on Engineering Applications of Neural Networks, Lile, France. 2005. — P. 129−136.
- AInajjar F., Murase K. A Simple Aplysia-Like Spiking Neural Network to Generate Adaptive Behavior in Autonomous Robots // Adaptive Behavior. 2008. — Vol. 16. — No 5. — P. 306−324.
- Joshi P., Maass W. Movement Generation with Circuits of Spiking Neurons // Neural Computation. 2005. — Vol. 17. — No 8. — P. 1715−1738.
- Carrillo R., Ros E., Boucheny C., Coenen O. J.-M.D. A real-time spiking cerebellum model for learning robot control // Biosystems. 2008. — Vol. 94. — No 1−2. — P. 18−27.
- Boucheny C., Carrillo R., Ros E., Coenen O. J.-M.D. Real-Time Spiking Neural Network: An Adaptive Cerebellar Model // Computational Intelligence and Bioinspired Systems: Lecture Notes in Computer Science.-2005. Vol. 3512. — P. 136−144.
- Maass W., Natschlager Т., Markram H. Real-time computing without stable states: a new framework for neural computation based on perturbations // Neural Computations. 2002. — Vol. 14. -No 11.-P. 2531−2560.
- Baxter J., Weaver L., Bartlett P. L. Direct gradient-based reinforcement learning: II. Gradient ascent algorithms and experiments // Technical report, Australian National University, Research School of Information Sciences and Engineering. 1999.
- Bellman R. A Markovian Decision Process // Journal of Mathematics and Mechanics. 1957. -Vol. 6.
- Farries M. A., Fairhall A. L. Reinforcement Learning With Modulated Spike Timing-Dependent Synaptic Plasticity //Neurophysiol. 2007. — Vol. 98. — No 6. — P. 3648−3665.
- Baras D., Meir R. Reinforcement Learning, Spike Time Dependent Plasticity and the BCM Rule // Neural Computation. 2007. — Vol. 19. — No 8. — P. 2245−2279.
- Levine M.W., Shefner, J.M. Fundamentals of sensation and perception. Pacific Grove, CA: Brooks/Cole, 1991. -512 p.
- Rejeb L., Guessoum Z., M’Hallah R. An Adaptive Approach for the Exploration-Exploitation Dilemma for Learning Agents // Multi-Agent Systems and Applications IV. 2005. — Vol. 3690. — P. 316−325.
- Bartlett P. L., Baxter, J. A biologically plausible and locally optimal learning algorithm for spiking neurons Electronic resource. 2000. Access Mode: http://arp.anu.edu.au/fltp/papers/jon/brains.pdf.gz.
- Legenstein R., Pecevski D., Maass W. A Learning Theory for Reward-Modulated Spike-Timing-Dependent Plasticity with Application to Biofeedback // PLoS Comput Biol. 2008. — Vol. 4. — No 10. — el000180. doi: 10.1371 /journal.pcbi. 1 000 180
- Izhikevich E. M. Solving the Distal Reward Problem through Linkage of STDP and Dopamine Signaling // Cerebral Cortex. 2007. — Vol. 17. — P. 2443 — 2452.
- Fremaux N., Sprekeler H., Gerstner W. Functional Requirements for Reward-Modulated Spike-Timing-Dependent Plasticity // The Journal of Neuroscience. -2010. Vol. 30. — No. 40. — P. 133 261 333.
- Редысо В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики М.: УРСС, 2005 — 224 с.
- Pakhomov V., Yelkin Е. Introducing an Another One Mirosot Robot Soccer System // Proceeding of FIRA Robot World Congress 2006. Dortmund University, 2006. — P. 137−145.
- Sinyavskiy O.Y., Kobrin A.I. Research opportunities of management by movement models of the mobile robot football player with the help of neural net algorithms // Proceeding of FIRA Robot World Congress 2006. Dortmund University, 2006. — P. 231−240.
- Matlab 7.11 overview. Electronic resource. Access Mode: http://www.mathworks.com/help/pdfdoc/matlab/getstart.pdf.
- Maple 14 overview. Electronic resource. Access Mode: http://www.inaplesoft.com/view.aspx?SF=53 244/0/Maple 14UserManua.pdf.
- Mathcad 15.0 overview. Electronic resource.. Access Mode: http://www.ptc.com/WCMS/files/121 836/en/6011Mathcad15DS.pdf.
- CSIM: A Neural Circuit SIMulator. Electronic resource.. Access Mode: http://www.lsm.tugraz.at/download/csim-l.l-usermanual.pdf.
- Hines M.L., Carnevale N.T. The NEURON simulation environment // The Handbook of Brain Theory and Neural Networks, 2nd ed., edited by M.A. Arbib. Cambridge, MA: MIT Press, 2003. — P. 769−773.
- Bower J. M., Beeman D., Hucka M. The GENESIS Simulation System // The Handbook of Brain Theory and Neural Networks, 2nd ed., edited by M.A. Arbib. Cambridge, MA: MIT Press, 2003. — P. 475−478
- Gewaltig M.O., Diesmann M. NEST // Scholarpedia. 2007. — Vol. 2. — No. 4.
- Goodman D.F.M., Brette R. The Brian simulator // Frontiers in Neuroscience. 2009. — Vol. 3. -No 2.-P. 192- 197.
- Мартыненко Ю.Г. Динамика мобильных роботов // Соровский Образовательный Журнал. 2000. — Т. 6. — № 5. — С. 110−116.
- Синявский О.Ю. Моделирование футбола роботов лиги MIROSOT // Материалы научного фестиваля «Мобильные роботы 2008». МГУПИ, 2008. — С. 145−156.
- Baraff D. An Introduction to Physically Based Modeling: Rigid Body Simulation II— Nonpenetration Constraints // Technical report Robotics Inst., Carnegie Mellon Univ., 1997.
- Barraf D. Fast contact force computation for Nonpenetrating Rigid Body // Computer Graphics Proceedings, Annual Conference Series. -1994. P. 23−34.
- Neural Networks (Information Optics). AUerton press, 2010. — Vol. 19. — No 4. — P. 300 309
- Синявский О.Ю., Кобрин А. И. Обучение спайкового нейрона с учителем в задаче детектирования пространственно-временного импульсного паттерна // Нейрокомпьютеры: разработка и применение. М. Радиотехника, 2010. — № 8. — С. 6976.
- Sinyavskiy O.Y. Autoassociative spatial-temporal pattern memory based on stochastic spiking neurons//Annals of DAAAM International Symposium. -2010. P. 121−122
- Синявский О.Ю., Кобрин А. И. Обучение спайковых нейронных сетей работе с нестационарными импульсными последовательностями // XI Всероссийская Научно-Техническая Конференция «Нейроинформатика-2009». Сборник Научных Трудов. МИФИ, М., 2009.-С. 139−149.
- Синявский О.Ю. Принципы построения универсальной программы для работы с искусственными нейронными сетями //Труды международной конференции «Современные проблемы математики, механики и информатики». -ТулГУ, 2005.-С. 121−127