ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² ΡƒΡ‡Ρ‘Π±Π΅, ΠΎΡ‡Π΅Π½ΡŒ быстро...
Π Π°Π±ΠΎΡ‚Π°Π΅ΠΌ вмСстС Π΄ΠΎ ΠΏΠΎΠ±Π΅Π΄Ρ‹

Условно-Ρ€Π΅Ρ„Π»Π΅ΠΊΡ‚ΠΎΡ€Π½ΠΎΠ΅ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅. К вопросу ΠΎΠ± ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹ΠΌ Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠΌ Π² условиях ΠΎΠ±Ρ‰Π΅ΠΉ постановки Π·Π°Π΄Π°Ρ‡ΠΈ

Π Π΅Ρ„Π΅Ρ€Π°Ρ‚ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

Π’ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ тСорСтичСски ΠΏΡ€ΠΈ Π²Ρ‹Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ условных рСфлСксов ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΠΎΠΉΡ‚ΠΈΡΡŒ ΠΎΠ΄Π½ΠΈΠΌΠΈ наказаниями (отсутствиС наказания ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ°ΠΊ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠ΅). Однако отсутствиС сигнала поощрСния Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ врСмя обучСния Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π°. ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ примСнСния слабых ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠ΅Π² являСтся Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ качСства обучСния ΠΎΡ‚ «Ρ‡ΠΈΡΡ‚ΠΎΡ‚Ρ‹» Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… условий. Π—Π΄Π΅ΡΡŒ особСнно Π²Π°ΠΆΠ½ΠΎ… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

Условно-Ρ€Π΅Ρ„Π»Π΅ΠΊΡ‚ΠΎΡ€Π½ΠΎΠ΅ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅. К вопросу ΠΎΠ± ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹ΠΌ Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠΌ Π² условиях ΠΎΠ±Ρ‰Π΅ΠΉ постановки Π·Π°Π΄Π°Ρ‡ΠΈ (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

Одной ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивных ΠΈ ΠΏΡ€ΠΎΡΡ‚Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ условно-Ρ€Π΅Ρ„Π»Π΅ΠΊΡ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ повСдСния являСтся вСроятностный Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ [13]. Π‘ΡƒΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ оцСниваСтся рСакция Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π° Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ воздСйствиС. Если рСакция Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½Π°, Ρ‚ΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ «ΠΏΠΎΠΎΡ‰Ρ€ΡΠ΅Ρ‚ся», ΠΈΠ½Π°Ρ‡Π΅ — «Π½Π°ΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ся». Π‘ΠΈΠ³Π½Π°Π»Ρ‹ поощрСния/наказания приводят ΠΊ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΡŽ структуры ΠΈΠ»ΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π°.

ПолоТим, Ρ‡Ρ‚ΠΎ имССтся устройство с N Π΄Π°Ρ‚Ρ‡ΠΈΠΊΠ°ΠΌΠΈ ΠΈ M ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ (ΠΈΡΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ°ΠΌΠΈ). Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ Π°Π»Ρ„Π°Π²ΠΈΡ‚ составляСт X=2N сигналов, Π° Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ — Y=2M (ΠΏΡ€ΠΈ условии нСзависимой ΠΎΡ‚Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ устройством ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡƒΠΏΡ€Π°Π²Π»ΡΡŽΡ‰Π΅Π³ΠΎ воздСйствия). ΠŸΡ€ΠΈ этом Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ [13], рассмотрим Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ с Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΎΠ² ΠΏΠΎ Π²ΡΠ΅ΠΌ 2N сигналам.

ДСйствия Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Π΅Ρ‚ Π² ΡΠΎΠΎΡ‚вСтствии со ΡΡ‚охастичСской ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ΠΉ P Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ QΠ§XΠ§Y, Π³Π΄Π΅ Q — число состояний; X, Y — Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π°Π»Ρ„Π°Π²ΠΈΡ‚ΠΎΠ². Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π°Ρ…ΠΎΠ΄ΡΡΡŒ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ состоянии q (t) ΠΈ ΠΏΡ€ΠΈΠ½ΡΠ² Π½Π° Π²Ρ…ΠΎΠ΄Π΅ сигнал x (t), Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ΡΠΎΡΡ‚ояниС q (t+1). ΠŸΡ€ΠΈ этом ΠΎΠ½ ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Π΅Ρ‚ дСйствиС y, Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌΠΎΠ΅ ΠΈΠ· ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π³ΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСроятностСй — строки ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ P:

y (t + 1) = F (x (t), q (t), P (t)),.

q (t + 1) = Q (x (t), q (t)).

БтохастичСская ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° дСйствий.

Рис. 3. БтохастичСская ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° дСйствий

ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹ΠΉ Ρ€ΠΎΠ±ΠΎΡ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ€Π΅Ρ„Π»Π΅ΠΊΡ‚ΠΎΡ€Π½Ρ‹ΠΉ РСакция Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π° Π½Π° Π²Ρ…ΠΎΠ΄Π½ΠΎΠ΅ воздСйствиС оцСниваСтся — Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ наказываСтся Π»ΠΈΠ±ΠΎ поощряСтся. Бмысл Ρ€Π΅Π°ΠΊΡ†ΠΈΠΈ Π½Π° ΡΠΈΠ³Π½Π°Π» наказания/поощрСния Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ вСроятностСй выполняСмых дСйствий. ИзмСнСниС вСроятностСй ΠΏΡ€ΠΈ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠΈ (s = 0) ΠΈ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠΈ (s = 1) выглядит Ρ‚Π°ΠΊ:

pij (t + 1, s (t)) = pij (t, s (t)) + (-1)s (t+1)gpij (t, s (t))[1 — pij (t, s (t))], (1).

pik (t + 1, s (t)) = pik (t, s (t)) — (-1)s (t+1)gpik (t, s (t))pij (t, s (t)), k j, 0g1,.

Π³Π΄Π΅ g — ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠΉ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния. Π’ ΡΡ‚ΠΎΠΉ связи с Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π² Ρ…ΠΎΠ΄Π΅ «Π΄Ρ€Π΅ΡΡΠΈΡ€ΠΎΠ²ΠΊΠΈ» Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΡ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ значСния вСроятностСй дСйствий.

Π ΠΎΠ±ΠΎΡ‚, управляСмый вСроятностным Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΎΠΌ, считываСт состояниС Π΄Π°Ρ‚Ρ‡ΠΈΠΊΠΎΠ² ΠΈ ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Π΅Ρ‚ ΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎΠ΅ дСйствиС. Π”Π°Π»Π΅Π΅ происходит ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° выполнСния «ΡΠ»Π°Π±ΠΎΠ³ΠΎ критСрия» — Π²ΠΈΠ΄ΠΈΡ‚ Π»ΠΈ ΠΎΠ½ Π»ΠΈΠ½ΠΈΡŽ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, хотя Π±Ρ‹ ΠΎΠ΄Π½ΠΈΠΌ Π΄Π°Ρ‚Ρ‡ΠΈΠΊΠΎΠΌ). Если Ρ€ΠΎΠ±ΠΎΡ‚ послС ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΠΈΡ двиТСния ΠΏΠΎ-ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ находится Π½Π° Π»ΠΈΠ½ΠΈΠΈ, Ρ‚ΠΎ Ρ€ΠΎΠ±ΠΎΡ‚ поощряСтся (Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ этого дСйствия для ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ состояния увСличиваСтся), ΠΈΠ½Π°Ρ‡Π΅ — наказываСтся (Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ).

Π­Ρ‚Π° вСсьма простая схСма ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ достаточно устойчивыС ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ примСнСния слабых ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠ΅Π² являСтся Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ качСства обучСния ΠΎΡ‚ «Ρ‡ΠΈΡΡ‚ΠΎΡ‚Ρ‹» Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… условий. Π—Π΄Π΅ΡΡŒ особСнно Π²Π°ΠΆΠ½ΠΎ Π½Π°Ρ‡ΠΈΠ½Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π² «ΠΊΠΎΠΌΡ„ΠΎΡ€Ρ‚Π½Ρ‹Ρ…» условиях, двигаясь ΠΎΡ‚ ΠΏΡ€ΠΎΡΡ‚ΠΎΠ³ΠΎ ΠΊ ΡΠ»ΠΎΠΆΠ½ΠΎΠΌΡƒ.

ΠΠ°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Ρ€ΠΎΠ±ΠΎΡ‚Π° Π½Π° ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½Π΅.

Рис. 4. ΠΠ°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Ρ€ΠΎΠ±ΠΎΡ‚Π° Π½Π° ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½Π΅

На Ρ€ΠΈΡ. 4, Π° ΠΏΠΎΠΊΠ°Π·Π°Π½Π° ситуация наличия Π½Π΅ΡƒΠ΄ΠΎΠ±Π½ΠΎΠ³ΠΎ для обучСния участка — Ρ€Π°Π·Π²ΠΈΠ»ΠΊΠΈ. Π’ ΡΡ‚ΠΎΠΌ случаС ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Π΅Π΅ Π½Π°Ρ‡Π°Π»ΡŒΠ½Π°Ρ ориСнтация, указанная Π½Π° Ρ€ΠΈΡ. 4, Π±.

Π’ Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠ΅ΠΌ ΠΏΠΎ ΠΎΠΊΠΎΠ½Ρ‡Π°Π½ΠΈΠΈ обучСния Ρ€ΠΎΠ±ΠΎΡ‚ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΡƒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρƒ ΠΈ Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… «Π·Π°Π³Ρ€ΡΠ·Π½Π΅Π½Π½Ρ‹Ρ…» условиях. Π­Ρ‚ΠΈ ΠΌΠΎΠ΄Π΅Π»ΡŒΠ½Ρ‹Π΅ «Π·Π°Π³Ρ€ΡΠ·Π½Π΅Π½Π½Ρ‹Π΅» условия прСдставлСны Π½Π° Ρ€ΠΈΡ. 5.

Один ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Β«Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ…Β» ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½ΠΎΠ².

Рис. 5. Один ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… «Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ…» ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½ΠΎΠ²

На Ρ€ΠΈΡΡƒΠ½ΠΊΠ΅ Π²ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ полоса ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½Π° сильно ΠΈΠ·Ρ€Π΅Π·Π°Π½Π°. Π­Ρ‚ΠΎ сдСлано ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ Π² Ρ†Π΅Π»ΡΡ… ускорСния обучСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€ΠΎΠ±ΠΎΡ‚ быстрСС Π½Π°Π±Ρ€Π°Π» ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ². ΠŸΡ€ΠΈ Π΄Π²ΠΈΠΆΠ΅Π½ΠΈΠΈ ΠΏΠΎ Ρ‚Π°ΠΊΠΎΠΌΡƒ слоТному ΠΏΠΎΠ»ΠΈΠ³ΠΎΠ½Ρƒ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов ΠΎΡ‚ Π΄Π°Ρ‚Ρ‡ΠΈΠΊΠΎΠ² Π½Π°Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ достаточно быстро.

ΠŸΠΎΠ΄ΠΎΠ±Π½Ρ‹ΠΉ Ρ€Π΅ΠΆΠΈΠΌ функционирования прСдставляСт собой ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρƒ обучСния, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠ΅.

ΠžΠ±Ρ€Π°Ρ‚ΠΈΠΌ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° Π²ΠΎΠΏΡ€ΠΎΡ ΠΎ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠΈ/Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠΈ Π² Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ. ЕстСствСнно, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ дрСссировкС ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΊΠ°ΠΊ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠ΅, Ρ‚Π°ΠΊ ΠΈ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠ΅. РассмотрСнная схСма обучСния с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ (модСль «ΡΡ‚ΠΈΠΌΡƒΠ»-рСакция») ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ рядом Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΠΉ ΠΊ Π±Π°Π»Π°Π½ΡΡƒ ΠΌΠ΅ΠΆΠ΄Ρƒ Π°ΠΊΡ‚Π°ΠΌΠΈ поощрСния/наказания.

Π’ [5] ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ тСорСтичСски ΠΏΡ€ΠΈ Π²Ρ‹Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ условных рСфлСксов ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΠΎΠΉΡ‚ΠΈΡΡŒ ΠΎΠ΄Π½ΠΈΠΌΠΈ наказаниями (отсутствиС наказания ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ°ΠΊ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠ΅). Однако отсутствиС сигнала поощрСния Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ врСмя обучСния Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚Π°.

Максимальная ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния достигаСтся ΠΏΡ€ΠΈ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠΈ. ЀактичСски, ΠΏΡ€ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°Ρ… достаточно ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π°ΠΊΡ‚Π° поощрСния для окончания обучСния. Но ΠΈ Π±Π΅Π· Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠΉ ΠΎΠ±ΠΎΠΉΡ‚ΠΈΡΡŒ нСльзя. Если Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠΎΡ‰Ρ€ΡΡ‚ΡŒ, Ρ‚ΠΎ ΡΠΈΡΡ‚Π΅ΠΌΡƒ нСльзя Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠ΅Ρ€Π΅ΡƒΡ‡ΠΈΡ‚ΡŒ (ΠΈΠ·-Π·Π° выроТдСния Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²). Π›ΠΈΠ±ΠΎ придСтся Π²Π²ΠΎΠ΄ΠΈΡ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ забывания (угасания рСфлСкса).

На Ρ€ΠΈΡ. 6 ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ повСдСния Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСроятностСй ΠΈΠ· 4-Ρ… элСмСнтов. ΠŸΡ€ΠΈ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠΈ Π·Π° Π΄Π΅ΠΉΡΡ‚Π²ΠΈΠ΅ 2 Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΉ вСроятности увСличиваСтся Π·Π° ΡΡ‡Π΅Ρ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ вСроятностСй Π΄Ρ€ΡƒΠ³ΠΈΡ… дСйствий, рис. 6, Π±. ΠŸΡ€ΠΈ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠΈ происходит ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ процСсс, рис. 6, Π².

Условно-Ρ€Π΅Ρ„Π»Π΅ΠΊΡ‚ΠΎΡ€Π½ΠΎΠ΅ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅. К вопросу ΠΎΠ± ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹ΠΌ Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠΌ Π² условиях ΠΎΠ±Ρ‰Π΅ΠΉ постановки Π·Π°Π΄Π°Ρ‡ΠΈ.

Π°) Π±) Π²) Рис. 6. РСакция элСмСнтов Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π½Π° ΡΠΈΠ³Π½Π°Π»Ρ‹ поощрСния-наказания.

Π°) — исходный Π²Π΅ΠΊΡ‚ΠΎΡ€; Π±) распрСдСлСниС вСроятностСй ΠΏΡ€ΠΈ ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠΈ Π·Π° Π΄Π΅ΠΉΡΡ‚Π²ΠΈΠ΅ 2; Π±) распрСдСлСниС вСроятностСй ΠΏΡ€ΠΈ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠΈ Π·Π° Π΄Π΅ΠΉΡΡ‚Π²ΠΈΠ΅ 3;

ΠžΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ максимальная ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ обучСния достигаСтся ΠΏΡ€ΠΈ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ сигналов поощрСния-наказания.

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ