ΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² ΡƒΡ‡Ρ‘Π±Π΅, ΠΎΡ‡Π΅Π½ΡŒ быстро...
Π Π°Π±ΠΎΡ‚Π°Π΅ΠΌ вмСстС Π΄ΠΎ ΠΏΠΎΠ±Π΅Π΄Ρ‹

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°ΡΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

Π‘ ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° появлСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Apriori, этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто примСняСмым Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΌ шагС. МногиС ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΠΈ ΠΈ ΠΏΠΎ ΠΌΠ°ΡΡˆΡ‚абируСмости, Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Ρ‹ Π½Π° ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Apriori, Π½Π° ΠΈΡΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π΅Π³ΠΎ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎΠ³ΠΎ свойства Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ слишком ΠΌΠ½ΠΎΠ³ΠΎ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² Π½Π° Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ Π½Π°Π±ΠΎΡ€Ρ‹ элСмСнтов. Apriori Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π½Π°Π±ΠΎΡ€Ρ‹ элСмСнтов ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

ΠœΠΈΠ½ΠΈΡΡ‚Π΅Ρ€ΡΡ‚Π²ΠΎ образования ΠΈ Π½Π°ΡƒΠΊΠΈ Π Π€ Π€Π΅Π΄Π΅Ρ€Π°Π»ΡŒΠ½ΠΎΠ΅ государствСнноС Π±ΡŽΠ΄ΠΆΠ΅Ρ‚Π½ΠΎΠ΅ ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΡƒΡ‡Ρ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ Π²Ρ‹ΡΡˆΠ΅Π³ΠΎ ΠΏΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ образования

«ΠΠΠ¦Π˜ΠžΠΠΠ›Π¬ΠΠ«Π™ Π˜Π‘Π‘Π›Π•Π”ΠžΠ’ΠΠ’Π•Π›Π¬Π‘ΠšΠ˜Π™ Π’ΠžΠœΠ‘ΠšΠ˜Π™ ΠŸΠžΠ›Π˜Π’Π•Π₯ΠΠ˜Π§Π•Π‘ΠšΠ˜Π™ Π£ΠΠ˜Π’Π•Π Π‘Π˜Π’Π•Π’»

Π˜Π½ΡΡ‚ΠΈΡ‚ΡƒΡ‚ ΠšΠΈΠ±Π΅Ρ€Π½Π΅Ρ‚ΠΈΠΊΠΈ НаправлСниС Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ° ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° ΠšΠ°Ρ„Π΅Π΄Ρ€Π° Π’Π’ ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ Ρ€Π°Π±ΠΎΡ‚Π° ΠΏΠΎ Π΄ΠΈΡΡ†ΠΈΠΏΠ»ΠΈΠ½Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ° ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° Π’Π΅ΠΌΠ°: ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining

Вомск 2012

1. Data Mining. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ понятия ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡ

1.1 Π­Ρ‚Π°ΠΏΡ‹ Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…

1.2 ΠšΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ систСм ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°

1.3 ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ исслСдования Π΄Π°Π½Π½Ρ‹Ρ… Π² Data Mining

2. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining

2.1 Π’Ρ‹Π²ΠΎΠ΄ ассоциативных ΠΏΡ€Π°Π²ΠΈΠ»

2.2 НСйросСтСвыС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

2.3 ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ блиТайшСго сосСда ΠΈ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй

2.4 Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

2.5 Алгоритмы кластСризации

2.6 ГСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

3. Π‘Ρ„Π΅Ρ€Ρ‹ примСнСния

4. ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΠΈ срСдств Data Mining

5. ΠšΡ€ΠΈΡ‚ΠΈΠΊΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ Бписок Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ развития ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ являСтся ΠΊΠΎΠ»ΠΎΡΡΠ°Π»ΡŒΠ½Ρ‹ΠΉ объСм Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π°ΠΊΠΎΠΏΠ»Π΅Π½Π½Ρ‹Ρ… Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½ΠΎΠΌ Π²ΠΈΠ΄Π΅, растущий быстрыми Ρ‚Π΅ΠΌΠΏΠ°ΠΌΠΈ. ΠŸΡ€ΠΈ этом Π΄Π°Π½Π½Ρ‹Π΅, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½ΠΎΠΉ структурой (тСксты, изобраТСния, Π°ΡƒΠ΄ΠΈΠΎ, Π²ΠΈΠ΄Π΅ΠΎ, гипСртСкстовыС Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Ρ‹, рСляционныС Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…). НакоплСнныС Π·Π° Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ срок Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ Π² ΡΠ΅Π±Π΅ закономСрности, Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΈ ΠΈ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·ΠΈ, ΡΠ²Π»ΡΡŽΡ‰ΠΈΠ΅ΡΡ Ρ†Π΅Π½Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΏΡ€ΠΈ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ, ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ, принятии Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π΅ Π·Π° ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ°ΠΌΠΈ. Однако Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ физичСски Π½Π΅ ΡΠΏΠΎΡΠΎΠ±Π΅Π½ эффСктивно Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ Π½Π΅ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ матСматичСской статистики Π΄ΠΎΠ»Π³ΠΎΠ΅ врСмя ΠΏΡ€Π΅Ρ‚Π΅Π½Π΄ΠΎΠ²Π°Π»ΠΈ Π½Π° Ρ€ΠΎΠ»ΡŒ основного инструмСнта Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…. Однако ΠΎΠ½ΠΈ Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹, Π° ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ лишь для подтвСрТдСния Π·Π°Ρ€Π°Π½Π΅Π΅ сформулированных Π³ΠΈΠΏΠΎΡ‚Π΅Π· ΠΈ «Π³Ρ€ΡƒΠ±ΠΎΠ³ΠΎ» Ρ€Π°Π·Π²Π΅Π΄ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°, ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰Π΅Π³ΠΎ основу ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ аналитичСской ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… (online analytical processing, OLAP). НСрСдко ΠΈΠΌΠ΅Π½Π½ΠΎ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²ΠΊΠ° Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹ оказываСтся самой слоТной Π·Π°Π΄Π°Ρ‡Π΅ΠΉ ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠΈ Π°Π½Π°Π»ΠΈΠ·Π° для ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π΄Π°Π»Π΅ΠΊΠΎ Π½Π΅ Π²ΡΠ΅ закономСрности Π² Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹ с ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ взгляда. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… (Data mining) Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ ΠΎΠ΄Π½Π° ΠΈΠ· ΡΠ°ΠΌΡ‹Ρ… Π²Π°ΠΆΠ½Ρ‹Ρ… ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΎΠ±Π΅Ρ‰Π°ΡŽΡ‰ΠΈΡ… Ρ‚Π΅ΠΌ для исслСдований ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ Π² ΠΎΡ‚расли ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ. Под ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΌ Π°Π½Π°Π»ΠΈΠ·ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… Π² ΡΡ‚ΠΎΠΌ случаС понимаСтся процСсс опрСдСлСния Π½ΠΎΠ²Ρ‹Ρ…, ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½Ρ‹Ρ… ΠΈ ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… Π·Π½Π°Π½ΠΈΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… массивов Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π°ΠΊ, MIT Technology Review ΠΎΡ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΎΠ²Π°Π» Data Mining ΠΊΠ°ΠΊ ΠΎΠ΄Π½Ρƒ ΠΈΠ· Π΄Π΅ΡΡΡ‚ΠΈ Ρ€Π°Π·Π²ΠΈΠ²Π°ΡŽΡ‰ΠΈΡ…ΡΡ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ измСнят ΠΌΠΈΡ€.

1. Data Mining. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ понятия ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡ

Data Mining — это процСсс обнаруТСния Π² «ΡΡ‹Ρ€Ρ‹Ρ…» Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π°Π½Π΅Π΅ нСизвСстных, Π½Π΅Ρ‚Ρ€ΠΈΠ²ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ…, практичСски ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ΠΈ Π΄ΠΎΡΡ‚ΡƒΠΏΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ Π·Π½Π°Π½ΠΈΠΉ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Ρ… для принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… сфСрах чСловСчСской Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ.

Π‘ΡƒΡ‚ΡŒ ΠΈ Ρ†Π΅Π»ΡŒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Data Mining ΠΌΠΎΠΆΠ½ΠΎ ΡΡ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ: это тСхнология, которая ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для поиска Π² Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΌΠ°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π½Π΅ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹Ρ…, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΈ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ закономСрностСй.

НСочСвидныС закономСрности — это Ρ‚Π°ΠΊΠΈΠ΅ закономСрности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ нСльзя ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΡ‚ΡŒ стандартными ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ»ΠΈ экспСртным ΠΏΡƒΡ‚Π΅ΠΌ.

Под ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹ΠΌΠΈ закономСрностями слСдуСт ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ закономСрности, ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ΡΠΊΡΠΏΠ΅Ρ€Ρ‚Π½ΠΎΠ³ΠΎ мнСния, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ всСгда являСтся ΡΡƒΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹ΠΌ.

Π­Ρ‚Π° концСпция Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ:

§ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π΅Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌΠΈ, Π½Π΅ΠΏΠΎΠ»Π½Ρ‹ΠΌΠΈ (ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ пропуски), ΠΏΡ€ΠΎΡ‚ΠΈΠ²ΠΎΡ€Π΅Ρ‡ΠΈΠ²Ρ‹ΠΌΠΈ, Ρ€Π°Π·Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹ΠΌΠΈ, косвСнными, ΠΈ ΠΏΡ€ΠΈ этом ΠΈΠΌΠ΅Ρ‚ΡŒ гигантскиС ΠΎΠ±ΡŠΡ‘ΠΌΡ‹; поэтому ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… прилоТСниях Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… усилий;

§ сами Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±Π»Π°Π΄Π°Ρ‚ΡŒ «ΡΠ»Π΅ΠΌΠ΅Π½Ρ‚Π°ΠΌΠΈ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°», Π² Ρ‡Π°ΡΡ‚ности, ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ ΠΏΠΎ ΠΏΡ€Π΅Ρ†Π΅Π΄Π΅Π½Ρ‚Π°ΠΌ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠ±Ρ‰ΠΈΠ΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ частных наблюдСний; Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Ρ‚Π°ΠΊΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Ρ‚Π°ΠΊΠΆΠ΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… усилий;

§ процСссы ΠΏΠ΅Ρ€Π΅Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сырых Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ, Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π·Π½Π°Π½ΠΈΡ Π½Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Ρ‹ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ, ΠΈ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ.

Π’ ΠΎΡΠ½ΠΎΠ²Ρƒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Data Mining ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Π° концСпция шаблонов (ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ²), ΠΎΡ‚Ρ€Π°ΠΆΠ°ΡŽΡ‰ΠΈΡ… Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚Ρ‹ многоаспСктных Π²Π·Π°ΠΈΠΌΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΉ Π² Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΈ ΡˆΠ°Π±Π»ΠΎΠ½Ρ‹ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой закономСрности, свойствСнныС ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½ΠΎ Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½Ρ‹ Π² ΠΏΠΎΠ½ΡΡ‚Π½ΠΎΠΉ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΡƒ Ρ„ΠΎΡ€ΠΌΠ΅.

Поиск шаблонов производится ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ, Π½Π΅ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ Ρ€Π°ΠΌΠΊΠ°ΠΌΠΈ Π°ΠΏΡ€ΠΈΠΎΡ€Π½Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΎ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ ΠΈ Π²ΠΈΠ΄Π΅ распрСдСлСний Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ.

Π’Π°ΠΆΠ½ΠΎΠΉ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ Data Mining являСтся Π½Π΅ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½ΠΎΡΡ‚ΡŒ ΠΈ Π½Π΅ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎΡΡ‚ΡŒ разыскиваСмых шаблонов. Π˜Π½Ρ‹ΠΌΠΈ словами, срСдства Data Mining ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΎΡ‚ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² статистичСской ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΡΡ€Π΅Π΄ΡΡ‚Π² OLAP Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ вмСсто ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π·Π°Ρ€Π°Π½Π΅Π΅ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅ΠΌΡ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌΠΈ взаимозависимостСй ΠΎΠ½ΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΈΠΈ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Π΄Π°Π½Π½Ρ‹Ρ… способны Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ взаимозависимости ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹ ΠΎΠ± ΠΈΡ… Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π΅. Π’Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ ΠΏΡΡ‚ΡŒ стандартных Ρ‚ΠΈΠΏΠΎΠ² закономСрностСй, выявляСмых ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ Data Mining:

Β· ассоциация — высокая Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ связи событий Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ ассоциации ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ‚ΠΎΠ²Π°Ρ€Ρ‹ Π² ΠΌΠ°Π³Π°Π·ΠΈΠ½Π΅, часто ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°Π΅ΠΌΡ‹Π΅ вмСстС;

Β· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ — высокая Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ связанных Π²ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ событий. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ являСтся ситуация, ΠΊΠΎΠ³Π΄Π° Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ срока послС приобрСтСния ΠΎΠ΄Π½ΠΎΠ³ΠΎ Ρ‚ΠΎΠ²Π°Ρ€Π° Π±ΡƒΠ΄Π΅Ρ‚ с Π²Ρ‹ΡΠΎΠΊΠΎΠΉ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ вСроятности ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π΅Π½ Π΄Ρ€ΡƒΠ³ΠΎΠΉ;

Β· классификация — ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ, Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΡŽΡ‰ΠΈΠ΅ Π³Ρ€ΡƒΠΏΠΏΡƒ, ΠΊ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ Ρ‚ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ΅ событиС ΠΈΠ»ΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚;

Β· кластСризация — Π·Π°ΠΊΠΎΠ½ΠΎΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ, сходная с ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠ΅ΠΉ ΠΈ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‰Π°ΡΡΡ ΠΎΡ‚ Π½Π΅Π΅ Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ сами Π³Ρ€ΡƒΠΏΠΏΡ‹ ΠΏΡ€ΠΈ этом Π½Π΅ Π·Π°Π΄Π°Π½Ρ‹ — ΠΎΠ½ΠΈ Π²Ρ‹ΡΠ²Π»ΡΡŽΡ‚ΡΡ автоматичСски Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…;

Β· Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ закономСрности — Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ шаблонов Π² Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ΅ повСдСния Ρ‚Π΅Ρ… ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Π₯Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ закономСрности — сСзонныС колСбания спроса Π½Π° Ρ‚Π΅ ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Π΅ Ρ‚ΠΎΠ²Π°Ρ€Ρ‹ Π»ΠΈΠ±ΠΎ услуги.

1.1 Π­Ρ‚Π°ΠΏΡ‹ Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…

Π’Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎ Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ этапы Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…:

1. Π˜Π·ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΡƒΡŽΡ‚ΡΡ основныС Ρ†Π΅Π»ΠΈ Π°Π½Π°Π»ΠΈΠ·Π°.

2. Π‘Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ….

3. ΠŸΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…:

a. ΠžΡ‡ΠΈΡΡ‚ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… — ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡ‚ΠΈΠ²ΠΎΡ€Π΅Ρ‡ΠΈΠΉ ΠΈ ΡΠ»ΡƒΡ‡Π°ΠΉΠ½Ρ‹Ρ… «ΡˆΡƒΠΌΠΎΠ²» ΠΈΠ· ΠΈΡΡ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…

b. Π˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ Π΄Π°Π½Π½Ρ‹Ρ… — объСдинСниС Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… источников Π² ΠΎΠ΄Π½ΠΎΠΌ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅

c. ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…. На Π΄Π°Π½Π½ΠΎΠΌ этапС Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ΡΡ ΠΊ Ρ„ΠΎΡ€ΠΌΠ΅, подходящСй для Π°Π½Π°Π»ΠΈΠ·Π°. Часто примСняСтся агрСгация Π΄Π°Π½Π½Ρ‹Ρ…, дискрСтизация Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ², сТатиС Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΡΠΎΠΊΡ€Π°Ρ‰Π΅Π½ΠΈΠ΅ размСрности.

4. Анализ Π΄Π°Π½Π½Ρ‹Ρ…. Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… Π΄Π°Π½Π½ΠΎΠ³ΠΎ этапа ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° с Ρ†Π΅Π»ΡŒΡŽ извлСчСния ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

5. Π˜Π½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΡ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ². Π”Π°Π½Π½Ρ‹ΠΉ этап ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ², ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ² Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ полСзности.

6. ИспользованиС Π½ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Π½ΠΈΠΉ.

1.2 ΠšΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ систСм ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π² ΡΠΈΡΡ‚Π΅ΠΌΠ°Ρ… ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π³Π»Π°Π²Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹:

1. Π‘Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ…, Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ΄Π½Π° ΠΈΠ»ΠΈ нСсколько Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…, Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, элСктронныС Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π²ΠΈΠ΄Ρ‹ Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠ΅Π², Π½Π°Π΄ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Ρ‹ очистка ΠΈ ΠΈΠ½Ρ‚Сграция.

2. Π‘Π΅Ρ€Π²Π΅Ρ€ Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° Π΄Π°Π½Π½Ρ‹Ρ…. Π£ΠΊΠ°Π·Π°Π½Π½Ρ‹ΠΉ сСрвСр ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ сущСствСнных Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠ³ΠΎ запроса.

3. Π‘Π°Π·Π° Π·Π½Π°Π½ΠΈΠΉ. Π­Ρ‚ΠΎ знания ΠΎ ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚, ΠΊΠ°ΠΊ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ поиск ΠΈ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΡΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

4. Π‘Π»ΡƒΠΆΠ±Π° Π΄ΠΎΠ±Ρ‹Ρ‡ΠΈ Π·Π½Π°Π½ΠΈΠΉ. Она являСтся Π½Π΅ΠΎΡ‚ΡŠΠ΅ΠΌΠ»Π΅ΠΌΠΎΠΉ Ρ‡Π°ΡΡ‚ΡŒΡŽ систСмы ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΡΠΎΠ΄Π΅Ρ€ΠΆΠΈΡ‚ Π½Π°Π±ΠΎΡ€ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ для Ρ‚Π°ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡, ΠΊΠ°ΠΊ характСризация, поиск ассоциаций, классификация, кластСрный Π°Π½Π°Π»ΠΈΠ· ΠΈ Π°Π½Π°Π»ΠΈΠ· ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ.

5. ΠœΠΎΠ΄ΡƒΠ»ΡŒ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ². Π”Π°Π½Π½Ρ‹ΠΉ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ вычисляСт ΠΌΠ΅Ρ€Ρ‹ интСрСса ΠΈΠ»ΠΈ полСзности ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

6. ГрафичСский ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΠΉ интСрфСйс. Π­Ρ‚ΠΎΡ‚ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° ΠΊΠΎΠΌΠΌΡƒΠ½ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΌ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΠΎΠΉ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ² Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ….

1.3 ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ исслСдования Π΄Π°Π½Π½Ρ‹Ρ… Π² Data Mining

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ аналитичСских ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π² Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Data Mining — это извСстныС матСматичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹. Новым Π² ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ являСтся Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΈΡ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΏΡ€ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ Ρ‚Π΅Ρ… ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Ρ… ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ, обусловлСнная появившимися возмоТностями тСхничСских ΠΈ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹Ρ… срСдств. Π‘Π»Π΅Π΄ΡƒΠ΅Ρ‚ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Data Mining Π±Ρ‹Π»ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… Ρ‚Π΅ΠΎΡ€ΠΈΠΈ искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°. Рассмотрим Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡˆΠΈΡ€ΠΎΠΊΠΎ употрСбляСмыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹:

1. Π’Ρ‹Π²ΠΎΠ΄ ассоциативных ΠΏΡ€Π°Π²ΠΈΠ».

2. НСйросСтСвыС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, идСя ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… основана Π½Π° Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ с Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π½Π΅Ρ€Π²Π½ΠΎΠΉ Ρ‚ΠΊΠ°Π½ΠΈ ΠΈ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ся Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ исходныС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ сигналы, ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‰ΠΈΠ΅ΡΡ Π² ΡΠΎΠΎΡ‚вСтствии с ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠΌΠΈΡΡ связями ΠΌΠ΅ΠΆΠ΄Ρƒ «Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ», Π° Π² ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ ΠΎΡ‚Π²Π΅Ρ‚Π°, ΡΠ²Π»ΡΡŽΡ‰Π΅Π³ΠΎΡΡ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π°, рассматриваСтся ΠΎΡ‚ΠΊΠ»ΠΈΠΊ всСй сСти Π½Π° ΠΈΡΡ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅.

3. Π’Ρ‹Π±ΠΎΡ€ Π±Π»ΠΈΠ·ΠΊΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΎΠ³Π° исходных Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· ΡƒΠΆΠ΅ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ историчСских Π΄Π°Π½Π½Ρ‹Ρ…. ΠΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ «Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠ΅Π³ΠΎ сосСда».

4. Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ — иСрархичСская структура, Π±Π°Π·ΠΈΡ€ΡƒΡŽΡ‰Π°ΡΡΡ Π½Π° Π½Π°Π±ΠΎΡ€Π΅ вопросов, ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°ΡŽΡ‰ΠΈΡ… ΠΎΡ‚Π²Π΅Ρ‚ «Π”Π°» ΠΈΠ»ΠΈ «ΠΠ΅Ρ‚».

5. ΠšΠ»Π°ΡΡ‚Π΅Ρ€Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для объСдинСния сходных событий Π² Π³Ρ€ΡƒΠΏΠΏΡ‹ Π½Π° ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΈΠΈ сходных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΠΎΠ»Π΅ΠΉ Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

6. ГСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ — поиск ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Π²Ρ‹Ρ€Π°ΠΆΠ°ΡŽΡ‰Π΅Π³ΠΎ Π²Π·Π°ΠΈΠΌΠΎΠ·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π° ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΈΠΈ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΌΠΎΠ΄ΠΈΡ„ΠΈΡ†ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ поиска.

Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Π³Π»Π°Π²Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ опишСм Π²Ρ‹ΡˆΠ΅ΠΏΠ΅Ρ€Π΅Ρ‡ΠΈΡΠ»Π΅Π½Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹.

2. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining

2.1 Π’Ρ‹Π²ΠΎΠ΄ ассоциативных ΠΏΡ€Π°Π²ΠΈΠ»

АссоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° — это ΠΏΡ€Π°Π²ΠΈΠ»Π° Π²ΠΈΠ΄Π° «Π΅ΡΠ»ΠΈ…, Ρ‚ΠΎ…». Поиск Ρ‚Π°ΠΊΠΈΡ… ΠΏΡ€Π°Π²ΠΈΠ» Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ скрытыС связи Π², Π½Π° ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ взгляд, Π½ΠΈΠΊΠ°ΠΊ Π½Π΅ ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Одним ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто Ρ†ΠΈΡ‚ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² поиска ассоциативных ΠΏΡ€Π°Π²ΠΈΠ» слуТит ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° поиска устойчивых связСй Π² ΠΊΠΎΡ€Π·ΠΈΠ½Π΅ покупатСля. Π­Ρ‚Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ‚ΠΎΠ²Π°Ρ€Ρ‹ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ΡΡ покупатСлями вмСстС, Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ спСциалисты ΠΏΠΎ ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Ρƒ ΠΌΠΎΠ³Π»ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π°Π·ΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ эти Ρ‚ΠΎΠ²Π°Ρ€Ρ‹ Π² ΠΌΠ°Π³Π°Π·ΠΈΠ½Π΅ для ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ объСма ΠΏΡ€ΠΎΠ΄Π°ΠΆ.

АссоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ утвСрТдСния Π²ΠΈΠ΄Π° {X1,X2,…, Xn} -> Y, Π³Π΄Π΅ подразумСваСтся, Ρ‡Ρ‚ΠΎ Y ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ Π² Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΈ ΠΏΡ€ΠΈ условии, Ρ‡Ρ‚ΠΎ X1, X2,…, Xn ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π² ΡΡ‚ΠΎΠΉ ΠΆΠ΅ Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΈ. Π‘Π»Π΅Π΄ΡƒΠ΅Ρ‚ ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ слово «ΠΌΠΎΠΆΠ΅Ρ‚» ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ Π½Π΅ ΡΠ²Π»ΡΠ΅Ρ‚ся тоТдСством, Π° Π²Ρ‹ΠΏΠΎΠ»Π½ΡΠ΅Ρ‚ся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π² ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ Y ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΡΡ‚ΡƒΠΏΠ°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ элСмСнтов, Π° Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ элСмСнт. Π’Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ нахоТдСния Y Π² Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΈ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ элСмСнты X1, X2,…, Xn, называСтся Π΄ΠΎΡΡ‚ΠΎΠ²Π΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ (confidence). ΠŸΡ€ΠΎΡ†Π΅Π½Ρ‚ Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ, содСрТащих ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΎΡ‚ ΠΎΠ±Ρ‰Π΅Π³ΠΎ числа Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ называСтся ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ (support). Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ достовСрности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π΄ΠΎΠ»ΠΆΠ½Π° ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Ρ‚ΡŒ Π΄ΠΎΡΡ‚ΠΎΠ²Π΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»Π°, называСтся ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΠ½ΠΎΡΡ‚ΡŒΡŽ (interestingness).

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ‚ΠΈΠΏΡ‹ ассоциативных ΠΏΡ€Π°Π²ΠΈΠ». Π’ ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠ΅ΠΉ Ρ„ΠΎΡ€ΠΌΠ΅ ассоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° ΡΠΎΠΎΠ±Ρ‰Π°ΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΈΠ»ΠΈ отсутствии ассоциации. Π’Π°ΠΊΠΈΠ΅ ΠΏΡ€Π°Π²ΠΈΠ»Π° Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π±ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ ассоциативными ΠΏΡ€Π°Π²ΠΈΠ»Π°ΠΌΠΈ (Boolean Association Rule). ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Ρ‚Π°ΠΊΠΎΠ³ΠΎ ΠΏΡ€Π°Π²ΠΈΠ»Π°: «ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ ΠΉΠΎΠ³ΡƒΡ€Ρ‚, Ρ‚Π°ΠΊ ΠΆΠ΅ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ масло с Π½ΠΈΠ·ΠΊΠΈΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ΠΌ ΠΆΠΈΡ€Π°».

ΠŸΡ€Π°Π²ΠΈΠ»Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠΎΠ±ΠΈΡ€Π°ΡŽΡ‚ нСсколько ассоциативных ΠΏΡ€Π°Π²ΠΈΠ» вмСстС, Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΌΡƒΠ»ΡŒΡ‚ΠΈΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹Π΅ ΠΈΠ»ΠΈ ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½Π½Ρ‹Π΅ ассоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° (Multilevel or Generalized Association Rules). ΠŸΡ€ΠΈ построСнии Ρ‚Π°ΠΊΠΈΡ… ΠΏΡ€Π°Π²ΠΈΠ», элСмСнты ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΡƒΡŽΡ‚ΡΡ согласно ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ, ΠΈ ΠΏΠΎΠΈΡΠΊ вСдСтся Π½Π° ΡΠ°ΠΌΠΎΠΌ высоком ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅. НапримСр, «ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ ΠΌΠΎΠ»ΠΎΠΊΠΎ, Ρ‚Π°ΠΊ ΠΆΠ΅ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ Ρ…Π»Π΅Π±». Π’ ΡΡ‚ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅, ΠΌΠΎΠ»ΠΎΠΊΠΎ ΠΈ Ρ…Π»Π΅Π± содСрТат ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΡŽ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ‚ΠΈΠΏΠΎΠ² ΠΈ Π±Ρ€Π΅Π½Π΄ΠΎΠ², ΠΎΠ΄Π½Π°ΠΊΠΎ поиск Π½Π° Π½ΠΈΠΆΠ½Π΅ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ Π½Π°ΠΉΡ‚ΠΈ интСрСсныС ΠΏΡ€Π°Π²ΠΈΠ»Π°.

Π‘ΠΎΠ»Π΅Π΅ слоТным Ρ‚ΠΈΠΏΠΎΠΌ ΠΏΡ€Π°Π²ΠΈΠ» ΡΠ²Π»ΡΡŽΡ‚ΡΡ количСствСнныС ассоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° (Quantitative Association Rules). Π­Ρ‚ΠΎΡ‚ Ρ‚ΠΈΠΏ ΠΏΡ€Π°Π²ΠΈΠ» ищСтся с ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ количСствСнных (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ†Π΅Π½Π°) ΠΈΠ»ΠΈ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎΠ») Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ², ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ ΠΊΠ°ΠΊ {, ,…,} ->. НапримСр, «ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΠΈ, Ρ‡Π΅ΠΉ возраст находится ΠΌΠ΅ΠΆΠ΄Ρƒ 30 ΠΈ 35 Π³ΠΎΠ΄Π°ΠΌΠΈ с Π΄ΠΎΡ…ΠΎΠ΄ΠΎΠΌ Π±ΠΎΠ»Π΅Π΅ 75 000 Π² Π³ΠΎΠ΄ ΠΏΠΎΠΊΡƒΠΏΠ°ΡŽΡ‚ ΠΌΠ°ΡˆΠΈΠ½Ρ‹ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΡŽ Π±ΠΎΠ»Π΅Π΅ 20 000» .

Π’Ρ‹ΡˆΠ΅ΠΏΠ΅Ρ€Π΅Ρ‡ΠΈΡΠ»Π΅Π½Π½Ρ‹Π΅ Ρ‚ΠΈΠΏΡ‹ ΠΏΡ€Π°Π²ΠΈΠ» Π½Π΅ Π·Π°Ρ‚Ρ€Π°Π³ΠΈΠ²Π°ΡŽΡ‚ Ρ‚ΠΎΡ‚ Ρ„Π°ΠΊΡ‚, Ρ‡Ρ‚ΠΎ Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΈ, ΠΏΠΎ ΡΠ²ΠΎΠ΅ΠΉ ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅, зависят ΠΎΡ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. НапримСр, поиск Π΄ΠΎ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ Π±Ρ‹Π» выставлСн Π½Π° ΠΏΡ€ΠΎΠ΄Π°ΠΆΡƒ ΠΈΠ»ΠΈ послС Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΎΠ½ ΠΈΡΡ‡Π΅Π· с Ρ€Ρ‹Π½ΠΊΠ°, нСблагоприятно повлияСт Π½Π° ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ. Π‘ ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ этого, Π² Π²Π²Π΅Π΄Π΅Π½Π° концСпция Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π½ΠΎΠ³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΆΠΈΠ·Π½ΠΈ Π² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… поиска Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ассоциативных ΠΏΡ€Π°Π²ΠΈΠ» (Temporal Association Rules).

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° поиска ассоциативных ΠΏΡ€Π°Π²ΠΈΠ» ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π² ΠΎΠ±Ρ‰Π΅ΠΌ Π²ΠΈΠ΄Π΅ Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½Π° Π½Π° Π΄Π²Π΅ части: поиск часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ Π½Π°Π±ΠΎΡ€ΠΎΠ² элСмСнтов, ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΡ ΠΏΡ€Π°Π²ΠΈΠ» Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Ρ… часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ Π½Π°Π±ΠΎΡ€ΠΎΠ². ΠŸΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ исслСдования, ΠΏΠΎ Π±ΠΎΠ»ΡŒΡˆΠ΅ΠΉ части, ΠΏΡ€ΠΈΠ΄Π΅Ρ€ΠΆΠΈΠ²Π°Π»ΠΈΡΡŒ этих Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΉ ΠΈ Ρ€Π°ΡΡˆΠΈΡ€ΡΠ»ΠΈ ΠΈΡ… Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… направлСниях.

Π‘ ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° появлСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Apriori, этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто примСняСмым Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΌ шагС. МногиС ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΠΈ ΠΈ ΠΏΠΎ ΠΌΠ°ΡΡˆΡ‚абируСмости, Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Ρ‹ Π½Π° ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Apriori, Π½Π° ΠΈΡΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π΅Π³ΠΎ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎΠ³ΠΎ свойства Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ слишком ΠΌΠ½ΠΎΠ³ΠΎ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² Π½Π° Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ Π½Π°Π±ΠΎΡ€Ρ‹ элСмСнтов. Apriori Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π½Π°Π±ΠΎΡ€Ρ‹ элСмСнтов ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ большиС Π½Π°Π±ΠΎΡ€Ρ‹, Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Π΅ Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ шагС, Π±Π΅Π· ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ рассмотрСния Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ. ΠœΠΎΠ΄ΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ AprioriTid ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ Apriori Π·Π° ΡΡ‡Π΅Ρ‚ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅. ΠŸΡ€ΠΈ подсчСтах Π½Π° ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΡˆΠ°Π³Π°Ρ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ лишь Π΄Π°Π½Π½Ρ‹Π΅, созданныС ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ ΠΈ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ Π³ΠΎΡ€Π°Π·Π΄ΠΎ мСньший Ρ€Π°Π·ΠΌΠ΅Ρ€, Ρ‡Π΅ΠΌ исходная Π±Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ΠΊΠΎΠ»ΠΎΡΡΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ росту ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π”Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠ°Ρ ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½Π½Π°Ρ вСрсия Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, названная AprioriHybrid, ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π°, Ссли ΠΏΡ€ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΠ΅Ρ€Π²Ρ‹Ρ… ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π°Ρ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Apriori, Π° Π·Π°Ρ‚Π΅ΠΌ, Π½Π° Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ·Π΄Π½ΠΈΡ… ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π°Ρ…, ΠΊΠΎΠ³Π΄Π° k-Ρ‹Π΅ Π½Π°Π±ΠΎΡ€Ρ‹-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Ρ‹ ΡƒΠΆΠ΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π΅Π½Ρ‹ Π² ΠΏΠ°ΠΌΡΡ‚ΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π°, ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡΡ Π½Π° AprioriTid.

Π”Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠΈΠ΅ усилия ΠΏΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡŽ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Apriori связаны с Ρ€Π°ΡΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ²Π°Π½ΠΈΠ΅ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (Count Distribution, Data Distribution, Candidate Distribution ΠΈ Π΄Ρ€.), Π΅Π³ΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ (Intelligent Data Distribution, Hybrid Distribution), Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π½ΠΎΠ²Ρ‹Ρ… структур Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π΄Π΅Ρ€Π΅Π²ΡŒΡ часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ…ΡΡ элСмСнтов (FP-growth).

Π’Ρ‚ΠΎΡ€ΠΎΠΉ шаг Π² ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΌ характСризуСтся Π΄ΠΎΡΡ‚ΠΎΠ²Π΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΠ½ΠΎΡΡ‚ΡŒΡŽ. Π’ Π½ΠΎΠ²Ρ‹Ρ… модификациях ΠΊ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΌ Π±ΡƒΠ»Π΅Π²Ρ‹ΠΌ ΠΏΡ€Π°Π²ΠΈΠ»Π°ΠΌ ΠΏΡ€Π°Π²ΠΈΠ» Π΄ΠΎΠ±Π°Π²Π»ΡΡŽΡ‚ΡΡ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ, качСство ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Π°Ρ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ°, описанныС Π²Ρ‹ΡˆΠ΅. Для поиска ΠΏΡ€Π°Π²ΠΈΠ» Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ.

2.2 НСйросСтСвыС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

Π˜ΡΠΊΡƒΡΡΡ‚Π²Π΅Π½Π½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти появились Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ примСнСния матСматичСского Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π° ΠΊ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡŽ функционирования Π½Π΅Ρ€Π²Π½ΠΎΠΉ систСмы Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° с Ρ†Π΅Π»ΡŒΡŽ Π΅Π΅ Π²ΠΎΡΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΡ. А ΠΈΠΌΠ΅Π½Π½ΠΎ: ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π½Π΅Ρ€Π²Π½ΠΎΠΉ систСмы ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ ΠΈ ΠΈΡΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ ошибки, Ρ‡Ρ‚ΠΎ Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ΡŒ ΡΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ, хотя ΠΈ Π΄ΠΎΡΡ‚Π°Ρ‚ΠΎΡ‡Π½ΠΎ Π³Ρ€ΡƒΠ±ΠΎ, Ρ€Π°Π±ΠΎΡ‚Ρƒ чСловСчСского ΠΌΠΎΠ·Π³Π°. Основной структурной ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΉ Ρ‡Π°ΡΡ‚ΡŒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти являСтся Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ (formal neuron), прСдставлСнный Π½Π° Ρ€ΠΈΡ. 1, Π³Π΄Π΅ x0, x1,…, xn — ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов, w0, w1,…, wn — значСния вСсов Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов Π½Π΅ΠΉΡ€ΠΎΠ½Π°, Π° y — Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал Π½Π΅ΠΉΡ€ΠΎΠ½Π°.

Рис. 1. Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½: синапсы (1), сумматор (2), ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ (3).

Π€ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ состоит ΠΈΠ· ΡΠ»Π΅ΠΌΠ΅Π½Ρ‚ΠΎΠ² 3 Ρ‚ΠΈΠΏΠΎΠ²: синапсов, сумматора ΠΈ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Сля. Бинапс Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΠ΅Ρ‚ силу связи ΠΌΠ΅ΠΆΠ΄Ρƒ двумя Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ.

Π‘ΡƒΠΌΠΌΠ°Ρ‚ΠΎΡ€ выполняСт слоТСниС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠΌΠ½ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π½Π° ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ вСса. ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π° — Π²Ρ‹Ρ…ΠΎΠ΄Π° сумматора. Π­Ρ‚Π° функция называСтся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΈΠ»ΠΈ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‚ΠΎΡ‡Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π°.

ΠžΠΏΠΈΡΠ°Π½Π½Ρ‹Π΅ Π²Ρ‹ΡˆΠ΅ Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы ΠΎΠ΄Π½ΠΈΡ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ для Π΄Ρ€ΡƒΠ³ΠΈΡ…. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠ΅ мноТСство связанных ΠΌΠ΅ΠΆΠ΄Ρƒ собой Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ искусствСнными Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹ΠΌΠΈ сСтями (artificial neural networks, ANN) ΠΈΠ»ΠΈ, ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΎ, Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹ΠΌΠΈ сСтями.

Π Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Ρ‚Ρ€ΠΈ ΠΎΠ±Ρ‰ΠΈΡ… Ρ‚ΠΈΠΏΠ° Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ², Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΠΈ ΠΎΡ‚ ΠΈΡ… ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡ Π² Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти:

* Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ (input nodes), Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠ΄Π°ΡŽΡ‚ΡΡ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы. Π’Π°ΠΊΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ ΠΈΠΌΠ΅ΡŽΡ‚, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΎΠ΄ΠΈΠ½ Π²Ρ…ΠΎΠ΄ с Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½Ρ‹ΠΌ вСсом, смСщСниС отсутствуСт, Π° Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄Π° Π½Π΅ΠΉΡ€ΠΎΠ½Π° Ρ€Π°Π²Π½ΠΎ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΌΡƒ сигналу;

* Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ (output nodes), Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ значСния ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти;

* скрытыС Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ (hidden nodes), Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ прямых связСй с Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ сигналами, ΠΏΡ€ΠΈ этом значСния Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов скрытых Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ся Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ сигналами ИНБ.

По ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ ΠΌΠ΅ΠΆΠ½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… связСй Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ Π΄Π²Π° класса ИНБ:

1. ИНБ прямого распространСния, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… сигнал распространяСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΊ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ.

2. Π Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Π΅ ИНБ — ИНБ с ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΌΠΈ связями. Π’ Ρ‚Π°ΠΊΠΈΡ… ИНБ сигналы ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠ΅Ρ€Π΅Π΄Π°Π²Π°Ρ‚ΡŒΡΡ ΠΌΠ΅ΠΆΠ΄Ρƒ Π»ΡŽΠ±Ρ‹ΠΌΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ, Π²Π½Π΅ зависимости ΠΎΡ‚ ΠΈΡ… Ρ€Π°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡ Π² Π˜ΠΠ‘.

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Π΄Π²Π° ΠΎΠ±Ρ‰ΠΈΡ… ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° ΠΊ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ ИНБ:

1. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ.

2. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π±Π΅Π· учитСля.

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ (supervised learning) ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ использованиС Π·Π°Ρ€Π°Π½Π΅Π΅ сформированного мноТСства ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ содСрТит Π²Π΅ΠΊΡ‚ΠΎΡ€ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Π²Π΅ΠΊΡ‚ΠΎΡ€ эталонных Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ зависят ΠΎΡ‚ ΠΏΠΎΡΡ‚Π°Π²Π»Π΅Π½Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ. Π”Π°Π½Π½ΠΎΠ΅ мноТСство Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΎΠΉ ΠΈΠ»ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌ мноТСством. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΎ Π½Π° Ρ‚Π°ΠΊΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ вСсов связСй ИНБ, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов ИНБ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ мСньшС ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ ΠΎΡ‚ Ρ‚Ρ€Π΅Π±ΡƒΠ΅ΠΌΡ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов для Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов.

ΠŸΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π±Π΅Π· учитСля (unsupervised learning) подстройка вСсов связСй производится Π»ΠΈΠ±ΠΎ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ†ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ, Π»ΠΈΠ±ΠΎ с ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ коррСляции Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… сигналов Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ², ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ сущСствуСт связь. Π’ ΡΠ»ΡƒΡ‡Π°Π΅ обучСния Π±Π΅Π· учитСля ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π°Ρ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π½Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ся.

НСйронныС сСти ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΡˆΠΈΡ€ΠΎΠΊΠΎΠ³ΠΎ спСктра Π·Π°Π΄Π°Ρ‡, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ для космичСских Ρ‡Π΅Π»Π½ΠΎΠΊΠΎΠ² ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Π²Π°Π»ΡŽΡ‚Π½Ρ‹Ρ… курсов. Однако ΠΎΠ½ΠΈ Π½Π΅ Ρ‡Π°ΡΡ‚ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² ΡΠΈΡΡ‚Π΅ΠΌΠ°Ρ… ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… Π² ΡΠ²ΡΠ·ΠΈ со ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ (знания, зафиксированныС ΠΊΠ°ΠΊ вСса Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… сотСн ΠΌΠ΅ΠΆΠ½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… связСй, ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ ΠΏΠΎΠ΄Π΄Π°ΡŽΡ‚ся Π°Π½Π°Π»ΠΈΠ·Ρƒ ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠΎΠΌ) ΠΈ Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½Π΅ΠΌ обучСния Π½Π° Π±ΠΎΠ»ΡŒΡˆΠΎΠΉ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Π‘ Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны, Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ Ρ‚Π°ΠΊΠΈΠΌΠΈ прСимущСствами для использования Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠ°ΠΊ ΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ ΠΊ Π·Π°ΡˆΡƒΠΌΠ»Π΅Π½Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈ Π²Ρ‹ΡΠΎΠΊΠ°Ρ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ.

2.3 ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ блиТайшСго сосСда ΠΈ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй

Π’ ΠΎΡΠ½ΠΎΠ²Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй (nearest neighbor algorithm) ΠΈ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй (k-nearest neighbor algorithm, KNN) Π»Π΅ΠΆΠΈΡ‚ сходство ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². Алгоритм блиТайшСго сосСда выдСляСт срСди всСх извСстных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΎΠ±ΡŠΠ΅ΠΊΡ‚, максимально Π±Π»ΠΈΠ·ΠΊΠΈΠΉ (ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π°) ΠΊ Π½ΠΎΠ²ΠΎΠΌΡƒ Ρ€Π°Π½Π΅Π΅ нСизвСстному ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ. Главная ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄Π° блиТайшСго сосСда это Π΅Π³ΠΎ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΊ Π²Ρ‹Π±Ρ€ΠΎΡΠ°ΠΌ Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ….

ΠžΠΏΠΈΡΠ°Π½Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ позволяСт ΠΈΠ·Π±Π΅Π³Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ KNN, Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠΉ срСди всСх наблюдСний ΡƒΠΆΠ΅ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй, ΠΏΠΎΡ…ΠΎΠΆΠΈΡ… Π½Π° Π½ΠΎΠ²Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚. На ΠΎΡΠ½ΠΎΠ²Π΅ классов Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй выносится Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΊΠ°ΡΠ°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°. Π’Π°ΠΆΠ½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° являСтся ΠΏΠΎΠ΄Π±ΠΎΡ€ коэффициСнта k — количСство записСй, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒΡΡ ΠΏΠΎΡ…ΠΎΠΆΠΈΠΌΠΈ. ΠœΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π²ΠΊΠ»Π°Π΄ сосСда ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΎΠ½Π°Π»Π΅Π½ Ρ€Π°ΡΡΡ‚ΠΎΡΠ½ΠΈΡŽ Π΄ΠΎ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° (ΠΌΠ΅Ρ‚ΠΎΠ΄ k-Π²Π·Π²Π΅ΡˆΠ΅Π½Π½Ρ‹Ρ… Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй) позволяСт Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ большСй точности классификации. ΠœΠ΅Ρ‚ΠΎΠ΄ k Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй, Ρ‚Π°ΠΊ ΠΆΠ΅, позволяСт ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°. НапримСр, всС k Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½ ΠΈ Ρ‚ΠΎΡ‚ ΠΆΠ΅ класс, Ρ‚ΠΎ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ провСряСмый ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ‚Π°ΠΊΠΎΠΉ ΠΆΠ΅ класс, ΠΎΡ‡Π΅Π½ΡŒ высока.

Π‘Ρ€Π΅Π΄ΠΈ особСнностСй Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° стоит ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ ΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ ΠΊ Π°Π½ΠΎΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ выбросам, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ попадания Ρ‚Π°ΠΊΠΎΠΉ записи Π² Ρ‡ΠΈΡΠ»ΠΎ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй ΠΌΠ°Π»Π°. Если ΠΆΠ΅ это ΠΏΡ€ΠΎΠΈΠ·ΠΎΡˆΠ»ΠΎ, Ρ‚ΠΎ Π²Π»ΠΈΡΠ½ΠΈΠ΅ Π½Π° Π³ΠΎΠ»ΠΎΡΠΎΠ²Π°Π½ΠΈΠ΅ (особСнно взвСшСнноС) (ΠΏΡ€ΠΈ k>2) Ρ‚Π°ΠΊΠΆΠ΅, скорСС всСго, Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΌΠ°Π»Ρ‹ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ ΠΈ Π²Π»ΠΈΡΠ½ΠΈΠ΅ Π½Π° ΠΈΡ‚ΠΎΠ³ классификации. Π’Π°ΠΊΠΆΠ΅, прСимущСствами ΡΠ²Π»ΡΡŽΡ‚ΡΡ проста Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ, Π»Π΅Π³ΠΊΠΎΡΡ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΏΡƒΡ‚Ρ‘ΠΌ использования Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящих Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ сочСтания ΠΈ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, Ρ‡Ρ‚ΠΎ позволяСт ΠΏΠΎΠ΄ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠΎΠ΄ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ. Алгоритм KNN ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ ΠΈ Ρ€ΡΠ΄ΠΎΠΌ нСдостатков. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΉ для Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΌ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, модСль нСльзя ΠΎΡ‚Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΎΡ‚ Π΄Π°Π½Π½Ρ‹Ρ…: для классификации Π½ΠΎΠ²ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π½ΡƒΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ всС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹. Π­Ρ‚Π° ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒ сильно ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ использованиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

2.4 Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

Под Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠΌ «Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ» подразумСваСтся сСмСйство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², основанных Π½Π° ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠΈ классификационных ΠΏΡ€Π°Π²ΠΈΠ» Π² ΠΈΠ΅Ρ€Π°Ρ€Ρ…ичСской, ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ структурС. Π­Ρ‚ΠΎ самый популярный класс Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ….

БСмСйство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ позволяСт ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Π»ΠΈΠ±ΠΎ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° для Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ случая Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ большого количСства Π΄Π°Π½Π½Ρ‹Ρ… ΠΎ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… случаях. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ этого сСмСйства ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΡ… Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ всС исходныС Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ дискрСтных Π³Ρ€ΡƒΠΏΠΏ.

ΠŸΡ€ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΊ Π½Π°Π±ΠΎΡ€Ρƒ исходных Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ отобраТаСтся Π² Π²ΠΈΠ΄Π΅ Π΄Π΅Ρ€Π΅Π²Π°. ΠŸΠΎΠ΄ΠΎΠ±Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΎΡΡƒΡ‰Π΅ΡΡ‚Π²ΠΈΡ‚ΡŒ нСсколько ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ Ρ‚Π°ΠΊΠΎΠ³ΠΎ раздСлСния, разбивая ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹ (Π²Π΅Ρ‚Π²ΠΈ Π΄Π΅Ρ€Π΅Π²Π°) Π½Π° Π±ΠΎΠ»Π΅Π΅ ΠΌΠ΅Π»ΠΊΠΈΠ΅ Π½Π° ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΈΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ продолТаСтся Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° значСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ прСдполагаСтся ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ, Π½Π΅ ΡΡ‚Π°Π½ΡƒΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΌΠΈ (ΠΈΠ»ΠΈ, Π² ΡΠ»ΡƒΡ‡Π°Π΅ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠ³ΠΎ значСния прСдсказываСмого ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°, Π±Π»ΠΈΠ·ΠΊΠΈΠΌΠΈ) для всСх ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… Π³Ρ€ΡƒΠΏΠΏ (Π»ΠΈΡΡ‚ΡŒΠ΅Π² Π΄Π΅Ρ€Π΅Π²Π°). ИмСнно эти значСния ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ся для осущСствлСния прСдсказаний Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π΄Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ДСйствиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ базируСтся Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² рСгрСссионного ΠΈ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°. Один ΠΈΠ· ΡΠ°ΠΌΡ‹Ρ… популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² этого сСмСйства — CART (Classification and Regression Trees), основанный Π½Π° Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π²Π΅Ρ‚Π²ΠΈ Π΄Π΅Ρ€Π΅Π²Π° Π½Π° Π΄Π²Π΅ Π΄ΠΎΡ‡Π΅Ρ€Π½ΠΈΠ΅ Π²Π΅Ρ‚Π²ΠΈ; ΠΏΡ€ΠΈ этом дальнСйшСС Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ Π²Π΅Ρ‚Π²ΠΈ зависит ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, ΠΌΠ½ΠΎΠ³ΠΎ Π»ΠΈ исходных Π΄Π°Π½Π½Ρ‹Ρ… описываСт данная Π²Π΅Ρ‚Π²ΡŒ. НСкоторыС Π΄Ρ€ΡƒΠ³ΠΈΠ΅ сходныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π²Π΅Ρ‚Π²ΡŒ Π½Π° Π±ΠΎΠ»ΡŒΡˆΠ΅Π΅ количСство Π΄ΠΎΡ‡Π΅Ρ€Π½ΠΈΡ… Π²Π΅Ρ‚Π²Π΅ΠΉ. Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ производится Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ высокого для описываСмых Π²Π΅Ρ‚Π²ΡŒΡŽ Π΄Π°Π½Π½Ρ‹Ρ… коэффициСнта коррСляции ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠΌ, согласно ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ происходит Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅, ΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π² Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠ΅ΠΌ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ прСдсказан.

ΠŸΠΎΠΏΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° связана с Π½Π°Π³Π»ΡΠ΄Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈ ΠΏΠΎΠ½ΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ. Но Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΈΠ°Π»ΡŒΠ½ΠΎ Π½Π΅ ΡΠΏΠΎΡΠΎΠ±Π½Ρ‹ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ «Π»ΡƒΡ‡ΡˆΠΈΠ΅» (Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ»Π½Ρ‹Π΅ ΠΈ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅) ΠΏΡ€Π°Π²ΠΈΠ»Π° Π² Π΄Π°Π½Π½Ρ‹Ρ…. Они Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΡŽΡ‚ Π½Π°ΠΈΠ²Π½Ρ‹ΠΉ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ просмотра ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈ Π½Π°Ρ…одят фактичСски части настоящих закономСрностСй, создавая лишь иллюзию логичСского Π²Ρ‹Π²ΠΎΠ΄Π°.

2.5 Алгоритмы кластСризации

ΠšΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΡ — это Π·Π°Π΄Π°Ρ‡Π° разбиСния мноТСства ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ кластСрами. Π“Π»Π°Π²Π½ΠΎΠ΅ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ кластСризации ΠΎΡ‚ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠ΅Ρ€Π΅Ρ‡Π΅Π½ΡŒ Π³Ρ€ΡƒΠΏΠΏ Ρ‡Π΅Ρ‚ΠΊΠΎ Π½Π΅ Π·Π°Π΄Π°Π½ ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΠ΅Ρ‚ся Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ кластСрного Π°Π½Π°Π»ΠΈΠ·Π° Π² ΠΎΠ±Ρ‰Π΅ΠΌ Π²ΠΈΠ΄Π΅ сводится ΠΊ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ этапам:

Β· ΠΎΡ‚Π±ΠΎΡ€ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² для кластСризации;

Β· ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ мноТСства ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Π±ΡƒΠ΄ΡƒΡ‚ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. ΠŸΡ€ΠΈ нСобходимости — нормализация Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…;

Β· вычислСниС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΌΠ΅Ρ€Ρ‹ сходства ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ;

Β· ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° кластСрного Π°Π½Π°Π»ΠΈΠ·Π° для создания Π³Ρ€ΡƒΠΏΠΏ сходных ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² (кластСров);

Β· прСдставлСниС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π°Π½Π°Π»ΠΈΠ·Π°.

ПослС получСния ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Π° ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²ΠΊΠ° Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° кластСризации Π΄ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΡ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°.

Π‘Ρ€Π΅Π΄ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² кластСризации Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ иСрархичСскиС ΠΈ ΠΏΠ»ΠΎΡΠΊΠΈΠ΅ Π³Ρ€ΡƒΠΏΠΏΡ‹. Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ (Ρ‚Π°ΠΊΠΆΠ΅ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ таксономии) строят Π½Π΅ ΠΎΠ΄Π½ΠΎ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π° Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΠ΅ΡΡ кластСры, Π° ΡΠΈΡΡ‚Π΅ΠΌΡƒ Π²Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Ρ‹Ρ…ΠΎΠ΄ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° прСдставляСт собой Π΄Π΅Ρ€Π΅Π²ΠΎ кластСров, ΠΊΠΎΡ€Π½Π΅ΠΌ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ являСтся вся Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°, Π° Π»ΠΈΡΡ‚ΡŒΡΠΌΠΈ — Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΌΠ΅Π»ΠΊΠΈΠ΅ кластСры. ПлоскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ строят ΠΎΠ΄Π½ΠΎ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΠ΅ΡΡ ΠΌΠ΅ΠΆΠ΄Ρƒ собой кластСры.

Π•Ρ‰Π΅ ΠΎΠ΄Π½Π° классификация Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² кластСризации — Π½Π° Ρ‡Π΅Ρ‚ΠΊΠΈΠ΅ ΠΈ Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹. Π§Π΅Ρ‚ΠΊΠΈΠ΅ (ΠΈΠ»ΠΈ Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΠ΅ΡΡ) Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ставят Π² ΡΠΎΠΎΡ‚вСтствиС Π½ΠΎΠΌΠ΅Ρ€ кластСра, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ кластСру. НСчСткиС (ΠΈΠ»ΠΈ ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΠ΅ΡΡ) Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ ставят Π² ΡΠΎΠΎΡ‚вСтствиС Π½Π°Π±ΠΎΡ€ вСщСствСнных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ ΠΊΠ»Π°ΡΡ‚Π΅Ρ€Π°ΠΌ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ относится ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ кластСру с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ.

Π‘Ρ€Π΅Π΄ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² иСрархичСской кластСризации Π²Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ΡΡ Π΄Π²Π° основных Ρ‚ΠΈΠΏΠ°: восходящиС ΠΈ Π½ΠΈΡΡ…одящиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹. НисходящиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΠΎ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΡƒ «ΡΠ²Π΅Ρ€Ρ…Ρƒ-Π²Π½ΠΈΠ·»: Π²Π½Π°Ρ‡Π°Π»Π΅ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΏΠΎΠΌΠ΅Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΠΎΠ΄ΠΈΠ½ кластСр, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π·Π°Ρ‚Π΅ΠΌ разбиваСтся Π½Π° Π²ΡΠ΅ Π±ΠΎΠ»Π΅Π΅ ΠΌΠ΅Π»ΠΊΠΈΠ΅ кластСры. Π‘ΠΎΠ»Π΅Π΅ распространСны восходящиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² Π½Π°Ρ‡Π°Π»Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΠΎΠΌΠ΅Ρ‰Π°ΡŽΡ‚ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ кластСр, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ кластСры Π²ΠΎ Π²ΡΠ΅ Π±ΠΎΠ»Π΅Π΅ ΠΊΡ€ΡƒΠΏΠ½Ρ‹Π΅, ΠΏΠΎΠΊΠ° всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒΡΡ Π² ΠΎΠ΄Π½ΠΎΠΌ кластСрС. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, строится систСма Π²Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ‚Π°ΠΊΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Π² Π²ΠΈΠ΄Π΅ Π΄Π΅Ρ€Π΅Π²Π°.

К Π½Π΅Π΄ΠΎΡΡ‚Π°Ρ‚ΠΊΡƒ иСрархичСских Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ отнСсти систСму ΠΏΠΎΠ»Π½Ρ‹Ρ… Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ, которая ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠ²Π»ΡΡ‚ΡŒΡΡ излишнСй Π² ΠΊΠΎΠ½Ρ‚СкстС Ρ€Π΅ΡˆΠ°Π΅ΠΌΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ.

Рассмотрим Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ плоскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹. ΠŸΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΠ΅ срСди этого класса — Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠΉ ошибки. Π—Π°Π΄Π°Ρ‡Ρƒ кластСризации для этих Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ ΠΊΠ°ΠΊ построСниС ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ разбиСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹. ΠŸΡ€ΠΈ этом ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠ°ΠΊ Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ срСднСквадратичСской ошибки разбиСния:

Π³Π΄Π΅ cj — «Ρ†Π΅Π½Ρ‚Ρ€ масс» кластСра j (Ρ‚ΠΎΡ‡ΠΊΠ° со ΡΡ€Π΅Π΄Π½ΠΈΠΌΠΈ значСниями характСристик для Π΄Π°Π½Π½ΠΎΠ³ΠΎ кластСра).

Π‘Π°ΠΌΡ‹ΠΌ распространСнным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ этой ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ являСтся ΠΌΠ΅Ρ‚ΠΎΠ΄ k-срСдних. Π­Ρ‚ΠΎΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ строит Π·Π°Π΄Π°Π½Π½ΠΎΠ΅ число кластСров, располоТСнных ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ дальшС Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°. Π Π°Π±ΠΎΡ‚Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° дСлится Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ этапов:

1. Π‘Π»ΡƒΡ‡Π°ΠΉΠ½ΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ k Ρ‚ΠΎΡ‡Π΅ΠΊ, ΡΠ²Π»ΡΡŽΡ‰ΠΈΡ…ΡΡ Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ «Ρ†Π΅Π½Ρ‚Ρ€Π°ΠΌΠΈ масс» кластСров.

2. ΠžΡ‚Π½Π΅ΡΡ‚ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΊ ΠΊΠ»Π°ΡΡ‚Π΅Ρ€Ρƒ с Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΠΌ «Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΌ масс».

3. ΠŸΠ΅Ρ€Π΅ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ «Ρ†Π΅Π½Ρ‚Ρ€Ρ‹ масс» кластСров согласно ΠΈΡ… Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΌΡƒ составу.

4. Если ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ остановки Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π΅ ΡƒΠ΄ΠΎΠ²Π»Π΅Ρ‚Π²ΠΎΡ€Π΅Π½, Π²Π΅Ρ€Π½ΡƒΡ‚ΡŒΡΡ ΠΊ ΠΏ. 2.

Π’ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ критСрия остановки Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ минимальноС ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ срСднСквадратичСской ошибки. Π’Π°ΠΊ ΠΆΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Ρ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Ссли Π½Π° ΡˆΠ°Π³Π΅ 2 Π½Π΅ Π±Ρ‹Π»ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΏΠ΅Ρ€Π΅ΠΌΠ΅ΡΡ‚ΠΈΠ²ΡˆΠΈΡ…ΡΡ ΠΈΠ· ΠΊΠ»Π°ΡΡ‚Π΅Ρ€Π° Π² ΠΊΠ»Π°ΡΡ‚Π΅Ρ€. К Π½Π΅Π΄ΠΎΡΡ‚Π°Ρ‚ΠΊΠ°ΠΌ Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΌΠΎΠΆΠ½ΠΎ отнСсти Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π·Π°Π΄Π°Π²Π°Ρ‚ΡŒ количСство кластСров для разбиСния.

НаиболСС популярным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΎΠΉ кластСризации являСтся Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ c-срСдних (c-means). Он ΠΏΡ€Π΅Π΄ΡΡ‚авляСт собой ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° k-срСдних. Π¨Π°Π³ΠΈ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

1. Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ΅ Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΎΠ΅ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ n ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° k кластСров ΠΏΡƒΡ‚Π΅ΠΌ Π²Ρ‹Π±ΠΎΡ€Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ принадлСТности U Ρ€Π°Π·ΠΌΠ΅Ρ€Π° n x k.

2. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ U, Π½Π°ΠΉΡ‚ΠΈ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ критСрия Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΎΠΉ ошибки:

Π³Π΄Π΅ ck — «Ρ†Π΅Π½Ρ‚Ρ€ масс» Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΎΠ³ΠΎ кластСра k:

.

3. ΠŸΠ΅Ρ€Π΅Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ с Ρ†Π΅Π»ΡŒΡŽ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ этого значСния критСрия Π½Π΅Ρ‡Π΅Ρ‚ΠΊΠΎΠΉ ошибки.

4. Π’ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Ρ‚ΡŒΡΡ Π² ΠΏ. 2 Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° измСнСния ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ U Π½Π΅ ΡΡ‚Π°Π½ΡƒΡ‚ Π½Π΅Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ.

Π­Ρ‚ΠΎΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ ΠΏΠΎΠ΄ΠΎΠΉΡ‚ΠΈ, Ссли Π·Π°Ρ€Π°Π½Π΅Π΅ нСизвСстно число кластСров, Π»ΠΈΠ±ΠΎ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½ΠΎ отнСсти ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ кластСру.

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ Π³Ρ€ΡƒΠΏΠΏΠ° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² — Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, основанныС Π½Π° Ρ‚Π΅ΠΎΡ€ΠΈΠΈ Π³Ρ€Π°Ρ„ΠΎΠ². Π‘ΡƒΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² прСдставляСтся Π² Π²ΠΈΠ΄Π΅ Π³Ρ€Π°Ρ„Π° G=(V, E), Π²Π΅Ρ€ΡˆΠΈΠ½Π°ΠΌ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π° Ρ€Π΅Π±Ρ€Π° ΠΈΠΌΠ΅ΡŽΡ‚ вСс, Ρ€Π°Π²Π½Ρ‹ΠΉ «Ρ€Π°ΡΡΡ‚ΠΎΡΠ½ΠΈΡŽ» ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ. Достоинством Π³Ρ€Π°Ρ„ΠΎΠ²Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² кластСризации ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½Π°Π³Π»ΡΠ΄Π½ΠΎΡΡ‚ΡŒ, ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ простота Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ вносСния Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΡƒΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΠΎΠ²Π°Π½ΠΈΠΉ, основанныС Π½Π° Π³Π΅ΠΎΠΌΠ΅Ρ‚ричСских сообраТСниях. ΠžΡΠ½ΠΎΠ²Π½Ρ‹ΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ выдСлСния связных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ построСния минимального ΠΏΠΎΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ (остовного) Π΄Π΅Ρ€Π΅Π²Π° ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ послойной кластСризации.

Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ выдСлСния связных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ задаСтся Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ R ΠΈ Π² Π³Ρ€Π°Ρ„Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ всС Ρ€Π΅Π±Ρ€Π°, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… «Ρ€Π°ΡΡΡ‚ояния» мСньшС R. Π‘ΠΎΠ΅Π΄ΠΈΠ½Π΅Π½Π½Ρ‹ΠΌΠΈ ΠΎΡΡ‚Π°ΡŽΡ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π±Π»ΠΈΠ·ΠΊΠΈΠ΅ ΠΏΠ°Ρ€Ρ‹ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². Бмысл Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ R, Π»Π΅ΠΆΠ°Ρ‰Π΅Π΅ Π² Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ всСх «Ρ€Π°ΡΡΡ‚ояний», ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Π³Ρ€Π°Ρ„ «Ρ€Π°Π·Π²Π°Π»ΠΈΡ‚ся» Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΎ связных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ ΠΈ Π΅ΡΡ‚ΡŒ кластСры.

Для ΠΏΠΎΠ΄Π±ΠΎΡ€Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° R ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ строится гистограмма распрСдСлСний ΠΏΠΎΠΏΠ°Ρ€Π½Ρ‹Ρ… расстояний. Π’ Π·Π°Π΄Π°Ρ‡Π°Ρ… с Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½Π½ΠΎΠΉ кластСрной структурой Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Π³ΠΈΡΡ‚ΠΎΠ³Ρ€Π°ΠΌΠΌΠ΅ Π±ΡƒΠ΄Π΅Ρ‚ Π΄Π²Π° ΠΏΠΈΠΊΠ° — ΠΎΠ΄ΠΈΠ½ соотвСтствуСт внутрикластСрным расстояниям, Π²Ρ‚ΠΎΡ€ΠΎΠΉ — мСТкластСрным расстояния. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ R подбираСтся ΠΈΠ· Π·ΠΎΠ½Ρ‹ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ° ΠΌΠ΅ΠΆΠ΄Ρƒ этими ΠΏΠΈΠΊΠ°ΠΌΠΈ. ΠŸΡ€ΠΈ этом ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ количСством кластСров ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ ΠΏΠΎΡ€ΠΎΠ³Π° расстояния довольно Π·Π°Ρ‚Ρ€ΡƒΠ΄Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ.

Алгоритм минимального ΠΏΠΎΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ Π΄Π΅Ρ€Π΅Π²Π° сначала строит Π½Π° Π³Ρ€Π°Ρ„Π΅ минимальноС ΠΏΠΎΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰Π΅Π΅ Π΄Π΅Ρ€Π΅Π²ΠΎ, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ удаляСт Ρ€Π΅Π±Ρ€Π° с Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΠΈΠΌ вСсом. Алгоритм послойной кластСризации основан Π½Π° Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠΈ связных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ Π³Ρ€Π°Ρ„Π° Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ расстояний ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ (Π²Π΅Ρ€ΡˆΠΈΠ½Π°ΠΌΠΈ). Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ расстояния задаСтся ΠΏΠΎΡ€ΠΎΠ³ΠΎΠΌ расстояния c. НапримСр, Ссли расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ, Ρ‚ΠΎ .

Алгоритм послойной кластСризации Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅Ρ‚ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠ΄Π³Ρ€Π°Ρ„ΠΎΠ² Π³Ρ€Π°Ρ„Π° G, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Ρ€Π°ΠΆΠ°ΡŽΡ‚ иСрархичСскиС связи ΠΌΠ΅ΠΆΠ΄Ρƒ кластСрами:

Π³Π΄Π΅ Gt = (V, Et) — Π³Ρ€Π°Ρ„ Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ сt, ,

сt — t-Ρ‹ΠΉ ΠΏΠΎΡ€ΠΎΠ³ расстояния, m — количСство ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ,

G0 = (V, o), o — пустоС мноТСство Ρ€Π΅Π±Π΅Ρ€ Π³Ρ€Π°Ρ„Π°, ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΠΎΠ΅ ΠΏΡ€ΠΈ t0 = 1,

Gm = G, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π³Ρ€Π°Ρ„ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π±Π΅Π· ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΉ Π½Π° Ρ€Π°ΡΡΡ‚ояниС (Π΄Π»ΠΈΠ½Ρƒ Ρ€Π΅Π±Π΅Ρ€ Π³Ρ€Π°Ρ„Π°), ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ tm = 1.

ΠŸΠΎΡΡ€Π΅Π΄ΡΡ‚Π²ΠΎΠΌ измСнСния ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ² расстояния {с0, …, сm}, Π³Π΄Π΅ 0 = с0 < с1 < …< сm = 1, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π³Π»ΡƒΠ±ΠΈΠ½Ρƒ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ΠΈΠΈ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΡ‹Ρ… кластСров. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ послойной кластСризации способСн ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ плоскоС Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊ ΠΈ ΠΈΠ΅Ρ€Π°Ρ€Ρ…ичСскоС.

ΠšΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΡ позволяСт Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Ρ†Π΅Π»Π΅ΠΉ:

Β· ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… Π·Π° ΡΡ‡Π΅Ρ‚ выявлСния структурных Π³Ρ€ΡƒΠΏΠΏ. Π Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹ схоТих ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² позволяСт ΡƒΠΏΡ€ΠΎΡΡ‚ΠΈΡ‚ΡŒ Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΡƒΡŽ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€ΠΈΠ½ΡΡ‚ия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, примСняя ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ кластСру свой ΠΌΠ΅Ρ‚ΠΎΠ΄ Π°Π½Π°Π»ΠΈΠ·Π°;

Β· позволяСт ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½ΠΎ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅. Для этого вмСсто хранСния всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ Ρ‚ΠΈΠΏΠΈΡ‡Π½ΠΎΠΌΡƒ наблюдСнию ΠΈΠ· ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ кластСра;

Β· ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Π½ΠΎΠ²Ρ‹Ρ… Π½Π΅Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΠΏΠΎΠΏΠ°Π»ΠΈ Π½ΠΈ Π² ΠΎΠ΄ΠΈΠ½ кластСр.

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ, кластСризация ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΊΠ°ΠΊ Π²ΡΠΏΠΎΠΌΠΎΠ³Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

2.6 ГСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹

ГСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ относятся ΠΊ Ρ‡ΠΈΡΠ»Ρƒ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΡ… Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ Π·Π°Π΄Π°Ρ‡ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ‚ΠΈΠΏΠΎΠ² (ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ‚ΠΎΡ€Π½Ρ‹Π΅, ΠΎΠ±Ρ‰ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡΠΌΠΈ ΠΈ Π±Π΅Π· ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΉ) ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ стСпСни слоТности. ΠŸΡ€ΠΈ этом гСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΡŽΡ‚ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΊΠ°ΠΊ ΠΎΠ΄Π½ΠΎΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ, Ρ‚Π°ΠΊ ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ поиска Π² Π±ΠΎΠ»ΡŒΡˆΠΎΠΌ пространствС, Π»Π°Π½Π΄ΡˆΠ°Ρ„Ρ‚ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ являСтся Π½Π΅Π³Π»Π°Π΄ΠΊΠΈΠΌ.

Π­Ρ‚Π° Π³Ρ€ΡƒΠΏΠΏΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΉ процСсс ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠΉ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰ΠΈΠΉ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ ΠΎΡ‚Π±ΠΎΡ€Π°, ΠΌΡƒΡ‚Π°Ρ†ΠΈΠΈ ΠΈ ΡΠΊΡ€Π΅Ρ‰ΠΈΠ²Π°Π½ΠΈΡ. Π’ Π½Π°Ρ‡Π°Π»Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° популяция формируСтся случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. Для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства Π·Π°ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ приспособлСнности, которая Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠ° для вычислСния приспособлСнности ΠΊΠ°ΠΆΠ΄ΠΎΠΉ особи. По Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌ оцСнивания особСй Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ приспособлСнныС ΠΈΠ· Π½ΠΈΡ… Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ для скрСщивания. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ скрСщивания Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹Ρ… особСй посрСдством примСнСния гСнСтичСского ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π° кроссинговСра создаСтся потомство, гСнСтичСская информация ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ формируСтся Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΎΠ±ΠΌΠ΅Π½Π° хромосомной ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΡΠΊΠΈΠΌΠΈ особями. Π‘ΠΎΠ·Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡ‚ΠΎΠΌΠΊΠΈ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ Π½ΠΎΠ²ΡƒΡŽ ΠΏΠΎΠΏΡƒΠ»ΡΡ†ΠΈΡŽ, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ Ρ‡Π°ΡΡ‚ΡŒ ΠΏΠΎΡ‚ΠΎΠΌΠΊΠΎΠ² ΠΌΡƒΡ‚ΠΈΡ€ΡƒΠ΅Ρ‚, Ρ‡Ρ‚ΠΎ выраТаСтся Π² ΡΠ»ΡƒΡ‡Π°ΠΉΠ½ΠΎΠΌ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΈ ΠΈΡ… Π³Π΅Π½ΠΎΡ‚ΠΈΠΏΠΎΠ². Π­Ρ‚Π°ΠΏ, Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰ΠΈΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ «ΠžΡ†Π΅Π½ΠΈΠ²Π°Π½ΠΈΠ΅ популяции» — «Π‘СлСкция» — «Π‘ΠΊΡ€Π΅Ρ‰ΠΈΠ²Π°Π½ΠΈΠ΅» — «ΠœΡƒΡ‚ация», называСтся ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠ΅ΠΌ. Π­Π²ΠΎΠ»ΡŽΡ†ΠΈΡ популяции состоит ΠΈΠ· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ‚Π°ΠΊΠΈΡ… ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠΉ.

Π’Ρ‹Π΄Π΅Π»ΡΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΎΡ‚Π±ΠΎΡ€Π° особСй для скрСщивания:

Β· Панмиксия. ОбС особи, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ составят Ρ€ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΡΠΊΡƒΡŽ ΠΏΠ°Ρ€Ρƒ, случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ ΠΈΠ· Π²ΡΠ΅ΠΉ популяции. Π›ΡŽΠ±Π°Ρ особь ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ Ρ‡Π»Π΅Π½ΠΎΠΌ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΠ°Ρ€. Π”Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ унивСрсалСн, Π½ΠΎ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° сниТаСтся с Ρ€ΠΎΡΡ‚ΠΎΠΌ числСнности популяции.

Β· БСлСкция. РодитСлями ΠΌΠΎΠ³ΡƒΡ‚ ΡΡ‚Π°Ρ‚ΡŒ особи с ΠΏΡ€ΠΈΡΠΏΠΎΡΠΎΠ±Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ Π½Π΅ Π½ΠΈΠΆΠ΅ срСднСго. Π’Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ обСспСчиваСт Π±ΠΎΠ»Π΅Π΅ Π±Ρ‹ΡΡ‚Ρ€ΡƒΡŽ ΡΡ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

Β· Π˜Π½Π±Ρ€ΠΈΠ΄ΠΈΠ½Π³. ΠœΠ΅Ρ‚ΠΎΠ΄ построСн Π½Π° Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠ°Ρ€Ρ‹ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π±Π»ΠΈΠ·ΠΊΠΎΠ³ΠΎ родства. Под родством здСсь понимаСтся расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‡Π»Π΅Π½Π°ΠΌΠΈ популяции ΠΊΠ°ΠΊ Π² ΡΠΌΡ‹ΡΠ»Π΅ гСомСтричСского расстояния особСй Π² ΠΏΡ€ΠΎΡΡ‚ранствС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Ρ‚Π°ΠΊ ΠΈ Ρ…Π΅ΠΌΠΈΠ½Π³ΠΎΠ²ΠΎ расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ Π³Π΅Π½ΠΎΡ‚ΠΈΠΏΠ°ΠΌΠΈ. ΠŸΠΎΡ‚ΠΎΠΌΡƒ Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ Π³Π΅Π½ΠΎΡ‚ΠΈΠΏΠ½Ρ‹ΠΉ ΠΈ Ρ„Π΅Π½ΠΎΡ‚ΠΈΠΏΠ½Ρ‹ΠΉ ΠΈΠ½Π±Ρ€ΠΈΠ΄ΠΈΠ½Π³. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ Ρ‡Π»Π΅Π½ ΠΏΠ°Ρ€Ρ‹ для скрСщивания выбираСтся случайно, Π° Π²Ρ‚ΠΎΡ€Ρ‹ΠΌ с Π±ΠΎΠ»ΡŒΡˆΠ΅ΠΉ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ Π±ΡƒΠ΄Π΅Ρ‚ максимально близкая ΠΊ Π½Π΅ΠΌΡƒ особь. Π˜Π½Π±Ρ€ΠΈΠ΄ΠΈΠ½Π³ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ свойством ΠΊΠΎΠ½Ρ†Π΅Π½Ρ‚Ρ€Π°Ρ†ΠΈΠΈ поиска Π² Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… ΡƒΠ·Π»Π°Ρ…, Ρ‡Ρ‚ΠΎ фактичСски ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΡŽ популяции Π½Π° ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹ Π²ΠΎΠΊΡ€ΡƒΠ³ ΠΏΠΎΠ΄ΠΎΠ·Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π½Π° ΡΠΊΡΡ‚Ρ€Π΅ΠΌΡƒΠΌ участков Π»Π°Π½Π΄ΡˆΠ°Ρ„Ρ‚Π°.

Β· Аутбридинг. Π€ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠ°Ρ€Ρ‹ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ дальнСго родства, для максимально Π΄Π°Π»Π΅ΠΊΠΈΡ… особСй. Аутбридинг Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ Π½Π° ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ сходимости Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΊ ΡƒΠΆΠ΅ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹ΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΠΌ, заставляя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΡ€ΠΎΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅, нСисслСдованныС области.

Алгоритмы формирования Π½ΠΎΠ²ΠΎΠΉ популяции:

Β· ΠžΡ‚Π±ΠΎΡ€ с Π²Ρ‹Ρ‚СснСниСм. Из Π²ΡΠ΅Ρ… особСй с ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΌΠΈ Π³Π΅Π½ΠΎΡ‚ΠΈΠΏΠ°ΠΌΠΈ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚Π΅Π½ΠΈΠ΅ отдаСтся Ρ‚Π΅ΠΌ, Ρ‡ΡŒΡ ΠΏΡ€ΠΈΡΠΏΠΎΡΠΎΠ±Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒ Π²Ρ‹ΡˆΠ΅. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π΄ΠΎΡΡ‚ΠΈΠ³Π°ΡŽΡ‚ΡΡ Π΄Π²Π΅ Ρ†Π΅Π»ΠΈ: Π½Π΅ Ρ‚Π΅Ρ€ΡΡŽΡ‚ΡΡ Π»ΡƒΡ‡ΡˆΠΈΠ΅ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‰ΠΈΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ хромосомными Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ, Π² ΠΏΠΎΠΏΡƒΠ»ΡΡ†ΠΈΠΈ постоянно поддСрТиваСтся достаточноС гСнСтичСскоС Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅. ВытСснСниС Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅Ρ‚ Π½ΠΎΠ²ΡƒΡŽ ΠΏΠΎΠΏΡƒΠ»ΡΡ†ΠΈΡŽ ΠΈΠ· Π΄Π°Π»Π΅ΠΊΠΎ располоТСнных особСй, вмСсто особСй, Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ…ΡΡ ΠΎΠΊΠΎΠ»ΠΎ Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ Π½Π°ΠΉΠ΄Π΅Π½Π½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ для ΠΌΠ½ΠΎΠ³ΠΎΡΠΊΡΡ‚Ρ€Π΅ΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡.

Β· Π­Π»ΠΈΡ‚Π½Ρ‹ΠΉ ΠΎΡ‚Π±ΠΎΡ€. Π­Π»ΠΈΡ‚Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΎΡ‚Π±ΠΎΡ€Π° Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΡŽΡ‚, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΎΡ‚Π±ΠΎΡ€Π΅ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΡƒΠ΄ΡƒΡ‚ Π²Ρ‹ΠΆΠΈΠ²Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠ΅ Ρ‡Π»Π΅Π½Ρ‹ популяции. ΠŸΡ€ΠΈ этом Ρ‡Π°ΡΡ‚ΡŒ самых Π»ΡƒΡ‡ΡˆΠΈΡ… особСй Π±Π΅Π· ΠΊΠ°ΠΊΠΈΡ…-Π»ΠΈΠ±ΠΎ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅ ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠ΅. Быстрая ΡΡ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ, обСспСчиваСмая элитным ΠΎΡ‚Π±ΠΎΡ€ΠΎΠΌ, ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ компСнсирована подходящим ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ Π²Ρ‹Π±ΠΎΡ€Π° Ρ€ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΡΠΊΠΈΡ… ΠΏΠ°Ρ€. Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π°ΡƒΡ‚Π±Ρ€ΠΈΠ΄ΠΈΠ½Π³ΠΎΠΌ. ИмСнно такая комбинация «Π°ΡƒΡ‚Π±Ρ€ΠΈΠ΄ΠΈΠ½Π³ — элитный ΠΎΡ‚Π±ΠΎΡ€» являСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивной.

Β· Π’ΡƒΡ€Π½ΠΈΡ€Π½Ρ‹ΠΉ ΠΎΡ‚Π±ΠΎΡ€. Π’ΡƒΡ€Π½ΠΈΡ€Π½Ρ‹ΠΉ ΠΎΡ‚Π±ΠΎΡ€ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅Ρ‚ n Ρ‚ΡƒΡ€Π½ΠΈΡ€ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ n ΠΎΡΠΎΠ±Π΅ΠΉ. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Ρ‚ΡƒΡ€Π½ΠΈΡ€ построСн Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ k ΡΠ»Π΅ΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ· ΠΏΠΎΠΏΡƒΠ»ΡΡ†ΠΈΠΈ, ΠΈ Π²Ρ‹Π±ΠΎΡ€Π° Π»ΡƒΡ‡ΡˆΠ΅ΠΉ особи срСди Π½ΠΈΡ…. НаиболСС распространСн Ρ‚ΡƒΡ€Π½ΠΈΡ€Π½Ρ‹ΠΉ ΠΎΡ‚Π±ΠΎΡ€ с k = 2.

Одним ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ вострСбованных ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ гСнСтичСских Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π² ΠΎΠ±Π»Π°ΡΡ‚ΠΈ Data Mining являСтся поиск Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ (поиск Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π³ΠΎ спСцификС ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ области). ГСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π² ΠΏΠ΅Ρ€Π²ΡƒΡŽ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ‚ΠΎΠΏΠΎΠ»ΠΎΠ³ΠΈΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй ΠΈ Π²Π΅ΡΠΎΠ². Однако, ΠΈΡ… Ρ‚Π°ΠΊΠΆΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΊΠ°ΠΊ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ инструмСнт.

3. Π‘Ρ„Π΅Ρ€Ρ‹ примСнСния

ВСхнология Data Mining ΠΈΠΌΠ΅Π΅Ρ‚ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡˆΠΈΡ€ΠΎΠΊΠΈΠΉ спСктр примСнСния, являясь, ΠΏΠΎ ΡΡƒΡ‚ΠΈ, Π½Π°Π±ΠΎΡ€ΠΎΠΌ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹Ρ… инструмСнтов для Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… любого Ρ‚ΠΈΠΏΠ°.

ΠœΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³ Одной ΠΈΠ· ΡΠ°ΠΌΡ‹Ρ… ΠΏΠ΅Ρ€Π²Ρ‹Ρ… сфСр, Π³Π΄Π΅ Π±Ρ‹Π»ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½Ρ‹ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π±Ρ‹Π»Π° сфСра ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π°. Π—Π°Π΄Π°Ρ‡Π°, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π½Π°Ρ‡Π°Π»ΠΎΡΡŒ Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Data Mining, называСтся Π°Π½Π°Π»ΠΈΠ· ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠΉ ΠΊΠΎΡ€Π·ΠΈΠ½Ρ‹.

Данная Π·Π°Π΄Π°Ρ‡Π° состоит Π² Π²Ρ‹ΡΠ²Π»Π΅Π½ΠΈΠΈ Ρ‚ΠΎΠ²Π°Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΠΈ стрСмятся ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°Ρ‚ΡŒ вмСстС. Π—Π½Π°Π½ΠΈΠ΅ ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠΉ ΠΊΠΎΡ€Π·ΠΈΠ½Ρ‹ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ для провСдСния Ρ€Π΅ΠΊΠ»Π°ΠΌΠ½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΉ, Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ покупатСлям, Π²Ρ‹Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ стратСгии создания запасов Ρ‚ΠΎΠ²Π°Ρ€ΠΎΠ² ΠΈ ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² ΠΈΡ… Ρ€Π°ΡΠΊΠ»Π°Π΄ΠΊΠΈ Π² Ρ‚ΠΎΡ€Π³ΠΎΠ²Ρ‹Ρ… Π·Π°Π»Π°Ρ….

Π’Π°ΠΊΠΆΠ΅ Π² ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π΅ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ, ΠΊΠ°ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Π°ΡƒΠ΄ΠΈΡ‚ΠΎΡ€ΠΈΠΈ Ρ‚ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π° для Π±ΠΎΠ»Π΅Π΅ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΠ³ΠΎ Π΅Π³ΠΎ продвиТСния; исслСдованиС Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… шаблонов, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ прСдприятиям ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎ ΡΠΎΠ·Π΄Π°Π½ΠΈΠΈ Ρ‚ΠΎΠ²Π°Ρ€Π½Ρ‹Ρ… запасов; созданиС ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Ρ‡Ρ‚ΠΎ Π΄Π°Π΅Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ прСдприятиям ΡƒΠ·Π½Π°Π²Π°Ρ‚ΡŒ Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ потрСбностСй Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² с ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ΠΌ; ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π»ΠΎΡΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°, Ρ‡Ρ‚ΠΎ позволяСт Π·Π°Π±Π»Π°Π³ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ ΠΌΠΎΠΌΠ΅Π½Ρ‚ ΡƒΡ…ΠΎΠ΄Π° ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π° ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΅Π³ΠΎ повСдСния ΠΈ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ ΠΏΠΎΡ‚Π΅Ρ€ΡŽ Ρ†Π΅Π½Π½ΠΎΠ³ΠΎ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°.

ΠŸΡ€ΠΎΠΌΡ‹ΡˆΠ»Π΅Π½Π½ΠΎΡΡ‚ΡŒ Одним ΠΈΠ· Π²Π°ΠΆΠ½Ρ‹Ρ… Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΉ Π² ΡΡ‚ΠΎΠΉ сфСрС являСтся ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ ΠΈ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ качСства, Π³Π΄Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ срСдств Π°Π½Π°Π»ΠΈΠ·Π° Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π²Ρ‹Ρ…ΠΎΠ΄ оборудования ΠΈΠ· ΡΡ‚роя, появлСниС нСисправностСй, ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅ΠΌΠΎΠ½Ρ‚Π½Ρ‹Π΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹. ΠŸΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ популярности ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… характСристик ΠΈ Π·Π½Π°Π½ΠΈΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊΠΈΠ΅ характСристики ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π·Π°ΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ вмСстС ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ производство, ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π³ΠΎ Π½Π° Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅ потрСбности ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΈΡ‚Π΅Π»Π΅ΠΉ.

ΠœΠ΅Π΄ΠΈΡ†ΠΈΠ½Π° Π’ ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Π΅ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚Π°ΠΊΠΆΠ΅ примСняСтся довольно ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ Π·Π°Π΄Π°Ρ‡ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠ»ΡƒΠΆΠΈΡ‚ΡŒ Π°Π½Π°Π»ΠΈΠ· Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² обслСдований, диагностика, сравнСниС эффСктивности ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² лСчСния ΠΈ Π»Π΅ΠΊΠ°Ρ€ΡΡ‚Π², Π°Π½Π°Π»ΠΈΠ· Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ ΠΈ ΠΈΡ… Ρ€Π°ΡΠΏΡ€ΠΎΡΡ‚ранСния, выявлСниС ΠΏΠΎΠ±ΠΎΡ‡Π½Ρ‹Ρ… эффСктов. Π’Π°ΠΊΠΈΠ΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Data Mining, ΠΊΠ°ΠΊ ассоциативныС ΠΏΡ€Π°Π²ΠΈΠ»Π° ΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΡˆΠ°Π±Π»ΠΎΠ½Ρ‹, ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ выявлСнии связСй ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΈΠ΅ΠΌΠΎΠΌ ΠΏΡ€Π΅ΠΏΠ°Ρ€Π°Ρ‚ΠΎΠ² ΠΈ ΠΏΠΎΠ±ΠΎΡ‡Π½Ρ‹ΠΌΠΈ эффСктами.

ΠœΠΎΠ»Π΅ΠΊΡƒΠ»ΡΡ€Π½Π°Ρ Π³Π΅Π½Π΅Ρ‚ΠΈΠΊΠ° ΠΈ Π³Π΅Π½Π½Π°Ρ инТСнСрия ΠŸΠΎΠΆΠ°Π»ΡƒΠΉ, Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ остро ΠΈ Π²ΠΌΠ΅ΡΡ‚Π΅ с Ρ‚Π΅ΠΌ Ρ‡Π΅Ρ‚ΠΊΠΎ Π·Π°Π΄Π°Ρ‡Π° обнаруТСния закономСрностСй Π² ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… стоит Π² ΠΌΠΎΠ»Π΅ΠΊΡƒΠ»ΡΡ€Π½ΠΎΠΉ Π³Π΅Π½Π΅Ρ‚ΠΈΠΊΠ΅ ΠΈ Π³Π΅Π½Π½ΠΎΠΉ ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€ΠΈΠΈ. Π—Π΄Π΅ΡΡŒ ΠΎΠ½Π° формулируСтся ΠΊΠ°ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΌΠ°Ρ€ΠΊΠ΅Ρ€ΠΎΠ², ΠΏΠΎΠ΄ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡŽΡ‚ гСнСтичСскиС ΠΊΠΎΠ΄Ρ‹, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Ρ‚Π΅ ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Π΅ фСнотипичСскиС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ ΠΆΠΈΠ²ΠΎΠ³ΠΎ ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΌΠ°. Π’Π°ΠΊΠΈΠ΅ ΠΊΠΎΠ΄Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ сотни, тысячи ΠΈ Π±ΠΎΠ»Π΅Π΅ связанных элСмСнтов. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ аналитичСского Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚Π°ΠΊΠΆΠ΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ обнаруТСнная ΡƒΡ‡Π΅Π½Ρ‹ΠΌΠΈ-Π³Π΅Π½Π΅Ρ‚ΠΈΠΊΠ°ΠΌΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ измСнСниями Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π”ΠΠš Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° ΠΈ Ρ€ΠΈΡΠΊΠΎΠΌ развития Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ.

ΠŸΡ€ΠΈΠΊΠ»Π°Π΄Π½Π°Ρ химия ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining находят ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΈ Π² ΠΎΠ±Π»Π°ΡΡ‚ΠΈ ΠΏΡ€ΠΈΠΊΠ»Π°Π΄Π½ΠΎΠΉ Ρ…ΠΈΠΌΠΈΠΈ. Π—Π΄Π΅ΡΡŒ Π½Π΅Ρ€Π΅Π΄ΠΊΠΎ Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚ вопрос ΠΎ Π²Ρ‹ΡΡΠ½Π΅Π½ΠΈΠΈ особСнностСй химичСского строСния Ρ‚Π΅Ρ… ΠΈΠ»ΠΈ ΠΈΠ½Ρ‹Ρ… соСдинСний, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΡ… ΠΈΡ… ΡΠ²ΠΎΠΉΡΡ‚Π²Π°. ОсобСнно Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Π° такая Π·Π°Π΄Π°Ρ‡Π° ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ слоТных химичСских соСдинСний, описаниС ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ сотни ΠΈ Ρ‚ысячи структурных элСмСнтов ΠΈ ΠΈΡ… ΡΠ²ΡΠ·Π΅ΠΉ.

Π‘ΠΎΡ€ΡŒΠ±Π° с ΠΏΡ€Π΅ΡΡ‚ΡƒΠΏΠ½ΠΎΡΡ‚ΡŒΡŽ Π’ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡Π΅Π½ΠΈΠΈ бСзопасности срСдства Data Mining ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅Π΄Π°Π²Π½ΠΎ, ΠΎΠ΄Π½Π°ΠΊΠΎ Π² Π½Π°ΡΡ‚оящСС врСмя ΡƒΠΆΠ΅ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Ρ‹ практичСскиС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‰ΠΈΠ΅ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… Π² ΡΡ‚ΠΎΠΉ области. ШвСйцарскими ΡƒΡ‡Π΅Π½Ρ‹ΠΌΠΈ Π±Ρ‹Π»ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ систСма Π°Π½Π°Π»ΠΈΠ·Π° протСстной активности с Ρ†Π΅Π»ΡŒΡŽ прогнозирования Π±ΡƒΠ΄ΡƒΡ‰ΠΈΡ… ΠΈΠ½Ρ†ΠΈΠ΄Π΅Π½Ρ‚ΠΎΠ² ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΠ° отслСТиваниС Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‰ΠΈΡ… ΠΊΠΈΠ±Π΅Ρ€ΡƒΠ³Ρ€ΠΎΠ· ΠΈ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΠΉ Ρ…Π°ΠΊΠ΅Ρ€ΠΎΠ² Π² ΠΌΠΈΡ€Π΅. ПослСдняя систСма позволяСт ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊΠΈΠ±Π΅Ρ€ΡƒΠ³Ρ€ΠΎΠ·Ρ‹ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ риски ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ бСзопасности. Π’Π°ΠΊΠΆΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для выявлСния ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π° с ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ ΠΊΠ°Ρ€Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ. ΠŸΡƒΡ‚Π΅ΠΌ Π°Π½Π°Π»ΠΈΠ·Π° ΠΏΡ€ΠΎΡˆΠ»Ρ‹Ρ… Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ впослСдствии оказались ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΠΌΠΈ, Π±Π°Π½ΠΊ выявляСт Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ стСрСотипы Ρ‚Π°ΠΊΠΎΠ³ΠΎ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π°.

Π”Ρ€ΡƒΠ³ΠΈΠ΅ прилоТСния

Β· Анализ риска. НапримСр, ΠΏΡƒΡ‚Π΅ΠΌ выявлСния сочСтаний Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ², связанных с ΠΎΠΏΠ»Π°Ρ‡Π΅Π½Π½Ρ‹ΠΌΠΈ заявлСниями, страховщики ΠΌΠΎΠ³ΡƒΡ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ свои ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΏΠΎ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π²Π°ΠΌ. Π˜Π·Π²Π΅ΡΡ‚Π΅Π½ случай, ΠΊΠΎΠ³Π΄Π° Π² Π‘ША крупная страховая компания ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ»Π°, Ρ‡Ρ‚ΠΎ суммы, Π²Ρ‹ΠΏΠ»Π°Ρ‡Π΅Π½Π½Ρ‹Π΅ ΠΏΠΎ Π·Π°ΡΠ²Π»Π΅Π½ΠΈΡΠΌ людСй, состоящих Π² Π±Ρ€Π°ΠΊΠ΅, Π²Π΄Π²ΠΎΠ΅ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ суммы ΠΏΠΎ Π·Π°ΡΠ²Π»Π΅Π½ΠΈΡΠΌ ΠΎΠ΄ΠΈΠ½ΠΎΠΊΠΈΡ… людСй. Компания ΠΎΡ‚Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Π»Π° Π½Π° ΡΡ‚ΠΎ Π½ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Π½ΠΈΠ΅ пСрСсмотром своСй ΠΎΠ±Ρ‰Π΅ΠΉ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ прСдоставлСния скидок сСмСйным ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌ.

Β· ΠœΠ΅Ρ‚Π΅ΠΎΡ€ΠΎΠ»ΠΎΠ³ΠΈΡ. ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅ ΠΏΠΎΠ³ΠΎΠ΄Ρ‹ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй, Π² Ρ‡Π°ΡΡ‚ности ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΡΠ°ΠΌΠΎΠΎΡ€Π³Π°Π½ΠΈΠ·ΡƒΡŽΡ‰ΠΈΠ΅ΡΡ ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠšΠΎΡ…ΠΎΠ½Π΅Π½Π°.

Β· ΠšΠ°Π΄Ρ€ΠΎΠ²Π°Ρ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠ°. БрСдства Π°Π½Π°Π»ΠΈΠ·Π° ΠΏΠΎΠΌΠΎΠ³Π°ΡŽΡ‚ слуТбам ΠΏΠΎ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡŽ пСрсоналом ΠΎΡ‚Π±ΠΈΡ€Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡƒΠ΄Π°Ρ‡Π½Ρ‹Ρ… ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΡ… Ρ€Π΅Π·ΡŽΠΌΠ΅, ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ характСристики ΠΈΠ΄Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… сотрудников для Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ долТности.

4. ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΠΈ срСдств Data Mining

БрСдства Data Mining Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎ относятся ΠΊ Π΄ΠΎΡ€ΠΎΠ³ΠΎΡΡ‚оящим ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹ΠΌ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π°ΠΌ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π΄ΠΎ Π½Π΅Π΄Π°Π²Π½Π΅Π³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ основными потрСбитСлями этой Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π±Ρ‹Π»ΠΈ Π±Π°Π½ΠΊΠΈ, финансовыС ΠΈ ΡΡ‚Ρ€Π°Ρ…ΠΎΠ²Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ, ΠΊΡ€ΡƒΠΏΠ½Ρ‹Π΅ Ρ‚ΠΎΡ€Π³ΠΎΠ²Ρ‹Π΅ прСдприятия, Π° ΠΎΡΠ½ΠΎΠ²Π½Ρ‹ΠΌΠΈ Π·Π°Π΄Π°Ρ‡Π°ΠΌΠΈ, Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‰ΠΈΠΌΠΈ примСнСния Data Mining, ΡΡ‡ΠΈΡ‚Π°Π»ΠΈΡΡŒ ΠΎΡ†Π΅Π½ΠΊΠ° ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹Ρ… ΠΈ ΡΡ‚Ρ€Π°Ρ…ΠΎΠ²Ρ‹Ρ… рисков ΠΈ Π²Ρ‹Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³ΠΎΠ²ΠΎΠΉ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ, Ρ‚Π°Ρ€ΠΈΡ„Π½Ρ‹Ρ… ΠΏΠ»Π°Π½ΠΎΠ² ΠΈ ΠΈΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΎΠ² Ρ€Π°Π±ΠΎΡ‚Ρ‹ с ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌΠΈ. Π’ ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π³ΠΎΠ΄Ρ‹ ситуация ΠΏΡ€Π΅Ρ‚Π΅Ρ€ΠΏΠ΅Π»Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ измСнСния: Π½Π° Ρ€Ρ‹Π½ΠΊΠ΅ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ³ΠΎ обСспСчСния появились ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅Π΄ΠΎΡ€ΠΎΠ³ΠΈΠ΅ инструмСнты Data Mining ΠΈ Π΄Π°ΠΆΠ΅ систСмы с ΡΠ²ΠΎΠ±ΠΎΠ΄Π½Ρ‹ΠΌ распространСниСм, Ρ‡Ρ‚ΠΎ сдСлало доступной эту Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΡŽ для прСдприятий ΠΌΠ°Π»ΠΎΠ³ΠΎ ΠΈ ΡΡ€Π΅Π΄Π½Π΅Π³ΠΎ бизнСса.

Π‘Ρ€Π΅Π΄ΠΈ ΠΏΠ»Π°Ρ‚Π½Ρ‹Ρ… инструмСнтов ΠΈ ΡΠΈΡΡ‚Π΅ΠΌ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… Π»ΠΈΠ΄Π΅Ρ€Π°ΠΌΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ SAS Institute (SAS Enterprise Miner), SPSS (SPSS, Clementine) ΠΈ StatSoft (STATISTICA Data Miner). Достаточно извСстными ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎΡ‚ Angoss (Angoss KnowledgeSTUDIO), IBM (IBM SPSS Modeler), Microsoft (Microsoft Analysis Services) ΠΈ (Oracle) Oracle Data Mining.

Π’Ρ‹Π±ΠΎΡ€ свободного ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ³ΠΎ обСспСчСния Ρ‚Π°ΠΊΠΆΠ΅ отличаСтся Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ΠΌ. Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΊΠ°ΠΊ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹Π΅ срСдства Π°Π½Π°Π»ΠΈΠ·Π°, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ JHepWork, KNIME, Orange, RapidMiner, Ρ‚Π°ΠΊ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ срСдства, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Carrot2 — фрэймворк для кластСризации тСкстовых Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² поисковых запросов, Chemicalize.org — Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π² ΠΎΠ±Π»Π°ΡΡ‚ΠΈ ΠΏΡ€ΠΈΠΊΠ»Π°Π΄Π½ΠΎΠΉ Ρ…ΠΈΠΌΠΈΠΈ, NLTK (Natural Language Toolkit) инструмСнт для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ СстСствСнного языка (natural language processing).

5. ΠšΡ€ΠΈΡ‚ΠΈΠΊΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ²

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Data Mining Π² Π±ΠΎΠ»ΡŒΡˆΠΎΠΉ ΠΌΠ΅Ρ€Π΅ зависят ΠΎΡ‚ ΡƒΡ€ΠΎΠ²Π½Ρ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π½Π΅ ΠΎΡ‚ «Ρ‡ΡƒΠ΄Π΅ΡΠ½Ρ‹Ρ… возмоТностСй» Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈΠ»ΠΈ Π½Π°Π±ΠΎΡ€Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². Около 75% Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π°Π΄ Data Mining состоит Π² ΡΠ±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Π΅Ρ‚ΡΡ Π΅Ρ‰Π΅ Π΄ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ инструмСнтов Π°Π½Π°Π»ΠΈΠ·Π°. НСграмотноС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ инструмСнтов, ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Ρ‚ ΠΊ Π±Π΅ΡΡΠΌΡ‹ΡΠ»Π΅Π½Π½ΠΎΠΉ Ρ‚Ρ€Π°Ρ‚Π΅ ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»Π° ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ, Π° ΠΈΠ½ΠΎΠ³Π΄Π° ΠΈ ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² Π΄ΠΎΠ»Π»Π°Ρ€ΠΎΠ².

МнСниС Π₯Π΅Ρ€Π±Π° Π­Π΄Π΅Π»ΡŒΡˆΡ‚Π°ΠΉΠ½Π° (Herb Edelstein), извСстного Π² ΠΌΠΈΡ€Π΅ экспСрта Π² ΠΎΠ±Π»Π°ΡΡ‚ΠΈ Data Mining, Π₯Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ CRM: «ΠΠ΅Π΄Π°Π²Π½Π΅Π΅ исслСдованиС ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Two Crows ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ Data Mining находится всС Π΅Ρ‰Π΅ Π½Π° Ρ€Π°Π½Π½Π΅ΠΉ стадии развития. МногиС ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‚ΡΡ этой Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠ΅ΠΉ, Π½ΠΎ Π»ΠΈΡˆΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π²Π½Π΅Π΄Ρ€ΡΡŽΡ‚ Ρ‚Π°ΠΊΠΈΠ΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹. Удалось Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ Π΅Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ Π²Π°ΠΆΠ½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚: процСсс Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Data Mining Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ оказываСтся Π±ΠΎΠ»Π΅Π΅ слоТным, Ρ‡Π΅ΠΌ оТидаСтся.

IT-ΠΊΠΎΠΌΠ°Π½Π΄Ρ‹ ΡƒΠ²Π»Π΅ΠΊΠ»ΠΈΡΡŒ ΠΌΠΈΡ„ΠΎΠΌ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ срСдства Data Mining просты Π² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠΈ. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ достаточно Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΠΎΠΉ инструмСнт Π½Π° Ρ‚Π΅Ρ€Π°Π±Π°ΠΉΡ‚Π½ΠΎΠΉ Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈ ΠΌΠΎΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎ появится полСзная информация. На ΡΠ°ΠΌΠΎΠΌ Π΄Π΅Π»Π΅, ΡƒΡΠΏΠ΅ΡˆΠ½Ρ‹ΠΉ Data Mining ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ понимания сути Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, знания Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Π° Ρ‚Π°ΠΊΠΆΠ΅ процСсса Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…". Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΡŽ Data Mining, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ограничСния, Π½Π°ΠΊΠ»Π°Π΄Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ, ΠΈ ΡΠ²ΡΠ·Π°Π½Π½Ρ‹Π΅ с Π½Π΅ΠΉ критичСскиС вопросы, Π° Ρ‚Π°ΠΊΠΆΠ΅ Ρ‚Ρ€Π΅Π·Π²ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ возмоТности Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. К ΠΊΡ€ΠΈΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠΌ вопросам относятся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅:

1. ВСхнология Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ Π½Π° Π²ΠΎΠΏΡ€ΠΎΡΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ Π±Ρ‹Π»ΠΈ Π·Π°Π΄Π°Π½Ρ‹. Она Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ°, Π° Π²ΡΠ΅Π³ΠΎ лишь Π΄Π°Π΅Ρ‚ Π΅ΠΌΡƒ ΠΌΠΎΡ‰Π½Ρ‹ΠΉ инструмСнт для облСгчСния ΠΈ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ Π΅Π³ΠΎ Ρ€Π°Π±ΠΎΡ‚Ρ‹.

2. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈ ΡΠΊΡΠΏΠ»ΡƒΠ°Ρ‚Π°Ρ†ΠΈΠΈ прилоТСния Data Mining.

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ данная тСхнология являСтся ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠ΄ΠΈΡΡ†ΠΈΠΏΠ»ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ ΠΎΠ±Π»Π°ΡΡ‚ΡŒΡŽ, для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ прилоТСния, Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ Data Mining, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π·Π°Π΄Π΅ΠΉΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ спСциалистов ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… областСй, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΡ‚ΡŒ ΠΈΡ… ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅Π½Π½ΠΎΠ΅ взаимодСйствиС.

3. ΠšΠ²Π°Π»ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ.

Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ инструмСнты Data Mining ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΡƒΡŽ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ «Π΄Ρ€ΡƒΠΆΠ΅Π»ΡŽΠ±Π½ΠΎΡΡ‚ΠΈ» интСрфСйса ΠΈ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΠΊΠ²Π°Π»ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ обСспСчСниС Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΡƒΡ€ΠΎΠ²Π½ΡŽ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ. ИспользованиС Data Mining Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ Π½Π΅Ρ€Π°Π·Ρ€Ρ‹Π²Π½ΠΎ связано с ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠ΅ΠΌ ΠΊΠ²Π°Π»ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ. Однако спСциалистов ΠΏΠΎ Data Mining, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹ Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Π»ΠΈΡΡŒ Π² Π±ΠΈΠ·Π½Π΅Ρ-процСссах, Π² Π½Π°ΡΡ‚оящСС врСмя ΠΌΠ°Π»ΠΎ.

4. Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… свСдСний Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π±Π΅Π· Ρ…ΠΎΡ€ΠΎΡˆΠ΅Π³ΠΎ понимания сути Π΄Π°Π½Π½Ρ‹Ρ….

НСобходим Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π²Ρ‹Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΈΠ½Ρ‚СрпрСтация зависимостСй ΠΈΠ»ΠΈ шаблонов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½Ρ‹. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Ρ€Π°Π±ΠΎΡ‚Π° с Ρ‚Π°ΠΊΠΈΠΌΠΈ срСдствами Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ тСсного сотрудничСства ΠΌΠ΅ΠΆΠ΄Ρƒ экспСртом Π² ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области ΠΈ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΠΈΡΡ‚ΠΎΠΌ ΠΏΠΎ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°ΠΌ Data Mining. ΠŸΠΎΡΡ‚ΠΎΠ΅Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Π³Ρ€Π°ΠΌΠΎΡ‚Π½ΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π² Π±ΠΈΠ·Π½Π΅Ρ-процСссы для возмоТности ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅Π΅ врСмя систСмы Data Mining ΠΏΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ Ρ‡Π°ΡΡ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰ Π΄Π°Π½Π½Ρ‹Ρ….

5. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

Π£ΡΠΏΠ΅ΡˆΠ½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ качСствСнной ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. По ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π΅Π½ΠΈΡŽ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΎΠ² ΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…, процСсс ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°Π½ΡΡ‚ΡŒ Π΄ΠΎ 80% ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ΠΎΠ² всСго Data Mining-процСсса.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ тСхнология Ρ€Π°Π±ΠΎΡ‚Π°Π»Π° Π½Π° ΡΠ΅Π±Ρ, потрСбуСтся ΠΌΠ½ΠΎΠ³ΠΎ усилий ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ уходят Π½Π° ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ…, Π²Ρ‹Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π΅Π΅ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²ΠΊΡƒ.

6. Π‘ΠΎΠ»ΡŒΡˆΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Π»ΠΎΠΆΠ½Ρ‹Ρ…, нСдостовСрных ΠΈΠ»ΠΈ бСсполСзных Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ².

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ Data Mining ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚Ρ‹ΡΠΊΠΈΠ²Π°Ρ‚ΡŒ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ Ρ†Π΅Π½Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ, которая ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ прСимущСство ΠΏΡ€ΠΈ дальнСйшСм ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ, ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ, принятии Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. Однако, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Data Mining, достаточно часто содСрТат Π»ΠΎΠΆΠ½Ρ‹Π΅ ΠΈ Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ смысла Π²Ρ‹Π²ΠΎΠ΄Ρ‹. МногиС спСциалисты ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ Data Mining-инструмСнты ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹Π΄Π°Π²Π°Ρ‚ΡŒ ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ количСство статистичСски нСдостовСрных Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ². Π§Ρ‚ΠΎΠ±Ρ‹ ΡΠ½ΠΈΠ·ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Ρ‚Π°ΠΊΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ², Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠ° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° адСкватности ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° Ρ‚Сстовых Π΄Π°Π½Π½Ρ‹Ρ…. Однако ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ Π»ΠΎΠΆΠ½Ρ‹Ρ… Π²Ρ‹Π²ΠΎΠ΄ΠΎΠ² Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ.

7. Высокая ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ.

ΠšΠ°Ρ‡Π΅ΡΡ‚Π²Π΅Π½Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹ΠΉ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ являСтся Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ‚Ρ€ΡƒΠ΄ΠΎΠ·Π°Ρ‚Ρ€Π°Ρ‚ со ΡΡ‚ΠΎΡ€ΠΎΠ½Ρ‹ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ обСспСчСниС Data Mining Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎ относятся ΠΊ Π΄ΠΎΡ€ΠΎΠ³ΠΎΡΡ‚оящим ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹ΠΌ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π°ΠΌ.

8. НаличиС достаточного количСства Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ….

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹ Data Mining, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ΡΡ‚атистичСских, тСорСтичСски Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ наличия строго ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ количСства рСтроспСктивных Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚Π° ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΡ‡ΠΈΠ½ΠΎΠΉ обнаруТСния нСдостовСрных, Π»ΠΎΠΆΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ, ΠΊΠ°ΠΊ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, принятия Π½Π° ΠΈΡ… ΠΎΡΠ½ΠΎΠ²Π΅ Π½Π΅Π²Π΅Ρ€Π½Ρ‹Ρ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. НСобходимо ΠΎΡΡƒΡ‰Π΅ΡΡ‚Π²Π»ΡΡ‚ΡŒ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ статистичСской значимости ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π½Π°Π½ΠΈΠΉ.

нСйросСтСвой Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ кластСризация Π΄Π°Π½Π½Ρ‹Π΅ mining

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π’ Π°Π½Π°Π»ΠΈΡ‚ичСском ΠΎΠ±Π·ΠΎΡ€Π΅ рассмотрСны основныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Data Mining, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π²Ρ‹Π²ΠΎΠ΄ ассоциативных ΠΏΡ€Π°Π²ΠΈΠ», нСйросСтСвыС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ блиТайшСго сосСда ΠΈ k-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй, Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ кластСризации, гСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹. Π‘Ρ‹Π»ΠΈ описаны ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ этапы процСсса ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ систСм ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°, Π° Ρ‚Π°ΠΊΠΆΠ΅ освСщСны ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΠΈ Ρ‚Π°ΠΊΠΈΡ… систСм.

Π”Π°Π½Π° краткая характСристика сфСр примСнСния ΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° ΠΊΡ€ΠΈΡ‚ΠΈΠΊΠ° Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Data Mining ΠΈ ΠΌΠ½Π΅Π½ΠΈΠ΅ экспСртов Π² ΡΡ‚ΠΎΠΉ области.

Бписок Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

1. Han and Micheline Kamber. Data Mining: Concepts and Techniques. Second Edition. — University of Illinois at Urbana-Champaign

2. Berry, Michael J. A. Data mining techniques: for marketing, sales, and customer relationship management — 2nd ed.

3. Siu Nin Lam. Discovering Association Rules in Data Mining. — Department of Computer Science University of Illinois at Urbana-Champaign

4. Π”ΡŽΠΊ Π’. А., Π‘Π°ΠΌΠΎΠΉΠ»Π΅Π½ΠΊΠΎ А. П. Data Mining: ΡƒΡ‡Π΅Π±Π½Ρ‹ΠΉ курс. — Π‘Пб.: ΠŸΠΈΡ‚Π΅Ρ€, 2001

5. Π”Π°Π΄ΠΈΠΌ слово ΠΊΡ€ΠΈΡ‚ΠΈΠΊΠ°ΠΌ. // Intersoft Lab. [2001—2012]. URL: http://citforum.ru/consulting/BI/dm_criticism/ (Π΄Π°Ρ‚Π° обращСния: 20.11.2012)

6. David Hand, Heikki Mannila, Padhraic Smyth. Principles of Data Mining. — The MIT Press, 2001

7. Π‘Ρ‚Π΅ΠΏΠ°Π½ΠΎΠ² Π . Π“. ВСхнология Data Mining: Π˜Π½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΉ Анализ Π”Π°Π½Π½Ρ‹Ρ…. — ΠšΠ°Π·Π°Π½ΡΠΊΠΈΠΉ ГосударствСнный УнивСрситСтим. Π’.И.Ульянова-Π›Π΅Π½ΠΈΠ½Π°, 2008.

8. Fredrik Johansson, Joel Brynielsson. Detecting Emergent Con? icts through Web Mining and Visualization. — Swedish Defence Research Agency (FOI) Stockholm, Sweden

9. An Introduction to Information Retrieval — Cambridge University. // The Stanford Natural Language Processing Group. URL: http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf (Π΄Π°Ρ‚Π° обращСния: 20.11.2012)

10. Mining of Massive Datasets Stanford University. //The Stanford InfoLab. URL: http://i.stanford.edu/~ullman/mmds/book.pdf

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ