Помощь в учёбе, очень быстро...
Работаем вместе до победы

Разработка моделей и методов верификации и анализа документов в электронном архиве энергетических объектов

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

В унаследованной системе архива документы хранятся в бумажном или электронном виде на компакт-дисках в помещении в центральном офисе организации. При переходе на новую систему электронного архива бумажные документы должны быть отсканированы. Для обеспечения структурирования документов и их быстрого поиска в архиве должны храниться не только электронные образы (изображения) документов, но и их… Читать ещё >

Содержание

  • 1. ИСПОЛЬЗОВАНИЕ ЭЛЕКТРОННЫХ АРХИВОВ В ЖИЗНЕННОМ ЦИКЛЕ ЭНЕРГЕТИЧЕСКИХ ОБЪЕКТОВ
    • 1. 1. Введение
    • 1. 2. Требования, предъявляемые к системе электронного архива
    • 1. 3. Краткий обзор систем электронного архива
    • 1. 4. Краткое описание схемы автоматизированного наполнения архива
    • 1. 5. Методы и системы Data Mining
    • 1. 6. Методы анализа исходных данных и поиска закономерностей
  • ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ
  • 2. МОДЕЛИ ДАННЫХ ЭЛЕКТРОННОГО АРХИВА
    • 2. 1. Введение
    • 2. 2. Информационно-аналитическая модель электронного архива
    • 2. 3. Подмодель хранения документов
    • 2. 4. Подмодель, позволяющая реализовать поиск закономерностей в документах
    • 2. 5. Подмодель прав доступа и структуры подразделений
    • 2. 6. Подмодель поиска документов
  • ВЫВОДЫ ПО ВТОРОЙ ГЛАВЕ
  • 3. МЕТОДЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ И АНАЛИЗА ЭЛЕКТРОННОГО АРХИВА
    • 3. 1. Введение
    • 3. 2. Схема наполнения электронного архива документами
    • 3. 3. Общая схема метода извлечения и применения знаний
    • 3. 4. Алгоритмы создания справочника на основе электронного архива
    • 3. 5. Использование последовательностей при занесении документов в электронный архив
    • 3. 6. Алгоритмы решения задачи кластеризации в электронном архиве
    • 3. 7. Методы поиска в электронном архиве
  • ВЫВОДЫ ПО ТРЕТЬЕЙ ГЛАВЕ
  • 4. ОСОБЕННОСТИ РЕАЛИЗАЦИИ СИСТЕМЫ ЭЛЕКТРОННОГО АРХИВА
    • 4. 1. Введение
    • 4. 2. Общая архитектура электронного архива
    • 4. 3. Реализация информационно-аналитической модели электронного архива
    • 4. 4. Реализация системы настройки информационно-аналитической модели архива
    • 4. 5. Реализация процесса поточного занесения документов в архив
    • 4. 6. Возможности автоматизированного формирования пакетов документов с использованием метода кластеризации
    • 4. 7. Реализация Web-приложения для поиска и просмотра документов
    • 4. 8. Внедрение и эксплуатация системы
    • 4. 9. Оценка эффективности разработанного метода
  • ВЫВОДЫ ПО ЧЕТВЕРТОЙ ГЛАВЕ

Разработка моделей и методов верификации и анализа документов в электронном архиве энергетических объектов (реферат, курсовая, диплом, контрольная)

Актуальность темы

Для предприятий энергетической отрасли важной задачей является создание единого информационного пространства путём перехода на безбумажный документооборот. При этом необходимо учитывать следующие особенности работы предприятий, занимающихся проектированием и монтажом энергетических объектов:

• территориальная распределенность (организации, занимающиеся проектированием, строительством, монтажом и эксплуатацией энергетических объектов всегда находятся на существенном расстоянии друг от друга);

• большое количество документации, которая должна поддерживаться в актуальном состоянии и быть доступной в сжатые сроки для оперативного принятия решений, особенно в аварийных ситуациях.

Эти особенности объективно требуют информационной интеграции процессов проектирования, монтажа и эксплуатации энергетических объектов. Ускорение информационных потоков необходимо для повышения эффективности и надёжности работы энергетических предприятий.

В организациях, занимающихся проектированием, строительством и реконструкцией энергетических объектов, обычно имеется архив технической документации порядка сотен тысяч документов. При этом организация может иметь распределённую структуру с филиалами в разных городах РФ, объекты строительства также могут быть удалёнными: от Нягани до Краснодарского края. В ' ходе строительных и особенно электромонтажных работ часто происходит изменение и дополнение проектной документации.

Поиск необходимой документации в «бумажном» архиве и её доставка (даже путём сканирования и электронной пересылки) в удалённые точки занимает большое время. Поэтому актуальна задача создания системы электронного архива: системы структурированного хранения проектной документации в электронном виде, обеспечивающей надёжность хранения, конфиденциальность и разграничение прав доступа, отслеживание истории использования документа, быстрый и удобный поиск, а также предоставляющей доступ к документации из любого места в любое время.

Особенности технической документации, которые необходимо сохранить при переходе к электронному архиву:

• соответствие ГОСТам серии СПДС;

• насыщенность символьными наименованиями (чертежи, объекты, устройства, материалы).

Рассмотрим комплект документации по некоторому энергетическому объекту (например, «Подстанция Мещанская»). Вся рабочая документация делится:

• по стадиям: проектная «ПД» и рабочая «РД»;

• по пусковым комплексам (ПК) — 1 ПК — строительство подстанции, 2 ПК — строительство заходов КЛ 220 кВ на подстанцию, 3, 4 ПК — строительство дополнительных кабельных линий;

• по буквенной марке номера рабочей документации (в соответствии с требованиями ГОСТа), например, АЭВ, АЭП, РЗ, СС и другие.

Практически каждый том рабочей документации содержит символьные наименования, например, спецификация оборудования содержит строки вида «Вентилятор Ш 48УОСдля ТОХ515"или «Оптический лазер БЫ ГСБГР, 1310 нм». Также в соответствии с «ГОСТ 2.104−68*» в основной надписи на чертеже указываются фамилии и подписи лиц, выполняющих разработку, проверку, технологический контроль, нормоконтроль и утверждение документа.

В архиве необходимо предоставить возможность группировки документов в соответствии с приведённой классификацией, чтобы обеспечить доступ к единственной актуальной версии документа всем заинтересованным лицам: руководителю объекта (подстанции) — проектировщикам из различных организаций, выполняющих проектгенподрядчику строительно-монтажных работначальнику монтажной бригады на объекте и т. д.

В унаследованной системе архива документы хранятся в бумажном или электронном виде на компакт-дисках в помещении в центральном офисе организации. При переходе на новую систему электронного архива бумажные документы должны быть отсканированы. Для обеспечения структурирования документов и их быстрого поиска в архиве должны храниться не только электронные образы (изображения) документов, но и их карточки (наборы атрибутов). Для формирования атрибутов документов применено распознавание отсканированных документов при помощи специализированных программных средств. При этом точность распознавания не всегда является стопроцентной, необходима верификация. Верификация — это процесс проверки правильности распознанных документов. Она производится человеком и заключается в сверке распознанного текста с графическим образом документа. Однако при большом потоке документов в силу монотонности работы увеличивается число ошибок верификации, что недопустимо для технической документации. В связи с этим актуальной является задача автоматизации процесса верификации для повышения скорости и уменьшения числа ошибок.

Так как некоторые атрибуты документов распознаются лучше, другие хуже, а процесс верификации является последовательным, для ускорения следует использовать зависимость значений атрибутов друг от друга. Наибольшую скорость в данном случае обеспечивают продукционные правила, так как они используют простую модель «ключ-значение», что обеспечивает наиболее быстрый поиск нужного правила. Актуальной является задача извлечения подобных зависимостей из уже накопленного архива документации. Для этого необходимо адаптировать методы Data Mining для работы с электронным архивом технической документации. Существующие программные продукты извлечения знаний часто ориентированы на конкретную предметную область (например, Deep Data Diver™ — в основном на медицинскую диагностику, AnswerTree — на маркетинговые исследования) и не предоставляют возможности интеграции с программами сканирования и верификации. Поэтому необходимо разработать специализированную систему, предназначенную для работы с техническими документами различной структуры.

Точность верификации необходима для быстрого поиска полного набора документов по заданному пользователем запросу. Например, пользователю может понадобиться комплект документации по релейной защите на некотором объекте или сводный сметный расчёт по подстанции. Необходимо предоставить возможность построения сложных запросов по тексту документа с учётом морфологических форм заданных слов. Актуальна также задача разработки методов и средств, обеспечивающих более высокую скорость поиска документов по сравнению с существующими системами. Причём, важен не только и не столько поиск конкретного документа, сколько поиск полного набора документов, удовлетворяющих набору условий. Для решения этой задачи необходимы дополнительное структурирование и группировка документов. Следовательно, актуальна задача автоматизации создания пакетов документов по каким-либо критериям.

В целом, основные требования к архиву могут быть сформулированы следующим образом:

• хранение больших объёмов документации (порядка сотен тысяч страниц);

• ориентация на техническую документацию, насыщенную символьными наименованиями, которые должны иметь единый вид;

• высокая скорость занесения документов в архив с учётом существующей системы хранения документов. Комплект документации по объекту объёмом 5000 страниц должен быть доступен в архиве не более чем за 2 недели, срочные документы должны быть занесены в архив в течение дня с учётом всех временных задержек;

• обеспечение возможности поиска документа по тексту;

• наличие средств автоматизированной группировки документов.

Анализ рынка программного обеспечения показал, что существующие системы не полностью удовлетворяют приведённым требованиям. Таким образом, актуальна задача разработки системы электронного архива, решающей данные задачи.

Современное архивоведение, в том числе и зарубежное, подробно рассмотрено в трудах Е. В. Старостина, Е. В. Булюлиной. Автоматизация архивного дела рассматривается в работах И. Н. Киселёва, В. И. Тихонова, Е. В. Бобровой. Задачам извлечения знаний из документов посвящены труды И. П. Норенкова, В. А. Дюка, Р. Михальски, К. Парсайе. В соответствии с ГОСТ 23 501.101−87, электронный архив может быть отнесён к обслуживающим подсистемам САПР. Основы построения интеллектуальных САПР с применением технологий знаний рассмотрены в трудах И. П. Норенкова, П. Хилла, Дж. Джонса. Информационная интеграция и построение корпоративных информационных систем рассматриваются в работах В. Н. Буркова, Н. Г. Твердохлеба, В. Н. Шведенко, Д. О’Лири, И. Д. Ратмановой, М. Г. Левина, А. Леона.

Работа выполнялась в ОАО «Электроцентромонтаж», занимающемся проектированием, строительством и реконструкцией энергетических объектов, монтажом и наладкой электрооборудования. Промышленное внедрение и эксплуатация выполнялись в 4-х филиалах этой же организации.

Диссертационная работа соответствует паспорту специальности 05.13.12 «Системы автоматизации проектирования (по отраслям)», так как затрагивает следующие вопросы:

• научные основы построения средств автоматизации проектирования, безбумажного документооборота и процессов работы электронных архивов технической документации (пункт 7 областей исследований в паспорте специальности);

• научные основы реализации жизненного цикла «проектированиепроизводство — эксплуатация», построения интегрированных средств управления и унификации прикладных протоколов информационной поддержки;

• разработка принципиально новых методов и средств взаимодействия «проектировщик — среда».

Целью диссертационной работы является повышение скорости доступа к актуальной проектно-конструкторской и технической документации путём создания электронного архива документов, а также точности и скорости верификации документов при загрузке в архив путём использования уже накопленных в архиве знаний. При этом решались следующие задачи:

1. Разработка информационно-аналитической модели электронного архива, обеспечивающей хранение массивов технической документации объёмом порядка сотен тысяч документов, группировку документов в соответствии с ГОСТами серии СПДС, использующимися в энергетике.

2. Разработка метода анализа документов, позволяющего оптимизировать верификацию и структурировать документы путём извлечения и применения нечётких продукционных правил.

3. Разработка методов и средств поиска в электронном архиве, позволяющих построить полный набор документов по запросу пользователя при заданных ограничениях на время и общее количество документов.

4. Экспериментальная проверка разработанных моделей и методов путём реализации в программной системе электронного архива.

Методы исследования. Использовались методы Data Mining, нечёткой математики, теории баз данных, систем искусственного интеллекта.

Научная новизна.

1. Разработана информационно-аналитическая модель электронного архива, позволяющая хранить документы и извлекать знания в виде нечётких продукционных правил. Она отличается от существующих моделей хранения тем, что позволяет варьировать набор атрибутов документа для разных типов, учитывать соответствие атрибутов типов и создавать на их основе продукционные правила.

2. Разработан метод анализа атрибутивного состава технической документации, основанный на разработанной модели метаданных и включающий в себя алгоритмы создания наборов правил-ассоциаций (справочников) и поиска последовательностей. Он отличается от существующих алгоритмов Data Mining, например FP-Growth, Apriori и их разновидностей, тем, что учитывает структуру хранения документов и особенности технических документов.

3. Разработан метод решения задачи кластеризации в архиве. Использование кластеризации позволяет группировать документы в соответствии с ГОСТами, либо по индивидуальным запросам пользователей. Метод отличается от традиционных алгоритмов агломеративной кластеризации тем, что вместо расстояния между точками использует разработанную модель метаданных, а также подготовленные на этапе анализа наборы продукционных правил. Это обеспечивает высокую скорость работы.

Практическая значимость работы.

1. На основе разработанной модели данных создана система электронного архива, позволяющая получать доступ к необходимым документам непосредственно с рабочих мест.

2. Применение методов извлечения знаний позволило сократить время верификации документов и увеличить скорость занесения документов в архив приблизительно на 25%, не увеличивая штат верификаторов. Метод позволяет извлекать знания с учётом того, что требуемые значения могут находиться в разных атрибутах, а также применять полученные знания при верификации без дополнительной интерпретации.

3. Разработанный метод поиска в архиве, использующий оригинальную схему взаимодействия компонент и дополнительные средства СУБД, обеспечивает построение полного списка документов по пользовательскому запросу при заданных временных ограничениях. Наличие атрибутивного и полнотекстового поиска позволяет учитывать многообразие технической документации и выполнять поиск только нужных пользователю документов.

4. Применение методов кластеризации позволяет более наглядно группировать документы в пакеты, что упрощает работу пользователям, например, при подготовке отчётов или комплектов технической документации по определённому объекту.

Апробация работы. Материалы диссертационной работы докладывались и обсуждались на следующих конференциях:

1)1 Международная конференция «Автоматизация управления и интеллектуальные системы и среды (АУИСС — 2010)»;

2) XVI Международная открытая научная конференция «Современные проблемы информатизации» (2011);

3) конференция «Спецпроект: анализ научных исследований» (3031.05.2011г);

4) конференция «Наука в информационном пространстве — 2011» (2930.09.2011г.).

Список публикаций. По результатам работы опубликованы 2 статьи в изданиях, рекомендованных ВАК, 6 статей в научных журналах, 5 тезисов докладов на конференциях, получено 1 свидетельство о государственной регистрации программы для ЭВМ.

Личный вклад. Выносимые на защиту модели и методы разработаны автором лично. В созданной системе электронного архива автором разработана система шаблонов Flexi Capture, система конфигурирования, мастер загрузки документов, компоненты, реализующие описанные в диссертации методы.

Внедрение. Система ДокПрофигм зарегистрирована в Реестре программ для ЭВМ, номер свидетельства 2 011 610 409. Успешно внедрена и применяется в ОАО «Электроцентромонтаж» для оперативного доступа сотрудников предприятия к актуальной технической документации. Тем самым заложена основа для единого информационного пространства предприятия.

Структура и объём работы. Диссертация состоит из введения, четырёх глав, заключения, списка литературы из 101 наименования и включает 138 страниц основного текста, 36 рисунков, 3 таблицы, 8 формул. В приложении приведено 4 акта о внедрении и 1 свидетельство о государственной регистрации программы для ЭВМ.

Основные результаты работы:

1. Разработана интегрированная модель данных и знаний, позволяющая хранить ключевые сущности электронного архива и связи между ними. Она обеспечивает хранение больших массивов разнообразной документации, в том числе технической, насыщенной символьными наименованиями, обеспечивает поиск документов атрибутом и словам и фразам из текста, а также группировку документов в соответствии с ГОСТ.

2. Предложена схема автоматизированной загрузки документов в архив и разработаны методы извлечения закономерностей из атрибутивного состава документов электронного архива и их применения при верификации, что позволило ускорить занесение документов в архив и выполнить требование оперативной доступности документа.

3. Разработан метод кластеризации, позволяющий автоматизировать создание пакетов документов.

4. На основании результатов опытной и промышленной эксплуатации решена задача организации единого информационного пространства для сотрудников проектирующих, строительных, монтажных, эксплуатационных организаций на протяжении всего процесса проектирования энергетического объекта.

5. Разработанные модели и методы показали свою эффективность при реализации на предприятии энергетической отрасли. Время поиска документа сократилось до 3−5 минут, скорость занесения в архив увеличилась на 25%, время подготовки комплекта документации по объекту сократилось на 50−70%.

Таким образом, степень решения поставленных задач и уровень полученных результатов свидетельствуют о достижении цели диссертационной работы.

Дальнейшее развитие исследований планируется в следующих направлениях.

1. Дальнейшее применение разработанных методов для анализа тенденций в документах электронного архива.

2. Реализация клиентских приложений архива, взаимодействующих с используемыми САПР. Это позволит работать с архивом (добавлять и извлекать документы) непосредственно в среде разработки.

Заключение

.

Обеспечение современного процесса проектирования энергетических объектов, отличающегося повышенными требованиями к скорости выполнения работ, а, следовательно, цикличностью, одновременной работой над проектом коллективов нескольких территориально-удалённых организаций, необходимостью оперативного контроля устранения недостатков и учёта изменяющихся условий окружающей среды невозможно без построения единого информационного пространства. В качестве общей интеграционной точки целесообразно использовать электронный архив документации, который обеспечит надёжное хранение документов в структурированном виде и доступ к ним из любой точки в любое время.

Несмотря на глубокую теоретическую проработку систем построения электронных архивов документов, а так же на наличие готовых программных продуктов, предназначенных для хранения электронных образов документов, в ходе выполнения работы выявлено отсутствие комплексного решения, обеспечивающего реализацию следующих, диктуемых спецификой энергетической отрасли, требований:

• хранение массива технической документации объёмом порядка сотен тысяч документов;

• скорость загрузки в архив не менее 4000 страниц в месяц для одного верификатора;

• группировка документов в соответствии с ГОСТом серии СПДС;

• время поиска документа по атрибутам не более 1 минуты, по фразе из текста — не более 5 минут.

Для решения данных проблем были проведены работы по обеспечению теоретической основы электронного архива технической документации в энергетической отрасли, состоящие из разработки информационно-аналитической модели и метода анализа документов. На их.

124 основе разработан программный комплекс — система электронного архива документов ДокПрофи. Она внедрена в ОАО «Электроцентромонтаж» -крупном предприятии, занимающимся всеми видами работ на объектах энергетической отрасли. Система используется в филиалах, занимающихся проектированием (Костромской инжиниринговый центр), строительством и монтажом (Новомосковское, Костромское, Курчатовское управления), управлением генподрядной деятельностью (Центральный офис).

Показать весь текст

Список литературы

  1. К. 101: OraclePL/SQL: Как писать мощные и гибкие программы на PL/SQL/ К. Аллен. — М.: Лори, 2001. — 350 с.
  2. , М. Г. Разработка медицинских экспертных систем средствами технологий Data Mining Электронный ресурс. / М. Г. Асеев, М. Ф. Баллюзек, В. А. Дюк. Режим доступа: http://www.olap.ru/home.asp7artIcN153, свободный.
  3. , А. Электронные архивы: автоматизация и процессы Электронный ресурс. / А. Афанасьев. Режим доступа: http://www.aiteh.ru/index.php?page=elektronnye-arhivy-avtomatizatsiya-i-protsessy
  4. , Е. В. Архивоведение: учебно-методическое пособие / Е. В. Булюлина. — Волгоград: Изд-во «ВолГУ», 2001. — 96 с.
  5. , В.Н. Модели и методы управления организационными системами / В. Н. Бурков, В. А. Ириков. М.: Наука, 1994. — 270 с.
  6. Буч, Г. Объектно-ориентированное проектирование / Г. Буч М.: Конкорд, 1992.
  7. , Г. В. Вычислительная математика: основы алгебраической и тригонометрической интерполяции / Г. В. Ващенко. Красноярск: СибГТУ, 2008.-64 с.
  8. ГОСТ 21.001 -93. Система проектной документации для строительства. Общие положения.
  9. ГОСТ 21.101−97. Система проектной документации для строительства. Основные требования к проектной и рабочей документации.
  10. ГОСТ 23 501.101−87. Системы автоматизированного проектирования. Основные положения.
  11. , А. М. Об одном методе индуктивного вывода с подрезанием деревьев решений / А. М. Гупал, А. А. Пономарев, А. М. Цветков // Кибернетика и системный анализ. 1993. — № 5. — С. 174 -178.
  12. , В. В. Системы искусственного интеллекта: учеб. пособие для вузов / В. В. Девятков. М.: Изд-во МГТУ им Н. Э. Баумана, 2001. — 352 с.
  13. , А. К. Введение в искусственные нейронные сети / А. К. Джейн, Ж. Мао, К. М. Моиуддин // Открытые системы. 1997. — № 4. -С. 16−24.
  14. , Дж. К. Методы проектирования / Дж. К. Джонс. М.: Мир, 1986.
  15. Дюк, В. А. Обработка данных на ПК в примерах / В. А. Дюк. — СПб.: Питер, 1997.
  16. Дюк, В. A. Data Mining интеллектуальный анализ данных Электронный ресурс. / В. А. Дюк. — Режим доступа: http://www.olap.ru/basic/dm2.asp, свободный.
  17. , И. И. Общая теория статистики / И. И. Елисеева, М. М. Юзбашев- под ред. чл.-корр. РАН И. И. Елисеевой. М.: Финансы и статистика, 1996. — 368 с.
  18. , А. Е. Извлечение знаний из текста и их обработка: состояние и перспективы / А. Е. Ермаков // Информационные технологии. 2009. -№ 7.-С. 50 — 55.
  19. , А. Е. Неполный синтаксический анализ текста в информационно-поисковых системах / А. Е. Ермаков // Компьютерная лингвистика и интеллектуальные технологии: тр. междунар. семинара «Диалог'2002». В 2 т. Т.2. Прикладные проблемы. М.: Наука, 2002.
  20. , М. Иерархический кластер-анализ и соответствия / М. Жамбю. — М.: Финансы и статистика, 1988. — 345 с.
  21. , Е.П. Применение комплекса САПР для разработки конструкторской документации в электронном виде / Е. П. Зимина, М. В. Васильев // Труды МАИ. 2011. — № 45. — С. 64.
  22. Реализация распределённого проектирования в САПР AutomatiCS на базе технологии XML / Н. Б. Ильичёв, Е. Р. Пантелеев, В. Пекунов, М. Первовский, Е. С. Целищев // CADmaster 2002. — № 4 (14).
  23. , Г. Г. Основы построения САПР и АСТПП / Г. Г. Казенков,
  24. A. Г. Соколов. М.: Высш. шк., 1989. — 340 с.
  25. , Г. К. CASE — структурный системный анализ / Г. К. Калянов. М.: Лори, 1996.
  26. , И. Н. Архивный сайт и пользователь Электронный ресурс. / И. Н. Киселёв. Режим доступа: http://www.rusarchives.ru/evants/conferences/archivalsites2008/kiselev.shtml, свободный.
  27. , И. Н. Архивные информационные технологии на современном этапе Электронный ресурс. / И. Н. Киселёв. Режим доступа: http://www.rusarchives.ru/news/council90 k. shtml, свободный.
  28. , М. Средства добычи знаний в бизнесе и финансах / М. Киселев, Е. Соломатин // Открытые системы. 1997. — № 4. — С. 41 — 44.
  29. Решение проблемы комплексного оперативного анализа информации хранилищ данных / С. Д. Коровкин, И. А. Левенец, И. Д. Ратманова,
  30. B. А. Старых, Л. В. Щавелёв // СУБД. 1997. -№ 5−6. — С. 47 -51.
  31. Корпоративные информационные системы: учеб. пособие: в 3 ч. 4.2 / А. Р. Денисов, М. Г. Левин. — Кострома: КГТУ, 2008. — 79 с.
  32. , Н. Продукты для интеллектуального анализа данных / Н. Кречетов. // Рынок программных средств. 1997. — № 14−15. — С. 32 — 39.
  33. , Т. Я. Методы создания справочника на основе электронного архива / Т. Я. Кроль, М. А. Харин, П. В. Евдокимов // Известия «КБНЦ РАН». -2011,-№ 1,-С. 154 158.
  34. , Т. Я. Методы решения задачи кластеризации и прогнозирования в электронном архиве / Т. Я. Кроль, М. А. Харин // Молодой учёный. — 2011.— № 6, Т. 1. — С. 135 137.
  35. Методы поиска в электронном архиве / Т. Я. Кроль, М. А. Харин, Н. В. Никоноров, Д. В. Иванов // Информационные технологии моделирования и управления. 2011. -№ 6. — С. 702 — 709.
  36. , Т.Я. Модели данных для реализации поиска и прав доступа к документам / Т. Я. Кроль и др. // Молодой учёный. — 2011. — № 11. -С. 79−84.
  37. , Т. Я. Опыт построения и реализации электронного архива на базе системы сканирования и распознавания Р1ех1СарШге / Т. Я. Кроль, М. А. Харин // Программная инженерия. 2012. — № 6. — С. 35 — 42.
  38. , Т. Я. Использование методов кластеризации для автоматизированного формирования пакетов документов / Т. Я. Кроль, М. А. Харин // Молодой учёный. — 2012. — № 10. С. 93 -95.
  39. , А. Словарь русского языка для ispell Электронный ресурс. / А. Лебедев. Режим досгупа: http://sconl55.phys.msu.su/~swaiVorthography.html, свободный.
  40. , И. П. Задачи управления знаниями, извлекаемыми из текстовых документов Электронный ресурс. / И. Г1. Норенков // Наука и образование. 2011. — № 9. — Режим доступа: http://technomag.edu.ru/doc/206 187.html, свободный.
  41. , И. П. Основы автоматизированного проектирования: учебник для вузов / И. П. Норенков. 2-е изд., перераб. и доп. — М.: Изд-во МГТУ им. Н. Э. Баумана, 2002. — 336 с.
  42. , И. П. Подходы к проектированию автоматизированных систем / И. П. Норенков // Наука и образование. 2005. — № 6. — С. 20 — 32.
  43. , H. Нечёткая логика математические основы Электронный ресурс. / Н. Паклин. — Режим доступа: http://www.basegroup.ru/library/analysis/fuzzylogic/math/, свободный.
  44. , Ю. А. Хранение истории изменения данных в архивах технической документации / Ю. А. Радионова // Научно-технический журнал «Автоматизация процессов управления». Ульяновск: типогр. ФНПЦ ОАО «НПО «МАРС», 2010. — № 1(19).-С. 82 — 88.
  45. , А. Ввод сканированных документов в электронный архив предприятия Электронный ресурс. / А. Рындин. Режим доступа: http://sapr.ru/article.aspx7icN7302
  46. , Е. В. Зарубежное архивоведение / Е. В. Старостин. М.: ИАИ РГГУ, 1997.-330 с.
  47. , Н.Г. Безбумажная технология в управлении производством / Н. Г. Твердохлеб. М.: Финансы и статистика, 1991. — 188 с.
  48. , Ф. Нейрокомпьютерная техника: Теория и практика / Ф. Уоссермен. М.: Мир, 1992. — 240 с.
  49. , С. Механизмы территориально распределённого проектирования / С. Фалибога // CAD/CAM/CAEObserver. 2011. -№ 8 (68).-С. 62 -63.
  50. , М. А. Обзор средств автоматизированного извлечения знаний и их применение в электронных архивах документов / М. А. Харин // Молодой учёный. — 2010. — № 5,Т.1, — С. 106- 108.
  51. , М. А. Электронные архивы документов и средства автоматизированного извлечения знаний / М. А. Харин // Информационные технологии моделирования и управления. 2010. — № 2. — С. 242 — 246.
  52. , С. Нечёткие деревья решений Электронный ресурс. / С. Царьков. Режим доступа: http://www.basegroup.ru/library/analysis/fuzzylogic/fuzzy dtrees/
  53. , А. М. Разработка алгоритмов индуктивного вывода с использованием деревьев решений / А. М. Цветков // Кибернетика и системный анализ. 1993. — № 1. — С. 174 — 178.
  54. , В. И. Метод классификации текстовых документов, основанный на полнотекстовом поиске / В. И. Шабанов, А. М. Андреев // Труды РОМИП'2003, — СПб.: НИИ Химии СПбГУ, 2003. С. 52 — 71.
  55. В. Н. Модели бизнес-процессов в объектно-функциональной системе управления предприятием: Автореф. дисс. док. техн. наук: Кострома, 2006. 32 с.
  56. , С.Д. Введение в теорию нечётких множеств и нечёткую логику / С. Д. Штовба. Винница: Континент-Прим, 2003. — 198 с.
  57. , JI. В. Способы аналитической обработки данных для поддержки принятия решений / J1. В. Щавелёв // СУБД. 1998. — № 4−5.
  58. , Н. Г. Основы теории нечётких и гибридных систем / Н. Г. Ярушкина. М.: Финансы и статистика, 2004. — 320 с.
  59. Aha, D. W. An Implementation and Experiment with the Nested Generalized Exemplars Algorithm (Technical Report AIC-95−003) / D.W. Aha. -Washington, DC: Naval Research Laboratory, Navy Center for Applied Research in Artificial Intelligence, 1995.
  60. Brand, E., Gerritsen R. Naive-Bayes and Nearest Neighbor / E. Brand, R. Gerritsen // DBMS. 1998. — № 7.
  61. Brand, E. Decision Trees / E. Brand, R. Gerritsen // DBMS. 1998. -№ 7.
  62. Fausett, L. V. Fundamentals of Neural Networks: Architectures, Algorithms, and Applications / L.V. Fausett. Englewood Cliffs, New Jersey: Prentice Hall, 1994. — 461 p.
  63. Fuernkranz, J. Separate-and-Conquer Rule Learning / J. Fuernkranz. -Vienna: Austrian Research Institute for Artificial Intelligence, Technical Report OEFAI-TR-96−25, 1996.
  64. Heckerman, D. Bayesian Networks for Data Mining / D. FIeckerman // Data Mining and Knowledge Discovery. 1997. — № 1. — P. 79 — 119.
  65. Integrated computer-aided manufacturing (ICAM): Information modeling manual, IDEF1 — Extended (IDEF1X). Albany, New York: GEC, 1985.
  66. Jain, A. Data Clustering: A review / A. Jain, M. Murty, P. Flynn // ACM Computing Surveys. 1999. — Vol. 31, no. 3. — Pp. 264−323.
  67. Kramer, S. Structural Regression Trees / S. Kramer. Vienna: Austrian Research Institute for Artificial Intelligence, Technical Report OEFAI-TR-95−35, 1995.
  68. Leon, A. Enterprise Resource Planning / A. Leon. — New Dehli: McGraw-Hill, 2008. — C. 224. — 500 c.
  69. MacQueen J. Some methods for classification and analysis of multivariate observations / J. MacQueen. // V Berkeley Symp. on Math. Statistics and Probability, p. 281—297.
  70. Michalski, R. S. A theory and methodology of inductive learning / R.S. Michalski // Artificial Intelligence. -1983. 20(2). — P. 111−162.
  71. Michalski, R. S. On the quasi-minimal solution of the covering problem / R.S. Michalski // In Proceedings of the 5th International Symposium on Information Processing (FCIP-69): Vol. A3 (Switching Circuits). Bled, Yugoslavia, 1969.-P. 125−128.
  72. O’Leary, D. L. Enterprise resource planning systems / D.L. O’Leary. — Cambridge University Press, 2000. — 232 c.
  73. Oracle Text Application Developer’s Guide. Oracle Corporation, 2003. Электронный ресурс. — Режим доступа: http://www.stanford.edu/dept/itss/docs/oracle/1 Og/text. 101 /Ь10 729.pdf.
  74. Parsaye, К. Rules are Much More than Decision Trees / K. Parsaye // The Journal of Data Warehousing. 1997. — № 1.
  75. Quinlan, J. R. Induction of decision trees / J.R. Quinlan // Machine Learning. 1986. — 1,-P. 81−106.
  76. Quinlan, J. R. Generating production rules from decision trees / J.R. Quinlan // In Proceedings of the 10th International Joint Conference on Artificial Intelligence (IJCAI-87). Morgan Kaufmann, 1987. — P. 304 -307.
  77. The EM algorithm // The Elements of Statistical Learning. — New York: Springer, 2001. — P. 236−243.
  78. Wettschereck, D. A Review and Empirical Evaluation of Feature Weighting Methods for a Class of Lazy Learning Algorithms / D. Wettschereck, D.W. Aha, T. Mohri // Artificial Intelligence Review. 11. — P. 273−314.
  79. ORM-система NHibernate Электронный ресурс. Режим доступа: http://nhibernate.org/, свободный.
  80. Спецификация стандарта MoReq2010 Электронный ресурс. Режим доступа: http://www.dlmforum.eu/index.php?option=com iotloader&view^categories&cid =40 4e47a2abad7422897e078fd469dd9933<emid=129&lang=en, свободный.
  81. Система Босс-Референт Электронный ресурс. Режим доступа: http://www.it.ru, свободный.
  82. Система Дело Электронный ресурс. Режим доступа: http://www.eos.ru/, свободный.
  83. Система Евфрат Электронный ресурс. Режим доступа: http://www.evfrat.ru/, свободный.
  84. Система Docs Fusion Электронный ресурс. Режим доступа: http://connectivity.opentext.com/, свободный.
  85. Система Documentum Электронный ресурс. Режим доступа: http://www.emc.com, свободный.
  86. Система LanDocs Электронный ресурс. Режим доступа: http://landocs.ru/, свободный.
  87. Система Microsoft Sharepoint Электронный ресурс. Режим доступа: http://office.microsoft.com/ru-ru/sharepoint/, свободный.
  88. Система нормативов NormaCS Электронный ресурс. Режим доступа: http://normacs.ru/desc.jsp, свободный.
  89. Система Optima Workflow Электронный ресурс. Режим доступа: http://optima-workflow.ru/, свободный.
  90. Система SmartPlant® Foundation Электронный ресурс. Режим доступа: http://www.intergraph.com/products/ppm/smartplant/foundation/default.aspx, свободный.
  91. Система TDMS Электронный ресурс. Режим доступа: http://www.tdms.ru/, свободный.
Заполнить форму текущей работой