Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке
Диссертация
Алгоритмы оптического распознавания символов (англ.: optical character recognition или OCR) алгоритмы постоянно развиваются и совершенствуются. В настоящий момент для некоторых языков, например английского, французского, русского, уже разработаны алгоритмы, распознающие печатные тексты с высокой эффективностью,. Современное коммерческое ПО OCR для этих языков рекламируются с заявлением о точности… Читать ещё >
Содержание
- ГЛАВА 1. АНАЛИЗ ВЬЕТНАМСКОГО ЯЗЫКА НА ПРЕДМЕТ РАСПОЗНАВАНИЯ ТЕКСТА
- ГЛАВА 2. ПОЛУЧЕНИЕ ЦИФРОВОГО ИЗОБРАЖЕНИЯ ИЗ ПЕЧАТНЫХ ДОКУМЕНТОВ И ПЕРВИЧНЫЕ ОБРАБОТКИ ИЗОБРАЖЕНИЯ
- 2. 1. Преимущество электронных документов по отношению к бумажным. Типы электронных Документов
- 2. 2. Процесс преобразования документов
- 2. 3. Дискретизация входного документа
- 2. 4. Бинаризация
- 2. 5. Связный компонент
- 2. 5. 1. Понятие связного компонента
- 2. 5. 2. Алгоритм анализа связных компонентов изображения
- 2. 6. Подавление шумов
- 2. 6. 1. Удаление малых шумовых блоков
- 2. 6. 2. Подавление шума с помощью морфологических операций
- 2. 7. Выравнивание страницы
- 7. 1. Метод Байрда
- 2. 7. 2. Метод Гашизуме
- 2. 7. 3. Метод Блумберга
- 2. 7. 4. Метод Амина и By
- 2. 7. 5. Разработанный метод
- 7. 1. Метод Байрда
- 3. 1. Анализ основных методов сегментации
- 3. 2. Динамическая локальная карта связи
- 3. 3. Анализ результатов применения алгоритма определения пороговых значений для многошкальной сегментации
- 3. 4. Разработка алгоритма построения иерархического дерева сегментации
- 3. 5. Идентификация текстовых блоков
- 4. 1. Разбиение текстовых блоков на строки
- 4. 2. Извлечение символов из строки
- 4. 2. 1. Разделение связанных символов
- 4. 2. 2. Объединение связных компонентов одного символа
- 4. 2. 3. Извлечение символов на базе распознавания
- 4. 2. 4. Целостный подход
- 4. 2. 5. Разработанный метод
- 5. 1. История развития оптического распознавания символов
- 5. 2. Обзор по современным опубликованным методам распознавания символов
- 5. 2. 1. Метод Пелега (Peleg) и Розенфелда
- 5. 2. 2. Метод Наги (Nagy) и др
- 5. 2. 3. Метод Ли (Lee) на основе скрытой Марковской модели
- 5. 2. 4. Распознавание символов на базе нейронных сетей
- 5. 3. Разработанный метод
- 5. 3. 1. Рейтинговый подход
- 5. 3. 2. Распознавание с помощью нейронных сетей
- 5. 3. 3. Комбинированный подход
- 6. 1. Обработка документа перед распознаванием
- 6. 1. 1. Анализ компонентов
- 6. 1. 2. Определение блоков
- 6. 1. 3. Идентификация блоков
- 6. 1. 4. Определения угла отклонения
- 6. 1. 5. Извлечения строк из текстовых блоков
- 6. 1. 6. Извлечения символов из строк
- 6. 2. Распознавание символов
- 6. 2. 1. Распознавание с помощью рейтингового подхода
- 6. 2. 2. Распознавание с помощью нейронных сетей
- 6. 2. 3. Комбинированный подход
Список литературы
- Энциклопедия Википедия Электронный ресурс. / WTKIMEDIA Project -Режим доступа: http://vi.wikipedia.org/wiki/ChLrQuocngir, свободный. Яз. вьетнамский.
- David Doermann, Jian Liang, and Huiping Li. Progress in camera-based document image analysis // In Proceedings of the 7th International Conference on Document Analysis and Recognition (ICDAR'03) 2003. — Vol. 1. — P. 606−616.
- Oivind Due Trier and Anil K. Jain. Goal-directed evaluation of binarization methods // IEEE Transactions on Pattern Analysis and Machine Intelligence -December 1995.-№ 17(12).-P. 1191−1201.
- Azriel Rosenfeld and John L. Pfaltz. Sequential operations in digital picture processing // Journal of the ACM. October 1966. — № 13(4). — P. 471−494.
- Ronald Lumia, Linda Shapiro, and Oscar Zuniga. A new connected components algorithm for virtual memory computers. // Computer Vision, Graphics, and Image Processing 1983. — № 22(2). -P.287−300.
- Linda Shapiro and George Stockman. / Computer Vision. Prentice Hall, March -2000.
- Henry S. Baird. The skew angle of printed documents. In Lawrence O’Gorman and R. Kasturi, editors. // Document Image Analysis 1995. — P. 204−208. — IEEE Computer Society Press.
- Akihide Hashizume, Pen-Shu Yeh, and Azriel Rosenfeld. A method of detecting the orientation of aligned components. // Pattern Recognition Letters № 4. — April 1986.-P. 125−132.
- Dan S. Bloomberg, Gary E. Kopec, and Lakshmi Dasari. Measuring document image skew and orientation. // In Proceedings of the SPIE Conference on Document Recognition II 1995. P. 302−316.
- Alan Pearlman. Converting to ABBYY FineReader OCR 9.0. Электронный ресурс. Режим доступа: http://www.law.com/jsp/legaltechnology/pubArticleLT.jsp?id=1 207 219 552 296
- Adnan Amin and Sue Wu. Robust skew detection in mixed text/graphics documents. // In Proceedings of the 8th International Conference on Document Analysis and Recognition. 2005. P. 247−251.
- A. Jain and B. Yu. Document representation and its application to page decomposition. / IEEE trans. // On Pattern Analysisand Machine Intelligence. № 20(3). — March 1998. — P. 294−308.
- O. Okun, D. Doermann, and M. Pietikainen. Page segmentation and zone classification: The state of the art. // In UMD 1999.
- F. Wahl, K. Wong, and R. Casey. Block segmentation and text extraction in mixed text/image documents. // CGIP. 1982. — № 20. P. 375−390.
- D. Wang and S. Srihari. Classification of newspaper image blocks using texture analysis. // CVGIP 1989. № 47. P. 327−352.
- T. Pavlidis and J. Zhou. Page segmentation by white streams. // Proc. 1st Int. Conf. Document Analysis and Recognition (ICDAR). 1991. P. 945−953. — Int. Assoc. Pattern Recognition.
- M. Hose and Y. Hoshino. Segmentation method of document images by two-dimensional Fourier transformation. // System and Computers in Japan. 2004 P. 57−65.
- A. Jain. Fundamentals of digital image processing. Prentice Hall, 1990.
- C. Tan and Z. Zhang. Text block segmentation using pyramid structure. // SPIE Document Recognition and Retrieval. San Jose, USA. — 2001 January 24−25. P.297−306.
- S. S. G. Nagy and S. Stoddard. Document analysis with expert system. // Proceedings of Pattern Recognition in Practice II. June 1985.
- R. B. Hennis. The IBM 1975 optical page reader: System design. // IBM Journal of Research and Development. № 12(5). — P.346−353. — September 1968.
- Robert M. Haralick, S. R. Sternberg, and X. Zhuang. Image analysis using mathematical morphology. // IEEE Transactions on Pattern Analysis and Machine Intelligence. № 9(4) — 1987. — P. 532−550.
- George Nagy. Twenty years of document image analysis in PAMI. // IEEE Transactions on Pattern Analysis and Machine Intelligence, № 22(1) January 2000.-P. 38−62.
- Yann LeCun, Leon Bossou, Yoshua Bengio, and Patrick Haner. Gradient-based learning applied to document recognition. // Proceedings of the IEEE. № 86(11) November 1998. — P. 2278−2324.
- Richard G. Casey and Eric Lecolinet. A survey of methods and strategies in character segmentation. // IEEE Transactions on Pattern Analysis and Machine Intelligence. № 18(7) July 1996. — P. 690−706.
- Gary Huang, Andrew McCallum, and Erik Learned-Miller. Cryptogram decoding for optical character recognition. // Technical Report 06−45 June 2006. University of Massachusetts Amherst.
- Dilip Sarkar. Methods to Speed Up Error Back-Propagation Learning Algorithm // ACM Computing Surveys, Vol. 27, №. 4, December 1995
- Gustav Tauschek. Reading machine Электронный ресурс. / U.S. Patent 2 026 329, December 1935. Режим доступа: http://www.google.com/patents?vid=USPAT2026329
- Paul W. Handel. Statistical machine Электронный ресурс. / U.S. Patent 1 915 993, June 1933. Режим доступа: http://www.google.com/patents7vidKJSPAT 1 915 993
- S. Mori, CY Suen, and K. Yamamoto. Historical review of OCR research and development. //Proceedings of the IEEE, Vol. 80(7), 1992. P. 1029−1058.
- Mindy Bosker. Omni document technologies. // Proceedings of the IEEE, Vol. 80(7), July 1992. P. 1066−1078.
- George Nagy. Document image analysis: What is missing? // Proceedings of the8th International Conference on Image Analysis and Processing. 1995. — P. 577—587.
- Simon Kahan, Theo Pavlidis, and Henry S. Baird. On the recognition of printed characters of any font and size. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 9(2), March 1987. P. 274−287.
- Shmuel Peleg and Azriel Rosenfeld. Breaking substitution ciphers using a relaxation algorithm. // Communications of the ACM, Vol. 22(11), November 1979.-P. 598−605.
- George Nagy, Sharad Seth, and Kent Einspahr. Decoding substitution ciphers by means of word matching with application to OCR. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 9(5), 1987. P. 710−715.
- Dar-Shyang Lee. Substitution deciphering based on HMMs with application to compressed document processing. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 24(12), December 2002. P. 1661−1666.
- Алгоритм Баума-Велша Электронный ресурс. Режим доступа: http://ru.wikipedia.org/wiki/AлгopитмБayмa-Beлшa
- Viterbi algorithm. Электронный ресурс. — Режим доступа: http://en.wikipedia.org/wiki/Viterbi algorithm
- Ньейн Эй. Разработка и исследование ПО для распознавания и анализа объектов на изображении с помощью нейронной сети: Диссертации насоискание ученой степени кандидата технических наук. / Московский инженерно-физический институт. М., 2007
- Тропченко А.Ю. Цифровая обработка изображений. Методы сжатия и вторичной обработки изображений. Распознавание объектов на изображении. СПб.: ИТМО- 1999.