Управление контентом веб-сайта на основе персонализации данных
Диссертация
Проведена апробация разработанных моделей и алгоритмов, показавшая их эффективность, осуществлена программная реализация системы персонализации на основе клиентских сценариев, выполненных на языке JavaScript, серверных сценариев на языке PHP в связке с системой управления базами данных MySQL. Проведен сравнительный анализ алгоритмов кластеризации под требования кластеризации поисковых… Читать ещё >
Содержание
- 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЯ
- 1. 1. Введение в персонализацию данных веб-сайта
- 1. 2. Выделение класса персонифицированных веб-сайтов
- 1. 3. Классификация систем персонализации сайтов
- 1. 4. Выделение концептуальных уровней персонализации
- 1. 5. Объект исследования
- 1. 6. Модель веб-сайта
- 1. 1. Выбор подхода к персонализации данных
- 1. 8. Модель пользователя
- Выводы по главе
- 2. РАЗРАБОТКА МОДЕЛИ ПЕРСОНАЛИЗАЦИИ ВЕБ-САЙТА НА ОСНОВЕ КОМБИНИРОВАННОГО ПОДХОДА К ФИЛЬТРАЦИИ ДАННЫХ
- 2. 1. Получение множества ссылок, удовлетворяющих постоянные потребности пользователя
- 2. 1. 1. Особенности обработки поисковых профилей
- 2. 1. 2. Требования к алгоритму кластеризации
- 2. 1. 3. Анализ алгоритмов кластеризации
- 2. 1. 4. Алгоритм кластеризации СЬОРЕ
- 2. 1. 5. Кластеризация поисковых профилей на основе алгоритма СЬОРЕ
- 2. 1. 6. Ранжирование поисковых запросов и соответствующих ссылок
- 2. 1. 7. Обобщенная блок-схема алгоритма персонализации с учетом постоянных потребностей конечного пользователя на основе кластеризации поисковых профилей
- 2. 2. Получение множества ссылок, удовлетворяющих текущие потребности пользователя
- 2. 2. 1. Получение множества ссылок, удовлетворяющих текущие потребности пользователя, на основе похожих поисковых запросов
- 2. 2. 2. Получение множества ссылок, удовлетворяющих текущие потребности пользователя, в случае отсутствия идентичных и похожих поисковых запросов
- 2. 2. 3. Получение множества ссылок, в случае нескольких просмотренных страниц
- 2. 2. 4. Обобщенная блок-схема алгоритма персонализации с учетом текущих потребностей конечного пользователей на основе непросмотренных страниц
- 2. 3. Перспектива развития разработанной модели персонализации
- 2. 1. Получение множества ссылок, удовлетворяющих постоянные потребности пользователя
- Выводы по главе
- 3. РАЗРАБОТКА МЕТОДА ОПРЕДЕЛЕНИЯ РЕЛЕВАНТНОСТИ СТРАНИЦ
- 3. 1. Анализ и классификация индикаторов предпочтений
- 3. 2. Многокритериальная оптимизация в задаче оценивания релевантности просмотренных страниц
- 3. 3. Метод определения релевантности страниц на основе индикатора предпочтений
- 3. 4. Экспериментальная оценка разработанной модели индикатора
- МКОПХП
- Выводы по главе
- 4. РЕАЛИЗАЦИЯ СИСТЕМЫ ПЕРСОНАЛИЗАЦИИ ДАННЫХ
- 4. 1. Выбор языков разработки сценариев и системы управления базой данных
- 4. 2. Особенности функционирования системы персонализации данных веб-сайта
- 4. 3. Оценка точности разработанной модели персонализации
- 4. 4. Перспективы развития системы персонализации данных на основе
- 8. аа8-архитектуры
- Выводы по главе
Список литературы
- Аверин Д.В. Опыт классификации электронных изданий // Известия вузов. Проблемы полиграфии и изд. дела. 2000. № 1. С. 145−148.
- Агеев В.Н. Электронная книга: новое средство социальной коммуникации. М.: Мир книги, 1997.
- Алгоритмы кластеризации на службе Data Mining. http://www.basegroup.ru/library/analysis/clusterization/datamining/ //10.03.2009
- Ашманов И.С., Иванов А. А. Продвижение сайта в поисковых системах.-М.: ООО «И.Д. Вильяме», 2007.-304 е.: ил.
- Батищев Д.И. Поисковые методы оптимального проектирования.// М.: Советское радио. 1975 126 с.
- Беляков Г. П. и др. Основы системотехники: Учеб. Пособие для вузов/ Г. П. Беляков, В. А. Сарычев, В. А. Сорокин, В. О. Чернышев. Под ред. В. О. Чернышева. Томск: МГП «РАСКО», 1992. 312 с ил.
- Бунин О. Персонализация сайтов. Мир Internet. -2001. 12. -С. 66−69.
- Вентцель Е. С, Овчаров Л. А. Теория случайных процессов и ее инженерные приложения. М.: Наука. Гл. ред. физ.-мат. лит. -1991. -384с.
- Вуль В.А. Электронные издания. СПб.: Изд-во «БХВ», 2003.
- Выбор метода кластеризации. http://www.market-joumal.com/marketingovyeissledovanija/209.htinl // 10.03.2009
- Гаек Я., Шидак 3. Теория ранговых критериев, М. :Наука, 1971.- 375 с.
- Гасов В.М., Цыганенко А. М. Методы и средства подготовки электронных изданий. М.: Изд-во МГУП, 2001.
- Гуменникова A.B. Адаптивные поисковые алгоритмы для решения сложных задач многокритериальной оптимизации. Диссертационная работа к.т.н.: Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева. Красноярск, 2006. -132с.
- Джонс М.Т. Программирование искусственного интеллекта в приложениях / М. Тим Джонс- Пер. с англ. Осипов А. И. — М.: ДМК Пресс, 2006 312 с.: ил.
- Емельянов C.B., Ларичев О. И. Многокритериальные методы принятия решений. М.: Знание, 1985. 32 с. (Новое в жизни, науке, технике. Сер. «Математика, кибернетика" — N» 10).
- Живицкая E.H. «Системный анализ и проектирование» http://victor-safronov.narod.ru/systems-analysis/Iectures/zliivickaya.html
- Зайцев И.Б., Адаптивные гипермедиа издания, интегрированные в Интернет: Диссертационная работа к.т.н.: 05.13.06. /Московский государственный университет печати. Москва, 2005. — 150 с.
- Зайцев И.Б. Методика «наивного» Байесовского классификатора для задачи совместной фильтрации в системах рекомендации // Доклады независимых авторов. Вып.2. Изд-во «DNA», Россия-Израиль, 2005. G.20−27.
- Зайцев И.Б. Модифицированный алгоритм «К-ближайших соседей» для совместной фильтрации в адаптивных гипертекстовых системах //
- Вестник МГУП. Ko5.-U.: МГУП, 2005.-С. 105−112.
- PHP и другие языки. http://phpm.ru/php/faq.languages.html // 23.02.2009
- Калинина Э.В., Лапига А. Г. и др. Оптимизация качества. Сложные продукты и процессы. //Москва. Химия. 1989. 256 с.
- Кейн В.М. Оптимизация систем управления по минимаксному критерию. М.: Наука, 1985.
- Кластерный анализ морфологических множеств http://www.ecosyn.ru/page0047.html // 14.04.2009
- Многокритериальные задачи принятия решений. Под ред. Д. М. Гвишиани, С В Емельянова. М.: Машиностроение, 1978.
- Многокритериальная оптимизация. Математические аспекты. М.:Наука, 1989, с. 116−123.
- Мур, Джеффри, Уэдерфорд, Лари Р., и др. Экономическое моделирование в Microsoft Excel, 6-е изд.: Пер. с англ. М.: Издательской дом «Вильяме», 2004. — 1024 с.
- Нейрокомпьютер как основа мыслящих ЭВМ. М.: Наука, 1993. — 237 с.
- О персонализации веб-сайта. http://www.webmascon.com/ 14.11.2003
- Обзор методов кластеризации текстовой информации http://www.dialog-21.ru/Archive/2001/volume2/226.htm // 01.03.2009
- Общая теория статистики: статистическая методология в изучении коммерческой деятельности: Учебник / Под ред. О. Э. Байтной, А. А. Спирина 5-е изд., доп. И перераб. — М. Ж Финансы и статистика, 2005.
- Паклин Н. «Кластеризация категорийных данных: масштабируемый алгоритм CLOPE». http://www.basegroup.ru/clusterization/clope.htm // 12.04.2009
- Ретинская И.В. Система оценки качества и выбора программно-аппаратных средств учебного назначения: Диссертационная работа д.т.н.: 05.13.14. /Московский государственный университет леса. Москва, 1997. 342 с.
- Семенкина О.Э. Поисковые методы синтеза систем управления космическими аппаратами. Дисс. на соиск. уч. ст. канд. техн. наук -Красноярск: Сибирская аэрокосмическая академия, 1995. -185 с.
- Серов В.А. Генетический алгоритм многокритериальной оптимизации В.А. Серов, Ю. В. Горячев. Проблемы теории и практики в инженерных исследованиях: Сб. научных трудов. М.: Машиностроение, 1999, с. 23−29. 120
- Статья из The Economist о коллаборативной фильтрации // http://artpragmatica.ru/rs/?uid=l 147 // 08.02.2010
- Страничные серверы приложений на базе сценариев. http://www.pcmag.ru/issues/subdetail.php7ID-657l&SUB JPAGE=1 // 15.10.2001
- Томсон Лаура, Люк Веллинг. Разработка web-приложений на PHP и MySQL: Пер. с англ. 2-е изд., испр. — СПб: ООО «ДиаСофтЮП», 2003.
- Царев А.Г. Выбор подхода к фильтрации информации для системы персонализации интернет-магазина. // Вестник Московского государственного университета леса — Лесной вестник. — 2008. — № 4(61).-С. 180−182.
- Царев А.Г. Интернет-магазин для стоматолога. Медицинский алфавит. Стоматология № 3(46). -2005. С. 16−17.
- Царев А.Г. Исследование интерфейсных взаимодействий пользователей Интернет-магазина. Судак // Новые информационныетехнологии. Тезисы докладов XVI международной студенческой школы-семинара М: МИЭМ, 2008, С. 247−248.
- Царев А.Г. Многокритериальная оптимизация в задаче вычисления релевантности страниц веб-сайта. // Естественные и технические науки № 4 (48). Москва: ООО «Изадтельство „Спутник+“, 2010, — с. 298−299. ISSN 1684−2626.
- Царев А.Г. Модель индикатора предпочтений конечного пользователя веб-сайта на основе многокритериальной комплексной оценки альтернатив. // Мониторинг. Наука и технологии. № 3, 2010.-е. 68−69. -ISSN 2076−7358.
- Царев А.Г. О сборе пользовательских данных в системе персонализации Интернет-магазина. // Вестник Московскогогосударственного университета леса — Лесной вестник. — 2009. -№ 3(66). С. 141−145.
- Царев А.Г. Счётчик пользовательских данных для системы персонализадии Интернет-магазина. // Инновации в условиях развития информационно-коммуникационных технологий: Материалы научно-практической конференции М.: МИЭМ, 2007.331−333.
- Царев А.Г., Шереметьев К. П. Тенденции развития интеллектуальных информационных систем в сети Интернет. //Интеллектуальные технологии в образовании, экономике и управлении -2005: Сборник статей 2 Международной конференции. — Воронеж, 2005. — С. 197 198.
- Царев В .В. Оценка экономической эффективности инвестиций. -СПб.: Питер, 2004. 464 с.
- Целых A.A., Разработка и исследование методов и алгоритмов для моделирования адаптивных веб-ресурсов на основе нечетких ультраграфов: Диссертационная работа к.т.н.: 05.13.17 / Таганрогский государственный радиотехнический университет, 2005
- Чубукова И. A. Data Mining. Учебное пособие. М.: Интернет-Университет Информационных технологий- БИНОМ. Лаборатория знаний, 2006. — 382 е.: ил., табл. — (Серия „Основы информационных технологий“),
- Щедрин А. Основы извлечения знаний из Internet. // Открытыесистемы, #04/2003
- Шереметьев К.П., Царев А. Г. Использование внешних статистических данных при персонализации сайта. // Вестник Московского государственного университета леса Лесной вестник. — 2006. — № 3(45). — С. 172−176.
- Шереметьев К.П., Царев А. Г. Система персонализации данных для сайтов электронной коммерции. // Вестник Московского государственного университета леса — Лесной вестник. — 2005. — № 6(42).-С. 172−175.
- Экенроде Р.Т., Взвешенные многомерные критерии, книга „Статистическое измерение качественных характеристик“ под ред. проф. Е. М. Четыркина. -М.:1970.
- Adomavicius Gediminas. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data Engineering, Vol. 17, No. 6
- Ansari A., Essegaier S., and Kohli R., „Internet Recommendations Systems,“ J. Marketing Research, pp. 363−375, Aug. 2000.
- Average Web Page Size Quintuples Since 2003 web page statistics and survey trends for page size and web objects. http ://www.websiteoptimization. com/ speed/tweak/average-web-page/ // 10.05.2010
- Balabanovic M. and Shoham Y., „Fab: Content-Based, Collaborative Recommendation,“ Comm. ACM, vol. 40, no. 3, pp. 66−72,1997.
- Basu C., Hirsh H., and Cohen W., „Recommendation as Classification: Using Social and Content-Based Information in Recommendation,“ Recommender Systems. Papers from 1998 Workshop, Technical Report WS-98−08, AAAI Press 1998.
- Billsus D. and Pazzani M., „A Personal News Agent that Talks, Learns and
- Explains,“ Proc. Third Ann. Conf. Autonomous Agents, 1999.
- Billsus D. and Pazzani M., „Learning Collaborative Information Filters,“ Proc. Int’l Conf. Machine Learning, 1998.
- Breese J., Heckerman D., and Kadie C. Empirical Analysis of Predictive Algorithms for Collaborative Filtering. In Proceedings of the Fourteenth Annual Conference on Uncertainty in Artificial Intelligence, pages 43−52, July 1998.
- Carpenter G.A. and S. Grossberg, 1985. Category Learning and Adaptive Pattern Recognition: a neural network model, in proceedings of third army conference on applied mathematics and computing, ARO Report 86−1, 37−56.
- Carpenter G.A., Grossberg S. Pattern Recognition by Self-Organizing Neural Networks, Cambridge, MA, MIT Press, 1991.
- Claypool M., Gokhale A., Miranda T., Murnikov P., Netes D., and Sartin M., „Combining Content-Based and Collaborative Filters in an Online Newspaper,“ Proc. ACM SIGIR '99 Workshop Recommender Systems: Algorithms and Evaluation, Aug. 1999.
- Claypool M., Le P., Wased M., and Brown D. Implicit interest indicators. In Intelligent User Interfaces, pagQS 33−40, 2001.
- CondliffM., Lewis D., Madigan D., and Posse C., „Bayesian Mixed-Effects Models for Recommender Systems,“ Proc. ACMSIGIR '99 Workshop Recommender Systems: Algorithms and Evaluation, Aug. 1999.
- Defays D., An efficient algorithm for a complete link method, The Computer Journal, 20:346−366, 1977
- Dunn J.C., A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters, Journal of Cybernetics 3- 1973: 32−57.
- Group-average agglomerative clustering. http://nlp.stanford.edu/lR-book/h1ml/htmledition/group-average-agglomerative-clustering-l.html // 08.02.2009
- Guha Sudipto, Rastogi R., and Shim K. CURE: A clustering algorithm for large databases. Technical report, Bell Laboratories, Murray Hill, 1997.
- Guha S., Rastogi R., and Shim K. ROCK: A robust clustering algorithm for categorical attributes. In Proc. ICDE'99, Sydney, Australia 1999.
- He H., Singh A. Efficient Algorithms for Mining Significant Substructures in Graphs with Quality Guarantees. Department of Computer Science University of California, Santa Barbara, 2004.
- Hill W., Stead L., Rosenstein M., and Furnas G., „Recommendingand Evaluating Choices in a Virtual Community of Use,“ Proc.Conf. Human Factors in Computing Systems, 1995.
- Hofmann, „Collaborative Filtering via Gaussian Probabilistic Latent Semantic Analysis,“ Proc. 26th Ann. Int’l ACM SIGIR Conf., 2003.
- Hofmann, „Probabilistic Latent Semantic Analysis,“ Proc. 15 th Conf. Uncertainty in Artificial Intelligence, pp. 289−296, 1999.
- Hubert, Lawrence- Baker, Frank B. Data Analysis by Single-Link and Complete-Link Hierarchical Clustering. Journal of Educational Statistics, 1, 2, 87−111, Sum 76.
- Kaufman L. and Rousseeuw P. J., Finding Groups in Data, An Itroduction to Cluster Analysis. Brussels, Belgium: John Wiley and Sons, 1990.
- Kilfoil M., Ghorbani A. Toward An Adaptive Web: The State of the Art and Science // Proc. of the GNSR 2003 Conference. Moncton, New Brunswick, Canada, 2003.
- Kohonen T.- (1989/1997/2001), Self-Organizing Maps. Berlin-New York: Springer-Verlag. Firsteditionl989. Secondeditionl997. Thirdextendededition2001.
- Lang K., „Newsweeder: Learning to Filter Netnews,“ Proc. 12thlnt'l Conf. Machine Learning, 1995.
- Linden G., Smith B., and York J., „Amazon.com Recommendations: Item-to-item Collaborative Filtering,“ IEEE Internet Computing, Jan./Feb. 2003.
- MacQueen, J.B. Some methods for classification and analysis of multivariate observations. In Proc. 5th Berkeley Symposium on Math. Stat, and Prob., 1967.
- Melville P., Mooney R., and Nagarajan R. Content-boosted collaborative filtering. In Proceedings of the ACM SIGIR Workshop on Recommender Systems, 2001.
- Mooney R.J., Bennett P.N., and Roy L., „Book RecommendingUsing Text Categorization with Extracted Information,“ Proc. Recommender Systems Papers from 1998 Workshop, Technical Report WS-98−08, 1998.
- Mooney RJ. and Roy L., „Content-Based Book RecommendingUsing Learning for Text Categorization,“ Proc. ACM SIGIR '99Workshop Recommender Systems: Algorithms and Evaluation, 1999.
- O’Connor M. and Heriocker J. Clustering items for collaborative filtering. In ACM SIGIR '99 Workshop on Recommender Systems: Algorithms and Evaluation. 1999.
- Pavlov D. and Pennock D., „A Maximum Entropy Approach to Collaborative Filtering in Dynamic, Sparse, High-Dimensional Domains,“ Proc. 16th Ann. Conf. Neural Information Processing Systems (NIPS '02), 2002.
- Pazzani M., „A Framework for Collaborative, Content-Based, and Demographic Filtering, Artificial Intelligence Rev., pp. 393−408, Dec.1999.
- Pazzani and Billsus D., „Learning and Revising User Profiles: The Identification of Interesting Web Sites,“ Machine Learning, vol. 27, pp. 313−331, 1997.
- Pennock D.M. and Horvitz E., „Collaborative Filtering by Personality Diagnosis: A Hybrid Memory And Model-Based Approach,“ Proc. Int’l Joint Conf. Artificial Intelligence Workshop: Machine Learning for Information Filtering, Aug. 1999
- Resnick P., Iakovou N., Sushak M., Bergstrom P. and Riedl J.,"GroupLens: An Open Architecture for Collaborative Filtering of Netnews,“ Proc. 1994 Computer Supported Cooperative Work Conf., 1994.
- Sarwar B., Karypis G., Konstan J., and Riedl J., „Application of Dimensionality Reduction in Recommender Systems-A Case Study,“ Proc. ACM WebKDD Workshop, 2000.
- Sarwar B., Karypis G., Konstan J., and Riedl J., „Item-Based Collaborative Filtering Recommendation Algorithms,“ Proc. lOthlnt’l WWW Conf., 2001.
- Schein A.I., Popescul A., Ungar L.H., and Pennock D.M. /'Methods and Metrics for Cold-Start Recommendations,» Proc. 25th Ann. Int’l ACM SIGIR Conf., 2002.
- Shahabi Cyrus, Banaei-Kashani Farnoush. «A Framework for Efficient and Anonymous Web Usage Mining Based on Client-Side Tracking», Department of Computer Science, Integrated Media Systems Center, University of Southern California, USA, 2001.
- Shardanand U. and Maes P., «Social Information Filtering: Algorithms for Automating 'Word of Mouth',» Proc. Conf. Human Factors in Computing Systems, 1995.
- Sibson R. SLINK: An optimally efficient algorithm for the single-link cluster method. King’s College Research Center, King’s College, Cambridge, and Cambridge University Statistical Laboratory.
- Soboroff and Nicholas C., «Combining Content and Collaborationin Text Filtering,» Proc. Int’l Joint Conf. Artificial Intelligence Workshop: Machine1. arning for Information Filtering, Aug. 1999.
- Strehl A., Ghosh J., Mooney R., Impact of similarity measures on web-page clustering. In Proc. AAAI Workshop on AI for Web Search (2000), 58−64, 2000.
- Tran T. and Cohen R., «Hybrid Recommender Systems forElectronic Commerce,» Proc. Knowledge-Based Electronic Markets, Papers from the AAAI Workshop, Technical Report WS-00−04, AAAI Press, 2000.
- Yang Y., Guan X., and You J. Clope: A fast and effective clustering algorithm for transactional data. Proc. of ACM SIGKDD Conference, July 2002.
- Zhang Y., Callan J., and Minka T., «Novelty and Redundancy Detection in Adaptive Filtering,» Proc. 25th Ann. Int’l ACM SIGIR Conf., pp. 81−88, 2002.
- Zhang, T., Ramakrishnan, R., and Livny, M. BIRCH: An efficient data clustering method for very large databases. In Proc SIGMOD'96, Montreal, Canada, 1996.
- Zuckerman, I., Albrecht, D., and Nicholson, A. Predicting user’s requests on the WWW. In Proceedings of the Seventh International Conference on User Modeling, pages 275−284. Springer Wien, 1999.