Классификация пользователей по данным из сети интернет

  • И.В. Пономарев Алтайский государственный университет Email: igorpon@mail.ru
  • С.В. Черкасов Алтайский государственный университет Email: cherkasov.475@yandex.ru
Ключевые слова: классификация, соцсети, пользователи, анализ данных, сбор информации, байесовский классификатор

Аннотация

Проведен анализ способов сбора информации о пользователях на различных площадках в сети интернет. Рассмотрен способ извлечения информации из социальной сети ``ВКонтакте''. Для создания информационной базы исследования было выбрано наиболее информативный, на наш взгляд, раздел - список групп, в которых состоит пользователь. В процессе исследования был разработан алгоритм разбора текста до уровня понимания компьютером. С помощь наивного байесовского классификатора реализована классификация социального положения пользователя. Этот же алгоритм без каких-либо изменений можно адаптировать к классификации интересов пользователя.

Литература

1. Официальная документация Vk API. - URL: https://vk.com/dev/methods.
2. Обработка естественного языка в Node.js. - URL: https://medium.com/devschacht/natural-language-processing-for-node-js-da990c7dd886.
3. Domingos P., Pazzani M. On the optimality of the simple Bayesian classifier under zero-one loss // Machine Learning. – 1997. – no. 29. – P. 103-137.
Опубликован
2020-12-01
Как цитировать
Пономарев И., Черкасов С. Классификация пользователей по данным из сети интернет // Труды семинара по геометрии и математическому моделированию, 2020, № 6. С. 35-38. URL: http://journal.asu.ru/psgmm/article/view/8845.