Даже небольшое количество негативных отзывов о компании либо качестве ее услуг, оставленный в сети конкурентами, клиентом или бывшим сотрудником, могут повлечь за собой отток потенциальных клиентов и как следствие серьезные финансовые потери. Также это ценный источник зон непрерывного улучшения сервиса для компании.
Спикер: Алексей Журавлев
— Какие сайты лучше использовать для сбора информации
— Поиск отрицательно-окрашенных отзывов
— Как автоматизировать этот процесс с помощью web-scraping (parsing) и пакетов BeautifulSoup и Selenium (Python)
— Проблемы, с которыми можно столкнуться: капчи и проч.
— Обзор алгоритмов для построения ML модели для бинарной классификации: word2vec+ XGBoost, word2vec+ SGD, tf-idf + SGD, , tf-idf + XGBoost
— Кластеризация отзывов с помощью KMeans, LDA, MiniBatchKMeans, Agglomerative
Материалы презентации здесь: https://newtechaudit.ru/wp-content/uploads/2020/08/prezentacziya-vneshnie-istochniki-webinarv2.pptx
Еще полезные статьи по теме:
ИСПОЛЬЗУЕМ DS ДЛЯ ОБРАБОТКИ ОТЗЫВОВ КЛИЕНТОВ С КРУПНЫХ САЙТОВ: https://newtechaudit.ru/ds-obrabotka/
ПАРСЕР НОВОСТНЫХ RSS-ЛЕНТ С ВОЗМОЖНОСТЬЮ ПОИСКА ПО ОПРЕДЕЛЕННЫМ СЛОВАМ — https://newtechaudit.ru/parser-novostnyh-rss-lent/
КЛАССИФИКАЦИЯ ОТЗЫВОВ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ https://newtechaudit.ru/klassifikacziya-otzyvov-polzovatelej/
ПРИМЕНЕНИЕ NLP В БАНКАХ: ВОЗМОЖНОСТИ И КЕЙС — https://newtechaudit.ru/primenenie-nlp-v-bankah-vozmozhnosti-i-kejs/