Анастасия Никулина

Рекомендательные системы анализируют предпочтения пользователей пользователей и на основании такого анализа пытаются предсказать, что им можем быть интересно: товар, фильм, книга и пр. 🤔 Какие существуют подходы в рекомендательных системах: - Коллаборативная фильтрация (Collaborative Filtering) - анализирует схожесть между пользователями. Например: "Пользователям, купившим этот товар, также понравилось..." 👥 - Фильтрация на основе контента (Content-Based Filtering) - анализирует характеристики объектов (товаров, фильмов и т...

Анастасия Никулина

16 прочтений · 1 месяц назад

4 мифа про Data Science 🦄

Искаженное представление о работе в Data Science может отпугивать многих людей — они не решаются попробовать себя в этой области, даже если их настоящая работа их не устраивает. Например, им кажется, что для работы в этой сфере нужно быть математическим гением или иметь техническое образование, а также что Data Science сводится только к обучению моделей машинного обучения. Но на самом деле все происходит совсем не так. В этой статье собраны распространенные заблуждения о Data Science, а также на примерах объяснено, почему в них не стоит верить...

Анастасия Никулина

204 прочтения · 9 месяцев назад

🎰 Многорукие бандиты в Data Science Многорукие бандиты - это интересная и увлекательная концепция, которая находит широкое применение в решении различных задач. В этой статье мы расскажем о многоруких бандитах, о том, как они работают, и о том, как Data Scientist может использовать эти методы для оптимизации результатов. Что такое многорукие бандиты? Многорукие бандиты - это класс алгоритмов, который возник в контексте задачи о распределении ограниченных ресурсов для достижения наилучшего возможного результата. Название "многорукие бандиты" происходит от аналогии с игрой в казино, где игрок стоит перед рядом игровых автоматов с ручками ("руками") и должен выбрать, на какой автомат поставить деньги, чтобы максимизировать свой выигрыш. В контексте Data Science, "руками" могут быть различные варианты или стратегии. Каждая из этих стратегий может давать различные результаты, и цель заключается в том, чтобы найти оптимальную стратегию или комбинацию стратегий, чтобы максимизировать ожидаемый выигрыш. Часто многорукие бандиты применяются в качестве замены А/Б тестирования в рекомендательных системах. Но при провединии таких тестов мы сталкиваемся с главной проблемой бизнеса - упущенная выгода за время проведения А/Б теста (когда используем неэффективный вариант, который показываем группам). Способы оптимизации и максимизации выгоды 1. Epsilon-Greedy. Это простой и эффективный подход, который случайным образом выбирает жадную стратегию с вероятностью «epsilon». Например, если eps=0.02, то алгоритм 98% времени выбирает лучший вариант, а в оставшиеся 2% времени выбирает случайные варианты 2. UCB1. Идея заключается в выборе стратегии, которая максимизирует верхнюю границу доверительного интервала для ожидаемой награды 3. Thompson Sampling. Этот метод использует вероятностный подход, сэмплируя стратегии из их апостериорных распределений и выбирая наилучший вариант. #datascience #recsys #python #machinelearning

Скрыли публикацию

1,0×

С чего начать обучение Data Science с нуля в 2023 году? #datascience

Скрыли публикацию

1,0×

Распознавание лиц при помощи #computervision

Скрыли публикацию

1,0×

Заменит ли CHATGPT программистов? #shorts #datascience #chatgpt

Скрыли публикацию

1,0×

Ждать ли нам новой революции как с ChatGPT? #shorts #chatgpt

Скрыли публикацию

1,0×

Розыгрыш билета на конференцию Moscow Python Conf++