X5 Data Science meetup #3
Бурный рост эффективности ML систем провоцирует огромное количество дискуссий. X5 Tech приглашает экспертов в Data Science, чтобы обсудить как с помощью новых методов и подходов победить неэффективные процессы.
В наших докладах мы рассмотрим проверенные и новые методы взаимодействия с пользователями: от рекомендаций музыки до генерации контента и чат-ботов на основе искусственного интеллекта. Конечно же, мы также обсудим сложности: галлюцинации, мониторинг языковых моделей, методы улучшения RAG-систем.
Программа
18:30 — 19:00 Начало регистрации участников. Вкусняшки и живое общение.
19:00 Стартуем, приветственное слово ведущего.
19:00 — 19:30 «Все зависит от контекста»
Андреева Дарья, менеджер по работе с большими данными, X5 Tech
Часто мы имеем необходимость работать со специфичными и/или чувствительными данными, но при этом не имеем возможности воспользоваться внешними моделями или дообучить какую-то OpenSource модель. Разберемся, какие у нас есть варианты в этом случае.
19:30 — 20:00 «Мониторинг LLM в production»
Панин Глеб, менеджер по работе с большими данными, X5 Tech
Языковые модели представляют из себя крайне интересный и перспективный инструмент, однако они известны своей нестабильностью. В этом докладе мы расскажем, как пытаемся обнаруживать некорректную работу LLM и оперативно с ней бороться.
20:00 — 20:40 «Контентный подход в рекомендательных системах для музыки»
Дмитрий Астанков, Machine Learning Engineer, Звук
Расскажу, зачем вообще может понадобиться информация из музыкальных аудиодорожек. Что мы можем понять по спектрограмме с помощью машинного обучения и как добытые данные применяются в рекомендательных системах.
20:40 — 21:00 Немного подкрепимся и продолжим!
21:00 — 21:30 «Использование LLM в разметке данных»
Ерохин Артем Игоревич, Ведущий менеджер по работе с большими данными, X5 Tech
Процесс разметки данных — дело достаточно затратное и трудоемкое. К счастью, последние достижения в области LLM могут стать серьезным подспорьем для улучшения процесса разметки данных. В докладе поговорим о том, как мы можем сократить затраты на разметку, используя большие языковые модели.
21:30 — AFTER PARTY.