X5 Data Science meetup #3

X5 Data Science meetup #3

Бурный рост эффективности ML систем провоцирует огромное количество дискуссий. X5 Tech приглашает экспертов в Data Science, чтобы обсудить как с помощью новых методов и подходов победить неэффективные процессы.

В наших докладах мы рассмотрим проверенные и новые методы взаимодействия с пользователями: от рекомендаций музыки до генерации контента и чат-ботов на основе искусственного интеллекта. Конечно же, мы также обсудим сложности: галлюцинации, мониторинг языковых моделей, методы улучшения RAG-систем.

 

Программа

18:30 — 19:00 Начало регистрации участников. Вкусняшки и живое общение.

19:00 Стартуем, приветственное слово ведущего.

19:00 — 19:30 «Все зависит от контекста»

Андреева Дарья, менеджер по работе с большими данными, X5 Tech

Часто мы имеем необходимость работать со специфичными и/или чувствительными данными, но при этом не имеем возможности воспользоваться внешними моделями или дообучить какую-то OpenSource модель. Разберемся, какие у нас есть варианты в этом случае.

19:30 — 20:00 «Мониторинг LLM в production»

Панин Глеб, менеджер по работе с большими данными, X5 Tech

Языковые модели представляют из себя крайне интересный и перспективный инструмент, однако они известны своей нестабильностью. В этом докладе мы расскажем, как пытаемся обнаруживать некорректную работу LLM и оперативно с ней бороться.

20:00 — 20:40 «Контентный подход в рекомендательных системах для музыки»

Дмитрий Астанков, Machine Learning Engineer, Звук

Расскажу, зачем вообще может понадобиться информация из музыкальных аудиодорожек. Что мы можем понять по спектрограмме с помощью машинного обучения и как добытые данные применяются в рекомендательных системах.

 

20:40 — 21:00 Немного подкрепимся и продолжим!

21:00 — 21:30 «Использование LLM в разметке данных»

 Ерохин Артем Игоревич, Ведущий менеджер по работе с большими данными, X5 Tech

Процесс разметки данных — дело достаточно затратное и трудоемкое. К счастью, последние достижения в области LLM могут стать серьезным подспорьем для улучшения процесса разметки данных. В докладе поговорим о том, как мы можем сократить затраты на разметку, используя большие языковые модели.

 

21:30 — AFTER PARTY.