Ozon Tech Community BI Meetup

Ozon Tech Community BI Meetup
Москва, Пресненская наб., 10, блок СOzonБесплатноОфлайн с онлайн трансляцией
Аналитика
https://ozontech.timepad.ru/event/2745021/

В этот раз мы познакомимся с командой платформы данных. На встрече нас ждут 5 докладов, в которых спикеры расскажут: про наши основные сервисы работы с данными, о новом подходе к работе с данными – «платформизация», про создание функционала для сжатия данных, а также обсудим термин data quality в отделе обработки данных.

Программа встречи:

18:30 | Начало регистрации

19:00 | Марина Самойлова, руководитель направления Платформы данных

Доклад: «Направление платформы данных Ozon». 

Интро о BI в Ozon: расскажем о 3-х сервисах работы с данными – Vertica, Clickhouse и Hadoop. 

19:30 | Александр Барановский, руководитель отдела Интеграции данных 

Доклад: «Платформизация в данных, как и зачем». 

В рамках доклада обсудим, как работает платформизация в Ozon, предпосылки внедрения нового подхода и что использовали до этого. Детально поговорим про роль единой платформы, какие были сложности и какую цель преследуем. 

20:00 | Евгения Губарева, руководитель группы автоматизации платформы данных

Доклад: «Как мы строим платформенное решение для транспорта данных от системы-источника до сырого слоя хранилища». 

Рассмотрим на примере применение такого подхода, как платформизация в данных, а именно, как мы автоматизируем поставку стриминговых данных от системы источника и до хранилища. Расскажем как нам удалось обобщить процесс траспортировки, какие требования к системе мы получили и как их выполняем.

20:30 | Перерыв

20:40 | Дмитрий Еричев, руководитель группы разработки инструментов BI

Доклад: «Сжатие данных в ClickHouse через функционал выбора лучших кодеков». 

Узнаем про создание функционала под кодовым названием Low Cardinality (LC), который выбирает лучшие кодеки сжатия в зависимости от характера данных. 

21:10 | Наталья Журавлёва, руководитель группы поддержки DWH

Доклад: «Data Quality».

Поговорим о том, что представляет из себя наш главный актив (спойлер – BI), а также, как мы следим за качеством данных и наши планы на будущее. 

21:40 | Фуршет, нетворкинг