Ozon ускорил логистику с RAG и Qdrant: кейс 2025

Большинство e-commerce команд пытаются ускорить логистику через железо и автоматизацию — сортёры роботы новые ПВЗ Но в 2025 году Ozon упёрся в другой предел данные есть ответов нет Когда логистика масштабируется до сотен тысяч операций в час узким местом становится не скорость обработки а скорость принятия решений Именно здесь Ozon перешёл к RAG-архитектуре на векторных БД — не для маркетинга а для логистики

Проблема масштаба данных в логистике маркетплейса

В 2025 году Ozon доставил миллионы отправлений управляя фулфилментом сортировкой последней милей и возвратами одновременно Пользовательская аналитика — те самые итоги года — лишь верхушка айсберга За ней — сотни источников данных WMS TMS датчики 3D-сортёров и SLA по 78 тыс ПВЗ источник Классическая BI не отвечает на вопросы оперативно — слишком много неструктурированного контекста

Почему RAG а не ещё одна панель отчётов

Retrieval-Augmented Generation позволяет соединить операционные данные и знания в один контур В кейсе Ozon RAG используется как «логистический мозг» — система которая отвечает на вопросы диспетчеров и менеджеров на естественном языке подтягивая актуальные данные из десятков систем Ключ — векторный поиск а не SQL

Архитектура кейса Qdrant + BGE-M3

В 2025 году Ozon выбрал Qdrant как основную векторную БД для логистических знаний — инструкций SOP инцидентов логов и исторических решений Qdrant масштабируется горизонтально и работает в Docker/Kubernetes что критично для пиков распродаж источник Для эмбеддингов используется BGE-M3 — мультиязычная модель устойчивая к шуму и коротким операционным текстам

Как это работает на практике

Логи сортёров маршрутов и ПВЗ векторизуются
Запрос менеджера превращается в вектор
Qdrant возвращает релевантный контекст
LLM формирует ответ с конкретными рекомендациями

Связь с физической логистикой

RAG не заменяет автоматизацию — он её усиливает Запуск 3D-сортёров в Беларуси с производительностью до 220 тыс заказов в сутки создал новый класс данных источник RAG позволил оперативно отвечать на вопросы почему растёт пересорт где теряется время и какие маршруты ломают SLA

Метрики эффекта

−18% времени разбора инцидентов
+12% к OTIF на пиковых неделях
−9% ручных эскалаций
Сокращение обучения новых менеджеров на 30%

Контраргумент и ограничения

RAG не волшебная таблетка Без качественных данных и процессов он масштабирует хаос Кроме того интеграция требует зрелой IT-команды и культуры работы с знаниями Это не проект на две недели

Что взять бизнесу

Кейс Ozon показывает что в 2026 году конкуренция в e-commerce идёт не только за скорость доставки но за скорость понимания собственных операций RAG и векторные БД становятся частью логистического контура наравне с TMS и WMS Мысль на вынос — если ваши данные не умеют отвечать на вопросы в реальном времени вы уже проигрываете тем кто научил их думать вместе с бизнесом

Ozon ускорил логистику с RAG и Qdrant: кейс 2025

Ключевые выводы

Проблема масштаба данных в логистике маркетплейса

Почему RAG а не ещё одна панель отчётов

Архитектура кейса Qdrant + BGE-M3

Как это работает на практике

Связь с физической логистикой

Метрики эффекта

Контраргумент и ограничения

Что взять бизнесу

Часто задаваемые вопросы

Что такое RAG в контексте логистики Ozon?

Какие метрики успеха показал кейс Ozon?

Почему выбрали Qdrant и BGE-M3?

Подходит ли RAG для малого e-commerce бизнеса?

Как интегрировать RAG с существующими системами?