Ozon ускорил логистику с RAG и Qdrant: кейс 2025
Ozon применил RAG-архитектуру на Qdrant и BGE-M3 для логистики e-commerce. Результаты: -18% времени на инциденты, +12% OTIF, -30% обучения. Разбор кейса, метрики и советы по внедрению для вашего бизнеса в 2026 году.
Ключевые выводы
- 1Ozon интегрировал RAG с Qdrant для оперативных ответов на вопросы логистики, используя векторный поиск.
- 2Метрики успеха: -18% времени разбора инцидентов, +12% OTIF на пиках, -9% эскалаций.
- 3Сокращение обучения менеджеров на 30% благодаря доступу к знаниям в реальном времени.
- 4RAG усиливает автоматизацию, но требует качественных данных и зрелой IT-команды.

Большинство e-commerce команд пытаются ускорить логистику через железо и автоматизацию — сортёры роботы новые ПВЗ Но в 2025 году Ozon упёрся в другой предел данные есть ответов нет Когда логистика масштабируется до сотен тысяч операций в час узким местом становится не скорость обработки а скорость принятия решений Именно здесь Ozon перешёл к RAG-архитектуре на векторных БД — не для маркетинга а для логистики
Проблема масштаба данных в логистике маркетплейса
В 2025 году Ozon доставил миллионы отправлений управляя фулфилментом сортировкой последней милей и возвратами одновременно Пользовательская аналитика — те самые итоги года — лишь верхушка айсберга За ней — сотни источников данных WMS TMS датчики 3D-сортёров и SLA по 78 тыс ПВЗ источник Классическая BI не отвечает на вопросы оперативно — слишком много неструктурированного контекста
Почему RAG а не ещё одна панель отчётов
Retrieval-Augmented Generation позволяет соединить операционные данные и знания в один контур В кейсе Ozon RAG используется как «логистический мозг» — система которая отвечает на вопросы диспетчеров и менеджеров на естественном языке подтягивая актуальные данные из десятков систем Ключ — векторный поиск а не SQL
Архитектура кейса Qdrant + BGE-M3
В 2025 году Ozon выбрал Qdrant как основную векторную БД для логистических знаний — инструкций SOP инцидентов логов и исторических решений Qdrant масштабируется горизонтально и работает в Docker/Kubernetes что критично для пиков распродаж источник Для эмбеддингов используется BGE-M3 — мультиязычная модель устойчивая к шуму и коротким операционным текстам
Как это работает на практике
- Логи сортёров маршрутов и ПВЗ векторизуются
- Запрос менеджера превращается в вектор
- Qdrant возвращает релевантный контекст
- LLM формирует ответ с конкретными рекомендациями
Связь с физической логистикой
RAG не заменяет автоматизацию — он её усиливает Запуск 3D-сортёров в Беларуси с производительностью до 220 тыс заказов в сутки создал новый класс данных источник RAG позволил оперативно отвечать на вопросы почему растёт пересорт где теряется время и какие маршруты ломают SLA
Метрики эффекта
- −18% времени разбора инцидентов
- +12% к OTIF на пиковых неделях
- −9% ручных эскалаций
- Сокращение обучения новых менеджеров на 30%
Контраргумент и ограничения
RAG не волшебная таблетка Без качественных данных и процессов он масштабирует хаос Кроме того интеграция требует зрелой IT-команды и культуры работы с знаниями Это не проект на две недели
Что взять бизнесу
Кейс Ozon показывает что в 2026 году конкуренция в e-commerce идёт не только за скорость доставки но за скорость понимания собственных операций RAG и векторные БД становятся частью логистического контура наравне с TMS и WMS Мысль на вынос — если ваши данные не умеют отвечать на вопросы в реальном времени вы уже проигрываете тем кто научил их думать вместе с бизнесом