Robot
Складчик
- #1
Computer Vision Engineer: от детекции и Doc-AI до продакшна (Алексей Малышкин)
- Ссылка на картинку

Практический курс по Computer Vision. Соберёте продакшн-сервис: датасет → обучение (YOLO/RT-DETR, SAM), трекинг, OCR/Doc-AI, веб-приложение (UI+API) и мониторинг. Экспорт в ONNX/TensorRT/OpenVINO, батчинг/квантование под CPU/GPU. Плюс профессиональные блоки: mAP/IoU/Dice и калибровка доверия, QA разметки и аугментации, p95/стоимость, дрейф данных и алерты, guardrails (NMS/правила), A/B-тесты, Triton/gRPC/FastAPI.
Этот курс — про продакшн-компьютерное зрение. Вы пройдёте путь от данных и разметки до работающего сервиса с метриками качества, скорости и стоимости инференса. Мы не ограничиваемся ноутбуками: строим сервисы, считаем p95-латентность и cost/1000 кадров, настраиваем мониторинг и приватность.
Что внутри. Детекция и сегментация (YOLOv8/YOLO11, RT-DETR, SAM), Doc-AI (PaddleOCR + LayoutParser), экспорт и ускорение (ONNX/TensorRT/OpenVINO, квантизация INT8, батчинг, динамические инпуты), сервисный слой (FastAPI, очереди Redis/RabbitMQ, rate-limit, ретраи), деплой (Docker/Compose, канареечные релизы), наблюдаемость (Prometheus/Grafana, структурированные логи, алерты).
Практика и артефакты:
Почему это ценно. Вы научитесь не только обучать модели, но и обосновывать ROMI: корректно мерить качество, latency и стоимость, находить узкие места, безопасно обновлять модели (канарейка/shadow), соблюдать политику PII (маскирование лиц/номеров, аудит доступа).
Формат: короткая теория → код → автопроверки/чек-листы → мини-итог. Финал — деплой сервиса с мониторингом и отчётом метрик.
Программа:
Секция 1. Введение и быстрый старт:
Этот курс — про продакшн-компьютерное зрение. Вы пройдёте путь от данных и разметки до работающего сервиса с метриками качества, скорости и стоимости инференса. Мы не ограничиваемся ноутбуками: строим сервисы, считаем p95-латентность и cost/1000 кадров, настраиваем мониторинг и приватность.
Что внутри. Детекция и сегментация (YOLOv8/YOLO11, RT-DETR, SAM), Doc-AI (PaddleOCR + LayoutParser), экспорт и ускорение (ONNX/TensorRT/OpenVINO, квантизация INT8, батчинг, динамические инпуты), сервисный слой (FastAPI, очереди Redis/RabbitMQ, rate-limit, ретраи), деплой (Docker/Compose, канареечные релизы), наблюдаемость (Prometheus/Grafana, структурированные логи, алерты).
Практика и артефакты:
- Retail: детектор пустых полок → mAP, p95, cost/req, дашборд.
- Пром: сегментация дефектов → IoU/Dice, отчёт по браку для менеджмента.
- Офис: Doc-AI для чеков/актов → JSON → БД, SLA эндпоинта.
Почему это ценно. Вы научитесь не только обучать модели, но и обосновывать ROMI: корректно мерить качество, latency и стоимость, находить узкие места, безопасно обновлять модели (канарейка/shadow), соблюдать политику PII (маскирование лиц/номеров, аудит доступа).
Формат: короткая теория → код → автопроверки/чек-листы → мини-итог. Финал — деплой сервиса с мониторингом и отчётом метрик.
Программа:
Секция 1. Введение и быстрый старт:
- Урок 1. Как будем работать: цели, стек, проекты
- Урок 2. Окружение: venv vs Docker/Compose (минимум)
- Урок 3. CLI/утилиты для CV
- Урок 4. Метрики CV простым языком
- Урок 5. Бенчмарк CPU/GPU (если есть)
- Урок 6. Git/Make/README как контракт воспроизводимости
- Урок 1. Сбор данных и схема классов
- Урок 2. Разметка детекции (Label Studio/Roboflow)
- Урок 3. Разметка сегментации (semantic/instance)
- Урок 4. Разметка документов (Doc-AI)
- Урок 5. Валидация датасета
- Урок 6. Аугментации и синтетика
- Урок 1. YOLO — базовая тренировка (сложный)
- Урок 2. Рецепты улучшения: EMA, cosine LR, freeze, AMP (сложный)
- Урок 3. RT-DETR — альтернатива для продакшна (сложный)
- Урок 4. Постпроцесс и калибровка порогов
- Урок 5. Экспорт детектора в ONNX (сложный)
- Урок 6. Error analysis детектора
- Урок 1. SAM — принципы и промпты (сложный)
- Урок 2. Fine-tune SAM: адаптер/LoRA (сложный)
- Урок 3. Instance vs semantic — метрики и выводы
- Урок 4. Постпроцесс масок
- Урок 5. Экспорт сегментации в ONNX (сложный)
- Урок 6. Витрина: сегментация дефектов + отчёт брака
- Урок 1. OCR базовый (PaddleOCR) (сложный)
- Урок 2. Layout/структура документов (сложный)
- Урок 3. Нормализация полей и правила
- Урок 4. Контракт JSON и валидация схемы
- Урок 5. API `/doc-parse` и запись в БД
- Урок 6. Витрина: Doc-AI end-to-end (сложный)
- Урок 1. ONNXRuntime на CPU (сложный)
- Урок 2. OpenVINO: IR и INT8 PTQ (сложный)
- Урок 3. TensorRT: FP16/INT8 на GPU (сложный)
- Урок 4. Батчинг и конвейерность
- Урок 5. Стоимость инференса
- Урок 6. Кейс «до/после» оптимизаций
- Урок 1. Базовый API `/predict` + OpenAPI
- Урок 2. Очереди и воркеры (Redis/RabbitMQ) (сложный)
- Урок 3. Rate limit, тайм-ауты, ретраи (сложный)
- Урок 4. Структурированные логи и трассировка
- Урок 5. Файлы, потоки, хранилища
- Урок 6. Нагрузочное тестирование и HAR-реплеи
- Урок 1. Prometheus экспортёр
- Урок 2. Grafana дашборд и алерты
- Урок 3. Качество оффлайн и регрессия
- Урок 4. Дрейф данных
- Урок 5. Дрейф качества
- Урок 6. Отчётность для бизнеса
- Урок 1. Docker-образы для CV
- Урок 2. Compose-стек: API + Redis + Prom + Grafana
- Урок 3. Blue-Green и Canary (сложный)
- Урок 4. Shadow-traffic
- Урок 5. Версионирование весов и откаты
- Урок 6. CI/CD минимум (сложный)
- Урок 1. Приватность изображений (PII)
- Урок 2. Security-базис сервиса
- Урок 3. ROMI для SMB-кейсов
- Урок 4. Финальный проект: Retail «пустые полки» (сложный)
- Урок 5. Финальный проект: Пром «дефекты»
- Урок 6. Финальный проект: Doc-AI «чеки/акты» (сложный)
Показать больше
Зарегистрируйтесь
, чтобы посмотреть скрытый контент.