[Stepik] RAG-системы на векторных базах данных (Дмитрий Соболев)

Aноним · Вторник в 13:26

RAG (Retrieval-Augmented Generation) — это технология, которая позволяет языковым моделям работать с актуальными данными и корпоративными знаниями. Вместо того чтобы полагаться только на обучающие данные, RAG-системы находят релевантную информацию в векторных базах и используют её для генерации точных ответов.

Почему именно этот курс?

Большинство курсов по AI останавливаются на базовых примерах с LangChain. Мы идём дальше — от математики эмбеддингов до продакшен-систем с мониторингом качества и CI/CD.

Что делает курс особенным:

Три векторные БД (FAISS, Qdrant, Weaviate) с глубоким погружением в архитектуру
Практикумы с реальными сценариями: от прототипа до deployment
Мультимодальный поиск (текст + изображения)
Production-подход: метрики качества, контроль версий, CI/CD для ML
Структура курса:

Введение в векторный поиск — эмбеддинги, алгоритмы ANN, архитектура хранилищ
FAISS — высокопроизводительная библиотека от Meta для миллионов векторов
Qdrant — современная векторная БД с богатым функционалом
Weaviate — векторная БД с GraphQL и гибкой схемой данных
Production-практики — мультимодальность, метрики, мониторинг, CI/CD
Каждый раздел включает практикум, где вы собираете работающие RAG-пайплайны и решаете задачи, близкие к боевым.

Для кого этот курс
ML-инженеры, которые хотят внедрять RAG в production и работать с векторными БД Backend-разработчики, интегрирующие AI/LLM в свои приложения Data Scientists, переходящие в ML Engineering и желающие понять инфраструктуру AI-энтузиасты с опытом программирования, готовые строить реальные AI-системы
Начальные требования
Python — умеете писать простые скрипты, работали с библиотеками типа pandas или requests
Базовое понимание ML — слышали про векторы и знаете, что такое расстояние между точками (остальное объясним)
Желательно, но не обязательно: опыт с API, знакомство с Git, общее представление о том, как работают LLM
Если вы писали код на Python и интересуетесь AI — этого достаточно. Всю специфику RAG и векторных БД разберём с нуля.

Программа курса:

1. Введение

1.1 Вводный урок

2. Векторные представления и поиск

2.1 Введение в семантический поиск и эмбеддинги
2.2 Инструменты для работы с эмбеддингами
2.3 Поиск ближайших соседей: от теории к архитектуре
2.4 Векторные хранилища
2.5 Что такое RAG и зачем оно нужно

3. FAISS

3.1 FAISS: архитектура и типы индексов
3.2 Работа с индексами FAISS
3.3 FAISS в RAG-пайплайне: LangChain и продакшен
3.4 Практикум по FAISS

4. Qdrant

4.1 Qdrant: архитектура и устройство
4.2 Qdrant на практике
4.3 Qdrant + LangChain: RAG-пайплайн
4.4 Практикум по Qdrant

5. Weaviate

5.1 Архитектура Weaviate и GraphQL API
5.2 Python SDK — схема, поиск, RAG
5.3 LangChain + Weaviate
5.4 Практикум по Weaviate

6. Поиск в продакшне: качество, контроль и объяснимость

6.1 Мультимодальный поиск: текст + изображение
6.2 Продвинутые приёмы поиска
6.3 Порог «не знаю»: конфиденс и правила отказа
6.4 Метрики качества поиска
6.5 Основы системы контроля версий Git
6.6 Непрерывная интеграция и доставка: CI/CD с GitHub Actions