Перейти к содержанию

Требования к аппаратному обеспечению

Требования к GPU

Параметр Минимум Рекомендуется
GPU архитектура Turing (RTX 20xx, T4) Ampere (RTX 30xx, A10, A100)
CUDA Compute Capability 7.0+ 8.0+
VRAM 24 GB 32+ GB
Количество GPU 1 1 (одного достаточно)

Поддерживаемые GPU — Consumer (GeForce)

GPU VRAM Статус
RTX 4090 24 GB Минимум для полной системы
RTX 3090 24 GB Минимум для полной системы
RTX 4080 16 GB Недостаточно
RTX 3080 10-12 GB Недостаточно
RTX 3070 8 GB Недостаточно
RTX 3060 12 GB Недостаточно

Поддерживаемые GPU — Datacenter

GPU VRAM Статус
NVIDIA A100 40/80 GB Отлично
NVIDIA A10 24 GB Рекомендуется
NVIDIA A30 24 GB Рекомендуется
NVIDIA L4 24 GB Рекомендуется
NVIDIA T4 16 GB Недостаточно
NVIDIA V100 16/32 GB 32 GB — рекомендуется, 16 GB — недостаточно

Использование VRAM по сервисам

Сервис Назначение Веса (float16) VRAM с overhead
translation-service Перевод RU→EN ~400 MB ~400 MB
threat-detector Детекция угроз (4B params) ~8 GB ~10 GB
content-safety Контентная безопасность (4B params) ~8 GB ~10 GB
Итого ~20 GB

Примечание

Обе 4B-модели загружаются в torch.float16 без квантизации. Overhead включает KV cache, активации и служебную память PyTorch.

Требования к серверу

Компонент Минимум Рекомендуется
CPU 16 cores (x86_64) 24+ cores
RAM 32 GB 64 GB
Disk 100 GB SSD 500 GB NVMe SSD
Network 1 Gbps 10 Gbps

Примечание

Threat Detector и Content Safety загружают модели по ~8 GB (float16) в VRAM. При CPU fallback (float32) каждая модель занимает ~16 GB системной RAM — убедитесь, что достаточно RAM при работе без GPU.

Требования к сетевым портам

Порт Сервис Направление Описание
8085 API Gateway Входящий Основная точка входа для клиентов
4200 Admin UI Входящий Веб-интерфейс администратора
8001 Admin API Внутренний Административный API
8000 Profiles Registry Внутренний Управление профилями
5432 PostgreSQL Внутренний База данных
6379 Redis Внутренний Кэш и очереди
9000/9001 MinIO Внутренний S3-хранилище / консоль
8181 OPA Внутренний Policy engine

Полная таблица портов — см. Таблица портов.