Требования к аппаратному обеспечению¶

Требования к GPU¶

Параметр	Минимум	Рекомендуется
GPU архитектура	Turing (RTX 20xx, T4)	Ampere (RTX 30xx, A10, A100)
CUDA Compute Capability	7.0+	8.0+
VRAM	24 GB	32+ GB
Количество GPU	1	1 (одного достаточно)

Поддерживаемые GPU — Consumer (GeForce)¶

GPU	VRAM	Статус
RTX 4090	24 GB	Минимум для полной системы
RTX 3090	24 GB	Минимум для полной системы
RTX 4080	16 GB	Недостаточно
RTX 3080	10-12 GB	Недостаточно
RTX 3070	8 GB	Недостаточно
RTX 3060	12 GB	Недостаточно

Поддерживаемые GPU — Datacenter¶

GPU	VRAM	Статус
NVIDIA A100	40/80 GB	Отлично
NVIDIA A10	24 GB	Рекомендуется
NVIDIA A30	24 GB	Рекомендуется
NVIDIA L4	24 GB	Рекомендуется
NVIDIA T4	16 GB	Недостаточно
NVIDIA V100	16/32 GB	32 GB — рекомендуется, 16 GB — недостаточно

Использование VRAM по сервисам¶

Сервис	Назначение	Веса (float16)	VRAM с overhead
translation-service	Перевод RU→EN	~400 MB	~400 MB
threat-detector	Детекция угроз (4B params)	~8 GB	~10 GB
content-safety	Контентная безопасность (4B params)	~8 GB	~10 GB
Итого			~20 GB

Примечание

Обе 4B-модели загружаются в torch.float16 без квантизации. Overhead включает KV cache, активации и служебную память PyTorch.

Требования к серверу¶

Компонент	Минимум	Рекомендуется
CPU	16 cores (x86_64)	24+ cores
RAM	32 GB	64 GB
Disk	100 GB SSD	500 GB NVMe SSD
Network	1 Gbps	10 Gbps

Примечание

Threat Detector и Content Safety загружают модели по ~8 GB (float16) в VRAM. При CPU fallback (float32) каждая модель занимает ~16 GB системной RAM — убедитесь, что достаточно RAM при работе без GPU.

Требования к сетевым портам¶

Порт	Сервис	Направление	Описание
8085	API Gateway	Входящий	Основная точка входа для клиентов
4200	Admin UI	Входящий	Веб-интерфейс администратора
8001	Admin API	Внутренний	Административный API
8000	Profiles Registry	Внутренний	Управление профилями
5432	PostgreSQL	Внутренний	База данных
6379	Redis	Внутренний	Кэш и очереди
9000/9001	MinIO	Внутренний	S3-хранилище / консоль
8181	OPA	Внутренний	Policy engine

Полная таблица портов — см. Таблица портов.