Требования к аппаратному обеспечению
Требования к GPU
| Параметр |
Минимум |
Рекомендуется |
| GPU архитектура |
Turing (RTX 20xx, T4) |
Ampere (RTX 30xx, A10, A100) |
| CUDA Compute Capability |
7.0+ |
8.0+ |
| VRAM |
24 GB |
32+ GB |
| Количество GPU |
1 |
1 (одного достаточно) |
Поддерживаемые GPU — Consumer (GeForce)
| GPU |
VRAM |
Статус |
| RTX 4090 |
24 GB |
Минимум для полной системы |
| RTX 3090 |
24 GB |
Минимум для полной системы |
| RTX 4080 |
16 GB |
Недостаточно |
| RTX 3080 |
10-12 GB |
Недостаточно |
| RTX 3070 |
8 GB |
Недостаточно |
| RTX 3060 |
12 GB |
Недостаточно |
Поддерживаемые GPU — Datacenter
| GPU |
VRAM |
Статус |
| NVIDIA A100 |
40/80 GB |
Отлично |
| NVIDIA A10 |
24 GB |
Рекомендуется |
| NVIDIA A30 |
24 GB |
Рекомендуется |
| NVIDIA L4 |
24 GB |
Рекомендуется |
| NVIDIA T4 |
16 GB |
Недостаточно |
| NVIDIA V100 |
16/32 GB |
32 GB — рекомендуется, 16 GB — недостаточно |
Использование VRAM по сервисам
| Сервис |
Назначение |
Веса (float16) |
VRAM с overhead |
| translation-service |
Перевод RU→EN |
~400 MB |
~400 MB |
| threat-detector |
Детекция угроз (4B params) |
~8 GB |
~10 GB |
| content-safety |
Контентная безопасность (4B params) |
~8 GB |
~10 GB |
| Итого |
|
|
~20 GB |
Примечание
Обе 4B-модели загружаются в torch.float16 без квантизации. Overhead включает KV cache, активации и служебную память PyTorch.
Требования к серверу
| Компонент |
Минимум |
Рекомендуется |
| CPU |
16 cores (x86_64) |
24+ cores |
| RAM |
32 GB |
64 GB |
| Disk |
100 GB SSD |
500 GB NVMe SSD |
| Network |
1 Gbps |
10 Gbps |
Примечание
Threat Detector и Content Safety загружают модели по ~8 GB (float16) в VRAM. При CPU fallback (float32) каждая модель занимает ~16 GB системной RAM — убедитесь, что достаточно RAM при работе без GPU.
Требования к сетевым портам
| Порт |
Сервис |
Направление |
Описание |
| 8085 |
API Gateway |
Входящий |
Основная точка входа для клиентов |
| 4200 |
Admin UI |
Входящий |
Веб-интерфейс администратора |
| 8001 |
Admin API |
Внутренний |
Административный API |
| 8000 |
Profiles Registry |
Внутренний |
Управление профилями |
| 5432 |
PostgreSQL |
Внутренний |
База данных |
| 6379 |
Redis |
Внутренний |
Кэш и очереди |
| 9000/9001 |
MinIO |
Внутренний |
S3-хранилище / консоль |
| 8181 |
OPA |
Внутренний |
Policy engine |
Полная таблица портов — см. Таблица портов.