Сервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый endpoint для работы с ней.
Полный список моделей смотрите в панели управления. Выберите модель и получите свой выделенный endpoint.
В выборе помогут теги, система поиска и ссылки на описание моделей в Hugging Face.
Задайте ключевые параметры работы модели: тип данных, максимальную длину контекста, количество одновременных запросов. Система предложит рекомендуемую конфигурацию инфраструктуры и релевантные бенчмарки.
Выберите параметры масштабирования: фиксированное количество инстансов или автоматическое масштабирование под нагрузку. Укажите тип диска.
Вы получите endpoint для работы с моделью, пример curl-запроса для тестирования, API-ключ для авторизации.