Полмиллиона запросов за месяц: мой LLM-challenge и первые выводы

Полмиллиона запросов за месяц: мой LLM-challenge и первые выводы

Привет, Хабр! Меня зовут Евгений, я работаю разработчиком в Университете Кембриджа (UK). В начале апреля я запустил llm7.io - полностью бесплатный LLM-провайдер, совместимый с популярными библиотеками chat completion. Цель была простая: проверить, насколько эффективно можно построить отказоустойчивую архитектуру под настоящую high-load-нагрузку, и при этом дать всем желающим доступ к мощным языковым моделям - без регистрации, API-токенов, смс и прочих барьеров. Что произошло за месяц?

15 мая 2025, четверг 13:16 Оставить комментарий Источник

Похожие материалы

[Перевод] Масштабирование LLM с помощью Golang: как мы обслуживаем миллионы запросов LLM

Хотя экосистема LLM в основном ориентирована на Python, мы нашли Go исключительно подходящим для производственных развертываний. Наша инфраструктура на базе Go обрабатывает миллионы ежемесячных запросов LLM с минимальной настройкой производительности. Помимо хорошо…

22 декабря 2025, понедельник 23:27 Источник
Проблемы с логикой у LLM и с доверием не только у LLM

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые

22 июля 2024, понедельник 4:23 Источник
Альтернатива чатам с ИИ для анализа и оптимизации SQL запросов. Часть 2

Месяц назад я опубликовал пост об инструменте для автоматической оптимизации SQL-запросов. Идея была простая — убрать этап «общения» с ИИ и предоставить простой интерфейс, где не нужно придумывать промпты.За первый месяц сервис использовали более 1000 человек. Ниже — выводы и результаты. Читать далее

19 августа 2025, вторник 23:55 Источник

Полмиллиона запросов за месяц: мой LLM-challenge и первые выводы

Комментарии

Похожие материалы

[Перевод] Масштабирование LLM с помощью Golang: как мы обслуживаем миллионы запросов LLM

Проблемы с логикой у LLM и с доверием не только у LLM

Альтернатива чатам с ИИ для анализа и оптимизации SQL запросов. Часть 2