Сравниваем скорость генерации LLM локально и по API

Сравниваем скорость генерации LLM локально и по API

По ощущениям, на Хабре одна группа пользователей пользуется LLM локально, а другая - через внешние API. А третья еще не определилась, и у неё периодически возникают следующие вопросы:- Что будет, если запускать LLM на CPU вместо GPU? Сильно упадет скорость?- А как это от размера модели…

31 марта 2025, понедельник 20:34 Оставить комментарий Источник

Похожие материалы

[Перевод] Полное руководство по оценке компонентов системы RAG: что необходимо знать

Системы дополненной генерации (RAG) были разработаны для улучшения качества ответа крупной языковой модели (LLM). Когда пользователь отправляет запрос, система RAG извлекает релевантную информацию из векторной базы данных и передает ее в LLM в качестве контекста. Затем LLM использует этот контекст для генерации ответа для пользователя. Этот процесс значительно улучшает качество ответов LLM с меньшим количеством «галлюцинаций». Читать далее

24 ноября 2024, воскресенье 14:35 Источник
Проблемы с логикой у LLM и с доверием не только у LLM

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые

22 июля 2024, понедельник 4:23 Источник
API против GUI: Сравниваем новое поколение LLM-агентов

Большие языковые модели (LLM) научились не только генерировать текст, но и выполнять реальные задачи, используя команды на естественном языке. Это открыло новую эру в автоматизации, породив так называемых LLM-агентов. Исследование "API Agents vs. GUI Agents: Divergence and Convergence" от Microsoft разбирает два ключевых подхода к созданию таких агентов. Давайте посмотрим, в чем их суть, различия и перспективы. Читать далее

5 апреля 2025, суббота 11:30 Источник

Сравниваем скорость генерации LLM локально и по API

Комментарии

Похожие материалы

[Перевод] Полное руководство по оценке компонентов системы RAG: что необходимо знать

Проблемы с логикой у LLM и с доверием не только у LLM

API против GUI: Сравниваем новое поколение LLM-агентов