Простой старт в LLM-разработке без API-ключей и облака: ставим Ollama, скачиваем модель и делаем первый вызов из Python через LiteLLM. Читать далее
Делаем из простого скрипта настоящий консольный чат: цикл общения, system prompt, обработка ошибок и первые шаги к “живому” AI-приложению на Python с Ollama и LiteLLM. Читать далее
3 дня борьбы с ROCm, RX580 и Ollama: как я запустил LLM на домашней видеокартеЯ попытался запустить LLM inference на старой AMD RX580 через ROCm и Ollama в Kubernetes. GPU определялся, VRAM занималась, контейнеры запускались — но inference падал с ошибками hipMemGetInfo, а иногда просто выдавал бессмысленный текст.В статье
В этой статье мы подробно разбираем Ollama — инструмент для локального запуска больших языковых моделей (LLM). Вы узнаете, как установить программу, выбрать подходящую модель, понять форматы и квантование, настроить систему под своё железо и работать как через CLI, так и через API. Практические советы, примеры конфигураций и рекомендации по VRAM помогут вам максимально эффективно использовать Ollama для диалогов, генерации текста, кода и других задач. Читать далее