LLM в телекоме, ЦОД и на периферии [исследования]

LLM в телекоме, ЦОД и на периферии [исследования]

Работа с большими языковыми моделями не только требует серьезных вычислительных ресурсов (например, облачных GPU), но и грамотного их использования. Зачастую инженерам приходится учитывать специфические особенности работы GPU-кластеров.Сегодня обсудим примечательные материалы, посвященные работе с большими языковыми моделями (large language models, LLM) в дата-центрах и роли пограничных вычислений в развитии систем ИИ. Расскажем про ключевые находки и выводы. Читать далее

14 января 2025, вторник 17:00 Оставить комментарий Источник

Похожие материалы

Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты

Всем привет! На связи команда AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. В этой статье мы опишем наш опыт работы с большими языковыми моделями (LLM), их внедрение для обработки корпоративных данных, а также поделимся нашими…

9 августа 2024, пятница 12:18 Источник
Собираем компьютер для работы с большими языковыми моделями

Привет, Хабр! Меня зовут Артем Чебыкин, я ML-инженер и автор медиа вАЙТИ. В этой статье я расскажу о том, какой тип компьютера: стационарный, ноутбук или макбук — больше всего подходит для машинного обучения и почему. Также рассмотрим начальный и продвинутый вариант сборки для машинного обучения больших языковых моделей (LLM). Читать далее

11 июня 2024, вторник 22:12 Источник
Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch

Алгоритмы для работы с большими даннымиВсем привет! Для начала давайте разберем что такое вообще Алгоритмы для работы с большими данными, основная суть алгоритмов для работы с большими данными — это эффективная обработка огромных объёмов информации при минимальных вычислительных ресурсах (памяти, CPU, диске). Их суть — жертвовать точностью ради скорости и масштабируемости. Читать далее

13 июля 2025, воскресенье 10:16 Источник

LLM в телекоме, ЦОД и на периферии [исследования]

Комментарии

Похожие материалы

Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты

Собираем компьютер для работы с большими языковыми моделями

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch