В Yttri мы изначально использовали ONNX-реранкер bge-reranker-v2-m3 для RAG-поиска. Качество было хорошим, но цена для local-first desktop-приложения оказалась слишком высокой: около 600 МБ модели, до 1.8 ГБ RAM в пике и ощутимая нагрузка на CPU.В статье разбираю, как мы заменили тяжёлый нейросетевой реранкер…
В статье на примере определения интента по фразе клиента, полученной в текстовом виде показаны подходы для решения поставленной задачи, выбор метрик и моделей.Сделан обзор на актуальные подходы для ускорения работы нейронных сетей, представлены библиотеки ONNX и ONNX Runtime.Проведены тесты с использованием фреймоворков ONNX и ONNX Runtime, используемых для ускорения работы моделей перед выводом их в продуктовую среду.Представлены графические зависимости и блоки кода. Читать далее
Большинство инженеров, работающих с машинным обучением, уже знакомы с форматом данных ONNX. Его часто используют для хранения обученных моделей и конвертации их мeжду фреймворками.В этой статье расскажу об ONNX и о том, почему этот формат данных широко используется. Посмотрим на особенности формата и конвертации в него и на экосистему полезных инструментов. Читать далее
Тип подвеса: наклонный Максимальная нагрузка: 40 кг Стандарт VESA: 75×75/400×600 Угол наклона: 15 град Глубина до стены: 29 мм Цвет: черный кронштейн для телевизора 32″-75″ REXANT до 40кг VESA 75×75/400×600 наклонный Артикул 38-0090-1 Цвет черный Тип подвеса наклонный Угол наклона 15град Глубина до стены 29мм Максимальная нагрузка 40кг Стандарт VESA 75×75/400×600 в наличиивозможна доставка. Цена: