Проектируем беспилотник в домашних условиях. End-to-End подход на основе открытой визуально-языковой модели qwen2.5vl. Задача следования за объектом реализована без дополнительного обучения, только на основе текстового чата с моделью. Читать далее
Продолжение статьи про сборку мини-беспилотника в домашних условиях на основе открытой визуально-языковой модели qwen2.5vl без дополнительного обучения, только на основе текстового чата с моделью. Теперь практическая часть: сборка, настройка, тесты... Читать далее
Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM…
В этой статье мы рассмотрим как на оборудовании стоимостью от 1000$, с полностью локальными LLM и VLM на основе скриншотов и коротких пояснений генерировать грамотно написанные отчеты об уязвимостях самого широкого спектра, начиная от Web/мобилок, заканчивая инфрастурктурными уязвимостями Active Directory, k8s и так далее. Заглянем под капот VLM (Vision Language Model) и рассмотрим различные подходы к описанию уязвимостей. Читать далее