Computer Vision модель в борьбе с галлюцинациями LLM. Оправданный оверинжиниринг?

Computer Vision модель в борьбе с галлюцинациями LLM. Оправданный оверинжиниринг?

Проект PhotoMentor создавался как ИИ-ментор для фотографов. Механика простая: пользователь загружает снимок, а под капотом Gemini выступает в роли арт-директора — анализирует композицию, работу со светом, цветовую гармонию и выдает детальный фидбек с оценкой.С главной проблемой Vision-моделей я столкнулся в первый же день закрытых тестов. Я скормил Gemini свой тестовый снимок: крупный портрет собаки, положившей морду на лапы.Модель уверенно выдала: Читать далее

10 марта 2026, вторник 7:30 Оставить комментарий Источник

Похожие материалы

DimDrone20: как я сделал летающую платформу для computer vision исследований

С 2017 года я делаю разный computer vision: начиная от понятных детекций и классификаций, заканчивая чтением по губам.И вот после череды случайностей, я оказываюсь единственным Computer Vision инженером в стартапе, который делает беспилотные вертолеты. По это причине я решаю ворваться со своей computer vision ноги и сделать какой-нибудь pet project связанный с дронами. План такой...

21 марта 2021, воскресенье 16:37 Источник
Google Cloud Vision API‎. Будущее Computer Vision as a service настало?

Год назад Google сваял платформу Cloud Vision API‎. Идея платформы — предоставить технологии Computer Vision, в которых Google является безусловным лидером, как сервис. Пару лет назад под каждую задачу существовала своя технология. Нельзя было взять что-то общее и добиться, чтобы алгоритм решал…

20 октября 2016, четверг 2:23 Источник
Data and Models Version control in Computer Vision meetup

Сообщество ML-REPA приглашает на открытый митап по вопросам воспроизводимости и управлению экспериментами в computer vision, который пройдет 15 августа в офисе Райффайзенбанк в Нагатино. На митапе будем разбираться с особенностями обеспечения воспроизводимости экспериментов в Computer Vision, автоматизации пайплайнов и версионирование моделей. Где может пригодиться DVC или MLFlow? А где лучше написать свой “велосипед“? Также глубже посмотрим на реализацию Catalyst и его применение. Читать дальше →

9 августа 2019, пятница 18:09 Источник

Computer Vision модель в борьбе с галлюцинациями LLM. Оправданный оверинжиниринг?

Комментарии

Похожие материалы

DimDrone20: как я сделал летающую платформу для computer vision исследований

Google Cloud Vision API‎. Будущее Computer Vision as a service настало?

Data and Models Version control in Computer Vision meetup