В этой статье рассматривается проблема галлюцинаций ИИ — их причины и возможные способы решения на архитектурном уровне. Это явление является одним из ключевых в работе современных языковых моделей. Создать надежную программу на базе ИИ невозможно без понимания причин возникновения галлюцинаций, которые нарушают работу систем и подрывают доверие к таким помощникам. Помимо технических сложностей, важную роль играет и человеческий фактор. Но обо всем по порядку. Читать далее
Всем привет, меня зовут Алена, я являюсь ML-специалистом в SimbirSoft. В этой статье я хочу рассказать о галлюцинациях больших языковых моделей, а именно о том, как их оценить и минимизировать.Большие языковые модели (далее LLM) становятся мощными инструментами для предприятий,…
Обзор посвящен исследованию, на тему «сверхвеса» (super weights) в больших языковых моделях (LLM). Авторы обнаружили, что очень небольшое количество параметров (вплоть до одного скаляра!) в LLM играет непропорционально важную роль в их способности генерировать…
В этой статье посмотрим как можно влиять на так называемые «галлюцинации» ChatGPT.А что такое эти «галлюцинации»? По сути это придумывание фактов нейронной сетью, ну или просто — враньё. Управление «галлюцинациями» позволит получать то что мы хотим, ну или по крайней мере улучшит вероятность получения правдивого ответа. Читать далее