Как заставить LLM сортировать данные: от наивного подхода до TrueSkill

Как заставить LLM сортировать данные: от наивного подхода до TrueSkill

Если вы когда-нибудь грузили в LLM список и просили выбрать лучшее или отсортировать — вы, скорее всего, получали посредственный результат. Я проверил это на 164 постах своего телеграм-канала, сравнив пять разных методов сортировки. Оказалось, что разница между «дёшево и плохо» и…

21 января 2026, среда 15:34 Оставить комментарий Источник

Похожие материалы

Проблемы с логикой у LLM и с доверием не только у LLM

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые

22 июля 2024, понедельник 4:23 Источник
Прижился ли в Минске раздельный сбор мусора и почему после вывоза отходы приходится сортировать заново

Корреспондент агентства «Минск-Новости» выясняла, как в городе идет раздельный сбор отходов и почему после вывоза их снова приходится сортировать. В столичных дворах расставлено несколько видов контейнеров для мусора. Это баки для твердых бытовых (коммунальных) отходов (ТБО, или ТКО) и вторичных материальных ресурсов (ВМР) – макулатуры (чаще – зеленого цвета), стеклобоя (синие) и отходов пластика (желтые […]

2 декабря 2014, вторник 18:45 Источник
[Перевод] Краткий обзор LLM бенчмарков

Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…

17 октября 2024, четверг 12:15 Источник

Как заставить LLM сортировать данные: от наивного подхода до TrueSkill

Комментарии

Похожие материалы

Проблемы с логикой у LLM и с доверием не только у LLM

Прижился ли в Минске раздельный сбор мусора и почему после вывоза отходы приходится сортировать заново

[Перевод] Краткий обзор LLM бенчмарков