Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Всем привет! Делюсь итогом двухмесячной работы - релизом рейтинга юридического рассуждения больших языковых моделей Lexometrica Ground Truth.Изначально цель была сугубо практической: требовалось выбрать лучшие модели для LegalTech-проекта "неШемяка!". Но в процессе пришлось столкнуться с…

9 марта 2026, понедельник 21:15 Оставить комментарий Источник

Похожие материалы

Как стартап находит ground truth данные в сельском хозяйстве

Компания OneSoil разрабатывает бесплатные приложения для фермеров, которыми пользуются более чем в 180 странах мира. В своей работе мы используем большие данные и машинное обучение, и отдельный квест для нас — найти ground truth данные. Рассказываем, как мы решаем эту нетривиальную задачу. Читать далее

25 ноября 2020, среда 19:33 Источник
LLM бенчмарк «Испытание Дали»

Выбирая LLM для своего первого пет-проекта, я случайно создал бенчмарк для LLM "Испытание Дали" по трем параметрам: качество, скорость и стоимость. Этот бенчмарк позволил мне найти оптимальную LLM для встраивания в продукты моей компании Флаг Софт. Возможно, вас тоже заинтересуют его результаты. Читать далее

27 апреля 2026, понедельник 8:01 Источник
1C Code Bench - бенчмарк для оценки способности LLM писать код на 1С

В эпоху бума больших языковых моделей (LLM) возникает вопрос: насколько хорошо современные LLM пишут код на платформе 1С:Предприятие? Для объективной оценки этих возможностей мы разработали 1C Code Bench — специализированный бенчмарк, позволяющий систематически тестировать и сравнивать способности различных LLM-моделей решать типовые задачи программирования на 1С. Читать далее

29 декабря 2025, понедельник 13:15 Источник

Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Комментарии

Похожие материалы

Как стартап находит ground truth данные в сельском хозяйстве

LLM бенчмарк «Испытание Дали»

1C Code Bench - бенчмарк для оценки способности LLM писать код на 1С