Бенчмарк Whetstone — исторический тест оценки производительности

Бенчмарк Whetstone — исторический тест оценки производительности

Продолжаю работу по обзору старых кроссплатформенных тестов оценки производительности, первая статья про целочисленный бенчмарк Dhrystone Тест разработан Гарольдом Керноу (CCTA) в 1972 году на языке Algol-60, в 1973 появляется реализация на языке Fortran, а в 1996 году появляется реализация…

8 ноября 2023, среда 23:38 Оставить комментарий Источник

Похожие материалы

[Перевод] Бенчмарк для оценки LLM в задачах триажа security-находок

Я создал собственный бенчмарк для оценки языковых моделей, потому что стандартные публичные тесты не отвечают на мой главный вопрос: какая модель лучше справляется с триажем security-находок. Эта задача отличается от оценки общей сообразительности модели. Читать далее

31 мая 2026, воскресенье 11:07 Источник
Manipulation Process Efficiency (MPE) Benchmark

Бенчмарк для технологии манипуляции Бенчмарк предназначен для оценки эффективности применения робототехнического комплекса (РТК) в задачах манипуляции предметами по сравнению с использованием ручного человеческого труда. Бенчмарк содержит следующий набор…

25 декабря 2020, пятница 20:37 Источник
Шлепа — Большой Русский Бенчмарк

Здарова хабровчане! На связе лаборатория Вихрей, сегодня мы расскажем про наш бенчмарк, Шлёпа - большой русский бенчмаркЧто есть сейчас для оценки русскоязычных LLMMera - бенчмарк от Сбера, использует тесты и генерацию, сабмит через сайт, сайт почти не обновлялся с зимы. Почитать про него можно тут Читать далее

2 сентября 2024, понедельник 12:00 Источник

Бенчмарк Whetstone — исторический тест оценки производительности

Комментарии

Похожие материалы

[Перевод] Бенчмарк для оценки LLM в задачах триажа security-находок

Manipulation Process Efficiency (MPE) Benchmark

Шлепа — Большой Русский Бенчмарк