Сравнительный анализ 18 LLM моделей: конец монополии?

Сравнительный анализ 18 LLM моделей: конец монополии?

???? Open-Source Догнал Топов: Что Произошло в Ноябре 2025?Конец монополии! Kimi-K2-Thinking (MIT-лицензия) — новый чемпион мысли. Эта open-source модель сравнялась с Claude Sonnet 4, показала 84.5% на GPQA Diamond (научное рассуждение) и 94.5-100% на олимпиадной математике AIME, опередив GPT-4o более чем на 30 процентных…

30 ноября 2025, воскресенье 23:57 Оставить комментарий Источник

Похожие материалы

[Перевод] Краткий обзор LLM бенчмарков

Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…

17 октября 2024, четверг 12:15 Источник
Сравнительный обзор весов. Личный опыт и тесты на себе

Совсем недавно я сделал большой сравнительный тест термосов. Многих это заинтересовало, а некоторые дамы в личку благодарили за отличную идею подарка к Новому Году. Понимая, что дамы тоже будут ждать подарков, я и сделал этот сравнительный тест весов. Вот только дарить их надо с…

20 декабря 2017, среда 12:18 Источник
Сравнительный анализ Apache Kafka и RabbitMQ

Сравнительный анализ Apache Kafka и RabbitMQВ статье поговорим об особенностях, достоинствах и недостатках двух популярных брокеров сообщений. В каком случае использовать тот или иной брокер? Как с помощью брокеров достичь максимальную производительность и гибкость в обработке данных?Тема будет интересна разработчикам на проектах, где требуется обмен информацией между разными компонентами или системами. Читать далее

26 июля 2023, среда 12:57 Источник

Сравнительный анализ 18 LLM моделей: конец монополии?

Комментарии

Похожие материалы

[Перевод] Краткий обзор LLM бенчмарков

Сравнительный обзор весов. Личный опыт и тесты на себе

Сравнительный анализ Apache Kafka и RabbitMQ