За последние годы мир убедил себя, что ИИ уже здесь и что он: говорит, пишет, рисует, а значит - он думает. Но что, если это всего лишь иллюзия? Что, если настоящий ИИ "молчит" и не потому что не может, а потому что "не хочет говорить", пока не будет готов нести ответственность за каждое…
Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые
Оригинал поста + Вспомогательные функции и исходные данные Оглавление Взаимоотношения персонажей — Кто кого родил — Кто кому брат или сестра — Кто кого убил — Кто кому служит — Кто с кем женат или помолвлен — У кого с кем был секс — Все отношения на одном графе Связь…
Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…