Тест Тьюринга явно устарел, сейчас пытаются придумать новые тесты на сильный ИИ. Но как оценить интеллект модели, если учёные сильно расходятся в оценке даже человека. Существует как минимум 70 определений интеллекта для сапиенсов.И ещё эти многочисленные научные статьи на тему
Открываешь новости и там пишут, что AGI уже завтра. В другом источнике, с таким же уверенным видом, что до настоящего AGI ещё десять лет. Потому что нынешние модели живут в чате и в демо, а не в цеху с людьми, сроками и поломками оборудования. Хочется хотя бы понять, о каком именно AGI…
Зачем использовать бенчмарки для оценки LLM? Бенчмарки LLM помогают оценивать точность больших языковых моделей, обеспечивая стандартизированную процедуру измерения метрик выполнения различных задач. Бенчмарки содержат все структуры и данные, необходимые для оценки LLM, в том…
TL;DR Вольная художественная интерпретация поста John Rush и комментариев под ним.Короткая версия доступна в виде поста.Что такое AGI?Общий искусственный интеллект (Artificial General Intelligence, AGI) часто называют «святым граалем» искусственного интеллекта. В отличие от современных технологий ИИ,