Разработка софта через описание: опыты с современными LLM

Разработка софта через описание: опыты с современными LLM

Кажется, LLM достигли в некоторых областях уровня мидла. В статье будет попытки потестировать LLM на тему генерации кода, описание одной из AI-IDE, тейк про то, что LLM — слепой программист, немного примеров кода на гитхабе и бесстыдное рекламирование собственного канала. Не переключайтесь! Читать далее

15 января 2025, среда 11:00 Оставить комментарий Источник

Похожие материалы

Проблемы с логикой у LLM и с доверием не только у LLM

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые

22 июля 2024, понедельник 4:23 Источник
Тандем Cpp/Dot для Описания Сложных ToolСhain(ов)

Разработка современного софта это далеко не только про код. Разработка современного софта это во многом про ToolСhain(ы). Прежде чем начать исполняться исходники проходят гигантский путь. C каждым годом выходят все более и более массивные системы сборки. Современные технологии разработки софта это многостадийные конвейеры из различных утилит. Понять их весьма сложно. Но можно. Поможет нам в этом язык Dot. Читать далее

16 сентября 2022, пятница 21:58 Источник
[Перевод] Краткий обзор LLM бенчмарков

Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…

17 октября 2024, четверг 12:15 Источник

Разработка софта через описание: опыты с современными LLM

Комментарии

Похожие материалы

Проблемы с логикой у LLM и с доверием не только у LLM

Тандем Cpp/Dot для Описания Сложных ToolСhain(ов)

[Перевод] Краткий обзор LLM бенчмарков