Кажется, LLM достигли в некоторых областях уровня мидла. В статье будет попытки потестировать LLM на тему генерации кода, описание одной из AI-IDE, тейк про то, что LLM — слепой программист, немного примеров кода на гитхабе и бесстыдное рекламирование собственного канала. Не переключайтесь! Читать далее
Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые
Разработка современного софта это далеко не только про код. Разработка современного софта это во многом про ToolСhain(ы). Прежде чем начать исполняться исходники проходят гигантский путь. C каждым годом выходят все более и более массивные системы сборки. Современные технологии разработки софта это многостадийные конвейеры из различных утилит. Понять их весьма сложно. Но можно. Поможет нам в этом язык Dot. Читать далее
Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…