В этой статье будет рассказано о популярных метриках оценки для задач генерации текста: BLEU, ROUGE, METEOR, BERTScore. Рассказ будет сопровождаться визуализацией, примерами и кодом на Python. ???? Начинаем ????
На NLP/LLM-собеседованиях часто проверяют не то, знаешь ли ты слова top-k, top-p и BLEU, а понимаешь ли ты, что происходит с распределением вероятностей, почему greedy decoding зацикливается, зачем нужна temperature и почему BLEU плохо оценивает ответы современных LLM.В этой статье - чеклист по языковому…
Яркий аромат красных цветов Rouge поднимает настроение. В набор входят дополняющих друг друга средства: Цветочный гель-крем для душа Rouge 200 мл При контакте с водой цветочный гель-крем для душа Estel Rouge превращается в мягкую и шелковистую пену. Нежно очищает, делает кожу мягкой и…
Яркий аромат красных цветов Rouge поднимает настроение. В набор входят дополняющих друг друга средства: Цветочный гель-крем для душа Rouge 200 мл При контакте с водой цветочный гель-крем для душа Estel Rouge превращается в мягкую и шелковистую пену. Нежно очищает, делает кожу мягкой и…