Большие языковые модели — это хорошо, но интересно, можно ли получить сравнимое качество на малых моделях. Вести диалог с GPT-2 не получится, а тем более написать диплом или научную статью. Она и другие small language models (SLM) по большей части выдают слабый текст, даже если обучить их на всей Википедии. Возможно, тут стоит вспомнить теорию Шмидхубера, который, как известно, всё придумал. Читать далее
Представительство Фонда содействия развитию малых форм предприятий в научно-технической сфере в Республике Дагестан приглашает малые инновационные компании республики принять участие в конкурсе на получение гранта в один миллион рублей, сообщили РИА «Дагестан» в региональном представительстве Фонда. «Малые предприятия, созданные менее двух лет назад и с оборотом до 1 млн рублей и соответствующие 209-ФЗ от 24 июля 2007 […]
В новой публикации «Large Language Models as Optimizers» (Большие языковые модели в роли оптимизаторов) команда исследователей Google DeepMind представила инновационный метод оптимизации, названный «оптимизация через промпты» (Optimization by PROmpting, OPRO). При применении этого метода в роли оптимизаторов…
Сейчас в мире довольно много разговор о том, что LLM оставят всех нас без работы. Чтобы понять о чем речь рассмотрим на практических примерах какие задачи из коробки могут решать современные большие языковые модели (large language models, LLM).З.Ы. Подписывайтесь на мой телеграм-канал :) Читать далее