«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Я обучил небольшую языковую модель, которая отвечает на дореформенном русском как человек из XIX века. Рассказываю, как подготовил данные, собрал синтетический корпус, обучил tiny-LLM и опубликовал её в виде чат-бота. Читать далѣе

28 ноября 2025, пятница 12:18 Оставить комментарий Источник

Похожие материалы

Я обучил модель на 10 000 код-ревью, чтобы отсеять мусор. Она начала предсказывать увольнения

Я хотел решить простую инженерную задачу: отсеять «шум» в комментариях на код-ревью. Обучил модель на 10 000 примеров, получил точность 87%. Потом открыл список ошибок. Оказалось, модель научилась предсказывать увольнения сотрудников за два месяца до того, как они принесут заявление. Рассказываю, как «пустые» комментарии выдают выгорание и почему данные иногда знают о нас больше, чем мы сами. Читать далее

18 февраля 2026, среда 7:15 Источник
[Перевод] Сможем ли мы научиться разговаривать с животными при помощи ИИ?

Люди всегда хотели разговаривать с животными. Будь то царь Соломон, Франциск Ассизский или Маугли - почти в каждой человеческой культуре существуют мифы о людях, умеющих разговаривать с животными. Во всём мире дети стремятся понять своих домашних питомцев, а родители пытаются…

10 сентября 2023, воскресенье 17:57 Источник
Как я обучил русский RAG‑сплиттер, который режет документы по индексам, а не по тексту

TL;DR. Из интереса обучил собственный русский RAG‑сплиттер — захотелось проверить, можно ли сделать context‑aware‑нарезку русских документов лучше готовых чанкеров.Я взял идею датской context-aware-splitter, пересобрал её под русский на базе T-lite-it-2.1 и изменил главное: модель возвращает индексы границ, а не переписанный текст. Хост потом режет оригинал по этим индексам.У index‑output оказалось три практических плюса: Читать далее

4 июля 2026, суббота 18:53 Источник

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Комментарии

Похожие материалы

Я обучил модель на 10 000 код-ревью, чтобы отсеять мусор. Она начала предсказывать увольнения

[Перевод] Сможем ли мы научиться разговаривать с животными при помощи ИИ?

Как я обучил русский RAG‑сплиттер, который режет документы по индексам, а не по тексту