Вы думаете, ChatGPT стал идеальным? Может «загуглить» любой факт, анализировать документы, даже писать код? Попробуйте спросить его про внутренние API вашей компании, корпоративные гайдлайны или правила код-ревью. Он молчит — и не зря. Ведь около 80 % рабочего времени программист тратит на поиск информации во внутренних системах.Сегодня расскажу о технологии, которая решает эту проблему — Retrieval Augmented Generation (RAG). Читать далее
Как золото пережило четырнадцать температур плавления, почему старая модель оказалась неполной и что это значит для будущего? Читать далее
На календаре 2025 год, и термин platform engineering прочно вошел в лексикон всех инженеров и менеджеров, занимающихся вопросами ИТ-инфраструктуры предприятий — примерно так же, как когда-то «DevOps», а еще раньше «Agile». К слову, предыдущие тренды порой превращались в модный хайп, под которым…
Привет, Хабр! Это Женя Руденко, Agile Cluster Lead в МТС Web Services. Когда в компании запускают Agile-трансформацию, чаще всего сталкиваются не с нехваткой инструментов или методик, а с сопротивлением людей — от тимлидов до C-level. Именно это и стало для меня первым вызовом при работе с командой…
Бывало ли, что для решения бизнес-кейса на собеседовании вам не хватило знания какой-нибудь метрики из предметной области? Это частая ситуация — например, в маркетплейсах всюду говорят про GMV, а в маркетинговой аналитике не обойтись без LTV.Привет, Хабр! Меня зовут Рафаэль…
Представляю свою библиотеку для обнуления байт выравнивания (padding) в unmanaged структурах.Обнуление байт паддинга (padding) обеспечивает детерминированное состояние памяти, что критически важно для двоичного сравнения или вычисления хэша. И не менее важно при бинарной сериализации. Читать далее
Вы когда-нибудь хотели взглянуть на свой код под новым углом? Например, увидеть, как бы выглядела ваша кодовая база, будь она городом? Звучит как что-то невероятное. Давайте вместе заглянем в город PVS-Studio и просмотрим, какие тайны он в себе хранит :). Читать далее
Открытие структуры ДНК в начале 1950-х годов — одно из самых захватывающих событий в истории науки, наполненное блестящими исследованиями, откровенными амбициями, ожесточённой конкуренцией и откровенным обманом.В нём участвовало много людей, в том числе Розалинд Франклин,…
Ваш Go-сервис жрёт память в проде, а на тестовом стенде всё идеально?Разбираем пошагово: как находить и диагностировать утечки ресурсов в Go-приложениях.Что внутри:Теория: GC, планировщик, модель памяти - минимум для понимания проблемыПрактика: pprof профили всех типов (heap, goroutine, allocs,…
Квадратичная сложность и линейно растущий KV cache в классическом механизме внимания, используемом в современных LLM, — серьёзная преграда для обработки экстремально длинных контекстов, особенно в условиях ограниченной видеопамяти на GPU. В этой статье мы рассмотрим различные…