[Перевод] Кодирование UTF-8 без ветвления

[Перевод] Кодирование UTF-8 без ветвления

Можно ли кодировать UTF-8 без ветвлений? Да. Вопрос Натан Голдбаум задал в чате Recurse вопрос: Я знаю, как декодировать UTF-8 с помощью битовой математики и таблиц поиска (см. https://github.com/skeeto/branchless-utf8), но если я хочу преобразовать кодовую точку UTF-8, то можно ли сделать ли это без ветвлений?…

30 января 2025, четверг 18:58 Оставить комментарий Источник

Похожие материалы

[Перевод] Нельзя предполагать, что все используют UTF-8

Как вычислять кодировку при помощи статистики Люди говорят на бесчисленном количестве разных языков. Эти языки не только несовместимы между собой, но и представляют огромную трудность при транспиляции в среде исполнения. К сожалению, все попытки стандартизации провалились. По

2 мая 2024, четверг 18:00 Источник
[Перевод] Как же прекрасна структура UTF-8

Когда я впервые узнал о кодировке UTF-8, то был поражён её продуманностью и структурой. Тем, как изящно её авторам удалось выразить миллионы символов разных языков и письменностей, параллельно сохранив обратную совместимость с ASCII.В UTF-8 используется 32 бита, а в старой доброй ASCII — 7…

21 сентября 2025, воскресенье 9:01 Источник
Валидация UTF-8 меньше чем за одну инструкцию на байт

Даниэль Лемир – профессор Заочного квебекского университета (TÉLUQ), придумавший способ очень быстро парсить double – совместно с инженером Джоном Кайзером из Microsoft опубликовали ещё одну свою находку: валидатор UTF-8, обгоняющий библиотеку UTF-8 CPP (2006) в 48..77 раз, ДКА от Бьёрна Хёрманна (2009) – в 20..45 раз, и алгоритм Google Fuchsia (2020) – в 13..35 раз. Новость об этой публикации на хабре уже постили, но без технических подробностей; так что восполняем этот недочёт. Читать дальше →

6 апреля 2021, вторник 18:01 Источник

[Перевод] Кодирование UTF-8 без ветвления

Комментарии

Похожие материалы

[Перевод] Нельзя предполагать, что все используют UTF-8

[Перевод] Как же прекрасна структура UTF-8

Валидация UTF-8 меньше чем за одну инструкцию на байт