Трансформеры широко используются в операциях, связанных с обработкой естественного языка (Natural Language Processing. NLP), а в последнее время также часто применяются во многих задачах компьютерного зрения, поскольку они моделируют глобальные и действующие на дальнем расстоянии связи, а также семантическую информацию изображений лучше, чем CNN, поскольку последняя является более локализованной. Читать далее
Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 1.Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 2.Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 3.Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 4.Уроки компьютерного зрения на Python + OpenCV с
Кто такой детектор?Данная статья посвящена постановке задачи детекции и обзору первых двухстадийных детекторов, таких как: R-CNN, Fast R-CNN и Faster RCNN. Читать далее
Mask R-CNN 3D – это расширение знаменитой модели Mask R-CNN для работы с трехмерными данными (объёмными изображениями или облаками точек). Классическая Mask R-CNN предназначена для instance segmentation (сегментации отдельных объектов) на 2D-изображениях и состоит из двух основных частей: (1) сети…