Проиндексируем фото архив для поиска на человеческом языке простыми фразами. Фраза: "новогодний праздник" найдет все фото связанные с новым годом. В этом нам поможет Qwen3-VL и Qdrant. Читать далее
Команда Alibaba Cloud выпустила Qwen3-ASR-Toolkit — открытый инструмент для транскрипции аудио- и видеофайлов любой длительности. Решение построено на базе модели Qwen3-ASR (ранее Qwen3-ASR-Flash) и устраняет ключевую проблему большинства API для распознавания речи — ограничение по длительности файла. Читать далее
Все же видели то вирусное видео, где коты на котоолимпиаде соревнуются в прыжках в воду? Несмотря на то что этот ролик – плод деятельности ИИ, получилось и правда очень забавно. И вы, если хотите, можете сделать такое же, используя нейросеть Hailuo. Она позволяет сгенерировать видео по текстовому описанию или оживить фото, которые у вас уже есть. Читать далее
Ещё не успело ИИ-сообщество оправится от набега ЛЛаМ и высвобождения GPT-4, подоспела новая напасть — 19го марта была выпущена китайская нейросеть ModelScope text2video от Alibaba, создающая короткие видеоролики по текстовому описанию. Читать далее