Как бы выглядел Погосян будучи дрэг-квином, а Зайцев? Модель pixel2style2pixel ответит и на этот вопрос
🤗HuggingSpaces
🤗HuggingSpaces
👨🎨poster2plot
Моделька преобразует постер/изображение в описание фильма. Кодеса пока нет, как и статейки. Но API по ее использованию уже есть.
Для примерчика взяллучшие фильмы и пару картинок из новостей МАИ.
🤗HuggingFace
Моделька преобразует постер/изображение в описание фильма. Кодеса пока нет, как и статейки. Но API по ее использованию уже есть.
Для примерчика взял
🤗HuggingFace
Media is too big
VIEW IN TELEGRAM
🔥MTTR: End-to-End Text Referring Video Object Segmentation
Новая SOTA в сегментации объектов в видео.
Устали тренировать вашу Unet модель на сегментацию? Теперь не надо ее тренить вовсе! Новая модель работает лучше и быстрее! Достаточно написать какой объект вы хотите сегментировать и нейронка сделает все за вас!
Модель основана на мультимодальном трансформере, в который подаются фичи от текстового энкодера (RoBERTa) и видео энкодера (Video Swin). Примечательно, что в отличие от предыдущих решений, обучение здесь end2end — sequence prediction problem.
Самый каеф что авторы сразу опубликовали кодес и веса сетки. Но колаба все еще нет☹️
📑 Paper | 💻 Code
Новая SOTA в сегментации объектов в видео.
Устали тренировать вашу Unet модель на сегментацию? Теперь не надо ее тренить вовсе! Новая модель работает лучше и быстрее! Достаточно написать какой объект вы хотите сегментировать и нейронка сделает все за вас!
Модель основана на мультимодальном трансформере, в который подаются фичи от текстового энкодера (RoBERTa) и видео энкодера (Video Swin). Примечательно, что в отличие от предыдущих решений, обучение здесь end2end — sequence prediction problem.
Самый каеф что авторы сразу опубликовали кодес и веса сетки. Но колаба все еще нет☹️
📑 Paper | 💻 Code