MLPops
760 subscribers
424 photos
120 videos
5 files
180 links
We are ML&MLOps community based in 🇷🇺Russia

Наш чат - t.me/+qJm7Ak4nU4EwZmJi
Download Telegram
🦌🎄One Hyper-Modal Transformer can be Creative as DALL-E and Smart as CLIP

Встречайте, RuDOLPH! Текстово-визуальный гипермодальный GPT-3 (350M), сочетающий в себе генеративные возможности текстового GPT-3 и текст-картиночного DALL-E с Reranking & Zero-Shot способностями CLIP

Гипермодальный RuDolph может:
- Генерировать текст
- Генерировать изображения по тексту
- «Проявлять» диффузией в высоком качестве и разрешении сгенерированные изображения
- Изменять (inpainting) изображения по описанию
- Генерировать текстовые описания для изображений
- Быть Feature Extractor’ом для few-shot и linear probe классификации
- Ранжировать изображения по текстовому описанию
- Классифицировать изображения в режиме Zero-Shot


💻 Code | 📑Paper (Soon) | 🤖Colab
👍6
Первое практическое применение РуДольфа и гипермодальных трансформеров.

Задача предсказания КБЖУ по фотографии еды, скорее не решенная и конечно вряд ли будет решена, потому что просто нельзя предсказать, что будет внутри пирожка.
Автор ТГ канала Мишин Лернинг 🤖🎓 обучил модель в image2text, генерировать КБЖУ.

🤗HuggingFace
👍1
Наконец-то узнали калорийность нашего ректора
👍6🤩3
This media is not supported in your browser
VIEW IN TELEGRAM
First Order Motion Model for Image Animation

Задача анимация изображения из видео, очень простая в формулировке, нужно сделать так что бы изображение повторяла движения на видео. Но решить ее без искажений достаточно сложно, кто то уже видел видео slidan'a на эту тему. Так вот, группа исследователей из Италии (университет DISI) опубликовали модель, которая работает в большинстве случаев куда лучше существующих аналогов, за счет нахождения ключевых точек и аффинных преобразований.


💻 Code | 📑Paper| 🤖Colab |🤗HuggingFace
👍7
#датасет Все комментарии DTF (на 16 Января 2022)

▪️ 10'640'095 комментариев
▪️ Две версии один не размеченный, другой размеченный на токсичные темы
▪️ Id, user id, текст, ответ на комментарий, id статьи, ссылка на статью


⬇️ Сами данные ⬇️
🤩5👍3
Результаты предварительной обработки токсичных комментариев DTF
👍13💩1
Украл мем
👍24🔥8
Time-Travel Rephotography.

"В отличие от обычных способов восстановления изображений, которые применяют разные независимые операции, такие как шумоподавление, раскрашивание и сверхразрешение, мы используем фреймворк StyleGAN2 для проецирования старых фотографий в пространство современных фотографий с высоким разрешением, достигая всех этих эффектов в единой структуре. Уникальность подхода - запечатлеть идентичность и позу объекта фотографии, а не множество артефактов на антикварных фотографиях низкого качества."

Год назад канале Two Minute Papers, вышло видео с описанием технологии и статьи, помню как пару месяцев сидел мониторил когда разместят код, но потом забил. И вот спустя год, они его выложили! И причем сразу с колабом!

Дополнительно данным алгоритмом можно неплохо "очеловечивать" различных персонажей.

Для теста, взял авиаконструкторов СССР и прогнал через сетку, результат реально "ВАУ!"

💻 Code | 📑Paper| 🤖Colab
👍1😱1