MLPops

VQGAN + CLIP

Это комбинация нейронных сетей которая преобразует текстовое описание в изображение.

VQGAN (Vector Quantized Generative Adversarial Network), это сеть сочетает в себе сверточные слои с слоями transformer, что отлично позволяет генерировать изображения с высоким разрешением.

CLIP (Contrastive Language–Image Pre-training) модель которую обучили определять какое описание из списка описаний лучше всего подходит для выбранного изображения

Как и все GAN сети, VQGAN принимает вектор шума и генерирует (выводит) реалистичное изображение. А CLIP генерирует векторное представление из текстового описания.

Пример созданных таким методом изображений:
- creation of the galaxy photo taken by the hubble telescope
- earth from space
- gravitational light distortion photo taken by hubble telescope
- pillars of creation photo taken by hubble telescope
- roscosmos rocket on takeoff

💻 Code | 🤖 Colab

P.S. Как нибудь вкратце распишу как CLIP был обучен и как пришли к этой идеи.

369 views18:27

MLPops

Ну и как же без ♂Boss of this gym♂

Сгенерированные изображения на основе название фильмов где снимался ♂Billy Herrington♂, вот они слева на право

- Playing with Fire 2
- Summer Trophies
- Tales from the Foxhole
- Lords Of The Locker Room
- Minute Man Solo 27: Big Shots

443 views18:33

MLPops via @like

1:32

This media is not supported in your browser

VIEW IN TELEGRAM

Машины еще не осознались, но уже восстали

На видео один из жителей дома ругается с умным домофоном «Уфанет» (отличное название), который отказывается пускать его по распознаванию лица.

По секрету скажу, большинство система по распознаванию лиц очень плохо работают с азиатами, когда обучение происходило со всеми остальными.

452 views11:56

❤️ 4 👏👎

MLPops

Ну что ж, вот и настало время лутать бабки🤑

Подай заявку и получи возможность получить грант на 500к.

Что от твоего проекта нужно?
- Какая нибудь научная новизна (ну прям новизна и не нужна)
- Понимание кому это можно продать
И ВСЕ!!

Подать заявку

462 views15:25

MLPops

Low life, high tech – США первыми вступили в эру киберпанк.
Автор.

480 views12:11

MLPops

Один из подписчиков в ВК посоветовал продавать нейро-арт на NFT аукционах
Ну в общем, https://rarible.com/lambdamai

Rarible

Rarible: NFT Marketplace

Turn your products or services into publicly tradable items

449 viewsedited 19:03

MLPops

Занятие по DataScience теперь онлайн на нашем твич канале

Начинаем в 17-30
Разберем, что такое регуляризация, ее виды, зачем она нужна, а также рассмотрим еще 2 вида регрессии

Вопросы так же можно задавать в Discord

350 viewsedited 13:09

MLPops

💃🏼PIFuHD 2D to 3D

PIFuHD - очередная крутая штука от Facebook AI. Что она делает? Она восстанавливает 3D модель человека из 2D изображения. PIFuHD основывается на методе Pixel-Aligned Implicit Function и иерархической MLP сети. Нейросеть учитывает глобальные и локальные контексты это помогает достичь высокой точности 3D модели. PIFuHD захватывает такие детали, как пальцы, черты лица и складки на одежде человека на изображении. Предыдущие подходы не были способны на такую детализацию.

Нейронка принимает на вход изображение человека размером 1024×1024. На выходе отдает 3D модель человека. Архитектура метода состоит из двух уровней PIFu модулей:

1. Базовый уровень, который фокусируется на извлечении глобальных признаков из изображения. Этот модуль схож с PIFu;
2. Уточняющий уровень, который фокусируется на извлечении информации о локальном контексте и добавлении детализации к 3D модели

📑 Paper | 💻 Code | 🤖 Colab | 🖥 Сайт

559 views09:17

MLPops via @like

This media is not supported in your browser

VIEW IN TELEGRAM

448 views09:17

❤️ 2 👏 2 👎

MLPops

👨‍🎨TargetCLIP

Офигительнейшая тема, с которой я проорал.
Команда из таки кашерного университета Израиля (Tel Aviv University), придумали оч крутую тему для переноса сущности с помощью CLIP.

Что они сделали?. Они пытаются смешать два скрытых пространства, пространство генератора (StyleGAN) и семантическое пространство (CLIP). Исходное (source) через StyleGAN переводят в пространство StyleGAN и потом при помощи CLIP переводят целевое (target) к тому же векторному пространству. А для смешивания этих двух пространств создали новый "оператор смешивания", который оптимизирован для смешивания оба скрытых пространства. Получаются очень

📑 Paper | 💻 Code | 🤖 Colab

362 views13:09

MLPops via @like

Why are you so serious?

356 views13:12

❤️👏 4 👎

About

Blog

Apps

Platform