🌟 Внимание много постов!
Анонсируем запуск OmniFusion от ребят из FusionBrain AIRI. Модель работает безупречно как с текстом, так и с изображениями! Понимание, анализ, вопросы и диалоги — всё это она может.
🔍 Уникально точное распознавание объектов на изображениях
🎨 Мастерски определяет позицию и цвет
🔢 Счет объектов без ошибок
🗣️ Функционирует на русском и английском
🧠 Разрешает сложнейшие задачи и даже IQ тесты
OmniFusion использует уникальный подход к слиянию модальностей, не переучивая модель с нуля. Смело применили адаптеры к энкодерам, проработали методы обучения и улучшили базовую предобученную LLM для восприятия изображений.
👁️ Тренировали модель на 7B параметрах, а по результатам — на уровне LLaVA с 13B.
Подробности архитектуры модели ищите на Хабре. Скрины ее работы просто топ.
Анонсируем запуск OmniFusion от ребят из FusionBrain AIRI. Модель работает безупречно как с текстом, так и с изображениями! Понимание, анализ, вопросы и диалоги — всё это она может.
🔍 Уникально точное распознавание объектов на изображениях
🎨 Мастерски определяет позицию и цвет
🔢 Счет объектов без ошибок
🗣️ Функционирует на русском и английском
🧠 Разрешает сложнейшие задачи и даже IQ тесты
OmniFusion использует уникальный подход к слиянию модальностей, не переучивая модель с нуля. Смело применили адаптеры к энкодерам, проработали методы обучения и улучшили базовую предобученную LLM для восприятия изображений.
👁️ Тренировали модель на 7B параметрах, а по результатам — на уровне LLaVA с 13B.
Подробности архитектуры модели ищите на Хабре. Скрины ее работы просто топ.
🖼️ Встречайте, Kandinsky 3.0 уже здесь!
🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.
Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).
🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!
🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.
Подробности тут
🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.
Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).
🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!
🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.
Подробности тут
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется, дела в OpenAI берут неожиданный оборот: Сэм Альтман возвращается в игру!
Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.
Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.
Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.
Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.
🔺 GigaChat поумнел!
🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B
💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.
🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)
🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.
🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.
🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B
💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.
🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)
🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.
🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.