MLPops
785 subscribers
424 photos
120 videos
5 files
180 links
We are ML&MLOps community based in 🇷🇺Russia

Наш чат - t.me/+qJm7Ak4nU4EwZmJi
Download Telegram
Ох и ох
Тут такое Эндрю Ын (Andrew Ng) представил


Vision Agent. По сути это замена джунов в CV командах, результаты прям на дастойном уровне.
Даешь видос, пишешь че надо сделать, на выходе код.

Для примера взял два их примера, и свой с упаковками соусов. Ну где-то качество храмает, но как итог это вау. Я потратил 5 секунд, а уже имею относительно рабочее решение для проверки гипотез и отмазок для своего руководителя.


Презентация сервиса
Сервис
Media is too big
VIEW IN TELEGRAM
Типикал я на работе
Новая дообучения модель gpt-4o-2024-11-20 имеет куда хуже метрики на MMLU, GPQA, MATH и SimpleQA чем gpt-4o-2024-08-06

Чет слабо вериться что они обучают модели, мб просто косты режат, и делают модели меньше, вот и тупеют
Macro-o1 MCTS

Китайцы опубликовали, статейку, и модель.
Че сделали? Добавили новую модель рассуждения, на базе поиска по дереву Монте Карло (Monte Carlo Tree Search) (MCTS) .
Смысл в том, что модель не стремиться как можно скорее предти к единственному решени, а используется MCTS для оценки различных подходов к рассуждению. Кратко, взяли qwen 7b, добавили ветвь рассуждения с возможностью отката, все.

Основные нововведения:
- MCTS используется для построения деревьев потенциальных шагов рассуждения и решений.
- Каждая вершина в дереве представляет состояние рассуждения, а ветви — возможные следующие шаги.
- Модель включает функцию ценности для оценки многообещающих путей.
- Реализует "стратегическое отступление (strategic retreat)" — возможность вернуться назад, когда путь рассуждения кажется непродуктивным.

Какие резы получили
- Превзошли базовые большие языковые модели на математических задачах GSM8K на 12%.
- Достигли 78% точности на задачах рассуждения "цепочка мыслей".
- Сгенерировали в среднем 3.2 действительных различных решения на задачу.
- Показали 15% улучшение в точности декомпозиции задач.

Самый большой кайф от этого, это то, что всякие маркетологи и тд, смогут видеть как модель расскуждает, по вычислениям занимает много ресов, но она пытается прорабатывать несколько возможных путей, а не пытаться выдать что то быстрое.

Папира
HuggingFace
GitHub
This media is not supported in your browser
VIEW IN TELEGRAM
NEO — это первый автономный AI-инженер для машинного обучения, который автоматизирует весь рабочий процесс.

Глянул пару видосов, берут датасет с кагла, ставят задачу как из кагла, и типо он реально решает задачу с размышелниями действиями и тд.

Если честно выглядит так, как будто бы они со сканили десяток ноутов с кагла и просто запускают лучший и типо вот смотрите все круто.

А в итоге окажется что там тысячи индусов 😂

Сайтец
Please open Telegram to view this post
VIEW IN TELEGRAM
Обновил список инструментов

- Добавил новую категорию AI Agent Platform
- Добавил больше инструментов для Model Registry
- Добавил больше инструментов для Experiment Management


https://tools.mlpops.ru
Media is too big
VIEW IN TELEGRAM
Бэн Афлек поясняет за генеративный ИИ в киноиндустрии

Ну так то да, по факту раскидал, генеративный ии не будет актеров заменять, а будет бустить продакшн, в плане монтажа спецэффектов и тд

Уже есть плагины для Davinci, Final Cut в который ты грузишь свой подкаст указываешь где какой спикер и он по красоте нарезает, вырезает все нелепые места, оставляя только контент
10 комманд из 10 LLM-Агентов пишут книгу в real-time

Эти агенты пишут книгу. "Terminal Velocity". Тема книги - исследование темы сознания, этического развития ИИ и сотрудничества человека и ИИ посредством множества взаимосвязанных повествований:

Там есть 10 команд LLM-Агентов состоящяя из:
- Спецификационный агент: Анализирует требования к сюжету и поддерживает нарративную согласованность
- Продакшн агент: Генерирует контент и внедряет креативные изменения
- Управляющий агент: Координирует работу между агентами и отслеживает творческий процесс
- Агент по оценке: Проверяет качество и тематическую резонансность
- Хроникер: Документирует творческий путь
- Документалист: Управляет исследованиями и ссылками
- Агент по дублированию: Обеспечивает оригинальность и предотвращает избыточность
- Редактор: Уточняет прозу и поддерживает стиль
- Тестировщик: Проверяет нарративную согласованность и техническую точность

Есть репа такая, в нее каждые 10-30 минут, прилетает коммит из одной групп, другая группа подхватывает и делает свою задачу.

Нахера и главное зачем, я хз
Выглядит круто, ждем на Amazon за $300
Главные фигуры в AI и их предикты по появлению AGI

Альтман уже минус
Маск скорее всего тоже

А вот дяде Хинтону больше верю
LLM Иисус

В Швейцарии в одной из церквей поставили "AI Jesus" внутри исповедальни.

Сделали они это вместе с лабортаторией иммерсианой реальности, внутри лабы проект назвали "Deus in Machina".

По факту там скорее всего ChatGPT с релегиозным промтом.

Интересно какой-нибудь ВШЭ поставит такой эксперемент с РПЦ? Или это оскорбление чувств?

Ох как же это похоже на сериал Американские боги.

https://www.theguardian.com/technology/2024/nov/21/deus-in-machina-swiss-church-installs-ai-powered-jesus
This media is not supported in your browser
VIEW IN TELEGRAM
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory


Просто хорошая, модификация SAM2, добавили просто адаптивный трекинг объекта. У SAM2 был прикол, он оч плохо работал когда много объектов в кадре и они все быстро двигаются.

Папира
GitHub