MLPops

Типикал я на работе

👍4

470 views07:12

Новая дообучения модель gpt-4o-2024-11-20 имеет куда хуже метрики на MMLU, GPQA, MATH и SimpleQA чем gpt-4o-2024-08-06

Чет слабо вериться что они обучают модели, мб просто косты режат, и делают модели меньше, вот и тупеют

❤1

420 views10:03

MLPops

Macro-o1 MCTS

Китайцы опубликовали, статейку, и модель.
Че сделали? Добавили новую модель рассуждения, на базе поиска по дереву Монте Карло (Monte Carlo Tree Search) (MCTS) .
Смысл в том, что модель не стремиться как можно скорее предти к единственному решени, а используется MCTS для оценки различных подходов к рассуждению. Кратко, взяли qwen 7b, добавили ветвь рассуждения с возможностью отката, все.

Основные нововведения:
- MCTS используется для построения деревьев потенциальных шагов рассуждения и решений.
- Каждая вершина в дереве представляет состояние рассуждения, а ветви — возможные следующие шаги.
- Модель включает функцию ценности для оценки многообещающих путей.
- Реализует "стратегическое отступление (strategic retreat)" — возможность вернуться назад, когда путь рассуждения кажется непродуктивным.

Какие резы получили
- Превзошли базовые большие языковые модели на математических задачах GSM8K на 12%.
- Достигли 78% точности на задачах рассуждения "цепочка мыслей".
- Сгенерировали в среднем 3.2 действительных различных решения на задачу.
- Показали 15% улучшение в точности декомпозиции задач.

Самый большой кайф от этого, это то, что всякие маркетологи и тд, смогут видеть как модель расскуждает, по вычислениям занимает много ресов, но она пытается прорабатывать несколько возможных путей, а не пытаться выдать что то быстрое.

Папира
HuggingFace
GitHub

❤2

395 views13:11

MLPops

2:14

This media is not supported in your browser

VIEW IN TELEGRAM

NEO — это первый автономный AI-инженер для машинного обучения, который автоматизирует весь рабочий процесс.

Глянул пару видосов, берут датасет с кагла, ставят задачу как из кагла, и типо он реально решает задачу с размышелниями действиями и тд.

Если честно выглядит так, как будто бы они со сканили десяток ноутов с кагла и просто запускают лучший и типо вот смотрите все круто.

А в итоге окажется что там тысячи индусов 😂

Сайтец

Please open Telegram to view this post

VIEW IN TELEGRAM

372 views15:01

MLPops

Обновил список инструментов

- Добавил новую категорию AI Agent Platform
- Добавил больше инструментов для Model Registry
- Добавил больше инструментов для Experiment Management

https://tools.mlpops.ru

👍5

396 views16:19

Бэн Афлек поясняет за генеративный ИИ в киноиндустрии

Ну так то да, по факту раскидал, генеративный ии не будет актеров заменять, а будет бустить продакшн, в плане монтажа спецэффектов и тд

Уже есть плагины для Davinci, Final Cut в который ты грузишь свой подкаст указываешь где какой спикер и он по красоте нарезает, вырезает все нелепые места, оставляя только контент

❤1

360 views08:32

MLPops

10 комманд из 10 LLM-Агентов пишут книгу в real-time

Эти агенты пишут книгу. "Terminal Velocity". Тема книги - исследование темы сознания, этического развития ИИ и сотрудничества человека и ИИ посредством множества взаимосвязанных повествований:

Там есть 10 команд LLM-Агентов состоящяя из:
- Спецификационный агент: Анализирует требования к сюжету и поддерживает нарративную согласованность
- Продакшн агент: Генерирует контент и внедряет креативные изменения
- Управляющий агент: Координирует работу между агентами и отслеживает творческий процесс
- Агент по оценке: Проверяет качество и тематическую резонансность
- Хроникер: Документирует творческий путь
- Документалист: Управляет исследованиями и ссылками
- Агент по дублированию: Обеспечивает оригинальность и предотвращает избыточность
- Редактор: Уточняет прозу и поддерживает стиль
- Тестировщик: Проверяет нарративную согласованность и техническую точность

Есть репа такая, в нее каждые 10-30 минут, прилетает коммит из одной групп, другая группа подхватывает и делает свою задачу.

Нахера и главное зачем, я хз
Выглядит круто, ждем на Amazon за $300

👍3❤1

378 views11:24

MLPops

Главные фигуры в AI и их предикты по появлению AGI

Альтман уже минус
Маск скорее всего тоже

А вот дяде Хинтону больше верю

367 views16:29

MLPops

LLM Иисус

В Швейцарии в одной из церквей поставили "AI Jesus" внутри исповедальни.

Сделали они это вместе с лабортаторией иммерсианой реальности, внутри лабы проект назвали "Deus in Machina".

По факту там скорее всего ChatGPT с релегиозным промтом.

Интересно какой-нибудь ВШЭ поставит такой эксперемент с РПЦ? Или это оскорбление чувств?

Ох как же это похоже на сериал Американские боги.

https://www.theguardian.com/technology/2024/nov/21/deus-in-machina-swiss-church-installs-ai-powered-jesus

👍1

382 views08:25

MLPops

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory

Просто хорошая, модификация SAM2, добавили просто адаптивный трекинг объекта. У SAM2 был прикол, он оч плохо работал когда много объектов в кадре и они все быстро двигаются.

Папира
GitHub

372 views11:51

MLPops

autoflow

RAG на базе графа знаний. Сделали на основе TiDB Vector, LLamaIndex и DSPy

Какие приколы есть
- Диалог в виде рассуждения
- Можно редактировать граф знаний добавляя/изменяя/удаляя информацию
- Легко встроить к себе куда удобно, есть JavaScipt снипет, что бы как Jivo было, вопросики писать

GitHub

402 views16:13

About

Blog

Apps

Platform