MLPops
788 subscribers
424 photos
120 videos
5 files
180 links
We are ML&MLOps community based in 🇷🇺Russia

Наш чат - t.me/+qJm7Ak4nU4EwZmJi
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Можно ли назвать DevOps/SRE гавночистом?
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan Video — новенький опенсорсный видео генератор на 13B от Tencent

Качество — топчик, особенно для 13B модели, хоть и генерит максимум пять секунд. Зато веса выложили, а это значит — можно позапускать

Генерит 129 кадров — ровно чуть больше 5 секунд при 24 fps.

Сама модель — прям почти Flux: сначала идут two-stream блоки, как в SD3, где визуальные и текстовые токены жуются параллельно, а потом уже типичные DiT блоки.

Для текстового энкодера юзают Clip и Multimodal LLM (llava-llama-3-8b, ссылочку подогнали: https://huggingface.co/xtuner/llava-llama-3-8b-v1_1-transformers) вместо обычного T5. Говорят, с этим MLLM они смогли добиться лучшего качества по промптам.

Чтобы запустить этот монстр, нужно минимум 45 гигов видеопамяти для 544x960 и 60 гигов для 720p. Но, уверен, надо подождать и добрые люди доделают ее и на какой нибудт 4070 можно будет запусить.


Демка
HuggingFace
Папира
GitHub
Не совсем понимаю, почему не было хайпа по поводу Model Context Protocol (MCP) от Anthropic, как будто его никто и не заметил. Хотя это ведь штука, которая существенно упрощает взаимодействие с внешними источниками данных.

Что такое MCP?

Это новый протокол, стандарт, который упрощает интеграцию ИИ с любыми источниками данных. MCP устраняет необходимость писать пользовательский код для каждого набора данных, предоставляя единый протокол. По сути, это стандарт, который позволяет использовать готовые решения для интеграции, а не разрабатывать каждую интеграцию с нуля. Просто берешь уже готовое приложение, делаешь pip install — и все. Типо хочешь интеграцию с Jira/Confluence pip install креды указал, интеграция готова. Выглядит как решение 90% проблем в LLM-Агентах.

Что по технической части?

Протокол основан на JSON-RPC 2.0 (версия "2024-11-05") и поддерживает двунаправленную связь между клиентами и серверами, обеспечивая запросы, уведомления и ответы. Среди ключевых функций: управление ресурсами, шаблоны для LLM, выполнение инструментов, отслеживание прогресса операций, логирование, автодополнение и пагинация. Основные компоненты включают ресурсы с URI, подсказки для генерации данных, серверные инструменты и точки доступа к файловой системе. Поддерживаются текст и изображения, уведомления о прогрессе, обработка ошибок и подписка на обновления.

Нашел пару сайтов, где собрали все популярные инструменты MCP:
mcpservers.ai
mcp-get.com
OpenAI выпустили новую модель o1 pro

Цена - 200 грязных зеленых бумажек

На 7-10 пунктов лучше чем просто о1

Стрим идет тут https://www.youtube.com/watch?v=rsFHqpN2bCM
Ну как и сказал 200 грязных зеленых бумажек
This media is not supported in your browser
VIEW IN TELEGRAM
Hugging Face добавил Text-to-SQL ко всем 250K+ публичным датасетам — теперь можно писать SQL-запросы с помощью Qwen 2.5 Coder 32B 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
Йошуа Бенжио, говорит, что есть люди, которые не против заменить человечество машинами, и такие сценарии могут стать актуальными уже через несколько лет.

Честно?
Звучит как сюжет для антиутопии, так и вижу сюжет Detroit Become Human, где очередные соевые куколды, будут защищать чувства машин.
В России вообще не стоит о таком беспокоится, в России еще лет 10 такого не будет, ведь что бы тебя заменили на заводе, должны появиться заводы))

Йошуа Бенжио — один из ведущих исследователей в области искусственного интеллекта, лауреат премии Тьюринга и один из «крестных отцов ИИ», его работы заложили основу для DL.
This media is not supported in your browser
VIEW IN TELEGRAM
Эрику Шмидту показали систему, которая создает тысячи ботов с уникальными, реалистичными ИИ-персонажами, но при этом с единым взглядом на определенные темы.

Идеальная фабрика троллей, ребята на Савушкина, ваша работа под угрозой
Есть тут посвещенные почему 9.9 > 9.11?
Решил составить список self-hosted решений, которыми я сам на постоянке пользуюсь.

Zitadel — мой IAM, поддерживает из коробки множество протоколов, быстрая настройка. Это мой лучший опыт с IAM.
GitHub

Outline Wiki — замена Notion, баз данных нет, но как хранилище идеально. Очень радует система прав и ролей, четкое разграничение.
Стал смотреть в сторону Docmost, выглядит вроде как интереснее.
GitHub

Iframely — тулза для Outline Wiki, чтобы красиво встраивать ссылки на популярные сервисы.
GitHub

Hoarder — система закладок с OpenAI. До того как поднял себе Hoarder, никогда не пользовался закладками в браузере, а эта штука автоматически ставит теги, категории и т.д. Единственный минус — для получения инфы он использует Chrome, и часто Cloudflare его блокирует, поэтому подробности о странице могут не загрузиться.
GitHub

UpTime Kuma — мониторинг доступности сервисов. Использую просто как свой мониторинг как своих сервисов, так и внешних, типа Яндекс Такси, Steam, Discord (обратное правило: жду разбана).
GitHub

changedetection.io — решение для мониторинга изменений страниц. В основном использую для мониторинга pip-пакетов, репозиториев, моделей, а иногда на Авито/Ozon, чтобы скидку вовремя словить.
GitHub

cal.com"кек-калл". По сути, это очень удобная замена Calendly, чтобы встречи с тобой можно было легко назначить.
GitHub

CalibreWeb — удобное решение для книжек. Загружаю туда книги, которые успел или планирую прочитать.
GitHub

paperless-ngx — удобное решение для ресёрчинга. Загружаешь туда десяток статей, как в читаемом формате, так и просто картинки, OCR переводит всё в текст. Получается очень удобный сервис для поиска по содержанию.
GitHub

BitWarden — просто хранилище паролей и ключей.
Сайт

NextCloud — просто как хранилище файлов.
GitHub

И конечно это все я развернул в Cloud.ru на бесплатной ВМке

Накидайте в комментарии, что вы используете (и для чего) из self-hosted решений. 😉
CEO Huggingface сделал прогноз по АИ на 2025: Шесть предсказаний для ИИ в 2025 году (и обзор того, как мои прогнозы на 2024 год сбылись):


Шесть предсказаний для AI в 2025 году (и обзор того, как мои предсказания на 2024 год сбылись):

- Пройдет первая крупная публичная акция протеста, связанная с AI
- Капитализация крупной компании сократится в два раза или более из-за AI
- Будет оформлено предзаказов на как минимум 100 000 персональных AI роботов
- Китай начнет лидировать в гонке AI (как следствие лидерства в гонке open-source AI).
- Произойдут крупные прорывы в AI для биологии и химии.
- Мы начнем видеть экономический и карьерный потенциал роста AI, при этом 15 млн разработчиков будут на Hugging Face.

Как мои предсказания на 2024 год сбылись:

- Громко разрекламированная AI компания обанкротится или будет приобретена за смешную сумму
(Inflexion, AdeptAI, ...)
- Open-source LLMs достигнут уровня лучших закрытых LLMs
с QwQ и десятками других
- Большие прорывы в AI для видео, временных рядов, биологии и химии
для видео 🔴 для временных рядов, биологии и химии
- Мы начнем гораздо больше говорить о стоимости (финансовой и экологической) AI
Финансовая 🔴 Экологическая (😢)
- Популярный медиаконтент будет в основном сгенерирован AI
с NotebookLM от Google
- 10 миллионов AI builders на Hugging Face приведут к отсутствию роста безработицы
🔜 в данный момент 7M AI builders на Hugging Face



Ох и ох
Надо бы и свои предикты на 2025 год сделать
This media is not supported in your browser
VIEW IN TELEGRAM
Альтман в очередной раз прогоняет базу «Люди потеряют работу из-за ИИ»

Да потеряют, но как и во второй промышленной революции, при смене ручного труда на станки, тоже самое будет у нас.
До появления электричества была такая проффесия, свечи на фонорях ходить поджигать.
Текущие должности умрут, это да, но появятся другие и мб даже в большем количестве

Не художник/дизайнер а промт инженер в визуальном направлении

Не программист, а промт инженер программ

Не DS а ОБУЧАТЕЛЬ ИССКУСТВЕННОГО ИНТЕЛЕКТА
This media is not supported in your browser
VIEW IN TELEGRAM
TTS WebGPU: Первая реально стабильная реализация TTS на WebGPU с Transformers.js

За основу взяли OuteTTS-0.2-500M и упаковали в Transformers.js работает стабильно, ошибок пока не ловил

На русском не работает

Демка
GitHub
Маск октрыл доступ до Grok 2 без подписки, но пока не у всех

Доступны следующие возможности:

- 10 запросов любой сложности каждые два часа.
- Генерация 10 изображений, превосходящих по качеству Midjourney, без ограничений и цензуры.
- Загрузка 3 изображений или документов для анализа ежедневно.
Там Google релизнули обновленную версию Gemeni-Exp-1206, пока что топ по задачам в коде


Как использовать Gemini-Exp-1206 бесплатно?

1. Перейдите в Google AI Studio и войдите в систему (бесплатно).
2. Перейдите в раздел "Создать запрос" (Create prompt).
3. В настройках измените модель на Gemini Experimental 1206.
4. Начните чатес.