This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan Video — новенький опенсорсный видео генератор на 13B от Tencent
Качество — топчик, особенно для 13B модели, хоть и генерит максимум пять секунд. Зато веса выложили, а это значит — можно позапускать
Генерит 129 кадров — ровно чуть больше 5 секунд при 24 fps.
Сама модель — прям почти Flux: сначала идут two-stream блоки, как в SD3, где визуальные и текстовые токены жуются параллельно, а потом уже типичные DiT блоки.
Для текстового энкодера юзают Clip и Multimodal LLM (llava-llama-3-8b, ссылочку подогнали: https://huggingface.co/xtuner/llava-llama-3-8b-v1_1-transformers) вместо обычного T5. Говорят, с этим MLLM они смогли добиться лучшего качества по промптам.
Чтобы запустить этот монстр, нужно минимум 45 гигов видеопамяти для 544x960 и 60 гигов для 720p. Но, уверен, надо подождать и добрые люди доделают ее и на какой нибудт 4070 можно будет запусить.
Демка
HuggingFace
Папира
GitHub
Качество — топчик, особенно для 13B модели, хоть и генерит максимум пять секунд. Зато веса выложили, а это значит — можно позапускать
Генерит 129 кадров — ровно чуть больше 5 секунд при 24 fps.
Сама модель — прям почти Flux: сначала идут two-stream блоки, как в SD3, где визуальные и текстовые токены жуются параллельно, а потом уже типичные DiT блоки.
Для текстового энкодера юзают Clip и Multimodal LLM (llava-llama-3-8b, ссылочку подогнали: https://huggingface.co/xtuner/llava-llama-3-8b-v1_1-transformers) вместо обычного T5. Говорят, с этим MLLM они смогли добиться лучшего качества по промптам.
Чтобы запустить этот монстр, нужно минимум 45 гигов видеопамяти для 544x960 и 60 гигов для 720p. Но, уверен, надо подождать и добрые люди доделают ее и на какой нибудт 4070 можно будет запусить.
Демка
HuggingFace
Папира
GitHub
December 5, 2024
Не совсем понимаю, почему не было хайпа по поводу Model Context Protocol (MCP) от Anthropic, как будто его никто и не заметил. Хотя это ведь штука, которая существенно упрощает взаимодействие с внешними источниками данных.
Что такое MCP?
Это новый протокол, стандарт, который упрощает интеграцию ИИ с любыми источниками данных. MCP устраняет необходимость писать пользовательский код для каждого набора данных, предоставляя единый протокол. По сути, это стандарт, который позволяет использовать готовые решения для интеграции, а не разрабатывать каждую интеграцию с нуля. Просто берешь уже готовое приложение, делаешь pip install — и все. Типо хочешь интеграцию с Jira/Confluence pip install креды указал, интеграция готова. Выглядит как решение 90% проблем в LLM-Агентах.
Что по технической части?
Протокол основан на JSON-RPC 2.0 (версия "2024-11-05") и поддерживает двунаправленную связь между клиентами и серверами, обеспечивая запросы, уведомления и ответы. Среди ключевых функций: управление ресурсами, шаблоны для LLM, выполнение инструментов, отслеживание прогресса операций, логирование, автодополнение и пагинация. Основные компоненты включают ресурсы с URI, подсказки для генерации данных, серверные инструменты и точки доступа к файловой системе. Поддерживаются текст и изображения, уведомления о прогрессе, обработка ошибок и подписка на обновления.
Нашел пару сайтов, где собрали все популярные инструменты MCP:
mcpservers.ai
mcp-get.com
Что такое MCP?
Это новый протокол, стандарт, который упрощает интеграцию ИИ с любыми источниками данных. MCP устраняет необходимость писать пользовательский код для каждого набора данных, предоставляя единый протокол. По сути, это стандарт, который позволяет использовать готовые решения для интеграции, а не разрабатывать каждую интеграцию с нуля. Просто берешь уже готовое приложение, делаешь pip install — и все. Типо хочешь интеграцию с Jira/Confluence pip install креды указал, интеграция готова. Выглядит как решение 90% проблем в LLM-Агентах.
Что по технической части?
Протокол основан на JSON-RPC 2.0 (версия "2024-11-05") и поддерживает двунаправленную связь между клиентами и серверами, обеспечивая запросы, уведомления и ответы. Среди ключевых функций: управление ресурсами, шаблоны для LLM, выполнение инструментов, отслеживание прогресса операций, логирование, автодополнение и пагинация. Основные компоненты включают ресурсы с URI, подсказки для генерации данных, серверные инструменты и точки доступа к файловой системе. Поддерживаются текст и изображения, уведомления о прогрессе, обработка ошибок и подписка на обновления.
Нашел пару сайтов, где собрали все популярные инструменты MCP:
mcpservers.ai
mcp-get.com
Mcp-Get
MCP Package Registry | Model Context Protocol
Find and search MCP servers in one place. The simplest way to discover, track, and manage Model Context Protocol servers with real-time insights.
December 5, 2024
OpenAI выпустили новую модель o1 pro
Цена - 200 грязных зеленых бумажек
На 7-10 пунктов лучше чем просто о1
Стрим идет тут https://www.youtube.com/watch?v=rsFHqpN2bCM
Цена - 200 грязных зеленых бумажек
На 7-10 пунктов лучше чем просто о1
Стрим идет тут https://www.youtube.com/watch?v=rsFHqpN2bCM
December 5, 2024
December 5, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Hugging Face добавил Text-to-SQL ко всем 250K+ публичным датасетам — теперь можно писать SQL-запросы с помощью Qwen 2.5 Coder 32B 🔥
December 6, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Йошуа Бенжио, говорит, что есть люди, которые не против заменить человечество машинами, и такие сценарии могут стать актуальными уже через несколько лет.
Честно?
Звучит как сюжет для антиутопии, так и вижу сюжет Detroit Become Human, где очередные соевые куколды, будут защищать чувства машин.
В России вообще не стоит о таком беспокоится, в России еще лет 10 такого не будет, ведь что бы тебя заменили на заводе, должны появиться заводы))
Йошуа Бенжио — один из ведущих исследователей в области искусственного интеллекта, лауреат премии Тьюринга и один из «крестных отцов ИИ», его работы заложили основу для DL.
Честно?
Звучит как сюжет для антиутопии, так и вижу сюжет Detroit Become Human, где очередные соевые куколды, будут защищать чувства машин.
В России вообще не стоит о таком беспокоится, в России еще лет 10 такого не будет, ведь что бы тебя заменили на заводе, должны появиться заводы))
December 6, 2024
December 6, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Эрику Шмидту показали систему, которая создает тысячи ботов с уникальными, реалистичными ИИ-персонажами, но при этом с единым взглядом на определенные темы.
Идеальная фабрика троллей, ребята на Савушкина, ваша работа под угрозой
Идеальная фабрика троллей, ребята на Савушкина, ваша работа под угрозой
December 6, 2024
December 7, 2024
December 7, 2024
Решил составить список self-hosted решений, которыми я сам на постоянке пользуюсь.
Zitadel — мой IAM, поддерживает из коробки множество протоколов, быстрая настройка. Это мой лучший опыт с IAM.
GitHub
Outline Wiki — замена Notion, баз данных нет, но как хранилище идеально. Очень радует система прав и ролей, четкое разграничение.
Стал смотреть в сторону Docmost, выглядит вроде как интереснее.
GitHub
Iframely — тулза для Outline Wiki, чтобы красиво встраивать ссылки на популярные сервисы.
GitHub
Hoarder — система закладок с OpenAI. До того как поднял себе Hoarder, никогда не пользовался закладками в браузере, а эта штука автоматически ставит теги, категории и т.д. Единственный минус — для получения инфы он использует Chrome, и часто Cloudflare его блокирует, поэтому подробности о странице могут не загрузиться.
GitHub
UpTime Kuma — мониторинг доступности сервисов. Использую просто как свой мониторинг как своих сервисов, так и внешних, типа Яндекс Такси, Steam, Discord (обратное правило: жду разбана).
GitHub
changedetection.io — решение для мониторинга изменений страниц. В основном использую для мониторинга pip-пакетов, репозиториев, моделей, а иногда на Авито/Ozon, чтобы скидку вовремя словить.
GitHub
cal.com —"кек-калл". По сути, это очень удобная замена Calendly, чтобы встречи с тобой можно было легко назначить.
GitHub
CalibreWeb — удобное решение для книжек. Загружаю туда книги, которые успел или планирую прочитать.
GitHub
paperless-ngx — удобное решение для ресёрчинга. Загружаешь туда десяток статей, как в читаемом формате, так и просто картинки, OCR переводит всё в текст. Получается очень удобный сервис для поиска по содержанию.
GitHub
BitWarden — просто хранилище паролей и ключей.
Сайт
NextCloud — просто как хранилище файлов.
GitHub
И конечно это все я развернул в Cloud.ru на бесплатной ВМке
Накидайте в комментарии, что вы используете (и для чего) из self-hosted решений. 😉
Zitadel — мой IAM, поддерживает из коробки множество протоколов, быстрая настройка. Это мой лучший опыт с IAM.
GitHub
Outline Wiki — замена Notion, баз данных нет, но как хранилище идеально. Очень радует система прав и ролей, четкое разграничение.
Стал смотреть в сторону Docmost, выглядит вроде как интереснее.
GitHub
Iframely — тулза для Outline Wiki, чтобы красиво встраивать ссылки на популярные сервисы.
GitHub
Hoarder — система закладок с OpenAI. До того как поднял себе Hoarder, никогда не пользовался закладками в браузере, а эта штука автоматически ставит теги, категории и т.д. Единственный минус — для получения инфы он использует Chrome, и часто Cloudflare его блокирует, поэтому подробности о странице могут не загрузиться.
GitHub
UpTime Kuma — мониторинг доступности сервисов. Использую просто как свой мониторинг как своих сервисов, так и внешних, типа Яндекс Такси, Steam, Discord (обратное правило: жду разбана).
GitHub
changedetection.io — решение для мониторинга изменений страниц. В основном использую для мониторинга pip-пакетов, репозиториев, моделей, а иногда на Авито/Ozon, чтобы скидку вовремя словить.
GitHub
cal.com —
GitHub
CalibreWeb — удобное решение для книжек. Загружаю туда книги, которые успел или планирую прочитать.
GitHub
paperless-ngx — удобное решение для ресёрчинга. Загружаешь туда десяток статей, как в читаемом формате, так и просто картинки, OCR переводит всё в текст. Получается очень удобный сервис для поиска по содержанию.
GitHub
BitWarden — просто хранилище паролей и ключей.
Сайт
NextCloud — просто как хранилище файлов.
GitHub
И конечно это все я развернул в Cloud.ru на бесплатной ВМке
Накидайте в комментарии, что вы используете (и для чего) из self-hosted решений. 😉
December 7, 2024
CEO Huggingface сделал прогноз по АИ на 2025: Шесть предсказаний для ИИ в 2025 году (и обзор того, как мои прогнозы на 2024 год сбылись):
Шесть предсказаний для AI в 2025 году (и обзор того, как мои предсказания на 2024 год сбылись):
- Пройдет первая крупная публичная акция протеста, связанная с AI
- Капитализация крупной компании сократится в два раза или более из-за AI
- Будет оформлено предзаказов на как минимум 100 000 персональных AI роботов
- Китай начнет лидировать в гонке AI (как следствие лидерства в гонке open-source AI).
- Произойдут крупные прорывы в AI для биологии и химии.
- Мы начнем видеть экономический и карьерный потенциал роста AI, при этом 15 млн разработчиков будут на Hugging Face.
Как мои предсказания на 2024 год сбылись:
- Громко разрекламированная AI компания обанкротится или будет приобретена за смешную сумму
✅ (Inflexion, AdeptAI, ...)
- Open-source LLMs достигнут уровня лучших закрытых LLMs
✅ с QwQ и десятками других
- Большие прорывы в AI для видео, временных рядов, биологии и химии
✅ для видео 🔴 для временных рядов, биологии и химии
- Мы начнем гораздо больше говорить о стоимости (финансовой и экологической) AI
✅ Финансовая 🔴 Экологическая (😢)
- Популярный медиаконтент будет в основном сгенерирован AI
✅ с NotebookLM от Google
- 10 миллионов AI builders на Hugging Face приведут к отсутствию роста безработицы
🔜 в данный момент 7M AI builders на Hugging Face
Ох и ох
Надо бы и свои предикты на 2025 год сделать
Шесть предсказаний для AI в 2025 году (и обзор того, как мои предсказания на 2024 год сбылись):
- Пройдет первая крупная публичная акция протеста, связанная с AI
- Капитализация крупной компании сократится в два раза или более из-за AI
- Будет оформлено предзаказов на как минимум 100 000 персональных AI роботов
- Китай начнет лидировать в гонке AI (как следствие лидерства в гонке open-source AI).
- Произойдут крупные прорывы в AI для биологии и химии.
- Мы начнем видеть экономический и карьерный потенциал роста AI, при этом 15 млн разработчиков будут на Hugging Face.
Как мои предсказания на 2024 год сбылись:
- Громко разрекламированная AI компания обанкротится или будет приобретена за смешную сумму
✅ (Inflexion, AdeptAI, ...)
- Open-source LLMs достигнут уровня лучших закрытых LLMs
✅ с QwQ и десятками других
- Большие прорывы в AI для видео, временных рядов, биологии и химии
✅ для видео 🔴 для временных рядов, биологии и химии
- Мы начнем гораздо больше говорить о стоимости (финансовой и экологической) AI
✅ Финансовая 🔴 Экологическая (😢)
- Популярный медиаконтент будет в основном сгенерирован AI
✅ с NotebookLM от Google
- 10 миллионов AI builders на Hugging Face приведут к отсутствию роста безработицы
🔜 в данный момент 7M AI builders на Hugging Face
Ох и ох
Надо бы и свои предикты на 2025 год сделать
December 8, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Альтман в очередной раз прогоняет базу «Люди потеряют работу из-за ИИ»
Да потеряют, но как и во второй промышленной революции, при смене ручного труда на станки, тоже самое будет у нас.
До появления электричества была такая проффесия, свечи на фонорях ходить поджигать.
Текущие должности умрут, это да, но появятся другие и мб даже в большем количестве
Не художник/дизайнер а промт инженер в визуальном направлении
Не программист, а промт инженер программ
Не DS а ОБУЧАТЕЛЬ ИССКУСТВЕННОГО ИНТЕЛЕКТА
Да потеряют, но как и во второй промышленной революции, при смене ручного труда на станки, тоже самое будет у нас.
До появления электричества была такая проффесия, свечи на фонорях ходить поджигать.
Текущие должности умрут, это да, но появятся другие и мб даже в большем количестве
Не художник/дизайнер а промт инженер в визуальном направлении
Не программист, а промт инженер программ
Не DS а ОБУЧАТЕЛЬ ИССКУСТВЕННОГО ИНТЕЛЕКТА
December 9, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
TTS WebGPU: Первая реально стабильная реализация TTS на WebGPU с Transformers.js
За основу взяли OuteTTS-0.2-500M и упаковали в Transformers.js работает стабильно, ошибок пока не ловил
На русском не работает
Демка
GitHub
За основу взяли OuteTTS-0.2-500M и упаковали в Transformers.js работает стабильно, ошибок пока не ловил
На русском не работает
Демка
GitHub
December 9, 2024
December 9, 2024
Там Google релизнули обновленную версию Gemeni-Exp-1206, пока что топ по задачам в коде
Как использовать Gemini-Exp-1206 бесплатно?
1. Перейдите в Google AI Studio и войдите в систему (бесплатно).
2. Перейдите в раздел "Создать запрос" (Create prompt).
3. В настройках измените модель на Gemini Experimental 1206.
4. Начните чатес.
Как использовать Gemini-Exp-1206 бесплатно?
1. Перейдите в Google AI Studio и войдите в систему (бесплатно).
2. Перейдите в раздел "Создать запрос" (Create prompt).
3. В настройках измените модель на Gemini Experimental 1206.
4. Начните чатес.
December 9, 2024
Пару дней назада релизнули LLama 3.3 70B
Че сделали лучше?
- Подтянули математику
- Подтянули работу с кодом
На это все, больше различий не замети
HuggingFace
Че сделали лучше?
- Подтянули математику
- Подтянули работу с кодом
На это все, больше различий не замети
HuggingFace
huggingface.co
meta-llama/Llama-3.3-70B-Instruct · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
December 9, 2024
December 10, 2024