MLPops
760 subscribers
424 photos
120 videos
5 files
180 links
We are ML&MLOps community based in 🇷🇺Russia

Наш чат - t.me/+qJm7Ak4nU4EwZmJi
Download Telegram
🖼️ Встречайте, Kandinsky 3.0 уже здесь!

🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.

Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).

🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!

🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.


Подробности тут
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется, дела в OpenAI берут неожиданный оборот: Сэм Альтман возвращается в игру!

Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.

Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.
😱2🔥1
🔺 GigaChat поумнел!

🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B

💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.

🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)

🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.

🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.
🔥3👍1
🏗️ Модель Архитектуры C4: Ключ к Пониманию и Документированию Систем

🔍 Что такое Модель C4?
Модель C4 – это подход к визуализации и документированию архитектуры программных систем. Она разбивает сложные системы на четыре уровня: Контекст, Контейнеры, Компоненты и Код. Это позволяет легко понимать, обсуждать и разрабатывать архитектурные решения.

🌐 Контекст
На этом уровне мы рассматриваем внешнее окружение системы: основные пользователи и взаимодействия.

📦 Контейнеры
Этот уровень фокусируется на приложениях и данных, составляющих систему, и их взаимодействиях.

🔩 Компоненты
Тут мы детализируем структуру отдельных приложений или сервисов внутри контейнеров.

👨‍💻 Код
Последний уровень - это реализация конкретных компонентов системы.

Почему это Важно?
Модель C4 помогает архитекторам, разработчикам и заинтересованным сторонам лучше понять структуру и динамику системы, что важно для эффективной работы и сопровождения.

📚 Хотите Узнать Больше?
Подробнее об этой модели читайте в статье! 👇

🔗 Полная Версия Статьи
🔥4
Андрей Карпатый в очередной раз берет и выкатывает часовую лекцию «Интро в большие языковые модели».

Не пропустите, это must-watch! 🚀

Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard

Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS

Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions


Преза
😱21
🤖 Разбираем Типы Инференса ML Моделей - От Batch до Real-Time!

🧠 Инференс в ML - это когда обученные модели применяются к новым данным для выводов и предсказаний. Каждый тип подходит для разных сценариев использования:

1️⃣ Batch Inference: Идеален для больших объемов данных, обрабатываемых за один раз. Основные преимущества - эффективность, масштабируемость и снижение стоимос​​ти.

2️⃣ Asynchronous Inference: Отлично подходит для обработки запросов, не требующих мгновенного ответа, позволяя системе обрабатывать другие зада​​чи.

3️⃣ Serverless Inference: Обработка данных моделью ML без необходимости поддержания сервера. Вычислительные ресурсы выделяются динамически, что упрощает управление инфраструктур​​ой.

4️⃣ Real-Time Inference: Для приложений, требующих быстрой обработки данных и предоставления результатов в реальном времени. Критично для приложений, требующих немедленного реагирован​​ия.

🔗 Узнайте больше о каждом типе и их применении в полной статье: Типы Инференса ML Моделей
🔥3👍1