MLPops

🖼️ Встречайте, Kandinsky 3.0 уже здесь!

🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.

Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).

🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!

🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.

Подробности тут

🔥4

661 views17:24

MLPops

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Кажется, дела в OpenAI берут неожиданный оборот: Сэм Альтман возвращается в игру!

Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.

Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.

😱2🔥1

597 views18:03

MLPops

🔺 GigaChat поумнел!

🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B

💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.

🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)

🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.

🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.

🔥3👍1

788 views13:36

MLPops

🏗️ Модель Архитектуры C4: Ключ к Пониманию и Документированию Систем

🔍 Что такое Модель C4?
Модель C4 – это подход к визуализации и документированию архитектуры программных систем. Она разбивает сложные системы на четыре уровня: Контекст, Контейнеры, Компоненты и Код. Это позволяет легко понимать, обсуждать и разрабатывать архитектурные решения.

🌐 Контекст
На этом уровне мы рассматриваем внешнее окружение системы: основные пользователи и взаимодействия.

📦 Контейнеры
Этот уровень фокусируется на приложениях и данных, составляющих систему, и их взаимодействиях.

🔩 Компоненты
Тут мы детализируем структуру отдельных приложений или сервисов внутри контейнеров.

👨‍💻 Код
Последний уровень - это реализация конкретных компонентов системы.

✅ Почему это Важно?
Модель C4 помогает архитекторам, разработчикам и заинтересованным сторонам лучше понять структуру и динамику системы, что важно для эффективной работы и сопровождения.

📚 Хотите Узнать Больше?
Подробнее об этой модели читайте в статье! 👇

🔗 Полная Версия Статьи

🔥4

940 views14:40

MLPops

Андрей Карпатый в очередной раз берет и выкатывает часовую лекцию «Интро в большие языковые модели».

Не пропустите, это must-watch! 🚀

Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard

Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS

Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions

Преза

YouTube

[1hr Talk] Intro to Large Language Models

This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…

😱2❤1

817 views19:28

MLPops

🤖 Разбираем Типы Инференса ML Моделей - От Batch до Real-Time!

🧠 Инференс в ML - это когда обученные модели применяются к новым данным для выводов и предсказаний. Каждый тип подходит для разных сценариев использования:

1️⃣ Batch Inference: Идеален для больших объемов данных, обрабатываемых за один раз. Основные преимущества - эффективность, масштабируемость и снижение стоимости.

2️⃣ Asynchronous Inference: Отлично подходит для обработки запросов, не требующих мгновенного ответа, позволяя системе обрабатывать другие задачи.

3️⃣ Serverless Inference: Обработка данных моделью ML без необходимости поддержания сервера. Вычислительные ресурсы выделяются динамически, что упрощает управление инфраструктурой.

4️⃣ Real-Time Inference: Для приложений, требующих быстрой обработки данных и предоставления результатов в реальном времени. Критично для приложений, требующих немедленного реагирования.

🔗 Узнайте больше о каждом типе и их применении в полной статье: Типы Инференса ML Моделей

🔥3👍1

1.09K views15:16

MLPops

Google релизнул Gemini - конкурент GPT-4

https://blog.google/technology/ai/google-gemini-ai/

Google

Introducing Gemini: our largest and most capable AI model

Gemini is our most capable and general model, built to be multimodal and optimized for three different sizes: Ultra, Pro and Nano.

🔥5👍1

830 viewsedited 15:11

MLPops