🖼️ Встречайте, Kandinsky 3.0 уже здесь!
🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.
Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).
🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!
🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.
Подробности тут
🚀 Новая версия модели существенно сокращет отставание от ведущих решений типо Midjourney и Stable Diffusion . Уже успел протестировать её до официального выхода, и что я могу сказать? Это разъеб. Ребатя отказались от предыдущей архитектуры, перейдя к более традиционной для диффузионных моделей, подобных SD.
Главный прирост — увеличение количество параметров: если раньше было 4.5 миллиарда, теперь — целых 11.8 миллиардов.
Изображения получились невероятно детализированными, хотя с переводом текста пока не всё гладко (да, в боте есть встроенный переводчик с русского на английский).
🌐 Самая важная новинка — русский домен. Теперь, спросив о Чебурашке, вы получите именно того самого Чебурашку!
🎞️ Вторая по важности новинка — видеогенерация с использованием пайплайна Deforum.
Подробности тут
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется, дела в OpenAI берут неожиданный оборот: Сэм Альтман возвращается в игру!
Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.
Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.
Пока точные детали интриги остаются за кулисами, однако, по слухам из New York Times, конфликт разгорелся из-за некоей публикации. Но информация кажется сомнительной и не до конца ясной.
Вопросы о будущем OpenAI и его пути продолжают висеть в воздухе. Исходя из текущей ситуации, не исключено, что статус Сэма может измениться в любой момент.
😱2🔥1
🔺 GigaChat поумнел!
🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B
💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.
🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)
🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.
🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.
🎉 SberDevice анонсировали новую модель GigaChat 29B которая бьет LLAMA 2 34B
💡 На последних тестах SBS модель показала уровень, почти равный ChatGPT 3.5-turbo, перейдя от начальных 33:67 на 7B до впечатляющих 43:57. Это четкий сигнал — что ребята на грани паритета.
🚀 На AIJ команда раскрыла некоторые секреты технической магии: как были подготовлены данные, как ускорялось обучение модели (и не слова про MLSpace, хотя сильно помогали с обучением)
🎯 На MMLU модель набрала 63,2% правильных ответов. Подготовка к инференсу идет полным ходом, API для разработчиков уже в строю, а вскоре возможно появится и бесплатный пробный период.
🔫 На удивление, ребята протестировали модель на юридическом экзамене, и модель прошла, набрав 80% правильных ответов, при проходных 70%. Можно сказать, что GigaChat умнее некоторых юристов.
🔥3👍1
🏗️ Модель Архитектуры C4: Ключ к Пониманию и Документированию Систем
🔍 Что такое Модель C4?
Модель C4 – это подход к визуализации и документированию архитектуры программных систем. Она разбивает сложные системы на четыре уровня: Контекст, Контейнеры, Компоненты и Код. Это позволяет легко понимать, обсуждать и разрабатывать архитектурные решения.
🌐 Контекст
На этом уровне мы рассматриваем внешнее окружение системы: основные пользователи и взаимодействия.
📦 Контейнеры
Этот уровень фокусируется на приложениях и данных, составляющих систему, и их взаимодействиях.
🔩 Компоненты
Тут мы детализируем структуру отдельных приложений или сервисов внутри контейнеров.
👨💻 Код
Последний уровень - это реализация конкретных компонентов системы.
✅ Почему это Важно?
Модель C4 помогает архитекторам, разработчикам и заинтересованным сторонам лучше понять структуру и динамику системы, что важно для эффективной работы и сопровождения.
📚 Хотите Узнать Больше?
Подробнее об этой модели читайте в статье! 👇
🔗 Полная Версия Статьи
🔍 Что такое Модель C4?
Модель C4 – это подход к визуализации и документированию архитектуры программных систем. Она разбивает сложные системы на четыре уровня: Контекст, Контейнеры, Компоненты и Код. Это позволяет легко понимать, обсуждать и разрабатывать архитектурные решения.
🌐 Контекст
На этом уровне мы рассматриваем внешнее окружение системы: основные пользователи и взаимодействия.
📦 Контейнеры
Этот уровень фокусируется на приложениях и данных, составляющих систему, и их взаимодействиях.
🔩 Компоненты
Тут мы детализируем структуру отдельных приложений или сервисов внутри контейнеров.
👨💻 Код
Последний уровень - это реализация конкретных компонентов системы.
✅ Почему это Важно?
Модель C4 помогает архитекторам, разработчикам и заинтересованным сторонам лучше понять структуру и динамику системы, что важно для эффективной работы и сопровождения.
📚 Хотите Узнать Больше?
Подробнее об этой модели читайте в статье! 👇
🔗 Полная Версия Статьи
🔥4
Андрей Карпатый в очередной раз берет и выкатывает часовую лекцию «Интро в большие языковые модели».
Не пропустите, это must-watch! 🚀
Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard
Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS
Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions
Преза
Не пропустите, это must-watch! 🚀
Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard
Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS
Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions
Преза
YouTube
[1hr Talk] Intro to Large Language Models
This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…
😱2❤1
🤖 Разбираем Типы Инференса ML Моделей - От Batch до Real-Time!
🧠 Инференс в ML - это когда обученные модели применяются к новым данным для выводов и предсказаний. Каждый тип подходит для разных сценариев использования:
1️⃣ Batch Inference: Идеален для больших объемов данных, обрабатываемых за один раз. Основные преимущества - эффективность, масштабируемость и снижение стоимости.
2️⃣ Asynchronous Inference: Отлично подходит для обработки запросов, не требующих мгновенного ответа, позволяя системе обрабатывать другие задачи.
3️⃣ Serverless Inference: Обработка данных моделью ML без необходимости поддержания сервера. Вычислительные ресурсы выделяются динамически, что упрощает управление инфраструктурой.
4️⃣ Real-Time Inference: Для приложений, требующих быстрой обработки данных и предоставления результатов в реальном времени. Критично для приложений, требующих немедленного реагирования.
🔗 Узнайте больше о каждом типе и их применении в полной статье: Типы Инференса ML Моделей
🧠 Инференс в ML - это когда обученные модели применяются к новым данным для выводов и предсказаний. Каждый тип подходит для разных сценариев использования:
1️⃣ Batch Inference: Идеален для больших объемов данных, обрабатываемых за один раз. Основные преимущества - эффективность, масштабируемость и снижение стоимости.
2️⃣ Asynchronous Inference: Отлично подходит для обработки запросов, не требующих мгновенного ответа, позволяя системе обрабатывать другие задачи.
3️⃣ Serverless Inference: Обработка данных моделью ML без необходимости поддержания сервера. Вычислительные ресурсы выделяются динамически, что упрощает управление инфраструктурой.
4️⃣ Real-Time Inference: Для приложений, требующих быстрой обработки данных и предоставления результатов в реальном времени. Критично для приложений, требующих немедленного реагирования.
🔗 Узнайте больше о каждом типе и их применении в полной статье: Типы Инференса ML Моделей
🔥3👍1