December 2, 2024
Хайп LLM-платформ.
Сидел на реддите и увидел тред, где сидят и обсуждают лучшую LLM-платформу для AI-агентов.
Я долго не мог вкурить, а че там вообще и как.
Заходишь на любую платформу, и на лэндосах огромных — космические корабли. Зарегался на парочке платформ, глянул и как понял.
Понял, что это настолько массивный прогрев ГОЕВ, который я до этого момента в облачном направлении не видел. Почему прогрев? Потому что каждый второй менеджер, который считает себя неебическим экспертом (нет), хочет либо делать этих агентов, либо использовать у себя их, а как, что и где — понятия не имеет. Но готов башлять туда сотни грязных бумажек.
По факту, все эти AI-платформы — это тупо серверлесс + векторная БД (типа Chroma или Milvus), мб где-то вообще в памяти, типа memGPT, и мб сервисы по логированию/трейсингу. И то — это не у всех есть.
Но как же умело греют гоев на этой теме, заставляя бошлять куда больше денег, тупо за то, что там есть приставка AI.
Ох, пора бы и мне к какому-нибудь из продуктов сделать приставку AI и начать греть гоев.
Сидел на реддите и увидел тред, где сидят и обсуждают лучшую LLM-платформу для AI-агентов.
Я долго не мог вкурить, а че там вообще и как.
Заходишь на любую платформу, и на лэндосах огромных — космические корабли. Зарегался на парочке платформ, глянул и как понял.
Понял, что это настолько массивный прогрев ГОЕВ, который я до этого момента в облачном направлении не видел. Почему прогрев? Потому что каждый второй менеджер, который считает себя неебическим экспертом (нет), хочет либо делать этих агентов, либо использовать у себя их, а как, что и где — понятия не имеет. Но готов башлять туда сотни грязных бумажек.
По факту, все эти AI-платформы — это тупо серверлесс + векторная БД (типа Chroma или Milvus), мб где-то вообще в памяти, типа memGPT, и мб сервисы по логированию/трейсингу. И то — это не у всех есть.
Но как же умело греют гоев на этой теме, заставляя бошлять куда больше денег, тупо за то, что там есть приставка AI.
Ох, пора бы и мне к какому-нибудь из продуктов сделать приставку AI и начать греть гоев.
December 3, 2024
Обновил список инструментов
- Добавил новую категорию RAG
- Добавил новую категорию Prompt
- Добавил больше инструментов для Observability
- Добавил больше инструментов для Data Storage
https://tools.mlpops.ru
- Добавил новую категорию RAG
- Добавил новую категорию Prompt
- Добавил больше инструментов для Observability
- Добавил больше инструментов для Data Storage
https://tools.mlpops.ru
tools.mlpops.ru
MLOps инструменты
Откройте для себя инструменты ML и MLOps.
December 3, 2024
December 3, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
У меня октрыта парочка ваканский, не кто не хочет? 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
December 3, 2024
Amazon представила Nova Pro — свою LLM, которая сопоставима с Claude 3.5 Sonnet
По метрикам на 2-3 пунтка ниже чем ChatGPT
Че по ценам
Nova Pro стоит $0.8/3.2, Nova Lite — $0.06/0.24 и Nova Micro — $0.04/0.14 за M токенов на input/output.
В сравнении с остальными выглядит оч выиграшно
GPT-4o - $2.50/1.25, gpt-4o-mini — $0.150/0.3, o1-preview — $15/60 за M токенов на input/output.
Claude 3.5 Sonnet - $3/15 за M токенов на input/output
Ананос Amazon
По метрикам на 2-3 пунтка ниже чем ChatGPT
Че по ценам
Nova Pro стоит $0.8/3.2, Nova Lite — $0.06/0.24 и Nova Micro — $0.04/0.14 за M токенов на input/output.
В сравнении с остальными выглядит оч выиграшно
GPT-4o - $2.50/1.25, gpt-4o-mini — $0.150/0.3, o1-preview — $15/60 за M токенов на input/output.
Claude 3.5 Sonnet - $3/15 за M токенов на input/output
Ананос Amazon
December 4, 2024
EpochAI представили новое исследование о железе для обучения
EpochAI выпустили исследование, посвященное аппаратным компонентам, собрав данные о более чем 100 видах железках.
Вот несколько интересных фактов и выводов:
➡️ При переходе с FP32 на INT8 производительность видеокарт увеличилась в 15 раз.
➡️ Несмотря на рост цен, вычисления становятся дешевле в среднем на 30% и энергоэффективнее на 50% ежегодно.
➡️ Общее количество операций в секунду растет примерно на 20% в год.
➡️ Это означает, что мощность процессоров удваивается каждые 2.8 года, что близко к закону Мура.
➡️ С 2016 года максимальные размеры кластеров для обучения ИИ выросли более чем в 20 раз.
➡️ На сегодняшний день самой популярной видеокартой в мире остается Nvidia A100.
Исследование подчеркивает устойчивый прогресс в области аппаратного обеспечения и его влияние на развитие ИИ.
Отчет можно найти тут
EpochAI выпустили исследование, посвященное аппаратным компонентам, собрав данные о более чем 100 видах железках.
Вот несколько интересных фактов и выводов:
➡️ При переходе с FP32 на INT8 производительность видеокарт увеличилась в 15 раз.
➡️ Несмотря на рост цен, вычисления становятся дешевле в среднем на 30% и энергоэффективнее на 50% ежегодно.
➡️ Общее количество операций в секунду растет примерно на 20% в год.
➡️ Это означает, что мощность процессоров удваивается каждые 2.8 года, что близко к закону Мура.
➡️ С 2016 года максимальные размеры кластеров для обучения ИИ выросли более чем в 20 раз.
➡️ На сегодняшний день самой популярной видеокартой в мире остается Nvidia A100.
Исследование подчеркивает устойчивый прогресс в области аппаратного обеспечения и его влияние на развитие ИИ.
Отчет можно найти тут
December 4, 2024
MLPops
Amazon представила Nova Pro — свою LLM, которая сопоставима с Claude 3.5 Sonnet По метрикам на 2-3 пунтка ниже чем ChatGPT Че по ценам Nova Pro стоит $0.8/3.2, Nova Lite — $0.06/0.24 и Nova Micro — $0.04/0.14 за M токенов на input/output. В сравнении с…
Не правильно на размерности глянул, походу LLM от AWS будет очень даже доступной по сравнению с остальными, но по метрикам не очень далеко ушли от LLama 90B.
Интересно они стали ставить у себя промт кэш, за счет чего так удешивили?
Интересно они стали ставить у себя промт кэш, за счет чего так удешивили?
December 4, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Лекс Фридман выпустил 5-часовое интервью с Дарио Амодеи, бывшим VP Research OpenAI и нынешним CEO Anthropic
В интервью также участвовали другие специалисты, включая Криса Олаха, который посвятил час обсуждению механистической интерпретируемости. Вот основные моменты:
➡️ О перспективах AGI: Дарио отметил, что, если просто экстраполировать текущие тренды (что не совсем научно), можно предположить появление AGI к 2026–2027 годам. Однако это остается неопределенным, так как никто не знает, насколько далеко смогут масштабироваться модели.
➡️ О будущем ИИ: Амодеи выражает оптимизм, полагая, что ИИ уровня человека может быть достигнут в ближайшее время. Он прогнозирует, что в ближайшие годы бюджеты на разработку и обучение ИИ продолжат расти. К 2027 году возможны кластеры стоимостью $100 млрд, по сравнению с текущими крупнейшими суперкомпьютерами, оценивающимися в $1 млрд.
➡️ О масштабировании моделей: По словам Дарио, процесс масштабирования продолжается и остается во многом необъяснимым с теоретической точки зрения. Возможно, подходы к масштабированию изменятся, но "оно найдет свой путь".
➡️ О пределах интеллекта: Человеческий интеллект – не предел. Модели могут стать значительно умнее нас, особенно в таких сферах, как биология.
➡️ Об улучшении моделей: Текущий прогресс в кодинге, физике и математике невероятно ускоряется. Например, на SWE-bench точность LLM в начале года составляла 2–3%, а сейчас достигает 50%.
➡️ О рисках монополии: Наибольшую тревогу вызывает концентрация контроля над ИИ в руках нескольких крупных корпораций. Это может иметь серьезные последствия.
Интервью подчеркивает важные тенденции и вызовы в развитии ИИ, а также риски, связанные с его глобальной концентрацией.
Само интервью - https://www.youtube.com/watch?v=ugvHCXCOmm4
В интервью также участвовали другие специалисты, включая Криса Олаха, который посвятил час обсуждению механистической интерпретируемости. Вот основные моменты:
➡️ О перспективах AGI: Дарио отметил, что, если просто экстраполировать текущие тренды (что не совсем научно), можно предположить появление AGI к 2026–2027 годам. Однако это остается неопределенным, так как никто не знает, насколько далеко смогут масштабироваться модели.
➡️ О будущем ИИ: Амодеи выражает оптимизм, полагая, что ИИ уровня человека может быть достигнут в ближайшее время. Он прогнозирует, что в ближайшие годы бюджеты на разработку и обучение ИИ продолжат расти. К 2027 году возможны кластеры стоимостью $100 млрд, по сравнению с текущими крупнейшими суперкомпьютерами, оценивающимися в $1 млрд.
➡️ О масштабировании моделей: По словам Дарио, процесс масштабирования продолжается и остается во многом необъяснимым с теоретической точки зрения. Возможно, подходы к масштабированию изменятся, но "оно найдет свой путь".
➡️ О пределах интеллекта: Человеческий интеллект – не предел. Модели могут стать значительно умнее нас, особенно в таких сферах, как биология.
➡️ Об улучшении моделей: Текущий прогресс в кодинге, физике и математике невероятно ускоряется. Например, на SWE-bench точность LLM в начале года составляла 2–3%, а сейчас достигает 50%.
➡️ О рисках монополии: Наибольшую тревогу вызывает концентрация контроля над ИИ в руках нескольких крупных корпораций. Это может иметь серьезные последствия.
Интервью подчеркивает важные тенденции и вызовы в развитии ИИ, а также риски, связанные с его глобальной концентрацией.
Само интервью - https://www.youtube.com/watch?v=ugvHCXCOmm4
December 4, 2024
Написал статейку про Векторные БД, просто навалил базы
Планирую выпустить пару статей на тему около AI-Агентов
https://mlpops.ru/blog/vector-db/
Планирую выпустить пару статей на тему около AI-Агентов
https://mlpops.ru/blog/vector-db/
mlpops.ru
Векторные базы данных — это высокопроизводительные системы для хранения и поиска векторов, используемые для задач, таких как семантический поиск, рекомендации и обнаружение аномалий. Ознакомьтесь с ведущими решениями, такими как Pinecone, Weaviate, Milvus…
December 4, 2024
World Labs выкатили ИИ-платформу, которая превращает обычные 2D-картинки в полноценные 3D-миры. Просто загружаешь изображение, и готов — ходишь, исследуешь, будто в игре. Поддерживаются крутые эффекты камеры, а технология дорисовывает невидимые части сцены. Платформа генерирует реалистичную геометрию, дорисовывает невидимые части сцены и выглядит просто 🔥
Правда, без мощного железа, в браузере может фризить. Записаться в вейтлист можно здесь.
Подробности и потрогать
Правда, без мощного железа, в браузере может фризить. Записаться в вейтлист можно здесь.
Подробности и потрогать
December 4, 2024
Langflow — это для тех, кто хочет собрать своё AI-приложение быстро и без лишнего головняка. Минимум кода, максимум возможностей.
Работает на Python и, что самое крутое, не привязан к конкретным моделям, API или базам данных.
Хочешь интегрировать что угодно? Без проблем. Это универсальный инструмент для тех, кто хочет экспериментировать с RAG и мультиагентными системами без сложностей
GitHub
Работает на Python и, что самое крутое, не привязан к конкретным моделям, API или базам данных.
Хочешь интегрировать что угодно? Без проблем. Это универсальный инструмент для тех, кто хочет экспериментировать с RAG и мультиагентными системами без сложностей
GitHub
December 5, 2024
This media is not supported in your browser
VIEW IN TELEGRAM
Можно ли назвать DevOps/SRE гавночистом?
December 5, 2024
December 5, 2024