MLPops
785 subscribers
424 photos
120 videos
5 files
180 links
We are ML&MLOps community based in 🇷🇺Russia

Наш чат - t.me/+qJm7Ak4nU4EwZmJi
Download Telegram
SmolVLM

Hugging Face объявила о выпуске SmolVLM, компактной VLM с 2B параметров, разработанной для выполнения локального инференса. SmolVLM превосходит все модели с аналогичным использованием GPU RAM и скоростью обработки токенов.

- SmolVLM генерирует токены в 7,5–16 раз быстрее, чем Qwen2-VL.
- В то время как другие модели такого размера не всегда можно запустить, SmolVLM стабильно генерирует 17 токен/сек на MacBook M1.
- Модель SmolVLM можно дообучить в Google Colab или использовать для обработки документов обычные GPU (не серверные).
- Кроме того, SmolVLM превосходит более крупные модели в видеотестах, несмотря на то, что она не была обучена на видео.


Демо
HuggingFace
Хайп по LLM спадает

Если наложить график создания LLM то придем прямо к Gartner Hype Cycle. Этот тренд виден как по анонсам от крупных компаний, так и в OpenSource (HuggingFace)

Мы прошли этап Завышиных ожиданий (Peak of Inflated Expectations), и прямо сейчас находимся/скримимся к спаду разочарований (Trough of Disillusionment)

Думаю к концу следующего года придем к плато продуктивности.
screenshot-to-code

Тулза для преобразования скринов, макетов и дизайнов в функциональный кодес.

Работает средне, но пока что это лучшее что есть в этой теме.

GitHub
Когда там че то интересное сделают
Через полгода сдача дипломов, поэтому держите напоминалку по структуре диплома/статьи.
Они умнеют милорд.

Тянки на патриках стали искать конретно эмельщиков и датасатанистов для отношений.

Ну че 4 года зубрешки матана скоро окупятся?
На выходных наконец нашел время и глянул подкаст Андрея Карпаты (сооснователя OpenAI, ex Head of AI Tesla)

И вот основные пункты из подкаста:

🔘 О беспилотных автомобилях:
"10 лет назад я впервые прокатился на беспилотной машине и был уверен, что это идеальный опыт. Однако потребовалось еще десятилетие, чтобы превратить эту технологию в коммерческий продукт. Сегодня мы достигли определенного уровня AGI в сфере автопилотов, но для глобализации этой технологии потребуется еще много времени. Аналогичная ситуация ожидает и LLM."

🔘 О Tesla:
Tesla значительно превосходит другие компании, работающие над автопилотами, даже если это сейчас не так очевидно. "Я верю в Tesla: она выбрала правильный путь, сосредоточившись на ИИ. Это не просто компания по созданию автомобилей с автопилотом, а крупнейшая робототехническая корпорация с огромным потенциалом. Ее подход обеспечит лидерство на рынке в ближайшие годы."

🔘 О трансформерах:
Трансформер — это не просто еще один алгоритм, а революционная архитектура, которая изменила наше понимание ИИ. Сегодня это единственная масштабируемая модель. "Я убежден, что трансформеры превосходят человеческий мозг во многих аспектах, просто они еще не раскрыли свой полный потенциал."

🔘 О фокусе на данных:
Если раньше основным препятствием для развития ИИ была архитектура ML моделей, то сейчас об этом почти не думают: за последние 5 лет трансформер практически не изменился. Главный акцент теперь смещен на данные.

🔘 О данных для обучения:
Данные из интернета далеко не идеальны для обучения моделей — это лишь "ближайший сосед" оптимальных данных. Для того чтобы модель умела рассуждать, ей нужны качественно другие источники знаний.

🔘 О синтетических данных:
Будущее за синтетическими данными, но их главным недостатком остаются недостаточная энтропия и разнообразие. Это серьезное препятствие, хотя текущие модели уже помогают создавать более совершенные. Итоговые модели, возможно, окажутся удивительно компактными.

🔘 О мотивации в образовании:
Андрей ушел в сферу образования, потому что стремится не заменить людей, а сделать их умнее и вдохновленнее. "Я хочу, чтобы люди поддерживали автоматизацию и мечтаю увидеть, на что способно человечество с помощью идеального ИИ-репетитора."

🔘 Об ИИ в обучении:
ИИ пока не способен самостоятельно создавать учебные курсы, но отлично справляется с их адаптацией под нужды каждого студента. "Образование должно стать для людей увлекательным процессом, а не тяжелым трудом."
AWS выкатили новый фреймворк Multi-Agent Orchestrator.

Это штука для оркестрации мультиагентных систем. Короче, как работает так: сначала анализирует твое сообщение, а потом подсовывает подходящего агента.

И это после того, как OpenAI уже сделали Swarm, Microsoft накатили AutoGen а LangSmith сделал LangGraph.
Короче, битва AI продолжается...

Ох как же хочется ворваться туда с двху ног

GitHub

https://www.youtube.com/watch?v=nCaBugZOQuc
This media is not supported in your browser
VIEW IN TELEGRAM
Если приду с таким же обоснование к финансам, то через сколько минут меня пошлют нахуй?
This media is not supported in your browser
VIEW IN TELEGRAM
Нобелевский лауреат Джеффри Хинтон говорит, что open source llm — это все равно, что позволить людям покупать ядерное оружие в МВидео.

Хотя бы примеры привел, почему это плохо