Сегодня новости сводятся к трём крупным темам: компании предлагают инструменты для создания собственных моделей и снижения их требований к ресурсам, аппаратный стэк и сетевые решения стремятся вынести ИИ поближе к пользователю, а регуляция и верификация ботов выходят в поле зрения бизнеса и государства.
Mistral представила Forge — платформу для крупных клиентов, позволяющую «строить» передовые модели, привязывая их к корпоративным знаниям и минуя часть облачных ограничений; компания позиционирует это как шаг против доминирования облачных гигантов Mistral Forge и подробный разбор в отраслевых изданиях подробности VentureBeat.
Together.ai выпустила Mamba‑3 — SSM (State‑Space Model), заявленный как быстрый и оптимизированный для вывода, открытый с первого дня и ориентированный на замену трансформеров в задачах декодирования: это важный шаг для тех, кто следит за альтернативной архитектурой моделей Mamba‑3.
NVIDIA на GTC показала, как RTX‑ПК и DGX позволяют запускать последние открытые модели и агенты локально, что снова ставит в центр внимание идею оффлайн‑ИИ и приватности при высоких скоростях инференса NVIDIA — RTX и DGX. Одновременно NVIDIA заявляет о методах сокращения памяти LLM до 20× без изменения весов, что обещает перераспределить ограничения по оперативной памяти при инференсе и разворачиваемости 20× экономии памяти.
NVIDIA расширяет взаимодействие аппаратуры с VR: сейчас RTX‑ускоренные компьютеры напрямую подключаются к Apple Vision Pro через CloudXR, что открывает новые сценарии для локального ИИ и смешанной реальности на мощных десктопах CloudXR и Apple Vision Pro.
Unsloth AI выпустила Unsloth Studio — локальный без‑кодовый интерфейс для высокоэффективной до‑обучения больших моделей с экономией VRAM до 70%, полезный для тех, кто хочет кастомизировать модели без больших кластеров GPU Unsloth Studio.
Разворачиваемость и доверие выходят в плоскость политики: OpenAI расширяет присутствие в государственном секторе через соглашение с AWS, что усиливает вопрос о том, кто и на каких условиях получает доступ к продвинутым моделям OpenAI и AWS. Параллельно стартап World запустил инструмент для проверки, за кем действительно стоит персональный шопинг‑агент — ботом или человеком, это важный шаг для защиты потребителей в эпоху агентировщика инструмент World.
Аппаратно‑сетевые инициативы формируют «сетку ИИ»: NVIDIA и телеком‑игроки описывают концепцию AI Grid для распределённого инференса и оптимизации задержек, а кейсы вроде Snapchat демонстрируют, как открытые библиотеки ускоряют обработку данных для A/B‑тестирования в реальном масштабе Building the AI Grid, Telecom AI Grids, Snap — ускорённая обработка.
В прикладной медицине Google Research представил несколько материалов о внедрении машинного обучения: обзор инноваций в клинических настройках и работа по улучшению скрининга молочной железы показывают, как исследования переходят в реальные рабочие процессы и где пока остаются узкие места Google Research — The Check Up, улучшение скрининга молочной железы.
Наконец, на уровне пользователей и медиа заметно, как компании экспериментируют с монетизацией и интерфейсами: BuzzFeed запустил набор «AI‑приложений» в попытке найти новый доход, а обсуждение «Claude Code» у Гарри Тана снова подняло вопросы о том, какие инструменты для разработчиков допустимы и полезны сообществу BuzzFeed и AI‑приложения, спор вокруг Claude Code.

