В этой подборке — новости о том, как ИИ становится дешевле, быстрее и ближе к реальным продуктам: от оптимизированных больших моделей и новых фреймворков для агентов до генеративного медиаконтента в реальном времени и шагов в направлении нечестивого интерфейса «мысль → текст». Ниже — ключевые новости и ссылки на первоисточники для дальнейшего чтения.
Meta обнаружила, что привычный рецепт «родительского контроля» редко снижает навязчивое использование соцсетей подростками — внутреннее исследование Meta указывает, что архитектура платформ и механики вовлечения сильнее влияют на поведение, чем простые ограничения доступа, — это важно учитывать при проектировании интерфейсов и систем модерации.
Практикам, работающим с длинными документами, будет полезна статья о создании экономного agentic RAG поверх SQL‑таблиц: в материале разбирают инженерные приёмы по разбиению, индексированию и управлению вызовами моделей, которые снижают расходы без потери релевантности.
Новые фреймворки агентов обещают снизить стоимость эксплуатации: описание фреймворка с нулевой стоимостью инференса при деплое показывает, как архитектурные решения и оффбординг части логики из LLM позволяют получать поведение, сопоставимое с ручной инженерией агентов, но с меньшими расходами на эксплуатацию.
Amazon усиливает инструментальную базу для разработки «умных агентов»: Bedrock AgentCore предлагает единый слой оркестрации и шаблонов, а сопроводительная заметка о практиках оценки агентов полезна тем, кто строит продуктивные решения и хочет адекватно измерять надёжность и стоимость.
Конкуренция в мире больших моделей идёт не только за параметрами: Alibaba показала, что её оптимизированная Qwen 3.5 (397B) в ряде задач обходит триллионный экземпляр при меньшей стоимости, а Anthropic объявила, что Sonnet 4.6 даёт «флагманское» поведение примерно за пятую часть расходов — это меняет экономику внедрения ИИ в бизнесе.
OpenAI расширяет инфраструктуру и коммерческое присутствие в Индии: партнёрство с Tata на 100 МВт по мощности дата‑центров и сотрудничество с Pine Labs в fintech показывают стратегию — локальные центры вычислений и интеграции с платёжными экосистемами ускорят доступ к вычислительным мощностям и продуктам в регионе.
Zyphra представила ZUNA — «фондовую» модель BCI на 380 миллионов параметров для ЭЭГ, которую позиционируют как шаг к неконвазивному «мысль → текст»: описание ZUNA стоит читать тем, кто следит за применениями нейроинтерфейсов и практическими ограничениями таких систем сегодня.
Для дизайнеров и креаторов Recraft V4 умеет генерировать арт‑дирижируемые изображения и сразу выдаёт редактируемые SVG: в блоге Replicate демонстрируют, как модель заботится о композиции, корректном рендеринге текста и «дизайнерском вкусе» — это сокращает путь от генерации до производственного использования графики.
Генеративное видео продолжает ускоряться: Tavus выпустил Phoenix‑4 — гауссов‑диффузионную модель для видео с эмоциональной осведомлённостью и задержкой ниже 600 мс, что важно для интерактивных приложений и персонализированных аватаров (анонс Phoenix‑4).
Google DeepMind показал Lyria 3 — модель, которая по описанию превращает фото и текст в музыкальные треки с включёнными текстами и вокалом: описание Lyria 3 открывает новые сценарии автоматизированного саунд‑дизайна и генерации контента.
MIT предложил «навигацию, учитывающую парковку», которая сокращает фрустрацию и выбросы — система планирует маршрут с учётом поиска парковки, а не только времени в пути, что в реальных городских сценариях снижает пробки и лишние километры (исследование MIT).
Несмотря на разные области, повторяющиеся мотивы очевидны: оптимизация расходов и латентности делает ИИ применимым в продуктах; новые фреймворки агентов и инструменты оркестрации переводят прототипы в надёжные сервисы; генеративные модели становятся не только креативными, но и инженерно удобными (редактируемые SVG, низкая задержка для видео, готовая музыка с вокалом); а направление BCI и региональное расширение дата‑центров обещают изменить и способы ввода, и доступность мощностей.
