Неделя принесла одновременно практические инструменты для разработчиков, сдвиги в инвестиционной повестке и напоминания о проблемах безопасности и оценки. В подборке — новые модели и форматы поиска знаний, компактные он‑девайс решения, руководства по агентным системам, а также изменения в политике и рынке приложений, которые прямо влияют на то, что и как вы будете строить в ближайшие месяцы.
Amazon представила мультимодальный поиск для своих баз знаний, который позволяет объединять текст, изображения и другие представления при извлечении информации — важный шаг для приложений, где ответы должны опираться на смешанные типы данных и медиа (Amazon Bedrock: мультимодальный поиск).
Китайская Zhipu AI выпустила GLM‑4.7‑Flash — MoE‑модель с конфигурацией 30B‑A3B, оптимизированную для локального кодирования и запуска агентов. Такая архитектура обещает компромисс между мощью больших моделей и экономичностью для edge‑кейсов (GLM‑4.7‑Flash).
Для тех, кто проектирует мобильные и встраиваемые решения, Liquid AI представила LFM2.5‑1.2B‑Thinking — 1.2‑миллиардную модель рассуждения, которая помещается менее чем в 1 ГБ и ориентирована на on‑device вывод, что сокращает задержки и требования к приватности данных (LFM2.5‑1.2B‑Thinking).
Salesforce AI предлагает FOFPred — framework для предсказания оптического потока «в будущее», управляемый языковыми описаниями. Это полезно как для более точного контроля роботов, так и для генерации видеоматериала с прогнозированием движения (FOFPred).
Если вам нужны практические рецепты для агентных систем, новый код‑гайд по «анемои‑стилю» полу‑централизованных агентов с peer‑to‑peer критиками в LangGraph даёт пошаговое представление о том, как организовать взаимодействие и оценку между агентами в распределённой сети (Anemoi‑гайд для LangGraph).
Для аналитиков и инженеров AutoGluon остаётся полезным инструментом: статья объясняет, как его пайплайны AutoML с блендингом и дистилляцией превращаются в production‑grade табличные модели — пригодится при быстром выводе моделей в бизнес‑продукты (AutoGluon для табличных моделей).
На пересечении политики и образования OpenAI запустила инициативу «Education for Countries», направленную на сотрудничество с правительствами и учебными институциями для интеграции ИИ‑образования в национальные программы — важно следить за тем, как это изменит подбор кадров и требования к навыкам (OpenAI: Education for Countries).
В вопросах безопасности ChatGPT начал внедрять предсказание возраста пользователей, чтобы защитить несовершеннолетних — интересный пример, как модели используются для соблюдения политики платформ и минимизации рисков, но тут много нюансов с точностью и приватностью (ChatGPT: прогноз возраста).
Инвестиционный ландшафт тоже меняется: венчурный фонд Sequoia согласился инвестировать в Anthropic — редкий случай, когда большой VC бьёт табу и вкладывается в прямого конкурента, что может ускорить консолидацию капитала в инфраструктурных и модельных ставках (Sequoia инвестирует в Anthropic).
Рынок конечных пользователей показывает иные сигналы: потребители в 2025 году потратили больше на мобильные приложения, чем на игры, — тренд подогревают AI‑функции в приложениях, что даёт разработчикам стимул фокусироваться на полезных AI‑фичах, а не только на развлечениях (рост расходов на AI‑приложения).
Пара материалов про надёжность и оценку моделей: исследователи предупреждают о системной предвзятости в ИИ и предлагают подходы к её снижению, а специалисты из MIT напоминают, почему слишком агрегированные метрики мешают понять реальные слабые места моделей — полезно при разработке честных и измеримых ML‑решений (проблема предвзятости, о необходимости более тонкой метрики).
И отдельно в разделе инфраструктуры: Илон Маск анонсировал, что перезапущенный Dojo3 от Tesla будет ориентирован на «космический» вычислительный эффект — не столько про ракету, сколько про развёртывание специализированных суперкомпьютеров в удалённых и нестандартных средах, что может переопределить представление о месте центров вычислений (Dojo3 для космических вычислений).
Несколько практических сигналов для разработчика: переход к мультимодальному поиску и компактным on‑device моделям даёт шанс снизить задержки и требования к приватности; фреймворки для предсказания оптического потока и AutoML ускоряют вывод роботов и табличных решений в прод; а инвестиции и потребительский спрос подтверждают, что AI‑фичи становятся коммерчески центральными. Если вы строите продукт — подумайте, где выгоднее перенести часть интеллекта на устройство, а где — использовать облачные мультимодальные индексы и agent‑паттерны.
