От Claude до Qwen 3.5: практические новости недели для тех, кто строит ИИ

На этой неделе новости сосредоточились на том, как ИИ переходит от экспериментов к реальным продуктам: миграция пользователей между крупными чат‑моделями, инструменты для безопасного и масштабируемого развёртывания агентов, компактные модели для устройств и примеры коммерческой интеграции. Ниже — подборка самых полезных и прагматичных заметок для разработчиков и продуктовых команд.

Пользователи активно переключаются с ChatGPT на Claude, и в статье разбирают практические шаги для миграции — от экспорта истории чатов до перенастройки интеграций. Это важно не только для конечных пользователей, но и для команд, которые планируют поддержку нескольких бэкендов и хотят понять, как сохранить качество и контекст при переносе данных.

Amazon показал готовый рецепт для «безсерверного» разговорного агента: инструкция с Claude, LangGraph и управляемым MLflow на Amazon SageMaker AI — практическая дорожная карта для тех, кто хочет быстро вывести в прод агентные интерфейсы без долгой инфраструктурной подготовки.

Параллельно AWS публикует рекомендации по безопасности для генеративных приложений: Bedrock Guardrails — набор практик и шаблонов для ограничения непредсказуемого поведения моделей и интеграции проверок в продуктовый поток.

Alibaba расширяет линейку для устройств: Qwen 3.5 Small — семейство моделей 0.8B–9B параметров, ориентированных на on‑device‑приложения, и одновременно OpenSandbox — единый безопасный API для исполнения автономных агентов. Для команд, которые думают об «интеллекте на устройстве» и автономных рабочих процессах, это важный сигнал: упрощённый путь к локальному исполнению и безопасным агентам.

Together AI обновила визуальную идентичность, но важнее — расширение продуктовой линейки: ребрендинг, безсерверный inference как API, выделённый вывод на собственном железе и библиотека открытых моделей. Это полезно для команд, которым нужен гибрид: быстрый запуск через API и возможность перейти на кастомный хостинг для производительности и контроля.

Малые, но впечатляющие вещи: NullClaw — фреймворк агентного ИИ на языке Zig размером 678 КБ, который запускается в пределах 1 МБ оперативной памяти и загружается за 2 миллисекунды. Это демонстрация того, как можно строить простые агентные решения для ограниченных устройств и встраиваемых систем.

В телеком‑секции NVIDIA анонсировала наборы «агентных» шаблонов и модели размышления для операторов связи: agentic AI blueprints и telco reasoning models. Для инженерных команд провайдера это моральный комплект: образцы архитектуры, которые переводят исследовательские идеи в рабочие кейсы сетевой автоматизации и оптимизации.

Google представила Gemini 3.1 Flash‑Lite — экономичный вариант с регулируемыми «уровнями мышления», рассчитанный на массовые production‑нагрузки. Это сигнал о тренде: модели, оптимизированные не только по качеству, но и по стоимости принятия решений в продакшене.

Политика и доверие не отстают: техработники призывают Минобороны и Конгресс отозвать ярлык «риска для цепочки поставок» в отношении Anthropic, а в другом материале разбирают отсутствие у индустрии ясной стратегии взаимодействия с государством: как компании должны (и не должны) работать с государственными органами. Для продуктовых и юридических команд это напоминание: наряду с технологиями надо готовить документацию, процесс аудита и модель сотрудничества с регуляторами.

Ближе к реальным пеймент‑кейсам: Santander и Mastercard провели первый в Европе пилот, где платежи исполнялись «ИИ‑мотором»: пилот AI‑исполнения платежей. Это пример, где автоматизация с низкой задержкой и высоким уровнем проверки решает коммерческую задачу, и полезно следить за тем, какие проверки и откаты используют банки.

Немного про продуктовую трансформацию: стартап 14.ai, основанный супружеской парой, заменяет команды поддержки в стартапах, демонстрируя готовность агентных рабочих процессов брать на себя рутинные сценарии и интегрироваться с продуктовой аналитикой.

Краткие наблюдения по совокупности новостей: компании продолжают уменьшать барьер входа для производства — это и компактные модели на устройствах, и безсерверные шаблоны для агентов. Безопасность и управляемость входят в обязательный набор (guardrails, audit‑trail, взаимодействие с регуляторами). Наконец, реальный бизнес уже тестирует ИИ в критичных сценариях — от платежей до поддержки клиентов — и вопрос не столько в «может ли ИИ», сколько в «как вовлечь процессы контроля, отката и ответственности».

От Claude до Qwen 3.5: практические новости недели для тех, кто строит ИИ

От нулевых потерь RAG до «суточных шепотов»: что сейчас важно инженеру ИИ

ИИ на границе: от Пентагона и инфраструктуры до 6G и новых инструментов для разработчиков

Что меняет индустрию ИИ прямо сейчас: от инфраструктуры до регулирования

Основные методы проверки фактов с помощью ИИ

Искусственный интеллект и медийная грамотность

Как оценить прозрачность онлайн издания?

Как оценить прозрачность газеты?

Технические требования Instagram: что нужно учесть перед запуском рекламы

Как писать идеальные промпты для Nano Banana Pro с помощью ChatGPT

Рекомендации OpenAI для правильного составления запросов для моделей рассуждения

Использование Google Sheets для подготовки данных к анализу и создания сводных таблиц

Провел эксперимент по вайбкодингу с 7 нейронками: 6 писали код, а последняя оценила их работу и предложила свой вариант

Как принимать решения осознанно и эффективно – обсуждаем в подкасте

Как медиа формируют наше восприятие миграции (подкаст на английском и русском)

В Душанбе прошел тренинг по объективному освещению миграции

Что должен знать и уметь специалист по инфографике?

Ресурсы для создания мультимедийного материала

Пример масштабируемой инфографики “Когнитивные искажения”

Аудитория Facebook в Таджикистане составляет только 6,8%

От Claude до Qwen 3.5: практические новости недели для тех, кто строит ИИ

Поделиться постом

Свежее

От нулевых потерь RAG до «суточных шепотов»: что сейчас важно инженеру ИИ

ИИ на границе: от Пентагона и инфраструктуры до 6G и новых инструментов для разработчиков

Что меняет индустрию ИИ прямо сейчас: от инфраструктуры до регулирования

От голосовых помощников до защищённого GPU: что важно знать про свежие шаги в области ИИ

Как проверять, ускорять и защищать ИИ: неделя про аудит, агентов и сверхскоростные чипы

TOP рубрик

ОСТАВЬТЕ ОТВЕТ Отменить ответ