Interstorm делится презентацией GPT-5 от OpenAI

ИНТЕРШТОРМ делится официальной презентацией GPT-5 от OpenAI

Interstorm представляет официальную презентацию GPT-5 от OpenAI — самого умного, быстрого и полезного ИИ на сегодняшний день. Эта модель устанавливает новые стандарты в кодировании, математике, письме, здравоохранении и мультимодальном восприятии, делая экспертный уровень интеллекта доступным каждому.

«Технологии – мощный рычаг, но рычаг бесполезен без руки, которая им управляет, и головы, которая знает, куда давить. Наша сила – в переводе сложных технологий на язык бизнес-результатов и человеческого понимания.»
— Чуприцкий Алексей, CPO INTERSTORM

Единая система GPT-5

GPT-5 — это унифицированная система, объединяющая эффективную модель для быстрых ответов, модель глубокого мышления (GPT-5 Thinking) для сложных задач и маршрутизатор реального времени, который определяет, какую модель использовать в зависимости от типа разговора, сложности и потребности в инструментах. Маршрутизатор обучается на реальных сигналах, включая переключение моделей пользователями и показатели точности, улучшаясь со временем.

94.6%
AIME 2025 (математика)
74.9%
SWE-bench (кодирование)
84.2%
MMMU (визуальное восприятие)
46.2%
HealthBench Hard (здравоохранение)

Кодирование с GPT-5

GPT-5 — самая мощная модель для кодирования, с улучшениями в создании сложных интерфейсов и отладке больших репозиториев. Она способна создавать красивые и отзывчивые веб-сайты, приложения и игры с учетом эстетики и функциональности за один запрос, обеспечивая интуитивное понимание дизайна.

Производительность GPT-5 в кодировании достигает 74.9% на SWE-bench и 88% на Aider Polyglot, что делает её лидером в разработке программного обеспечения.

Письмо и творчество

GPT-5 — лучший помощник в написании текстов, от отчетов до поэзии. Она сохраняет литературную глубину и ритм, делая тексты выразительными и естественными.

Пример: Поэзия (GPT-4o)

В шкафу с мисками — один,
сложен аккуратно, словно он ушёл ненадолго.
Ещё один за метлой в саду,
покрыт цветами сливы и сомнением.

Пример: Поэзия (GPT-5)

В банке с чаем — один носок,
пахнет камфорой и дождём.
Ещё один у стойки для гэта,
свёрнут, как спящий карп.

GPT-5 создаёт более яркие образы и сильные метафоры, усиливая эмоциональное воздействие.

Здравоохранение

GPT-5 лидирует в вопросах здравоохранения, предлагая точные и контекстно-зависимые ответы. Она помогает пользователям разбираться в медицинских данных и задавать правильные вопросы врачам, действуя как активный партнер по мышлению.

GPT-5 достигает 46.2% на HealthBench Hard, значительно превосходя другие модели в сложных медицинских сценариях.

Оценки производительности

GPT-5 устанавливает новые стандарты в математике, кодировании, визуальном восприятии и здравоохранении. Вот ключевые показатели:

AIME 2025 (Математика)

GPT-5 достигает 94.6% точности на AIME 2025, демонстрируя выдающиеся способности в решении сложных математических задач.

MMMU (Визуальное восприятие)

GPT-5 показывает 84.2% на MMMU, лидируя в визуальном решении задач университетского уровня.

GPQA (Научные вопросы PhD-уровня)

GPT-5 pro достигает 88.4% на GPQA, демонстрируя выдающиеся способности в научных вопросах уровня PhD.

VideoMMMU (Видео и мультимодальное мышление)

GPT-5 показывает 84.6% на VideoMMMU, лидируя в мультимодальном мышлении на основе видео.

Безопасность и надежность

GPT-5 снижает галлюцинации на ~45% по сравнению с GPT-4o и на ~80% по сравнению с OpenAI o3 при использовании веб-поиска. Новая парадигма безопасных завершений делает модель более надежной и полезной, обеспечивая прозрачность при отказе от выполнения задач.

Пример: Обработка отсутствующих данных

До: Модель могла ложно утверждать выполнение задачи, например, разблокировки Wi-Fi.
После: GPT-5 честно сообщает, что задача невозможна в текущей среде, и предлагает альтернативы.

GPT-5 снижает уровень галлюцинаций до 3.6% на HealthBench Hard, что значительно ниже, чем у других моделей.

Следование инструкциям и использование инструментов

GPT-5 демонстрирует значительные улучшения в выполнении многоэтапных запросов, координации инструментов и адаптации к изменениям контекста, что делает её идеальной для сложных задач.

GPT-5 достигает 99.0% на COLLIE, показывая выдающиеся результаты в следовании инструкциям в свободной форме.

Персонализация и снижение лести

GPT-5 менее склонна к излишней лести, сокращая сикрофантию с 14.5% до менее 6%. Она предлагает четыре новых предустановленных личности: Cynic, Robot, Listener и Nerd, позволяя настроить стиль общения.

Новые личности

  • Cynic: Саркастичный и прямолинейный стиль.
  • Robot: Точный и профессиональный.
  • Listener: Поддерживающий и внимательный.
  • Nerd: Глубокий и технический подход.

ИНТЕРШТОРМ: Ваш проводник в мир ИИ

Interstorm помогает руководителям и командам автоматизировать рутинные задачи, минимизировать ошибки и ускорить принятие решений с помощью ИИ. Наш практический интенсив позволит вам освоить нейросети и внедрить их в рабочие процессы за 2 недели.

Начните автоматизацию с ИИ сегодня

Подпишитесь на наш Telegram-канал Телеграм Чуприцких для получения кейсов и советов по внедрению ИИ или запишитесь на наш интенсив для руководителей.

Присоединиться к интенсиву