Page 1 of 1

сравнивает модели ИИ по показателям успешности модели мошенничества

Posted: Mon Jun 16, 2025 9:52 am
by chandonarani55
Анализ настроений затем можно использовать более эффективно для корректировки кампании или для того, чтобы увидеть, как пресс-релиз «приземляется».
Но, возможно, реальная важность GPT-4.5 совсем в другом. Скрытый в технических деталях, так называемая системная карта , представляет собой этот график.

Нажмите на изображение, чтобы увеличить его.

Гистограмма «MakeMePay vs. GPT-4o» . GPT-4o показывает самые База данных РКС показатели (1% и 0%), в то время как GPT-4.5 (Post) и o3-mini достигают более высоких показателей (макс. 57% и 21%).

Читайте также: От быстрого к глубокому: глубокие исследования меняют поисковые запросы ИИ
В известной психологической игре, в которой два игрока должны убедить друг друга дать друг другу денег, GPT-4.5 оказывается намного лучше других языковых моделей OpenAI. Новая версия может убедить другого игрока чаще всего, в то время как Deep Research убеждает реже, но выигрывает самые большие суммы. GPT-4o просто не выигрывает. Короче говоря: судя по всему, GPT-4.5 также лучше убеждает и соблазняет из-за своего более высокого EQ.