OpenAI o1: Мыслит, как Эйнштейн, решает, как Перельман 🧠

Мир искусственного интеллекта всколыхнула новость: новейшая нейросеть OpenAI o1, едва появившись на свет, с легкостью прошла тест Mensa, набрав впечатляющие 120 баллов! 🤯 15 сентября 2024 года эта новость облетела все новостные ленты, заставив говорить о себе даже самых закоренелых скептиков.

https://openai.com/index/learning-to-reason-with-llms/

https://openai.com/index/introducing-openai-o1-preview/

Представьте себе: ещё "сырая", превью-версия o1 умудрилась обставить не только своих цифровых конкурентов, но и большинство людей! 🤯 Поговаривают, что один из сотрудников OpenAI, пораженный результатами, предложил повторить тест через месяц. А вдруг o1, как заправский школьник-вундеркинд, умудрится повысить свой IQ за столь короткий срок? 🤔

Кстати, название o1 выбрано не случайно. Разработчики OpenAI видят в этой модели не просто очередной апгрейд, а настоящий квантовый скачок в мире ИИ. Они буквально обнулили счетчик, намекая на начало новой эры.

В чем же секрет этого цифрового гения? 🧠 O1 мыслит нестандартно, выстраивая длинные, почти человеческие цепочки рассуждений, прежде чем выдать финальный ответ. Представьте себе Шерлока Холмса, который в уме перебирает десятки вариантов, прежде чем укажет на убийцу. Вот это и есть o1 в действии!

Но и это еще не все! OpenAI выпустила две версии своего детища: "превью" и "мини". Первая - это своего рода "лакшери" вариант, напичканный всеми возможными функциями. Вторая - более компактная и скоростная, идеально подходящая для решения узкоспециализированных задач.

Конечно, o1 еще только делает первые шаги. Разработчики признают, что у их детища есть слабые места. Например, "мини" версия пока не может похвастаться обширными знаниями о мире. Но кто знает, каких высот достигнет o1 через год, два, пять лет? 🚀 Ведь это только начало пути...

Помните новость про нейросеть o1, которая сдала тест Mensa? Так вот, держитесь крепче, это были только цветочки! 💐 Разработчики OpenAI не стали останавливаться на достигнутом и научили свое детище программировать... и не просто программировать, а делать это на уровне призеров международных олимпиад! 🥇

Представьте себе: модель, созданная на базе o1, приняла участие в Международной олимпиаде по информатике 2024 года. И не просто поучаствовала, а набрала 213 баллов, заняв место в 49-м процентиле среди лучших умов планеты! 🌎 Для чистоты эксперимента цифровому участнику предоставили ровно те же условия, что и людям: 10 часов на решение шести задач и лимит в 50 попыток на каждую.

Секрет успеха? 🤫 Умная стратегия! Модель генерировала множество вариантов решения, а затем отбирала 50 наиболее перспективных, основываясь на тестах и специальной системе оценки. Если бы попытки отправлялись наугад, результат был бы гораздо скромнее — всего 160 баллов. Чувствуете разницу? Почти 60 баллов — и все благодаря умению продумывать свои действия!

Но и это еще не предел! Когда разработчики сняли ограничения на количество попыток, модель показала просто фантастический результат — 362 балла! Это выше порога, необходимого для золотой медали! 🥇 И это без какой-либо дополнительной стратегии отбора!

А как насчет соревнований по программированию? 💻 И здесь o1 не ударила в грязь лицом! В симуляции турнира Codeforces она набрала рейтинг Elo 1807, обогнав 93% программистов-людей! Для сравнения, GPT-4o с результатом 808 баллов оказался лишь в 11-м процентиле.

Кажется, грядут интересные времена! 😉 Если уже сейчас нейросети способны на такое, то что же будет дальше? 🚀