Forge Reasoning API Beta и Nous Chat: Эволюция в выводах LLM

https://hermes.nousresearch.com

Nous Research представляет два новых проекта: Forge Reasoning API Beta и Nous Chat - простую платформу для общения с языковой моделью Hermes. Forge Reasoning API включает наши достижения в исследованиях вывода ИИ, основываясь на опыте разработки оригинальной модели Hermes.

Nous Chat
Наша специализированная платформа для простого взаимодействия с мощной языковой моделью Hermes 3 70B! Мы разработали элегантный интерфейс, который делает сложные возможности ИИ доступными, сохраняя простоту использования.

Hermes 3 - это модель с открытым исходным кодом, созданная для улучшенного выражения мыслей, длительных рассуждений и индивидуальной настройки. На hermes.nousresearch.com система многопоточных бесед помогает организовать мысли и проекты, а системный промпт и настройки конфигурации дают полный контроль над взаимодействием с ИИ. Будь то проведение анализа, исследование будущих сценариев или поиск практических советов, Nous Chat предоставляет сфокусированную среду для максимально эффективного использования нашей популярной модели с открытым исходным кодом.

Nous Chat доступен по адресу https://hermes.nousresearch.com и в настоящее время БЕСПЛАТЕН.

Как Forge влияет на экосистему LLM?
Forge Reasoning API позволяет взять любую популярную модель и усилить ее интерпретатором кода и продвинутыми возможностями рассуждения. Наши оценки показывают, что Forge улучшает модель Hermes 70B до уровня конкурентоспособности с гораздо более крупными моделями от Google, OpenAI и Anthropic в тестах на рассуждение.

Hermes 70B с Forge превосходит более крупные модели в оценке AIME. Эта метрика фокусируется на математических вопросах олимпиадного уровня - соревнование AIME является одним из двух тестов, используемых для определения права участия в математической олимпиаде США, и использовалось как стандарт для подобных систем рассуждения в прошлом.

Forge Reasoning API (Beta)
Forge Reasoning API будет доступен в бета-версии для избранной группы пользователей начиная с этой недели.

"Forge" объединяет несколько исследовательских прорывов, включая наше семейство моделей Hermes, Mixture of Agents, Chain of Code, Monte Carlo Tree Search для создания комплексной системы улучшенных возможностей рассуждения.

Уровень модели: Свобода выбора
Понимая важность гибкости, мы разработали Forge для поддержки нескольких моделей, включая:
- Hermes 3
- Claude Sonnet 3.5
- Gemini
- GPT 4

Пользователи могут использовать одну модель для реализации Monte Carlo Tree Search или комбинировать несколько моделей для улучшения разнообразия выводов.

Уровень рассуждений: Три подхода

1. MCTS (Monte Carlo Tree Search)
Метод работает через четыре ключевые фазы:
- Выбор: Определение перспективных узлов
- Расширение: Добавление новых узлов решений
- Симуляция: Тестирование случайных последовательностей действий
- Обратное распространение: Обновление статистики узлов

2. CoC (Chain of Code)
Серия шагов рассуждения, связанная с интерпретатором кода. Особенно эффективна для решения реальных задач, где математика и код переплетаются с семантической структурой.

3. MoA (Mixture of Agents)
Позволяет нескольким моделям отвечать на запрос, совещаться друг с другом и синтезировать новые ответы для более полного и разнообразного результата.