Meta* FAIR: Обновления и достижения в области ИИ

https://ai.meta.com/blog/fair-news-segment-anything-2-1-meta-spirit-lm-layer-skip-salsa-lingua/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=fair 18 октября 2024 года

Meta* продолжает делиться своими последними исследованиями и разработками в области ИИ, выпуская новые модели, инструменты и наборы данных. В этот раз команда Meta FAIR (Fundamental AI Research) представила ряд новинок, которые направлены на достижение передового машинного интеллекта (AMI), поддерживая при этом открытую науку и воспроизводимость исследований.

Meta убеждены: доступ к передовым ИИ-технологиям открывает возможности для всех. Именно поэтому мы стремимся к постоянному развитию открытой экосистемы ИИ.

Команда Meta’s Fundamental AI Research (FAIR) сосредоточена на создании передового машинного интеллекта (AMI) и его использовании для разработки продуктов и инноваций, которые приносят пользу каждому. Уже более десяти лет мы делимся передовыми исследованиями и сотрудничаем с мировым сообществом ИИ. Наша миссия по достижению AMI — это продолжение нашей приверженности инновациям ради общего блага. Как отметил Марк Цукерберг в недавнем открытом письме, открытый ИИ «имеет больший потенциал, чем любая другая современная технология, для повышения человеческой продуктивности, креативности и качества жизни», а также для ускорения экономического роста и продвижения революционных медицинских и научных исследований.

Meta делится результатами последних исследований и моделей, которые поддерживают цель — достичь AMI, при этом поддерживая открытую науку и воспроизводимость. Эти разработки охватывают ключевые компоненты AMI: восприятие, речь и язык, мышление, воплощённость и согласованность.

Сегодняшний релиз включает различные работы от FAIR, такие как SAM 2.1, обновление нашей популярной модели Segment Anything Model 2, а также улучшение представлений предложений для больших языковых моделей (LLM) и многое другое. Каждая работа включает открытые исходные коды, которые сообщество может использовать для своих исследований и развития интересующих их направлений.

Публичное распространение наших ранних исследовательских работ — это способ вдохновить на новые итерации и в конечном итоге помочь ответственному развитию ИИ. Сохраняя подход к открытой науке и делясь нашими наработками с сообществом, мы остаёмся верны своей цели создания ИИ-систем, которые будут полезны каждому и помогут объединить мир. Мы с нетерпением ждём, что люди создадут с помощью этих новейших релизов, и готовы продолжать важные диалоги с сообществом открытого ИИ.

Рассмотрим ключевые моменты и достижения:

🔥 Meta Segment Anything Model 2.1 (SAM 2.1)
Буквально за пару месяцев после релиза SAM 2, модель была скачана более 700 000 раз, а веб-демо использовалось для сегментации сотен тысяч объектов в изображениях и видео. Теперь представлено обновление — SAM 2.1, которое улучшило производительность модели за счёт новых техник аугментации данных и доработки обработки окклюзий (когда объекты частично перекрываются). А ещё... разработчики выпустили SAM 2 Developer Suite — комплект инструментов с открытым исходным кодом для обучения модели и веб-демо. Теперь можно не только сегментировать, но и дорабатывать модель под свои нужды!

Скачать SAM 2.1 и Developer Suite

🎙 Meta Spirit LM: Мультимодальная модель для интеграции речи и текста

Тексты и речь часто идут рука об руку, но существующие модели не всегда могут передать всю глубину интонаций и эмоций. Meta Spirit LM решает эту проблему, объединяя возможности текстовых и речевых моделей. Теперь можно генерировать речь, которая звучит более естественно и эмоционально. Две версии модели: Spirit LM Base и Spirit LM Expressive – работают с фонетическими токенами, а также с тональностью речи (вроде радости, удивления или гнева). Это шаг к более естественному взаимодействию между человеком и ИИ.

Подробнее о модели Spirit LM:

Read the paper

Download the code

Download model weights

⚡ Layer Skip: Оптимизация производительности больших языковых моделей

Большие языковые модели мощны, но требуют много ресурсов.

Layer Skip — это решение, которое ускоряет генерацию текста за счёт пропуска некоторых слоёв модели, сохраняя при этом точность. В результате — улучшение производительности моделей вроде Llama 3, Llama 2 и Code Llama до 1,7 раз быстрее. Это может стать серьёзным шагом к более энергоэффективным ИИ-решениям.

Узнать больше о Layer Skip:

Read the paper

Download the code

Download the weights

🛡 SALSA: Безопасность постквантовой криптографии
Безопасность данных — всегда в приоритете, особенно в эпоху квантовых вычислений. SALSA предлагает новый способ атаки на существующие криптографические стандарты с использованием ИИ. Эта технология может помочь исследователям оценивать и усиливать безопасность постквантовой криптографии, чтобы защитить данные в будущем.

О SALSA и криптографии:
Read the paper

Download the code

📚 Meta Lingua: Ускорение исследований через эффективное обучение моделей
Новая платформа Meta Lingua создана для того, чтобы упростить и ускорить процесс обучения языковых моделей. Она легка в установке, модульна и позволяет проводить эксперименты с минимумом технических трудностей. Это отличная новость для исследователей, которые хотят сосредоточиться на своих идеях, а не на сложных конфигурациях.

Скачать Meta Lingua

🧪 Meta Open Materials 2024: Открытые данные для открытия новых материалов Открытие новых материалов может занять десятилетия, но с помощью ИИ этот процесс можно ускорить. Meta Open Materials 2024 предлагает один из крупнейших наборов данных для изучения неорганических материалов — 100 миллионов примеров. Этот набор уже занял лидерские позиции в рейтинге Matbench-Discovery.

Загрузить набор данных Meta Open Materials:

Download the code base

Download the model

Read the paper

💬 MEXMA: Улучшенные представления предложений для кросс-языковых задач
MEXMA — новый способ представления предложений в многоязычных моделях. Эта модель использует как предложения, так и токены для обучения, что позволяет значительно улучшить качество представлений текста на разных языках. Она поддерживает 80 языков, что делает её невероятно универсальной.

Подробнее о MEXMA:

Download the code base

Download the model

Read the paper

🤖 Self-Taught Evaluator: Модель для генерации синтетических данных
Создание данных для обучения моделей может быть дорогостоящим и трудоёмким. Self-Taught Evaluator предлагает альтернативу — она генерирует синтетические данные для обучения моделей вознаграждений без человеческих аннотаций. Эта модель уже показала отличные результаты на RewardBench и используется в сообществе для обучения топовых моделей.

Узнать больше о Self-Taught Evaluator:

Download the model

Access the synthetic data

Get the code base

Read the paper

Meta продолжает открыто делиться своими достижениями в области ИИ, поддерживая открытое сообщество и воспроизводимость исследований. Новые релизы, такие как SAM 2.1, Meta Spirit LM, Layer Skip и другие, направлены на то, чтобы ускорить прогресс в различных областях ИИ, от обработки изображений до материаловедения. Этот подход не только помогает исследовательскому сообществу, но и делает ИИ более доступным для всех.

Компания Meta* (признана в РФ экстремистской организацией и запрещена) внесена в соответствующий реестр.