Самообучающийся разум. Новая эра рассуждений
Исследователи представили OpenSIR, платформу самообучения с подкреплением, использующую самоигру и разнообразные награды для развития математического мышления больших языковых моделей. Модель OpenSIR демонстрирует способность к самостоятельному освоению математических задач без участия человека, открывая путь к развитию искусственного интеллекта, способного к непрерывному обучению.
Исследователи представили OpenSIR, систему, использующую самообучение и разнообразные награды для решения математических задач и генерации новых, с верифицируемой обратной связью.
Современные подходы к обучению языковых моделей с подкреплением для рассуждений часто требуют размеченных данных для оценки результатов, что ограничивает потенциал достижения сверхчеловеческого уровня. В данной работе представлен OpenSIR: Open-Ended Self-Improving Reasoner – фреймворк самообучения, в котором модель самостоятельно генерирует и решает новые математические задачи, попеременно выполняя роли учителя и ученика без внешнего контроля. Эксперименты показали, что OpenSIR значительно улучшает навыки решения задач у моделей Llama-3.2-3B-Instruct и Gemma-2-2B-Instruct на наборах данных GSM8K и College Math, благодаря оптимизации сложности и разнообразия генерируемых задач. Способен ли такой подход к самообучению привести к созданию действительно автономных систем искусственного интеллекта, способных к неограниченному обучению и открытиям?
Иллюзия Рассуждений: Ограничения Больших Языковых Моделей
Современные большие языковые модели (LLM) демонстрируют впечатляющую производительность, однако часто испытывают трудности при решении сложных, многошаговых задач рассуждения, ограничивая их надежность в критических приложениях. Традиционные подходы к обучению с подкреплением требуют обширной ручной аннотации, создавая узкое место при масштабировании. Это требует значительных затрат и затрудняет адаптацию моделей к новым задачам.
Включение вознаграждения за разнообразие приводит к генерации задач с низкой текстовой схожестью и минимальным перекрытием концепций, что свидетельствует об эффективном исследовании различных типов задач.
Ограничения существующих методов стимулируют поиск альтернативных стратегий для повышения способности LLM к комплексному рассуждению без чрезмерной зависимости от ручной аннотации. Необходимо создание систем, способных к самообучению и адаптации в условиях неопределенности. Стабильность – это всего лишь иллюзия, которая хорошо кэшируется.
OpenSIR: Эволюция Учителя и Ученика
В рамках исследований в области искусственного интеллекта представлена система OpenSIR – новая парадигма самообучения, позволяющая большим языковым моделям (LLM) итеративно генерировать и решать математические задачи без внешнего контроля. Ключевым элементом OpenSIR является динамика “Учитель-Ученик”, где одна модель генерирует задачи, а другая – решает. Постоянное взаимодействие и взаимное обучение способствуют непрерывному улучшению обеих моделей.
Использование принципа самообучения направлено на повышение способности моделей к логическому мышлению и решению сложных задач. Цикл генерации задач и их решения обеспечивает постоянную тренировку и совершенствование навыков, позволяя моделям развивать более глубокое понимание математических концепций.
Управление Разнообразием и Сложностью в OpenSIR
В системе OpenSIR для оценки качества задач и корректности решений используется функция оценки, направляющая процесс обучения и позволяющая модели совершенствовать свои навыки. Для стимулирования исследования разнообразных математических концепций применяется награда за разнообразие, поощряющая генерацию новых типов задач и расширяющую область знаний системы.
Расстояние между задачами (Embedding Distance) используется для измерения семантической близости. Это обеспечивает исследование широкого спектра концепций и предотвращает зацикливание на узком наборе тем. Кроме того, система динамически регулирует сложность задач посредством калибровки сложности, поддерживая оптимальный уровень вызова для модели.
OpenSIR: Валидация на Стандартных Наборах Данных
Система OpenSIR демонстрирует существенные улучшения в производительности на сложных наборах данных для математического рассуждения, таких как GSM8K и MATH. Эффективность подхода к самообучению подтверждена оценками с использованием моделей Llama-3.2-3B-Instruct и Gemma-2-2B-Instruct.
Применение OpenSIR наблюдает повышение показателя успешности решения задач для сложных проблем. Модель Llama-3.2-3B-Instruct улучшила свою точность на GSM8K на 4.4 процентных пункта (до 78.3%), а на College Math — на 5.6 процентных пункта (до 34.4%). Система способствует увеличению охвата концепций. Модель Gemma-2-2B-Instruct продемонстрировала улучшение точности на GSM8K на 20.2 процентных пункта (до 58.7%), а на College Math — на 4.3 процентных пункта (до 23.4%). Система не просто решает задачи, она взращивает понимание.
Расширяя Горизонты Автономного Рассуждения
Дальнейшие исследования будут сосредоточены на масштабировании OpenSIR для ещё более крупных моделей и сложных предметных областей. Особое внимание уделяется оптимизации вычислительных ресурсов и разработке алгоритмов, способных эффективно работать с данными высокой размерности. Изучение различных структур вознаграждения и стратегий обучения по учебным программам может дополнительно оптимизировать процесс обучения.
Рассматривается возможность использования методов обучения с подкреплением и активного обучения для повышения эффективности и скорости сходимости модели. Применение OpenSIR в таких областях, как научные открытия и генерация кода, обещает открыть новые уровни автоматизации и инноваций. Способность фреймворка генерировать разнообразные и сложные задачи также имеет потенциал для создания более надёжных и устойчивых систем искусственного интеллекта.
Представленная работа демонстрирует стремление к созданию систем, способных к самостоятельному развитию, что неминуемо ведёт к усложнению архитектуры. OpenSIR, стремясь к генерации и решению новых задач, подобна организму, растущему и развивающемуся без внешнего контроля. Эта тенденция к самообучению, несомненно, порождает необходимость в постоянной адаптации и пересмотре первоначальных принципов. Как однажды заметила Ада Лавлейс: «Самое главное – это предвидеть последствия». В контексте OpenSIR это означает, что при проектировании системы самообучения необходимо учитывать не только текущие возможности, но и потенциальные направления её развития, чтобы избежать непредсказуемых ошибок и обеспечить устойчивость к будущим изменениям. Развитие подобных систем не является построением, а скорее взращиванием, где каждый архитектурный выбор — это пророчество о будущем сбое.
Что дальше?
Представленная работа, стремясь к автономному обучению математическому рассуждению, неизбежно сталкивается с фундаментальным вопросом: что есть «прогресс» в системе, лишенной внешнего наблюдателя? OpenSIR демонстрирует способность генерировать и решать задачи, но само определение «интересной» или «сложной» задачи остается заложенным в архитектуре вознаграждения. Система, которая идеально оптимизирует заранее заданные метрики, рискует зациклиться на локальных оптимумах, игнорируя потенциальные пути развития, которые не вписываются в узкие рамки критериев оценки.
Следующим шагом представляется не столько увеличение масштаба модели или усложнение алгоритмов, сколько исследование механизмов внутренней диверсификации. Система, которая никогда не ошибается, мертва. Настоящая самообучающаяся система должна не избегать ошибок, а активно их искать, рассматривая сбои не как дефекты, а как акты очищения, обнажающие скрытые предположения и ограничения.
В конечном счете, перспектива открытого, самообучающегося разума заключается не в создании идеального решателя задач, но в формировании сложной, непредсказуемой экосистемы, где обучение — это не оптимизация, а непрерывный процесс адаптации и трансформации. И в этом процессе, как и в любом другом, нет места совершенству – только постоянное движение к новым, неизбежно несовершенным, состояниям.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Выставка 'Голос космоса. НЛО и паранормальные явления'

Гибриды инопланетян и людей живут на Земле

Загадочная полоса света над британским городом

Загадочные мегаструктуры под пирамидами в Гизе

Звезда, которая указывала путь мудрецам

Инопланетная комета содержит ключи к жизни

Инопланетяне живут среди людей

Информатор посоветовал Трампу назначить царя по НЛО

Конструкция моста Леонардо да Винчи работает

Марс мог быть тропическим оазисом

Наконец-то нашли Вифлеемскую звезду

Президент США полностью проинформирован об НЛО

Роботы уничтожат человечество в течение 100 лет

Семиногого осьминога выбросило на берег Шотландии

Сенатор попросил Трампа о встрече по НЛО

Скоро произойдет раскрытие информации об НЛО

Странная комета являются ключом к жизни на Земле

Странный дирижабль в 1897 году над Миссури

Трамп знает об инопланетянах

Я был похищен инопланетянами с тремя щупальцами

Как рассчитать расход пропанового баллона в быту

Проверка моих микрозаймов по фамилии

Архив исследований НЛО выставлен на аукцион

Загадочная библейская карта 1525 года

История похищения Барни и Бетти Хилл

Марс мог быть тропическим оазисом

Межзвездная комета может нести инопланетную жизнь

Последние данные о высадке инопланетян на Землю

Правительство США владеет инопланетными технологиями

Разоблачителям НЛО нужна амнистия

Самые странные случаи НЛО произошли в Бразилии

Свидетельства тропических осадков на Марсе

Скептики опровергли воскресение Иисуса

Скрытые мегаструктуры под египетскими пирамидами в Гизе

Таинственный пожар вспыхнул в Розуэлле

Тайна голубых диких собак Чернобыля

Треугольный НЛО сняли в Мексике

Физический варп-двигатель возможен

Что заставляет людей верить в невероятное

Что послужит толчком ко Второму пришествию

Экстрасенс предсказал дату конца человечества

Эпоха раскрытия пользуется большим успехом

Ажиотаж вокруг возможного обнародования досье об НЛО

Жевательная резинка обнаружена на астероиде Бенну

Знаменитый призрак из Уэзерспуна

Инопланетный корабль имеет два двигателя

Левитирующие датчики проложат путь к темной материи

Манхэттенский проект по созданию антивещества

Массивная галактика грандиозной формы

Моделирование венерианских вулканических выбросов

Перед полетами на Марс нам нужна лучшая защита

Плоская земля, духи и теории заговора

Разгадка тайны космической пыли

Религии, связанные с НЛО, и поиски смысла жизни

Скрытые звезды влияют на поиск техносигнатур

Спустя 50 лет после встречи с НЛО Нимиц отправляется на свалку

Сфера Буга вызывает разногласия у экспертов

Тайна затмения, которому 2700 лет

Трамп намерен рассекретить файлы об НЛО

Что происходит с кремами и лекарствами в космосе

Что связывает квантовую физику и гравитацию

Экзолуна вращается вокруг газового гиганта HD 206893 B

Квесты на детский день рождения в Ростове-на-Дону. 'Прятки в темноте' и другие идеи

Отделка фасада дома из панелей ЖБИ

Академическим кругам пора заняться изучением НЛО

Вирусные кадры с НЛО вызвали ожесточенные споры

Вода на планетах у переменных звезд

Воды у Калифорнии осветил подводный НЛО

Гели могут объяснить происхождение жизни на Земле

ИИ-модели готовы признаться в своих грешках

Конспиролог пропал при загадочных обстоятельствах

Крупные речные дренажные системы Марса

Насколько быстро расширяется Вселенная

НЛО заметили над Майами-Бич

НЛО поднялся из моря в Саффолке

Обнаружил ли телескоп экзолуну

Подводные НЛО - новая область интереса законодателей

Призрак, бродящий по коллайдеру ЦЕРНА

Путешествия во времени без парадоксов возможны

Сколько сейчас времени на Марсе

Страшные предсказания Бабы Ванги на 2026 год

Тайны сооружения возле Даррингтон Уоллс-хенджа

Утечка гелия на экзопланете WASP-107b

Ученые составляют карту ореолов темной материи

Все, что вам нужно знать о звездолете пришельцев

Женщина заметила таинственные огни в небе

Живой Нострадамус Атос Саломе предупреждает

Житель Келоуны заметил в небе НЛО

Загадочные подводные НЛО

Загадочный пожар вспыхнул в Розуэлле

Звездолет инопланетян намного быстрее наших

Знаменитый рестлер оказался втянутым в загадку НЛО

Инопланетяне могут быть ангелами или демонами

Исследования о существовании внеземной разумной жизни

Конфликт на экстрасенсорном фронте

Космическая жвачка необходимая для жизни

Межпространственные порталы в другие сферы бытия

Мы верим в разумную жизнь, но все еще одиноки

Найдите доказательство того, что Земля плоская

Найдите край Земли и станьте миллионером

Облака, похожие на НЛО, над горой Шаста

Синий человечек из Стадхема

Таинственное пламя вспыхнуло в Розуэлле

Только что открыли новый закон физики

Бизнесмен финансирует уфо-программу в Олбани

Ванга предсказала, что 2025 год изменит мир

Влияние Марса на климат Земли

Выяснили, почему мы обрели Сознание

Госсекретарь США поддерживает высказывания об НЛО

Земная жизнь стала сложной на миллиард лет раньше

Инопланетный космический корабль мчится к Земле

Космический корабль инопланетян вызывает панику

НЛО заметили в западном округе Миссури

Обнаружили осевое вращение нитей космической паутины

Объяснение нейтринных аномалий не подтвердили

Приближается разоблачение НЛО или это паника

Псы Чернобыля переживают стремительную эволюцию

Путешествие по британской истории НЛО

Россияне уверены в существовании тайных обществ

Странные вспышки над местами ядерных испытаний

Странные огни, похищения и близкие встречи

Таинственные объекты в небе Калифорнии

Тайна черных дыр раскрыта

Утес-НЛО в Балтийском море. Данные сканирования

А может все звезды на самом деле НЛО

Бабушка-зомби вылезла из гроба и начала готовить

Все ИИ-гиганты провалили проверку на безопасность

Высказывания Рубио о программах НЛО взрывоопасны

Гонка за НЛО, что реально, а что - обман

Женщина увидела Бога после аварии на мотоцикле

Загадка подводного Стоунхенджа

Знаменитый экстрасенс поделился предсказаниями

Зонд-перехватчик предложили отправить на охоту

Любопытная история с НЛО в Кексбурге

Миф о вампирах получил научное подтверждение

НАСА обнаружило таинственную космическую жвачку

НЛО могут быть идентифицированы на фото 1950-х годов

Подразделение Пентагона по изучению НЛО

Помешанный на инопланетянах Тампико

Создан инструмент для определения будущих катастроф

США обнаружили настоящую инопланетную технологию

Учёные взломали ИИ бессмыслицей

Часы на Марсе будут идти на 477 мс быстрее

Человекоподобного робота заметили на границе Индии

Астероид дает сведения о происхождении жизни

Бактерии помогут построить дома на Марсе

Биовиды в зоне Чернобыльской катастрофы мутируют

Исследование квантовой природы черных дыр

Квантовый прорыв открыл путь к телепортации

Криовулканы обнаружили на межзвездной комете

Межзвездный обьект полон вулканов

Мужчина заметил призрака на праздничных снимках

НЛО идентифицированы на изображениях 1950-х годов

Послание WOW могло исходить от межзвездного объекта

Похожи ли супер-юпитеры на Юпитер

Самые убедительные признаки внеземной жизни

Свидетельства дождливого климата на Марсе обнаружены

Свидетельства существования первичных черных дыр

Слепому человеку впервые вернули зрение

Совершил ли гражданин СССР экскурсию по НЛО

Тайна происхождения Пойнт Поверти

Теории заговора становятся мейнстримом в ЕС

Трамп должен развеять противоречивые сообщения о НЛО

Чат-бот рассказал секреты атомной бомбы

Археологи нашли утерянную Книгу мертвых

Взаимодействие темной материи и темной энергии

Восьмой континент Земли больше не потерян

Вспышки молний зафиксировали на Марсе

Звезды бросают вызов черной дыре

Идея замены актеров на ИИ ужасает

ИИ и робототехника сделают работу необязательной

Как были изготовлены и перемещены моаи

Как ИИ представляет людей

Когда научная фантастика становится реальностью

Мужские черепа у ворот Шимао переписывают историю

О чем говорит нам семь десятилетий охоты на инопланетян

Образцы метеоритов - капсулы времени

Обсуждение загадки НЛО 70-летней давности

Ореол красного света над маленьким итальянским городком

Почему для жизни недостаточно находиться в нужном месте

Проклятые и зловещие дома с привидениями

Разгадка секретов квантовой гравитации

Разрушительный звездный шторм на красном карлике

Старейшая россиянка умерла на 115-м году жизни

Все, что вам нужно знать о Джеке Потрошителе

Все, что вам нужно знать о звездолете 3I/ATLAS

Наверх
Яндекс.Метрика