Почему ИИ не победит в игре 'Что? Где? Когда?'
В ЮФУ придумали новый остроумный способ тестировать ИИ на способность работать в реальных ситуациях использования русского языка. Исследователи искусственного интеллекта из МИИ ИМ ЮФУ предлагают использовать интеллектуальные языковые игры, как пример — заставлять ИИ отвечать на вопросы из архива телевикторины «Что? Где? Когда?» и «Своей игры». Инициативу прокомментировал опытный игрок.
В наше время параллельно развиваются самые разные технологии искусственного интеллекта, но в широком употреблении под ИИ люди почти всегда подразумевают именно большие языковые модели (LLM – Large Language Model), такие как DeepSeek или ChatGPT, из-за шумихи вокруг них.
Ответственный исполнитель проекта «Фронтирная лаборатория рентгеноспектральной нанометрологии» Центра наукоемкого приборостроения ЮФУ Богдан Проценко и его коллеги, как и многие исследователи, на практике делают ставку не на языковые-модели гиганты, а на модели ИИ поменьше, обученные на заведомо более качественных данных, как в случае линейки моделей LLaMa3.
«Ее разработчики получили существенный прирост качества моделей, главным образом «почистив данные» для обучения предыдущих версий, без радикальных изменений в архитектуре нейросети. Между сложностью архитектуры ИИ и качеством данных для его обучения всякий ML-инженер и аналитик данных почти всегда выберет последнее, потому что в мире не бесконечное количество качественного контента, и лучше, если нейросеть может научиться на миллионе умных текстов, чтобы не пришлось ей скармливать миллиард глупых», — поделился Богдан Проценко.
Создатели ИИ часто исходят из позиции, что логическое мышление и способность рассуждать («ризонинг») нейросетей не страдает от того, на каком языке ИИ «подумает», главное, чтобы он умел грамотно формулировать ответ на языке пользователя. Доказать обратное нетрудно: можем спросить у большой языковой модели, например, на языке хинди, какие предметы и темы проходят десятиклассники по школьной программе. И он вам ответит на грамотном литературном хинди, но только расскажет так, как проходят в десятом классе в американских школах, а не в индийских.
«Русского, например, в данных для предтренировки всех зарубежных моделей ощутимо меньше английского, потому модель пишет и мыслит «умнее» и грамотнее, если ее спросить на английском и попросить на нем же ответить. Бенчмарки, «линейки», которыми измеряют качество моделей и их работы на разных языках – как правило, просто перевод с одного из языков, обычно английского, на другие. Такой расклад не отражает качества работы модели в реальной языковой ситуации», — объяснил Богдан Проценко.
Как же объективно оценить, какая модель ИИ действительно «умнее»? Для этого отлично подходят различного рода интеллектуальные игры: они являются весьма непростыми для LLM, и при этом за многие годы накоплен огромный и крайне качественный — отточенный поколениями игроков, а не сгенерированный ИИ — архив подобных вопросов, во многих из которых предостаточно и культурной, и тонкой языковой специфики языка.
«Мышление и языки близки. Как победы ИИ над человеком в шахматы и го были яркими ключевыми моментами развития ИИ в конце прошлого века, так «Что? Где? Когда?» и «Своя игра» — вызовы сегодняшнего дня. Способность успешно отвечать на вопросы, написанные умными телезрителями для еще более умных знатоков, появляется только в самых больших и умных LLM, причем моделям с большим количеством русского языка в предтренировочной выборке обычно проще», — подчеркнул Богдан Проценко.
В качестве примера ученые протестировали старшую модель из семейства LLaMa-3, демонстрирующую хорошее владение русским языком, но даже она ошиблась в вопросах, требующих знания специфических для русскоязычной культуры фактов. Например, вопросы о композиторе Владимире Шаинском, о Царь-пушке в Кремле, о спортивных объектах, построенных вокруг Москвы к Олимпиаде-80, тривиальные для русскоязычных людей, для LLM на 405 миллиардов параметров, владеющей десятками естественных языков и языков программирования, разбирающейся в куче вопросов, от квантовой механики до медицины, оказываются не под силу.
Необычный способ тестировать ИИ интеллектуальными играми прокомментировал научный журналист, популяризатор науки и лектор Алексей Паевский — участник «Своей игры» и автор вопросов для «Что? Где? Когда?».
«Решать вопросы «Своей игры» искусственному интеллекту определенно будет легче, поскольку они обычно направлены на эрудицию и личные знания игрока, а вот вопросы «Что? Где? Когда?» скорее на способность команды знатоков мыслить и догадываться. Для ответа на средний вопрос «ЧГК» русскому человеку обычно не нужны никакие специальные знания свыше школьной программы и общей культуры, другое дело, что зачастую вопросы «завернуты» так, что лишь единицы поймут о чем речь. Если сообщество авторов вопросов «ЧГК» узнает, что ИИ научился на их вопросы отвечать с легкостью, это их замотивирует закручивать новые вопросы так, что у ИИ не будет шансов, а для знатоков при этом сложность останется прежней», — поделился Алексей Паевский.
Четырехкратный чемпион мира по «Что? Где? Когда?» Михаил Левандовский добавил, что главная сложность игры в ее изменчивости. На заре «Что? Где? Когда?» ключом к победе было умение распознавать «явления» — абстрактные образы и социальные закономерности. Это для современных ИИ-систем по-прежнему остаются серьезным вызовом.
«Впрочем, тогда же возник и другой тип вопросов — перефразировки известных цитат, названий или сюжетов из ограниченного круга классических произведений. С ними, я уверен, искусственный интеллект справлялся бы мгновенно. Сейчас основной тренд — языковые игры: каламбуры, двойные смыслы, игра слов, сложные ментальные конструкции. Здесь ИИ демонстрирует результаты с переменным успехом. Пока что он порой ошибается, но скоро сможет соревноваться с человеком на равных», — рассказал Михаил Левандовский.
Другой глобальный результат исследователей ЮФУ заключается в том, что они протестировали несколько методов генерации ответов, включая цепочку рассуждений и подход с «внутренним критиком», который оценивает предложенные гипотезы – такая своего рода имитация команды знатоков ЧГК и того, как «раскручивают» вопросы в спортивном ЧГК. Например, модель сначала должна предложить несколько вариантов, а затем самой себе объяснить, почему каждый из них неверен, а тот вариант, на который она сможет придумать меньше критики, она и предлагает как верный.
«Такие подходы, с критикой, показывают прирост точности по сравнению с методами без «критика». Однако избыточная критика иногда подавляет креативность модели — как и у людей, — и она вообще больше не может генерировать новые гипотезы», — поделился Богдан Проценко.
Это может означать что этап инструктирования LLM, (instruction tuning), когда модели учат быть «покорными» и отвечать по существу, можно делать с учетом этой специфики, тем самым делая модели еще умнее в сценариях саморефлексии и самокритики.
«В терминологии «ЧГК» есть термин «щелчок». Ответ, который «щелкает», не только подходит под условия вопроса и под все подсказки в вопросе, но и красиво ложится на общекультурный контекст. Это не элемент озарения, это способ проверить свой ответ, со всеми ли зацепками вопроса он бьется, выдерживает ли он внутреннюю критику. Прекрасно, если можно настроить алгоритм ИИ по схожему принципу, при этом, конечно, не нужно обманываться, будто бы ИИ обладает умом, он обладает способностью подбирать решение к задачам, аналогичным той, на которой он тренировался», — прокомментировал Алексей Паевский.
По словам затока, когда автомобиль стал быстрее человека, легкая атлетика не исчезла как спорт — так и интеллектуальные игры не исчезнут, если ИИ однажды начнет играть в них лучше человека. Смысл «Что? Где? Когда?» в демонстрации возможностей командной работы, того, насколько одни шесть человек могут проявить себя лучше, чем другие шесть человек в рамках специально придуманных для этого вопросов.
ИИ глобально уступает человеку не в умении отвечать на вопросы, у которых уже есть заведомо правильный ответ, а в способности к творчеству и созидательной деятельности, к таким результатам мышления, как озарение и открытие. Но пока большие языковые модели не обучатся на русских базах данных, они будут проигрывать нам даже в викторинах.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Активность НЛО над Шотландией

Архиепископ Вашингтона отстранил экзорциста

Бразильский блогер видел НЛО

Гигантский шар посреди болот

Земля наклонилась на 31,5 дюйма, этого быть не должно

Из-за блогера резко возросло число антипрививочников

Инопланетные тела и корабли, не принадлежащие людям

Как комментарии об НЛО вызвали споры

Комментарии об НЛО могут стоить карьеры

Люди могут принять за НЛО даже мусорный пакет

НЛО - это, по сути, Демоны

Опытного католического экзорциста отстранили

Редкое явление в небе над Пушкино

Священника-экзорциста отстранили из-за демонов

Скептик, который прозрел

Таинственный самолет вызвал интерес

Фильм про уфолога выходит в прокат

Шотландская встреча с НЛО

Я лично видел корабли, не принадлежащие людям

Является ли это намеком на новый самолет

Германия создает системы космического наблюдения

Загадочный треугольный самолет замечен над Зоной 51

Заявление ведущего американского экзорциста

Инновационные марсоходы плавают по песку

Миссия Психея сфотографировала полумесяц Марса

Новый метод обнаружения облаков на экзопланетах

Обнаружены возможные следы ранней жизни

Объяснение массивных черных дыр ранней Вселенной

Опасения по поводу частной колонизации Марса

После 10 лет модернизации легендарный телескоп вернулся

Проверка ставит под сомнение эволюцию темной энергии

Работа в экстремальных лунных условиях

Светящиеся грибы на службе науке

Смогут ли марсианские поселенцы печатать инструменты

Таинственный спутник Нептуна Нереида

Телескоп AtLAST изучит недостающую часть Вселенной

Удивительный кратер Гюйгенса на Марсе

Черные дыры могут избегать сингулярностей

Что могло формировать строительные блоки жизни

Что можно сделать с ложной информацией

Аренда транспорта в городе Сочи

Рисунок акварелью. Техника, история и особенности работы с материалом

Аренда транспорта в городе Омск

Агент ЦРУ рассказал о базах инопланетян

Архиепископ отстранил экзорциста из-за НЛО

Астрофизик рассказал о файлах Пентагона

Вопрос об НЛО заставил чиновника улыбнуться

Действия США - циничный политический трюк

ИИ-лаборатории озаботились вопросом сознания у машин

Интриги вокруг НЛО

Космический учёный нарушил молчание по поводу НЛО

Лазеры можно разметить в лунных кратерах

На Земле находятся четыре инопланетные базы

Особо смотреть не на что

Охотники заполонили озеро Лох-Несс

Причудливые образования Венеры озадачивают

Роман Аманды Лори об НЛО

Собрали воедино улики по загадочным радиосигналам

Стивен Спилберг вспоминает о близкой встрече

Существование водяных паровых шлейфов на Европе

Тайна космического стекла Тутанхамона

Тело пропавшей сотрудницы атомной лаборатории найдено

Член съемочной группы пострадал от призрака

Гигантские красные столбы появились над Тибетом

Доказательство существования путешествий во времени

Китайский Нострадамус высказался о файлах про НЛО

Мощные взрывы сотрясали восточное побережье США

Наблюдение НЛО в Огайо

Нашли остатки Ноева ковчега в Турции

НЛО в форме колеса замечено в Турции

НЛО в форме сигары ошеломило очевидца

НЛО над Сирией пронеслось со скоростью света

Почему инопланетян так манит Краснодарский край

Правительственная информация об НЛО - тупик

Предупреждение о наличии демонического элемента в НЛО

Самые мистические леса Великобритании

Три НЛО превратились в два над Англией

Умопомрачительный мираж у берегов Корнуолла

ФБР опубликовало материалы по делу Ди Би Купера

ФБР упоминает наблюдение НЛО в Миннесоте

Фильм 'Спящий пёс' рассказывает о журналисте-уфологе

Четыре НЛО заметили над Ираном

Экстрасенс раскрыл тайны скрытых баз инопланетян

Все фото программы НАСА Артемида - подделки

Группа бигфутов преследовала подростков в Айдахо

Группа НЛО пролетела над Краснодарским краем

Два НЛО размером с Землю пролетели мимо Солнца

Загадка инопланетного стекла Тутанхамона

Загадочная гибель угольного судна Циклоп

Загадочные объекты над Неаполем

Зацепка, указывающая на самолет Амелии Эрхарт

Звезда кантри Кейси Масгрейвс рассказала о НЛО

Какова вероятность паранормальных явлений

Мужчина вызвал НЛО медитацией

Наконец-то правда раскрылась

НАСА не нашло следов крушения НЛО

НЛО размером в семь миль пролетел мимо Солнца

НЛО, упавшее недалеко от острова Лумми

Новый случай увечья скота в Аргентине

Объяснили природу объекта на дне Балтики

Огромный НЛО пристыкован в кратере на Луне

Певица заявила, что сняла на видео НЛО

Первая пропавшая без вести учёная найдена мертвой

Почему Спилберг уверен, что мы не одни во Вселенной

Профессор из Гарварда опровергает данные ЦРУ

Пси-агент ЦРУ определил расположение баз инопланетян

Световая сущность посетила медитирующих туристов

Странные находки в Антарктиде

Существуют ли инопланетяне

Уфолог обнаружил животное на Марсе

Файлы об НЛО подробно описывают демонов

Что заметили в небе в Подмосковье

Экзорцист рассказал об ужасающей встрече

Белый диск замечен над Миссури

Белый дом буквально создал фейковый сайт об НЛО

Белый объект замечен над Мексикой

Будут ли миссии на Луну целесообразными

Два НЛО заметили над Гавайями

Департамент войны опубликовал файлы об НЛО

За кулисами темной стороны Нового Орлеана

Загадка Бермудского треугольника разгадана

Звездная пыль раскрывает тайны Солнечной системы

Как земной щит выдерживает удары солнечных бурь

Как люди могут восстановить утраченное зрение

Калифорния манит пришельцев

Китайский эксперт ошеломлен тайнами НЛО

Космический мусор представляет растущую опасность

Летающий объект человекообразной формы

Математики доказывают существование калейдоциклов

На Марсе впервые обнаружен эффект Цван-Вольфа

НЛО замечено в эфире новостей в Миссури

НЛО танцуют над Осакой

Обнаружили одну из первых галактик Вселенной

Оружие, превращающее врагов в камень, заметили на Марсе

Пришло время расширить наше понимание темной материи

Разноцветный НЛО заметили в Миннесоте

Разумно ли христианам игнорировать дебаты об НЛО

Световой корабль замечен над Ютой

Создание телекоммуникационной сети на Марсе

Теория струн вытекает из основных знаний о Вселенной

Технологии инопланетной расы на Марсе

Флот НЛО замечен над Калифорнией

Что такое 'Смотровая башня НЛО' в Колорадо

Белый дом создал фейковый сайт об НЛО

Британский меловой гигант приведен в порядок

Были ли марсианские приливы достаточно сильными

ИИ всё ещё уверенно выдаёт ложь за правду

ИИ для интерпретации акустического пульса Солнца

Карта неба, на которой изображено 6000 экзопланет

НАСА делает ставку на ядерные двигатели для Марса

Новый метод может раскрыть секреты звона черных дыр

Одновременно запечатлели оба полушария кометы 3I-ATLAS

Отыскали суперземлю в обитаемой зоне

Планы Пентагона по отслеживанию самолетов с орбиты

Площадка для наблюдения за НЛО в Колорадо

Поверхность лун Юпитера и Сатурна оказалась пористой

Пульсар раскрывает невидимые структуры

Свет уличили в движении с отрицательным временем

Снайперское укрытие Освальда выставлено на аукцион

США столкнулось с обвинениями в газлайтинге

Уфологические документы Трампа вызовут хаос

Хаос, вызванный водой на Марсе

Что скрыто в сообщениях Пентагона о НЛО

Белый дом смешивает конспирологию с миграцией

Гравитационные волны позволят обнаружить темную материю

Две черные дыры, растущие быстрее своих галактик

Десятилетия наблюдений необъяснимого

Домен, посвященный НЛО, вызвал волну критики

Загадочный звуковой удар сотряс дома жителей США

Измерения мощности струй черной дыры

Инопланетяне в центре внимания на Капитолийском холме

Исследование выявило гейзеры на Ганимеде

Истинное предназначение сайта aliens.gov

Как связать воедино все объекты во Вселенной

Каково было бы пережить астероидный апокалипсис

Конусоголовые люди могут быть инопланетянами

Ледяные кольца Сатурна образовались из спутника

Нижний предел размера для обитаемых экзопланет

НЛО над Абилином, что это за странный объект

Новый путь к хранению энергии на Луне

Новый фильм Спилберга об НЛО взбудоражил интернет

Обнаружено 27 планет-кандидатов у двух солнц

Одна из самых странных медийных уфо-бурь 90-х

Пасторы предупреждают о падших ангелах в конце времен

Противоударная защита космических аппаратов

Психопатов не существует в реальной жизни

Наверх
Яндекс.Метрика