Почему ИИ не победит в игре 'Что? Где? Когда?'
В ЮФУ придумали новый остроумный способ тестировать ИИ на способность работать в реальных ситуациях использования русского языка. Исследователи искусственного интеллекта из МИИ ИМ ЮФУ предлагают использовать интеллектуальные языковые игры, как пример — заставлять ИИ отвечать на вопросы из архива телевикторины «Что? Где? Когда?» и «Своей игры». Инициативу прокомментировал опытный игрок.
В наше время параллельно развиваются самые разные технологии искусственного интеллекта, но в широком употреблении под ИИ люди почти всегда подразумевают именно большие языковые модели (LLM – Large Language Model), такие как DeepSeek или ChatGPT, из-за шумихи вокруг них.
Ответственный исполнитель проекта «Фронтирная лаборатория рентгеноспектральной нанометрологии» Центра наукоемкого приборостроения ЮФУ Богдан Проценко и его коллеги, как и многие исследователи, на практике делают ставку не на языковые-модели гиганты, а на модели ИИ поменьше, обученные на заведомо более качественных данных, как в случае линейки моделей LLaMa3.
«Ее разработчики получили существенный прирост качества моделей, главным образом «почистив данные» для обучения предыдущих версий, без радикальных изменений в архитектуре нейросети. Между сложностью архитектуры ИИ и качеством данных для его обучения всякий ML-инженер и аналитик данных почти всегда выберет последнее, потому что в мире не бесконечное количество качественного контента, и лучше, если нейросеть может научиться на миллионе умных текстов, чтобы не пришлось ей скармливать миллиард глупых», — поделился Богдан Проценко.
Создатели ИИ часто исходят из позиции, что логическое мышление и способность рассуждать («ризонинг») нейросетей не страдает от того, на каком языке ИИ «подумает», главное, чтобы он умел грамотно формулировать ответ на языке пользователя. Доказать обратное нетрудно: можем спросить у большой языковой модели, например, на языке хинди, какие предметы и темы проходят десятиклассники по школьной программе. И он вам ответит на грамотном литературном хинди, но только расскажет так, как проходят в десятом классе в американских школах, а не в индийских.
«Русского, например, в данных для предтренировки всех зарубежных моделей ощутимо меньше английского, потому модель пишет и мыслит «умнее» и грамотнее, если ее спросить на английском и попросить на нем же ответить. Бенчмарки, «линейки», которыми измеряют качество моделей и их работы на разных языках – как правило, просто перевод с одного из языков, обычно английского, на другие. Такой расклад не отражает качества работы модели в реальной языковой ситуации», — объяснил Богдан Проценко.
Как же объективно оценить, какая модель ИИ действительно «умнее»? Для этого отлично подходят различного рода интеллектуальные игры: они являются весьма непростыми для LLM, и при этом за многие годы накоплен огромный и крайне качественный — отточенный поколениями игроков, а не сгенерированный ИИ — архив подобных вопросов, во многих из которых предостаточно и культурной, и тонкой языковой специфики языка.
«Мышление и языки близки. Как победы ИИ над человеком в шахматы и го были яркими ключевыми моментами развития ИИ в конце прошлого века, так «Что? Где? Когда?» и «Своя игра» — вызовы сегодняшнего дня. Способность успешно отвечать на вопросы, написанные умными телезрителями для еще более умных знатоков, появляется только в самых больших и умных LLM, причем моделям с большим количеством русского языка в предтренировочной выборке обычно проще», — подчеркнул Богдан Проценко.
В качестве примера ученые протестировали старшую модель из семейства LLaMa-3, демонстрирующую хорошее владение русским языком, но даже она ошиблась в вопросах, требующих знания специфических для русскоязычной культуры фактов. Например, вопросы о композиторе Владимире Шаинском, о Царь-пушке в Кремле, о спортивных объектах, построенных вокруг Москвы к Олимпиаде-80, тривиальные для русскоязычных людей, для LLM на 405 миллиардов параметров, владеющей десятками естественных языков и языков программирования, разбирающейся в куче вопросов, от квантовой механики до медицины, оказываются не под силу.
Необычный способ тестировать ИИ интеллектуальными играми прокомментировал научный журналист, популяризатор науки и лектор Алексей Паевский — участник «Своей игры» и автор вопросов для «Что? Где? Когда?».
«Решать вопросы «Своей игры» искусственному интеллекту определенно будет легче, поскольку они обычно направлены на эрудицию и личные знания игрока, а вот вопросы «Что? Где? Когда?» скорее на способность команды знатоков мыслить и догадываться. Для ответа на средний вопрос «ЧГК» русскому человеку обычно не нужны никакие специальные знания свыше школьной программы и общей культуры, другое дело, что зачастую вопросы «завернуты» так, что лишь единицы поймут о чем речь. Если сообщество авторов вопросов «ЧГК» узнает, что ИИ научился на их вопросы отвечать с легкостью, это их замотивирует закручивать новые вопросы так, что у ИИ не будет шансов, а для знатоков при этом сложность останется прежней», — поделился Алексей Паевский.
Четырехкратный чемпион мира по «Что? Где? Когда?» Михаил Левандовский добавил, что главная сложность игры в ее изменчивости. На заре «Что? Где? Когда?» ключом к победе было умение распознавать «явления» — абстрактные образы и социальные закономерности. Это для современных ИИ-систем по-прежнему остаются серьезным вызовом.
«Впрочем, тогда же возник и другой тип вопросов — перефразировки известных цитат, названий или сюжетов из ограниченного круга классических произведений. С ними, я уверен, искусственный интеллект справлялся бы мгновенно. Сейчас основной тренд — языковые игры: каламбуры, двойные смыслы, игра слов, сложные ментальные конструкции. Здесь ИИ демонстрирует результаты с переменным успехом. Пока что он порой ошибается, но скоро сможет соревноваться с человеком на равных», — рассказал Михаил Левандовский.
Другой глобальный результат исследователей ЮФУ заключается в том, что они протестировали несколько методов генерации ответов, включая цепочку рассуждений и подход с «внутренним критиком», который оценивает предложенные гипотезы – такая своего рода имитация команды знатоков ЧГК и того, как «раскручивают» вопросы в спортивном ЧГК. Например, модель сначала должна предложить несколько вариантов, а затем самой себе объяснить, почему каждый из них неверен, а тот вариант, на который она сможет придумать меньше критики, она и предлагает как верный.
«Такие подходы, с критикой, показывают прирост точности по сравнению с методами без «критика». Однако избыточная критика иногда подавляет креативность модели — как и у людей, — и она вообще больше не может генерировать новые гипотезы», — поделился Богдан Проценко.
Это может означать что этап инструктирования LLM, (instruction tuning), когда модели учат быть «покорными» и отвечать по существу, можно делать с учетом этой специфики, тем самым делая модели еще умнее в сценариях саморефлексии и самокритики.
«В терминологии «ЧГК» есть термин «щелчок». Ответ, который «щелкает», не только подходит под условия вопроса и под все подсказки в вопросе, но и красиво ложится на общекультурный контекст. Это не элемент озарения, это способ проверить свой ответ, со всеми ли зацепками вопроса он бьется, выдерживает ли он внутреннюю критику. Прекрасно, если можно настроить алгоритм ИИ по схожему принципу, при этом, конечно, не нужно обманываться, будто бы ИИ обладает умом, он обладает способностью подбирать решение к задачам, аналогичным той, на которой он тренировался», — прокомментировал Алексей Паевский.
По словам затока, когда автомобиль стал быстрее человека, легкая атлетика не исчезла как спорт — так и интеллектуальные игры не исчезнут, если ИИ однажды начнет играть в них лучше человека. Смысл «Что? Где? Когда?» в демонстрации возможностей командной работы, того, насколько одни шесть человек могут проявить себя лучше, чем другие шесть человек в рамках специально придуманных для этого вопросов.
ИИ глобально уступает человеку не в умении отвечать на вопросы, у которых уже есть заведомо правильный ответ, а в способности к творчеству и созидательной деятельности, к таким результатам мышления, как озарение и открытие. Но пока большие языковые модели не обучатся на русских базах данных, они будут проигрывать нам даже в викторинах.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Большой пожар подбирается все ближе к Зоне 51

Где может начаться массовое вымирание

Житель городка в Неваде хранит секреты Зоны 51

Земля находится внутри огромной пустоты

Знаковом отчет Канады об НЛО

Известные сообщения о наблюдениях НЛО

Как добраться до экзопланеты у Проксимы Центавра

Канадский доклад рекомендует создать бюро по НЛО

Количество наблюдений НЛО увеличилось

Лесной пожар в районе Зоны 51 или что-то еще

Облака холодного водорода внутри пузырьков Ферми

Обнаружили следы человека возрастом 115 000 лет

Огромный пожар вспыхнул в Зоне 51

Очень странная комета залетела в нашу систему

Первичные черные дыры ускорили звездообразование

Пожар в кустарнике вспыхнул вблизи Зоны 51

Поиск внеземного разума с помощью высоких энергий

Посадка Аполлона-11 на Луну была инсценирована

Таинственный новый мир обнаружен в нашей системе

Уфологи спорят из-за секретных технологий

Внедорожники TANK. Китайский прорыв на автомобильном рынке

Мотоциклы. Какие бывают и чем отличаются

Пауки в доме. Когда стоит задуматься о профессиональной помощи

Уход за кожей с муцином улитки - зачем он нужен и кому подходит

Как выбрать сантехническое оборудование для дома. Ванны, душевые кабины и настенные смесители

Будущее за самовоспроизводящимися роботами

В Нью-Мексико есть проблема с инопланетянами

Встречи сына музыкальной иконы с НЛО

Действия министерства обороны США в отношении НЛО

Загадочный НЛО в Саратоке

Захватывающая правда о Битве за Лос-Анджелес

Квантовая батарея превзошла классическую

Колумбийская модель сделала лучшие снимки НЛО

НЛО в Техасе вызвал ажиотаж в интернете

Обнаружили 1600-летнюю гробницу майя

Огромный корабль пришельцев несется к Земле

Отечественная система управления роботами силой мысли

Пентагон будет игнорировать запросы от уфолога

Пентагон десятилетиями обманывал общественность

Подтвердили существование временных отражений

Правдивость легенды о Троянской войне

Трапециевидные гробницы старше египетских пирамид

Человек, предсказавший интернет в 1945-м

Я была одержима духом в тюрьме с привидениями

Я охотник за шпионами из ФБР

В первой половине года в США замечено 2000 НЛО

Волшебные грибы могут стать ключом к продлению жизни

Две ужасающие черные дыры сливаются в одну

Действительно ли Титаник был непотопляемым

Жуткая теория, стоящая за размытыми фото НЛО

Инопланетяне в небе Канады

Инопланетяне подают таинственный сигнал

Инопланетяне уже здесь

Канадский ученый опубликовал отчет об НЛО

Люди сдвинули Северный полюс на 3 фута

НЛО самая большая загадка Вселенной

НЛО, испускающий световой луч

Опубликована засекреченная запись НЛО

Пианино предупреждало о смерти члена семьи

Самый большой марсианский метеорит продается

Столкновение F-16 с НЛО вызвало слухи о инопланетянах

Странный красный объект упал с неба в Болгарии

Таинственные сгустки в недрах Земли

Тайный знак на каждой долларовой купюре

Ученый опубликовал доклад об НЛО

Был ли Марс обречен стать пустыней

Гидротермальные системы помогли зарождению жизни

Двойная детонация старой звезды

Еще один загадочный межзвездный объект

Загадочное столкновение военного самолета с НЛО

Исследования НЛО возраждаются в Канаде

История звезды кантри об НЛО

Межзвездная комета забрела к нам на задний двор

Наблюдения НЛО в окрестностях Торбея

Неужели НЛО врезался в F-16

Обнаружили экзопланету, похожую на суперземлю

Первая станция по исследованию НЛО в Оттаве

Почему на Марсе нет жизни

Рекордный рост числа наблюдений НЛО в США

Скрытые структуры в первых галактиках Вселенной

Тайна легендарного витрувианского человека Да Винчи

Хаос в Солнечной системе и углерод на Земле

Что если темная энергия уменьшится

Экзопланеты могут стать причиной собственной гибели

Экзопланеты с необычной орбитальной динамикой

Единая система учёта ставок в Казахстане. Причины внедрения

Невидимая угроза. Как аэрогазовый контроль предотвращает взрывы и отравления

Как выбрать подушку для здорового сна

Особенности международных грузоперевозок. Турция, ОАЭ и Китай — три разных подхода

Новый взгляд на премиум от HONGQI. Сочетание динамики, технологий и комфорта

Астрономы обнаружили третий межзвездный объект

Более 2000 случаев наблюдения НЛО в США

Главный рекламный объект фестиваля НЛО украли

Двери откроет новый музей ужасов

Добыча полезных ископаемых на Луне становится ближе

Маргинальные американцы скептически относятся к ИИ

Обнаружение сети гравитационных волн

Образ Несси привлекает тысячи посетителей

Подземный город может находиться под Сфинксом

Проведение исследований в области солнечной геоинженерии

Скорость вращения звезд для оценки их возраста

Создание космических местообитания

Странное существо в лесу Мазамитла

Структуры, необходимые для обнаружения экзопланет

Таинственное существо нападает на баранов

Титан - объект для изучения атмосферы экзопланет

Третий межзвездный объект в Солнечной системе

Три разбившихся НЛО есть у Великобритании

Турист встретился с легендарным Укумаром

Эпоха разоблачителей НЛО часто кажется тупиковой

Более 2000 случаев наблюдений НЛО в США

Болид озарил ночное небо над Челябинском

Большое число на грани человеческих знаний

В Нью-Йорке зафиксировано 66 случаев наблюдения НЛО

Заказать место для посадки НЛО можно в Вене

Земные аэропорты видно с расстояния 200 светолет

Зловещее облако судного дня окутывает Мэриленд

Инопланетяне могут засечь работу наших радаров

Кости Иисуса спрятаны в тайных хранилищах США

Люди с высоким IQ оказались менее нравственными

Мир наполнен шумами

НЛО, инопланетяне и президенты США

Полеты НЛО над авиабазой Райт-Паттерсон

Полеты НЛО над ядерным объектом в Техасе

Путешествия во времени без парадоксов возможны

Пчелу превратили в киборга

Созданные ИИ вирусы научились обходить защиту ПК

Умение предсказывать будущее связали с IQ

Череп единорога нашли у замка короля Артура

Энтузиаст разработал интерфейс мозг-компьютер

Аэропорты могут помочь инопланетянам обнаружить Землю

ВМФ США утратил 500 страниц информации о НЛО

Жители Мичигана сообщили о трех десятках НЛО

ИИ Google начинает читать все ваши сообщения

Как менялась погода на Венере за 10 лет

Квантовая запутанность в мозге - Сознание

Место, где слои почвы находятся в перевернутом положении

Научно-фантастическом фильм - Похищение инопланетянами

Невероятные случаи похищения людей инопланетянами

Новое представление о том, как развиваются галактики

Открытие в подводном Стоунхендже переписывает историю

Охотники за метеоритами прочесывают Джорджию

Растущее число свидетельств эволюции темной энергии

Резьба, которая раскрывает секреты египетских царей

Сотрудник НАСА нарушил давнее молчание по поводу НЛО

Тайна межзвездного объекта, несущегося через нашу систему

Утраченную ветвь Древа человечества

ЦРУ неправильно обращается с файлами об НЛО

Чернобыльские собаки превратились в нечто новое

Экзопланета у тихой звезды-карлика

Вещество из галлюциногенных грибов продлило жизнь

Власти США считают, что они действительно сняли НЛО

Встреча с инопланетянами в Огайо

Вся наша галактика может находиться внутри Дыры

Доказательства существования НЛО находятся в Пентагоне

Жители Мичигана сообщили о трех десятках НЛО

Затерянный город древнейшей цивилизации Америки

ИИ неделями дурачил пользователей Spotify

ИИ создал первое в мире лекарство от рака

Инцидент в Розуэлле. Может ли он быть байкой

Крушение НЛО в Розуэлле. Мистификация

Нашли способ обратить вспять выпадение волос

НЛО летит по небу во время грозы в Мэриленде

Паскагула. Еще один свидетель

Плазма, которая может растопить законы Реальности

Подросток создал мифический луч смерти Архимеда

Современные компьютеры не подходят для мира ИИ

Сходка уфологов в районе Фолкерка

Теории о подземном городе под египетским Сфинксом

Фотографии пришельцев из Розуэлла

Вращение Земли неожиданно ускорилось

Загадочный случай с летчиком Виктором Годдардом

История гаданий и предсказаний

Конгрессвумен поделилась взглядами на ангелов

Крошечные различия между психопатами и нормалами

Легенда ЮФС делится своим выводами о встречах с НЛО

Опровергли один из величайших мифов острова Пасхи

Очевидцы что-то видят в озере Лох-Несс

Призрак мальчика из старинной кровати

Робот приготовил и посолил стейк с расстояния 1800 км

Смерть Вселенной наступит раньше

Столкновение неизвестного объекта с Сатурном

Тайны и заговоры удивительного мира Антарктиды

Технология 'мозг-компьютер' проходит клинические испытания

Удивительное открытие на острове Пасхи

Уфологи выявили места аномалий в России

Наверх
Яндекс.Метрика