ИИ не может правильно написать слово Клубника
Сколько раз буква “р” встречается в слове “клубника”? Согласно таким выдающимся продуктам искусственного интеллекта, как GPT-4o и Claude, ответ - дважды. Большие языковые модели (Lms) позволяют писать эссе и решать уравнения за считанные секунды. Они могут синтезировать терабайты данных быстрее, чем человек может открыть книгу. Тем не менее, эти, казалось бы, всезнающие ИИ иногда дают столь впечатляющие сбои, что неудача превращается в вирусный мем, и мы все радуемся с облегчением, что, возможно, еще есть время, прежде чем нам придется склониться перед нашими новыми повелителями ИИ.
Неспособность крупных языковых моделей понять концепцию букв и слогов свидетельствует о более важной истине, о которой мы часто забываем: у этих существ нет мозга. Они думают не так, как мы. Они не люди и даже не особенно похожи на людей.
Большинство LLM основаны на трансформаторах, своего рода архитектуре глубокого обучения. Модели-трансформаторы разбивают текст на токены, которые могут быть полными словами, слогами или буквами, в зависимости от модели.
“Программы LLM основаны на архитектуре transformer, которая, в частности, не позволяет считывать текст. Когда вы вводите запрос, он преобразуется в кодировку”, - сказал TechCrunch Мэтью Гуздиал, исследователь искусственного интеллекта и доцент Университета Альберты. “Когда он видит слово ”the", у него есть единственная кодировка того, что означает "the", но он не знает о "T", "H", "E"."
Это связано с тем, что преобразователи не способны эффективно воспринимать или выводить фактический текст. Вместо этого текст преобразуется в числовое представление самого себя, которое затем контекстуализируется, чтобы помочь ИИ найти логический ответ. Другими словами, ИИ может знать, что лексемы “солома” и “ягода” составляют “клубнику”, но он может не понимать, что “клубника” состоит из букв “s”, “t”, “r”, “a”, “w”, “b"., ”e”, “r”, “r” и “y” в этом определенном порядке. Таким образом, он не может сказать вам, сколько букв — не говоря уже о том, сколько “р” — содержится в слове “клубника”.
Эту проблему нелегко устранить, поскольку она встроена в саму архитектуру, которая обеспечивает работу этих LLM.
Кайл Уиггерс из TechCrunch в прошлом месяце углубился в эту проблему и поговорил с Шериданом Фейхтом, аспирантом Северо-Восточного университета, изучающим интерпретируемость LLM.
“Довольно сложно обойти вопрос о том, каким именно должно быть ”слово" для языковой модели, и даже если мы заставим экспертов-людей договориться об идеальном словарном запасе токенов, модели, вероятно, все равно сочтут полезным "разбивать" вещи еще больше", - сказал Фейхт TechCrunch. “Я предполагаю, что из-за такой нечеткости не существует такого понятия, как идеальный токенизатор”.
Эта проблема становится еще более сложной по мере того, как магистрант изучает все больше языков. Например, некоторые методы маркировки могут предполагать, что пробел в предложении всегда будет стоять перед новым словом, но многие языки, такие как китайский, японский, тайский, лаосский, корейский, кхмерский и другие, не используют пробелы для разделения слов. Исследователь искусственного интеллекта Google DeepMind Йенни Джун в ходе исследования, проведенного в 2023 году, обнаружила, что для передачи того же значения в некоторых языках требуется в 10 раз больше токенов, чем в английском.
“Вероятно, лучше всего позволить моделям смотреть на персонажей напрямую, не прибегая к токенизации, но прямо сейчас это просто невозможно с точки зрения вычислений для трансформеров”, - сказал Фейхт.
Генераторы изображений, такие как Midjourney и DALL-E, не используют архитектуру transformer, которая используется в текстовых генераторах, таких как ChatGPT. Вместо этого генераторы изображений обычно используют диффузионные модели, которые восстанавливают изображение из шума. Модели диффузии обучаются на больших базах данных изображений, и у них появляется стимул попытаться воссоздать что-то похожее на то, чему они научились на основе обучающих данных.
Как рассказала TechCrunch Мелаш Тека Хадгу, соучредитель Lesan и научный сотрудник Института DAIR, “Генераторы изображений, как правило, гораздо лучше работают с такими артефактами, как автомобили и лица людей, и в меньшей степени - с такими мелкими объектами, как пальцы и почерк”.
Это может быть связано с тем, что эти мелкие детали не так часто выделяются в обучающих наборах, как, например, то, что у деревьев обычно зеленые листья. Проблемы с диффузионными моделями, возможно, легче устранить, чем те, которые возникают у трансформаторов. Некоторые генераторы изображений улучшили представление рук, например, за счет обучения большему количеству изображений реальных человеческих рук.
“Еще в прошлом году все эти модели были очень плохи с пальцами, и это та же проблема, что и с текстом”, - объяснил Гуздаль. “У них это действительно хорошо получается на местах, так что если вы посмотрите на руку с шестью или семью пальцами, вы можете сказать: "Ого, это похоже на палец". Аналогично, с сгенерированным текстом вы могли бы сказать, что это выглядит как буква ”Н", а это - как буква "П", но у них действительно плохо получается структурировать все это вместе".
Вот почему, если вы попросите генератор изображений с искусственным интеллектом создать меню для мексиканского ресторана, вы можете получить обычные блюда, такие как “Тако”, но с большей вероятностью найдете такие блюда, как “Тамилос”, “Энчидаа” и “Бурхильтос”.
Поскольку эти мемы о написании слова “strawberry” распространяются по всему Интернету, OpenAI работает над новым продуктом для искусственного интеллекта под кодовым названием Strawberry, который, как предполагается, будет еще более искусен в рассуждениях. Рост числа LLM был ограничен тем фактом, что в мире просто не хватает данных об обучении, чтобы сделать такие продукты, как ChatGPT, более точными. Но, как сообщается, Strawberry может генерировать точные синтетические данные, чтобы сделать LLM OpenAI еще лучше. Согласно информации, Strawberry может разгадывать кроссворды "Connections" из New York Times, для решения которых требуется творческое мышление и умение распознавать образы, а также решать математические уравнения, с которыми она раньше не сталкивалась.
Тем временем Google DeepMind недавно представила системы искусственного интеллекта AlphaProof и AlphaGeometry 2, предназначенные для формального математического анализа. Google утверждает, что эти две системы решили четыре из шести задач Международной математической олимпиады, что является достаточным показателем для получения серебряной медали на престижном соревновании.
Немного странно, что мемы о том, что искусственный интеллект не может правильно написать слово “клубника”, распространяются одновременно с сообщениями о клубнике OpenAI. Но генеральный директор OpenAI Сэм Альтман ухватился за возможность показать нам, что у него в саду довольно впечатляющий урожай ягод.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Выяснили происхождение странной пары планет

Жизнь на Земле зависела от редкого металла

Жуткая аудиозапись экипажа Аполлона-12

Инопланетяне - правда или вымысел

Катастрофическое раскрытие информации

Моя встреча с призраком Брюса Форсайта

Мы должны относиться к Земле как к звездолету

НЛО над Мичиганом скрыт в досье Трампа

Новые файлы со взрывоопасными данными

От светящихся зеленых шаров до летающих дисков

Ошеломляющие сообщения о зеленых шарах

Парк Юрского периода в реальной жизни

Понимание расширения Вселенной и темной энергии

Пугающая встреча офицера разведки США с НЛО

Разумные инопланетяне где-то там

Столкновение НЛО с группой истребителей

Температурные карты Марса в высоком разрешении

Файлы об НЛО могут иметь неприятные последствия

Шары и таинственные объекты

Эпоха контроля разума и секретных экспериментов

Карго-доставка из Китая для новичков. Пошаговый алгоритм от закупки до получения

Бесчисленные оранжевые шары роятся над США

Видеоролики с НЛО, опубликованные в новой базе данных

Власти США опубликовали десятки роликов с НЛО

Загадочные круги на полях в 2026 году

Истребитель сбивает НЛО в недавнем видео Пентагона

Маленький городок стал точкой притяжения НЛО

Марсоход обнаружил странную пирамиду

Мета голосует за тотальную слежку

НЛО над Казахстаном

НЛО, сбитый американским истребителем

О чем говорит нам вторая партия файлов об НЛО

Пентагон публикует новую партию файлов об НЛО

Почему гора Таганай начала качаться

Пять фактов из новых файлов Трампа об НЛО

Сообщения о наблюдениях НЛО по всему Мэриленду

Столкновение истребителя с НЛО над озером Гурон

Тайны архивов АНБ

Уточнили места для поиска внеземных цивилизаций

Ученые верят в инопланетян, но смеются над НЛО

Ярмарка НЛО в Пайн-Буше

Американский истребитель сбивает НЛО над Мичиганом

Видеозаписи и документы военных США об НЛО

Военное министерство США опубликовало файлы об НЛО

Вторая серия материалов об НЛО

Как создавать экзотическую квантовую материю

Как создаются миры-изгои

Компания Пантекс упоминается в документах об НЛО

Крошечный мир с атмосферой, которой не должно быть

Материалы об НЛО рассекреченные Пентагоном

Министерство войны обнародавало партию файлов об НЛО

Мы больше не являемся главными хищниками планеты

Мы не были одни в течение 77 лет

Необъяснимые зеленые шары и летающие диски

НЛО заметили с круизного лайнера у берегов Канкуна

Новая партия файлов об НЛО

Пентагон опубликовал вторую серию документов об НЛО

Последняя партия файлов и видеозаписей об НЛО

Рассекреченные файлы Пентагона об НЛО

Самые популярные теории об инопланетянах

Следующая порция файлов об НЛО

Состав поверхности близлежащей суперземли

Столкновение F-16 над озером Гурон в Мичигане

Стоунхендж был первым спортивным стадионом Британии

США публикуют вторую партию рассекреченных файлов

Таинственный сигнал преследовал астрономов

Ури Геллер о своем туре по бункеру пришельцев

Ученые раскрывают тайну египетских пирамид

Файлы и видеоматериалы об НЛО, опубликованные Пентагоном

Формирование Луны до сих пор остается загадкой

Я потерял дар речи после этих наблюдений

Внутри Млечного Пути скрывается другая галактика

Вторжение инопланетян спровоцирует кризис и хаос

Жуткая тайна окружает зону тишины США

Загадка Стоунхенджа, возможно, разгадана

Загадочное круглое сооружение недалеко от Зоны 51

Загадочные кувшины веками пылились в поле

Задача планирования маршрута к астероидам

Звездообразный аппарат инопланетян

Инопланетный материал обнаружен внутри кратера

Искусственный интеллект может имитировать умерших

Как образуются тесные двойные звёзды

Миссия по поиску землеподобных планет

Мы ищем внеземную жизнь не в том направлении

Национальные парки - охотничьи угодья инопланетян

НЛО существуют на самом деле

Новые документы об НЛО вызывают споры

Новый литий-плазменный двигатель для Марса

Новый способ планирования траекторий к астероидам

Обломки НЛО и тела инопланетян скрываются

Океанами правят высшие разумные существа

Правительство США готовит вторую партию файлов

Рой аппаратов может получить изображение Проксимы Б

Скандал с вскрытием инопланетянина

Скрытые структуры обнаружили в Великой пирамиде

Случайно доказали теорию струн

Старая гиперскоростная звезда

Фактор, определяющий продолжительность вашей жизни

Физики измерили отрицательное время

Фонд опубликовал документы АНБ об НЛО

ЦРУ знает о четырех типах инопланетян

Готовятся к публикации более масштабные секреты

Документы об НЛО вызывают вопросы о предвзятости

Дональд Трамп опубликовал странное изображение

Загадочная смерть специального агента

Настоящий Индиана Джонс подвергся нападению

Настоящий 'Парк Юрского периода' в реальной жизни

НЛО длиной 100 миль замечен над Луной

НЛО замечен на орбите Земли

Обнаружены четыре типа инопланетной жизни

Пастор предупреждает о демонических НЛО

Пентагон рассекретил 162 файла об НЛО

Поразительный случай встречи НЛО с истребителями

Почему ваши молекулы являются правосторонними

Правительство США знает о четырёх видах инопланетян

Свиньи-мутанты обрели тревожные способности

Скандал вокруг НЛО разгорелся вновь

Странное фото Трампа вызывает споры

Тайна корабля-призрака Мэри Селест разгадана

Физический варп-двигатель считался невозможным

Что если инопланетяне вторгнутся на Землю

Экскурсии по России и миру с местными гидами

Аномальные воздушные феномены в Аргентине

Астронавт МКС заснял неопознанный объект

В обломках НЛО нашли четыре вида инопланетян

Возможность миграции жизни с Марса на Землю

Воспроизвели механизм гибели нашей Вселенной

Вторая сфера обнаружена в джунглях Колумбии

Древние каменные горшки Лаоса оказались склепами

Из обломков НЛО извлекли четыре вида инопланетян

Конгресс переключают свое внимание на подрядчиков

Конспирология встречается с реальными новостями

Людьми манипулируют инопланетяне

Мегалитическая гробница переписывает историю

НЛО превосходят американский арсенал

Пост Трампа в социальных сетях стал вирусным

Рассекретили материалы об аномальных объектах

Рассекреченные правительственные документы об НЛО

Создают искусственный мозг из живых клеток

Сообщения о наблюдениях НЛО в регионе Лоукантри

Учёный ЦРУ раскрывает конкретные виды инопланетян

Что мы узнали из первой НЛО-публикации Пентагона

Вера в НЛО не является религией в традиционном смысле

Демоны мучили меня невообразимыми способами

Зомби, призраки и НЛО захватили Западную Вирджинию

Как будет выглядеть первый контакт

Картина того, чего на самом деле хотят инопланетяне

Моё пребывание в самом демоническом доме США

Мужчина арестован за звонок по поводу зомби

О полупрозрачных существах расскажут в июне

Они помнят каждый миг своей жизни

Пирамиды были гравитационными передатчиками

Раскрыт главный инопланетный секрет США

Рептилоиды, серые и нордики

Сайт Пентагона зафиксировал более 1 млрд посещений

Самые мрачные демонические видения

Старый снимок вновь взбудоражил мир уфологии

Тайна корабля-призрака Мэри Селест разгадана

Трамп вызвал хаос, опубликовав фото инопланетянина

Уфолог Климов рассказал о фото инсектоида

Феномен НЛО - дело рук дьявола

Фото с Аполлона не должны были публиковать

Британская Зона 51 хранит секреты инопланетян

Восьмиконечный НЛО был ангелом с крыльями

ИИ-помощник устроил настоящий кошмар

История Вселенной может быть переписана

Кракены эпохи динозавров

Мифы о полой Земле и нацистских НЛО

НЛО на Луне поддаются объяснению

НЛО нацелены на ядерные объекты

НЛО призваны раскрыть наши скрытые силы

Обнаружены минимум четыре инопланетных вида

От богомолов до рептилоидов

Пришельцы на крыше школы в Анлаби

Психоз, вызванный ИИ

Раскрыты секретные файлы Базза Олдрина об НЛО

Сын президента Байдена высказался о НЛО

Тайна скрытого храма под Сфинксом

Трамп публикует загадочные изображения

Тысячи подводных НЛО роятся вдоль побережья США

Ужасающие послания из космоса

Файлы об НЛО являются спусковым механизмом

Австрийский космонавт хотел бы увидеть инопланетян

Военным известно о четырех видах инопланетян

Документы об НЛО опубликованы в сети

Загадочный НЛО замечен над Ормузским проливом

Наверх
Яндекс.Метрика