Компьютер прошел тест тьюринга. Пройти тест тьюринга
Роботы, наделённые сознанием, способные мыслить, творить, общаться – об этой идее мы все знаем не понаслышке, ведь то и дело на экранах появляются всё новые фильмы, в которых фигурируют киборги, например, «Терминатор», «Я — Робот», «Прометей» и т.д. Да и новости всё чаще пестрят заголовками о том, что учёные продвинулись в создании искусственного разума, сделали человекоподобную машину или о том, что наконец-таки пройден тест Тьюринга. И тем, кого интересует идея искусственного интеллекта, а также тем, кто не в курсе, что это за тест Тьюринга такой и почему вокруг него столько шумихи, наверняка будет интересен материал, который мы подготовили.
Начнём же мы с краткого обзора темы искусственного интеллекта.
Искусственный интеллект
Под термином «искусственный интеллект» принято понимать науку и технологию создания наделённых интеллектом машин и, более всего, обладающих интеллектом компьютерных программ. Однако нередко данным понятием называют также свойство различных интеллектуальных систем к выполнению , изначально считающихся свойственными только человеку. Кроме того, идея искусственного интеллекта связана с подобной задачей применения компьютерной техники с целью понять человеческий интеллект.
В качестве научного направления искусственный интеллект начал формироваться примерно в середине прошлого столетия, когда сформировалось достаточное количество предпосылок для этого. Например, философы всё больше спорили на тему природы человека и процессов познания мира, психологи и нейрофизиологи занимались разработкой теорий, касающихся мышления и работы человеческого мозга, математики и экономисты проводили всевозможные расчёты и представления знаний о мире и т.д. Таким образом и был заложен фундамент теории алгоритмов, благодаря чему появились первые компьютеры.
Практика показала, что потенциал машин в плане произведения вычислений намного больше человеческого, по причине чего в кругах учёных возник вопрос: а каков вообще потенциал компьютеров, и смогут ли машины со временем достичь уровня человеческого развития?
Так, в 1950 году одним из основоположников в сфере вычислительной техники, английским учёным Аланом Тьюрингом в издании «Mind» была написана статья «Вычислительные машины и разум» где описывалась процедура, благодаря которой можно получить возможность определения того момента, когда машина станет на одну ступень с человеком в плане своей разумности. Эта процедура и получила название теста Тьюринга. Но, следует полагать, что реализация теста Тьюринга была бы невозможной без созданного искусственного интеллекта, и к этому процессу учёные подходили с нескольких позиций.
Подходы к созданию искусственного интеллекта
В первую очередь следует выделить общий подход к созданию искусственного интеллекта, который предполагает, что он будет способен к проявлению поведения, которое не будет отличаться от человеческого. Кстати, представленную идею можно назвать обобщением подхода теста Тьюринга, согласно которому машину можно считать разумной тогда, когда она будет в состоянии вести беседу с обычным человеком, и он не сможет отличить её от другого человека, при условии, что беседа идёт в письменной форме.
Второй подход принадлежит писателям-фантастам. Он говорит о том, что искусственный интеллект появится тогда, когда машина сможет творить и чувствовать. Но этот подход не способен выдержать критики, если рассмотреть его более детально. Например, создать машину, которая будет производить оценку каких-либо параметров внутренней или внешней среды и как-то реагировать на них, по большому счёту, не сложно. Учитывая то, что датчики будут реагировать на определённые раздражители, про такой механизм уже можно сказать, что у него есть «чувства».
Третий поход называется символьным. По сути, именно он был изначально свойственен эпохе цифровых машин. После того как был создан первый язык символьных вычислений, разработчики стали уверены, что есть шанс и практической реализации искусственного интеллекта с помощью технологии символьных вычислений, благодаря чему стало бы возможным иметь дело со слабоформализованными смыслами и представлениями.
Был и логический подход к созданию искусственного интеллекта, основанный на моделировании рассуждений, и главным козырем которого являлась . Но с 90-х годов прошлого века начал развиваться агентно-ориентированный подход, основанный на применении интеллектуальных агентов и предполагающий, что интеллект является конкретно вычислительной составляющей потенциала машины достигать поставленные перед ней цели.
А в итоге появился гибридный подход, главная идея которого заключается в том, что только комплексное использование символьных и нейронных моделей поможет достичь полноценного спектра вычислительных и когнитивных возможностей. К примеру, нейронные сети могут генерировать экспертные правила рассуждений, а посредством статистического обучения можно сформировать порождающие правила.
Теперь же вернёмся к тесту Алана Тьюринга.
Тест Тьюринга
Тест Тьюринга, как мы и упомянули, предназначен для определения потенциала искусственного интеллекта, близкого к . Классическую интерпретацию данного теста можно выразить так: человек взаимодействует с одним компьютером или человеком. Основываясь на ответах на определённые вопросы, человек должен определить, кто является его собеседником: компьютер или человек. А в функции компьютерной программы входит введение человека в заблуждение и подведение его к неправильному выводу. В процессе теста никто из участников не видит друг друга.
Алан Тьюринг говорил, что машину можно признать мыслящей, если она сможет ввести в заблуждение 30% участников-людей в процессе переписки. И на протяжении десятков лет реализовать этот тест никому не удавалось, но в 2014 году издание «The Independent» сообщило, что компьютерная программа сумела убедить людей в том, что они обмениваются сообщениями с тринадцатилетним мальчиком. Это, собственно говоря, и означает, что по факту тест Тьюринга был пройден.
Интересно то, что компьютерную программу под названием «Юджин Густман» создали именно российские программисты, а сам тест был организован учёными из Университета Рединга в Лондоне в Королевском обществе. В ходе эксперимента 33% участников поверили в то, что общаются с реальным человеком. Кстати, «Юджин» утверждал, что он тринадцатилетний мальчик, живущий в Одессе.
Данный факт, несомненно, является огромнейшим шагом в исследованиях по созданию искусственного интеллекта, однако учёные заявляют, что это достижение может быть использовано киберпреступниками.
«Юджин Густман» — это первая программа, прошедшая тест, хотя есть также и другие программы, близкие к подобному результату. Среди них можно назвать такие как «JFRED», «Elbot the Robot», «Ultra Hal» и «Cleverbot».
По словам одного из основателей «Юджина» Владимира Веселова, основная идея разработчиков заключалась в том, чтобы «Юджин» знал всё и, одновременно, ничего не знал, а на разработку программы с «настоящей» личностью было потрачено огромное количество времени. Профессор из Университета Рединга Кевин Уорвик говорит, что в области искусственного интеллекта до сих пор не было более спорного и знакового события.
Мы же в данном случае не можем не согласиться со специалистами, ведь сам факт того, что машина смогла убедить людей в том, что она человек, может перевернуть всю мировую компьютерную систему. Представьте только, какие вообще могут быть последствия, если кибернетические собеседники, обладающие искусственным интеллектом, смогут вести живую переписку с людьми, а спам-ботов станет невозможно распознать?
Заключение
Что же можно сказать об идее искусственного интеллекта? С одной стороны, она поистине потрясающа, и если искусственный интеллект будет создан, это позволит всему человечеству сделать огромный шаг вперёд в своём развитии. Но если посмотреть на это с критической точки зрения, сознающий искусственный разум, если он попадёт в руки недобросовестных людей, сможет нанести человеку не поддающийся никакому описанию вред. Философствовать на эту тему можно очень и очень долго, но мы не станем этим заниматься – пусть это станет пищей для вашего ума.
Мы же хотим лишь посоветовать вам заниматься , и становиться умнее и образованнее, ведь за вас этого не сделает ни одна машина.
Компьютерная программа, убедила людей, что она является 13-летним мальчиком и тем самым стала первой программой, прошедшей тест Тьюринга.
Тьюринг создал тест для определения того, может ли машина мыслить.
Оригинальный тест состоит в следующем. Человек в течении 5 минут общается с одним компьютером и одним человеком. Получая ответы на вопросы, человек должен определить, что разговаривает с человеком или компьютерной программой. Задачей компьютерной программы является ввести человека в заблуждение, чтобы тот сделал ошибочный выбор.
Участники теста не видят друг друга. В случае, если судья не может точно сказать, кто из собеседников человек, то считается, что компьютер прошел тест. Беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (второстепенного компьютера). Это необходимо, чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь. Переписка производится через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов (в наши дни компьютеры реагируют быстрее чем человек).
Для прохождения теста необходимо, чтобы компьютерная программа смогла обмануть 30 процентов людей.
Компьютерная программа «Евгений Густман», создана командой разработчиков из России, прошла тест, проведенный в Королевском обществе в Лондоне. Она убедила 33 процента судей, в том, что она является 13-летним мальчиком из Одессы, сообщили ученые из Университета Рединга, которые организовали этот тест.
«Наша главная идея заключалась в том, что он может утверждать, что чего-то не знает, в его возрасте действительно он может не знать каких-то вещей» — сказал Владимир Веселов, один из создателей программы, - «Мы потратили много времени на разработку правдоподобного персонажа.»
Успех программы, скорее всего, создаст некоторые опасения по поводу будущего компьютеров, сказал Кевин Уорвик, профессор Университета Рединга и проректор по исследовательской работе в университете Ковентри.
«В области искусственного интеллекта нет более знаковых и противоречивых этапов, чем тест Тьюринга, когда компьютер убеждает достаточное количество судей, в том, что это не машина, а человек» — сказал он. «Имея компьютер, который может обмануть человека, заставить его подумать, что кто-то или даже что-то является человеком, это является тревожным сигналом, связанным с киберпреступностью. Тест Тьюринга является очень важным инструментом для борьбы с этой угрозой. Важно полностью понять, как общение в Интернете в реальном времени может ввести в заблуждение человека, полагающего истинность что-то в то время, когда на самом деле это не так.»
В тесте, организованном в Королевском обществе в субботу, принимало участие пять программ. Судьями были актер Robert Llewellyn, который играл робота Kryten в «Красном карлике» (научная комедия телеканала BBC), и лорд Шарки, который возглавлял кампанию, целью которой была посмертная реабилитация Алана Тьюринга в прошлом году.
Алан Тьюринг представил свой тест в 1950 в статье, «Вычислительная техника и разум». В ней он заявил, из-за того, что «мышление» трудно определить, важно, сможет ли компьютер имитировать реальное человеческое существо. С тех пор он стал одним из ключевых элементов философии искусственного интеллекта.
Успех пришел на 60-летие со дня смерти Тьюринга, в субботу 07.06.2014 года.
Источник: The Independent
P.S. Самостоятельно проверить насколько умна эта программа можно на сайте лаборатории искусственного интеллекта Принстонского университета. Лично у меня не сложилось впечатления что я разговариваю с человеком, пусть даже и с ребенком. Так что тест Тьюринга, мне кажется, не совсем еще пройден.
Как вы оцениваете эту публикацию?
Тест Тьюринга – это тест, как следует из названия, предложенный Аланом Тьюрингом, для определения обладает ли машина интеллектом. Тьюринг решил, что нет смысла разрабатывать обширный список требований, необходимых для создания искусственного интеллекта, который к тому же может оказаться противоречивым, и предложил тест, основанный на том, что поведение объекта, обладающего искусственным интеллектом, в конечном итоге нельзя будет отличить от поведения таких бесспорно интеллектуальных сущностей, как человеческие существа. Компьютер успешно пройдет тест Тьюринга, если человек-экспериментатор, задавший ему в письменном виде определенные вопросы, не сможет определить, получены ли письменные ответы от другого человека или от некоторого устройства. На данный момент составление программы для компьютера, чтобы он прошел тест Тьюринга, требует большого объема работы. Запрограммированный таким образом компьютер должен включать в себя:
- средства обработки текстов на естественных языках (Natural Language Processing – NLP), позволяющие успешно общаться с компьютером, скажем на английском языке;
- средства представления знаний, с помощью которых компьютер может записать в память то, что он узнает или прочитает;
- средства автоматического формирования логических выводов, обеспечивающие возможность использовать хранимую информацию для поиска ответов на вопросы и вывода новых заключений;
- средства машинного обучения, которые позволяют приспосабливаться к новым обстоятельствам, а также обнаруживать и экстраполировать признаки стандартных ситуаций.
В тесте Тьюринга сознательно исключено непосредственное физическое взаимодействие экспериментатора и компьютера, поскольку для создания искусственного интеллекта не требуется физическая имитация человека. Но в так называемом полном тесте Тьюринга предусмотрено использование видеосигнала для того, чтобы экспериментатор мог проверить способности испытуемого объекта к восприятию, а также имел возможность представить физические объекты «в неполном виде» (пропустить их «через штриховку»).
Тьюринг предсказывал, что компьютеры в конечном счёте пройдут его тест. Он считал, что к 2000 году компьютер с памятью 1 миллиард бит (около 119 МБ) в ходе 5-минутного теста сможет обмануть судей в 30 % случаев.
Это предсказание не сбылось. Тьюринг также предсказал, что сочетание «мыслящая машина» не будет считаться оксюмороном, а обучение компьютеров будет играть важную роль в создании мощных компьютеров (с чем большинство современных исследователей согласны).
Пока что ни одна программа и близко не подошла к прохождению теста Тьюринга. Такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza. Но такие «успехи» не являются прохождением теста Тьюринга. Во-первых, человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует. Во-вторых, документированные случаи обычно относятся к таким чатам, где многие беседы отрывочны и бессмысленны. В-третьих, многие пользователи чатов используют английский как второй или третий язык, и бессмысленный ответ программы, вероятно, спишется ими на языковый барьер. В-четвертых, многие пользователи ничего не знают об Элизе и ей подобных программах и не могут распознать совершенно нечеловеческие ошибки, которые эти программы допускают.
Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лебнера. Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лебнера 3 раза (в 2000, 2001 и 2004).
Несмотря на то, что прошло больше 50 лет, тест Тьюринга не потерял своей значимости. Но в настоящее время исследователи искусственного интеллекта практически не занимаются решением задачи прохождения теста Тьюринга, считая, что гораздо важнее изучить основополагающие принципы интеллекта, чем продублировать одного из носителей естественного интеллекта. В частности, проблему «искусственного полета» удалось успешно решить лишь после того, как братья Райт и другие исследователи перестали имитировать птиц и приступили к изучению аэродинамики. В научных и технических работах по воздухоплаванию цель этой области знаний не определяется как «создание машин, которые в своем полете настолько напоминают голубей, что даже могут обмануть настоящих птиц».
Стандартная интерпретация теста Тьюринга
Тест Тьюринга - эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» , опубликованной в 1950 году в философском журнале Mind . Тьюринг задался целью определить, может ли машина мыслить .
Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор ».
Все участники теста не видят друг друга. Если судья не может сказать определённо, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведётся в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.
История
Философские предпосылки
Хотя исследования в области искусственного интеллекта начались в 1956 году , их философские корни уходят глубоко в прошлое . Вопрос, сможет ли машина думать, имеет долгую историю. Он тесно связан с различиями между дуалистическим и материалистическим взглядами. С точки зрения дуализма, мысль не является материальной (или, по крайней мере, не имеет материальных свойств), и поэтому разум нельзя объяснить только с помощью физических понятий. С другой стороны, материализм гласит, что разум можно объяснить физически, таким образом, оставляя возможность существования разумов, созданных искусственно.
Алан Тьюринг
К 1956 году британские учёные уже на протяжении 10 лет исследовали «машинный интеллект». Этот вопрос был обычным предметом для обсуждения среди членов «Ratio Club» - неформальной группы британских кибернетиков и исследователей в области электроники, в которой состоял и Алан Тьюринг, в честь которого был назван тест.
Тьюринг в особенности занимался проблемой машинного интеллекта, по меньшей мере, с 1941 года. Одно из самых первых его упоминаний о «компьютерном интеллекте» было сделано в 1947 году. В докладе «Интеллектуальные машины» Тьюринг исследовал вопрос, может ли машина обнаруживать разумное поведение, и в рамках этого исследования предложил то, что может считаться предтечей его дальнейших исследований: «Нетрудно разработать машину, которая будет неплохо играть в шахматы. Теперь возьмем трёх человек - субъектов эксперимента. А, В и С. Пусть А и С неважно играют в шахматы, а В - оператор машины. […] Используются две комнаты, а также некоторый механизм для передачи сообщений о ходах. Участник С играет или с А, или с машиной. Участник С может затрудниться ответить, с кем он играет».
Таким образом, к моменту публикации в 1950 году статьи «Вычислительные машины и разум», Тьюринг уже на протяжении многих лет рассматривал возможность существования искусственного интеллекта. Тем не менее данная статья стала первой статьёй Тьюринга, в которой рассматривалось исключительно это понятие.
Тьюринг начинает свою статью утверждением: «Я предлагаю рассмотреть вопрос „Могут ли машины думать?“». Он подчёркивает, что традиционный подход к этому вопросу состоит в том, чтобы сначала определить понятия «машина» и «интеллект». Тьюринг, однако, выбрал другой путь; вместо этого он заменил исходный вопрос другим, «который тесно связан с исходным и формулируется относительно недвусмысленно». По существу, он предлагает заменить вопрос «Думают ли машины?» вопросом «Могут ли машины делать то, что можем делать мы (как мыслящие создания)?». Преимуществом нового вопроса, как утверждает Тьюринг, является то, что он проводит «чёткую границу между физическими и интеллектуальными возможностями человека».
Чтобы продемонстрировать этот подход, Тьюринг предлагает тест, придуманный по аналогии с игрой для вечеринок «Imitation game» - имитационная игра. В этой игре мужчина и женщина направляются в разные комнаты, а гости пытаются различить их, задавая им серию письменных вопросов и читая напечатанные на машинке ответы на них. По правилам игры и мужчина, и женщина пытаются убедить гостей, что все наоборот. Тьюринг предлагает переделать игру следующим образом: "Теперь зададим вопрос, что случится, если в этой игре роль А будет исполнять машина? Будет ли задающий вопросы ошибаться так же часто, как если бы он играл с мужчиной и женщиной? Эти вопросы заменяют собой исходный «Может ли машина думать?».
В том же докладе Тьюринг позднее предлагает «эквивалентную» альтернативную формулировку, включающую судью, который беседует только с компьютером и человеком. Наряду с тем, что ни одна из этих формулировок точно не соответствует той версии теста Тьюринга, которая наиболее известна сегодня, в 1952 учёный предложил третью. В этой версии теста, которую Тьюринг обсудил в эфире радио Би-Би-Си, жюри задаёт вопросы компьютеру, а роль компьютера состоит в том, чтобы заставить значительную часть членов жюри поверить, что он на самом деле человек.
В статье Тьюринга учтены 9 предполагаемых вопросов, которые включают все основные возражения против искусственного интеллекта, поднятые после того, как статья была впервые опубликована.
Элиза и PARRY
Блей Витби указывает на четыре основные поворотные точки в истории теста Тьюринга - публикация статьи «Вычислительные машины и разум» в 1950, сообщение о создании Джозефом Уайзенбаумом программы Элиза (ELIZA) в 1966, создание Кеннетом Колби программы PARRY , которая была впервые описана в 1972 году, и Коллоквиум Тьюринга в 1990.
Принцип работы Элизы заключается в исследовании введённых пользователем комментариев на наличие ключевых слов. Если найдено ключевое слово, то применяется правило, по которому комментарий пользователя преобразуется и возвращается предложение-результат. Если же ключевое слово не найдено, Элиза либо возвращает пользователю общий ответ, либо повторяет один из предыдущих комментариев. Вдобавок Уайзенбаум запрограммировал Элизу на имитацию поведения психотерапевта, работающего по клиент-центрированной методике. Это позволяет Элизе «притвориться, что она не знает почти ничего о реальном мире». Применяя эти способы, программа Уайзенбаума могла вводить в заблуждение некоторых людей, которые думали, что они разговаривают с реально существующим человеком, а некоторых было «очень трудно убедить, что Элиза […] не человек». На этом основании некоторые утверждают, что Элиза - одна из программ (возможно первая), которые смогли пройти тест Тьюринга. Однако это утверждение очень спорно, так как людей, «задающих вопросы», инструктировали так, чтобы они думали, что с ними будет разговаривать настоящий психотерапевт, и не подозревали о том, что они могут разговаривать с компьютером.
Коллоквиум по разговорным системам, 2005
В ноябре 2005 года в Университете Суррея проходила однодневная встреча разработчиков ACE, которую посетили победители практических тестов Тьюринга, проходивших в рамках конкурса на получение премии Лёбнера: Робби Гарнер (Robby Garner), Ричард Уоллес (Richard Wallace), Ролл Карпентер (Rollo Carpenter). В числе приглашённых докладчиков были Дэвид Хэмилл (David Hamill), Хью Лёбнер и Хьюма Ша.
Симпозиум общества AISB по тесту Тьюринга, 2008
В 2008 году наряду с проведением очередного конкурса на получение премии Лёбнера, проходившего в Университете Рединга (University of Reading), Общество изучения искусственного интеллекта и моделирования поведения (The Society for the Study of Artificial Intelligence and Simulation of Behavior - AISB) провело однодневный симпозиум, на котором обсуждался тест Тьюринга. Симпозиум организовали Джон Бенден (John Barnden), Марк Бишоп (Mark Bishop), Хьюма Ша и Кевин Ворвик. В числе докладчиков были директор Королевского института баронесса Сьюзан Гринфилд (Susan Greenfield) , Сельмер Брингсорд (Selmer Bringsjord), биограф Тьюринга Эндрю Ходжес (Andrew Hodges) и учёный Оуэн Холланд (Owen Holland). Никакого соглашения о каноническом тесте Тьюринга не появилось, однако Брингсорд предположил, что более крупная премия будет способствовать тому, что тест Тьюринга будет пройден быстрее.
Год Алана Тьюринга и Тьюринг-100 в 2012
В 2012 году отмечался юбилей Алана Тьюринга. На протяжении всего года проходило множество больших мероприятий. Многие из них проходили в местах, имевших большое значение в жизни Тьюринга: Кембридж, Манчестер и Блетчи Парк. Год Алана Тьюринга курируется организацией TCAC (Turing Centenary Advisory Committee), осуществляющей профессиональную и организационную поддержку мероприятий в 2012 году. Также поддержкой мероприятий занимаются: ACM , ASL , SSAISB , BCS , BCTCS , Блетчи Парк , BMC , BLC , CCS , Association CiE , EACSL , EATCS , FoLLI , IACAP , IACR , KGS и LICS .
Для организации мероприятий по празднованию в июне 2012 года столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отражённую в таких голливудских фильмах, как «Бегущий по лезвию », до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.
На этом конкурсе россияне, имена которых не разглашались, представили программу «Eugene » . В 150 проведённых тестах (а по факту пятиминутных разговорах) участвовали пять новейших программ, которые «затерялись» среди 25 обычных людей. Программа «Eugene», изображавшая 13-летнего мальчика, проживающего в Одессе , стала победителем, сумев в 29,2 % своих ответов ввести экзаменаторов в заблуждение. Таким образом, программа не добрала всего 0,8 % для полного прохождения теста.
Тест Тьюринга на русском языке, 2015
В 2015 году компания Наносемантика и Фонд Сколково провели конкурс «Тест Тьюринга на русском языке». Независимые судьи из числа посетителей конференции Startup Village в Москве общались с 8 отобранными экспертным советом роботами и 8 волонтёрами-лингвистами. После 3-х минут разговора на русском языке судьи определяли, кто из их собеседников является роботом, а кто нет. Каждый робот провёл по 15 разговоров. В конкурсе победил робот, созданный Иваном Голубевым из Санкт-Петербурга , - «Соня Гусева». 47 % собеседников приняли его за человека .
Варианты теста Тьюринга
Стоит отметить, что в советской психологии Выготский Л. С. и Лурия А. Р. дали вполне чёткие определения «интеллекта» и «мышления» .
Недостатки теста
Несмотря на все свои достоинства и известность, тест критикуют на нескольких основаниях.
Человеческий разум и разум вообще
Направленность теста Тьюринга ярко выражена в сторону человека (антропоморфизм). Проверяется только способность машины походить на человека, а не разумность машины вообще. Тест неспособен оценить общий интеллект машины по двум причинам:
- Иногда поведение человека не поддаётся разумному толкованию. В это же время тест Тьюринга требует, чтобы машина была способна имитировать все виды человеческого поведения, не обращая внимания на то, насколько оно разумно. Он также проверяет способность имитировать такое поведение, какое человек за разумное и не посчитает, например, реакция на оскорбления, соблазн соврать или просто большое количество опечаток. Если машина неспособна с точностью до деталей имитировать поведение человека, опечатки и тому подобное, то она не проходит тест, несмотря на весь тот интеллект, которым она может обладать.
- Некоторое разумное поведение не присуще человеку. Тест Тьюринга не проверяет высокоинтеллектуальное поведение, например, способность решать сложные задачи или выдвигать оригинальные идеи. По сути, тест требует, чтобы машина обманывала: какой бы умной ни была машина, она должна притворяться не слишком умной, чтобы пройти тест. Если же машина способна быстро решить некую вычислительную задачу, непосильную для человека, она по определению провалит тест.
Непрактичность
Экстраполируя экспоненциальный рост уровня технологии в течение нескольких десятилетий, футурист Рэймонд Курцвейл предположил, что машины, способные пройти тест Тьюринга, будут изготовлены, по грубым оценкам, около 2020 года. Это перекликается с законом Мура .
В проект Long Bet Project входит пари стоимостью 20 000 $ между Митчем Капуром (Mitch Kapor - пессимист) и Рэймондом Курцвейлом (оптимист). Смысл пари: пройдет ли компьютер тест Тьюринга к 2029 году? Определены также некоторые условия пари .
Вариации теста Тьюринга
Многочисленные версии теста Тьюринга, включая описанные ранее, уже обсуждаются довольно долгое время.
Обратный тест Тьюринга и CAPTCHA
Модификация теста Тьюринга, в которой цель или одну или более ролей машины и человека поменяли местами, называется обратным тестом Тьюринга. Пример этого теста приведён в работе психоаналитика Уилфреда Биона , который был в особенности восхищён тем, как активизируется мыслительная активность при столкновении с другим разумом.
Развивая эту идею, Р. Д. Хиншелвуд (R. D. Hinshelwood) описал разум как «аппарат, распознающий разум», отметив, что это можно считать как бы «дополнением» к тесту Тьюринга. Теперь задачей компьютера будет определить с кем он беседовал: с человеком или же с другим компьютером. Именно на это дополнение к вопросу и пытался ответить Тьюринг, но, пожалуй, оно вводит достаточно высокий стандарт на то, чтобы определить, может ли машина «думать» так, как мы обычно относим это понятие к человеку.
CAPTCHA - это разновидность обратного теста Тьюринга. Перед тем как разрешить выполнение некоторого действия на сайте, пользователю выдаётся искажённое изображение с набором цифр и букв и предложение ввести этот набор в специальное поле. Цель этой операции - предотвратить атаки автоматических систем на сайт. Обоснованием подобной операции является то, что пока не существует программ достаточно мощных для того, чтобы распознать и точно воспроизвести текст с искажённого изображения (или они недоступны рядовым пользователям), поэтому считается, что система, которая смогла это сделать, с высокой вероятностью может считаться человеком. Выводом будет (хотя и не обязательно), что искусственный интеллект пока не создан.
Тест Тьюринга со специалистом
Эта вариация теста описывается следующим образом: ответ машины не должен отличаться от ответа эксперта - специалиста в определённой области знаний.
Тест бессмертия
Тест бессмертия - это вариация теста Тьюринга, которая определяет, качественно ли передан характер человека, а именно возможно ли отличить скопированный характер от характера человека, послужившего его источником.
Минимальный интеллектуальный Signal-тест (MIST)
MIST предложен Крисом Мак-Кинстри (Chris McKinstry). В этой вариации теста Тьюринга разрешены лишь два типа ответов - «да» и «нет». Обычно MIST используют для сбора статистической информации, с помощью которой можно измерить производительность программ, реализующих искусственный интеллект.
Мета-тест Тьюринга
В этой вариации теста субъект (скажем, компьютер) считают разумным, если он создал нечто, что он сам хочет проверить на разумность.
Премия Хаттера
Организаторы премии Хаттера считают, что сжатие текста на естественном языке является трудной задачей для искусственного интеллекта, эквивалентной прохождению теста Тьюринга.
Тест по сжатию информации имеет определённые преимущества над большей частью вариантов и вариаций теста Тьюринга:
- Его результатом является единственное число, по которому можно судить какая из двух машин «более разумная».
- Не требуется, чтобы компьютер врал судье - учить компьютеры врать считают плохой идеей.
Основными недостатками подобного теста являются:
- С его помощью невозможно протестировать человека.
- Неизвестно какой результат (и есть ли он вообще) эквивалентен прохождению теста Тьюринга (на уровне человека).
Другие тесты интеллекта
Существует множество тестов на уровень интеллекта, которые используют для тестирования людей. Возможно, что их можно использовать для тестирования искусственного интеллекта. Некоторые тесты (например, Си-тест), выведенные из «Колмогоровской сложности», используются для проверки людей и компьютеров.
Тест BotPrize
Двум командам программистов удалось победить в конкурсе BotPrize, который называют «игровой версией» теста Тьюринга. Сообщение о результатах теста приведено на сайте BotPrize, кратко его результаты анализирует NewScientist. Тест BotPrize проходил в виде многопользовательской компьютерной игры (Unreal Tournament 2004), персонажами которой управляли реальные люди или компьютерные алгоритмы
Преподавательница из технологического университета Джорджии (США) Джилл Уотсон в течение пяти месяцев помогала студентам в работе над проектами по дизайну компьютерных программ. Ее считали выдающимся педагогом вплоть до того момента, когда выяснилось, что Джилл Уотсон не человек, а робот, система искусственного интеллекта на базе IBM Watson . Эту историю рассказали в The Wall Street Journal .
Робот «Джилл» вместе с еще девятью преподавателями-людьми помогала около 300 студентам разрабатывать программы, касающиеся дизайна презентаций, например, грамотного подбора картинок-иллюстраций.
Джилл помогала студентам на интернет-форуме, где они сдавали и обсуждали работы, использовала в своей речи жаргонные и просторечные обороты вроде «угу» («Yep!»), то есть вела себя как обычный человек.
«Она должна была напоминать нам о датах дедлайна и с помощью вопросов подогревать обсуждения работ. Это было как обычный разговор с обычным человеком», - рассказала студентка вуза Дженнифер Гевин.
Другой студент, Шрейяс Видьярти, представлял себе Джилл как симпатичную белую женщину 20-ти с небольшим лет, работающую над докторской диссертацией.
Не заподозрил в человеке робота даже студент Баррик Рид, который два года работал на IBM, создавая программы для «Джилл Уотсон». Даже в имени «Уотсон» он не разглядел подвоха.
Робот был включен в университетскую программу обучения, чтобы избавить преподавателей от огромного потока вопросов, с которыми к ним обращаются в процессе обучения студенты. Робот «Джилл» способен к обучению в отличие от интернет-чатботов.
Строго говоря, этот робот-педагог сдал знаменитый тест Алана Тьюринга, который на протяжении довольно долгого времени считался главным критерием для ответа на вопрос «Могут ли машины мыслить?».
Тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.
Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Все участники теста не видят друг друга. Если судья не может сказать определенно, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.
Алан Тьюринг - знаменитый английский математик и криптограф, во время второй мировой войны разработавший алгоритм для взлома немецкого шифратора «Энигма». Он начинает свою статью утверждением: «Я предлагаю рассмотреть вопрос „Могут ли машины думать?“». Тьюринг подчёркивает, что традиционный подход к этому вопросу состоит в том, чтобы сначала определить понятия «машина» и «интеллект». Словно понимая, что это можно обсуждать до бесконечности, а толку будет немного, Тьюринг выбирает другой путь. Он предлагает заменить вопрос «Думают ли машины?» вопросом «Могут ли машины делать то, что можем делать мы (как мыслящие создания)?».
В окончательной версии теста Тьюринга жюри должно задавать вопросы компьютеру, задача которого - заставить членов жюри поверить, что он на самом деле человек.
Вокруг теста Тьюринга со временем разгорелись жаркие споры экспертов по когнитивистике. Например, американскпй философ Джон Роджерс Сёрл в 1980 году написал статью «Разум, мозг и программы», в которой выдвинул контраргумент, известный как мысленный эксперимент «Китайская комната». Сёрл настаивал, что даже прохождение роботами или программами теста Тьюринга будет означать лишь манипуляцию символами, которых они не понимают. А без понимания нет разума. Значит тест Тьюринга неверен.
Эксперимент «Китайская комната» заключается в том, что испытуемый помещается в изолированную комнату, в которую ему через узкую щель передают вопросы, записанные китайскими иероглифами. С помощью книги с инструкциями по манипуляциям с иероглифами, человек, совершенно не понимающий китайской письменности, сможет правильно ответить на все вопросы и ввести в заблуждение того, кто их задает. Тот будет считать, что отвечающий на его вопросы прекрасно знает китайский язык.
В ходе дискуссии, которая продолжалась все 80-е и 90-е годы вспомнили даже «мельницу Лейбница», то есть мысленный эксперимент великого математика, описанный им в книге «Монадология». Лейбниц предлагает представить машину величиной с мельницу, которая бы могла симулировать чувства, мысли и восприятие. То есть внешне казалась бы разумной. Если зайти внутрь такой машины, то ни один из ее механизмов не будет являться сознанием или мозгом. Думается, что Лейбниц и Сёрл разными способами выразили одну и ту же мысль: даже если машины кажется мыслящей, она на самом деле не мыслит.
Ответа на вопрос «Могут ли машины мыслить?» нет до сих пор по одной простой причине: ученые перестали спорить и пытаются создать такие машины. Возможно, они когда-нибудь преуспеют в этом. Однако, не исключено, что искусственный интеллект обманет даже своих создателей, которые поверят в его разумность и которая на самом деле будет лишь манипуляцией, но такой искусной, что раскрыть ее человеку окажется не под силу. +
В фильме выдающегося советского режиссера -документалиста Семена Райтбурта демонстрируется одна из попыток прохождения теста Тьюринга роботом. В ходе эксперимента, воспроизводимого в фильме, несколько человек задают одинаковые вопросы двум неизвестным собеседникам, пытаясь распознать, кто перед ними - машина или человек. Признаюсь, что я лично ошибся, роботом оказался не тот, на которого я подумал. Поэтому мне вполне понятны чувства студентов «мисс Джилл Уотсон», полгода принимавших ее за человека.
Испытайте себя, товарищи!