Впервые модель искусственного интеллекта официально прошла тест Тьюринга — метод оценки способности машины подражать человеку. В эксперименте, проведенном учеными из Университета Сан-Диего, штат Калифорнийский университет, участники запутали модель GPT-4.5 от Openai с человеком в 73% случаев во время трехстороннего общения.
Тест Тьюринга, предложенный математикой Аланом Тьюрингом в 1950 году, давно считается золотым стандартом для определения человеческого интеллекта машин. В классической версии теста экзаменатора он общается одновременно с человеком и компьютером через текстовый интерфейс и пытается определить, кто он.
В эксперименте приняли участие около 300 человек, которые были случайным образом разделены на две группы: половина проверяли, а другая половина пыталась доказать, что они были людьми. Каждый общается параллельно с человеком и чат -ботом. В конце теста участников попросили определить, какой из двух собеседников был искусственный интеллект.
Тесты проводились в двух версиях: один ИИ был впервые попросил взять на себя роль конкретного человека, такого как молодой интернет -маньяк. В других случаях чат -бот действовал без подсказования. В режиме моделирования две модели достигли результатов более 50%: GPT-4,5 путают с человеком в 75,5%случаев, а Llama из мета-в 64,7%.
Эксперты отмечают, что прохождение теста Тьюринга не означает, что ИИ действительно думает как человек. Современные языковые модели обучаются на огромном количестве текста, генерируемого человеком, что позволяет им мастерски подражать человеческой речи, даже в ситуациях, когда они не понимают объект.