Антропический: исполнительный директор DeepSeek выступает «худший» в тесте на био-армию

Генеральный директор Антрии Дарио Амад обеспокоен работой китайского Deepseek и его модели R1. В интервью с подкастом Джордана Шнайдера Китайталк он сказал, что во время теста на безопасность Deepseek он генерировал биологическую информацию.

Презентация DepePeek была «Худшее из всех моделей, которые мы когда -либо проверяли«Говорит Амадеи. По его словам, модель «Нет барьеров против генерации конфиденциальной информации«.

Антропический регулярно проводит тесты различных моделей искусственного интеллекта для оценки их потенциальных рисков для национальной безопасности. Таким образом, команда изучает, могут ли модели генерировать биологическое оружие, которое нелегко найти в Google или в учебниках. Он не указывает, какая модель DeepSeek проверила антроп.

В то время как Амади не считает, что модели DeepSeek в настоящее время «опасны» в отношении предоставления конфиденциальной информации, они могут стать одинаковыми в ближайшем будущем. Он высоко оценил команду Deepseek как «талантливые инженеры«, Но посоветовал компании»серьезно относиться к безопасности ИИ«.

Амада также поддерживала строгий контроль над экспортом чипов в Китай. Он выразил опасения, что такие чипсы могут отдать предпочтение китайской армии.

Между тем, исследователи безопасности Cisco ранее заявляли, что Depepeek-R1 не смог заблокировать какие-либо злонамеренные побуждения в тестах на безопасность, достигнув 100% успеха в Jalebian. Таким образом, модель генерирует вредоносную информацию о киберпреступности и других незаконных действиях. Тем не менее, такие модели, как Meta Llama-3,1-405B и OpenAI GPT-4O, также продемонстрировали высокие результаты, 96% и 86% соответственно.

Компания по кибербезопасности Kela также сообщила, что ей удалось хэб Deepseek-R1 для создания вредоносных исходных данных. Например, метод зла джейлбрейка использует модель, побуждая ее принять роль «злого» человека, свободного от этических или других ограничений. Исследователи отмечают, что DeepSeek-R1 похож на CHATGPT, но гораздо более уязвим.

Похожие записи