Інженер Microsoft Шейн Джонс надіслав до Сенату США листа, де стверджує, що виявив вразливості генератора зображень DALL-E 3 від OpenAI, які можуть дозволити користувачам створювати картинки з порно (як-от скандальні діпфейки з Тейлор Свіфт) або сценами насильства. Дійшовши висновку, що DALL·E 3 становить загрозу громадській безпеці і має бути вилучений з публічного доступу аж до усунення всіх експлойтів, пан Джонс проінформував про це своє начальство у Microsoft. Керівники попросили інженера надіслати звіт прямо до OpenAI, що він і зробив, на додачу опублікувавши на LinkedIn лист до Ради директорів OpenAI із закликом призупинити доступ користувачів до DALL-E 3. Та натомість юристи Microsoft зажадали, аби пан Джонс прибрав своє послання, і надалі ігнорували усі запити стурбованого інженера. 

У компанії OpenAI підтверджують, що отримали звіт Шейна Джонса, але запевняють, що виявлені вразливості не можуть обійти фільтри системи безпеки, а, крім того, у DALL-E 3 додане відхилення запитів, які містять ім’я публічної особи. Над перевіркою інструментів генеративного ШІ працює «червона команда» експертів (фахівці, які тестують системи на проникнення), і для посилення заходів безпеки, кажуть в OpenAI, вони використовують багатосторонній підхід.  

Невідомо, чи переконає це сенаторів, особливо на тлі скандалу із діпфейками Тейлор Свіфт, та вимогами до законодавців захистити публічних (і не лише публічних) осіб від порнографічних фальшивок. Шейн Джонс закликає уряд США створити систему відстеження конкретних вразливостей ШІ-інструментів, змусити розробників звітувати про них, і захистити тих співробітників, які «доносять до громадськості правду про ризики ШІ».  

Літературний редактор.

Коменти