Задача:
Методы ... позволяют создавать вредоносные входные данные, основываясь на полной осведомленности о модели:
Варианты ответа:
- Методы ограниченного черного ящика
- Методы белого ящика
Решение:
Этот вопрос касается классификации методов атак на модели машинного обучения, в частности, создания так называемых "состязательных примеров" (adversarial examples). Ключевая фраза здесь — "основываясь на полной осведомленности о модели".
Давайте вспомним определения:
- Методы "белого ящика" (White-box methods): Эти методы предполагают, что атакующий имеет полный доступ к внутренней структуре, архитектуре, параметрам (весам), функциям активации и даже градиентам модели. Имея такую полную информацию, атакующий может очень точно и эффективно вычислять, как нужно изменить входные данные, чтобы модель сделала ошибочное предсказание, при этом изменения во входных данных остаются незаметными для человека. Примеры таких атак включают FGSM (Fast Gradient Sign Method), PGD (Projected Gradient Descent) и другие.
- Методы "черного ящика" (Black-box methods): Эти методы предполагают, что атакующий не имеет доступа к внутренней структуре модели. Он может только подавать входные данные и наблюдать за выходными предсказаниями модели. Создание вредоносных примеров в этом случае гораздо сложнее и часто требует большего количества запросов к модели или использования суррогатных моделей.
- Методы "ограниченного черного ящика" (Limited/Restricted Black-box methods): Это подкатегория методов черного ящика, где доступ к модели может быть немного шире, чем просто "вход-выход", но все еще не полный. Например, может быть доступ к вероятностям классов, но не к градиентам.
Вопрос явно указывает на "полную осведомленность о модели". Это является определяющей характеристикой методов "белого ящика". Именно полный доступ к внутренностям модели позволяет создавать наиболее эффективные и целенаправленные вредоносные входные данные.
Вывод:
Методы "белого ящика" используются для создания вредоносных входных данных, когда атакующий обладает полной информацией о внутренней структуре и параметрах целевой модели.
Правильный ответ:
Методы белого ящика
