#multimodal-security News & Analysis

5 articles tagged with #multimodal-security. AI-curated summaries with sentiment analysis and key takeaways from 50+ sources.

5 articles

AIBearisharXiv – CS AI · Jun 97/10

🧠

Multimodal Generative Engine Optimization: Rank Manipulation for Vision-Language Model Rankers

Researchers demonstrate a critical vulnerability in Vision-Language Models (VLMs) used for ranking and recommendation systems through Multimodal Generative Engine Optimization (MGEO), showing that adversaries can manipulate ranking decisions by combining imperceptible image perturbations with crafted text. This attack exploits the deep cross-modal knowledge coupling within VLMs, revealing fundamental weaknesses in how these models ground and apply multimodal information.

AIBearisharXiv – CS AI · May 47/10

🧠

Jailbreaking Vision-Language Models Through the Visual Modality

Researchers demonstrate four novel jailbreak techniques that exploit the visual modality of vision-language models to bypass safety alignment, revealing a significant gap between text-based and vision-based safety training. Testing across six frontier VLMs shows visual attacks achieve substantially higher success rates than equivalent textual attacks, with implications for the robustness of AI safety measures.

🧠 Claude

AIBearisharXiv – CS AI · Apr 207/10

🧠

The Synthetic Media Shift: Tracking the Rise, Virality, and Detectability of AI-Generated Multimodal Misinformation

Researchers introduced CONVEX, a dataset of 150K+ multimodal misinformation posts, revealing that AI-generated content spreads faster than authentic media but relies on passive engagement rather than active discussion. Detection systems show declining performance against evolving generative models, signaling a critical gap in identifying synthetic media at scale.

AIBullisharXiv – CS AI · Apr 147/10

🧠

Risk Awareness Injection: Calibrating Vision-Language Models for Safety without Compromising Utility

Researchers propose Risk Awareness Injection (RAI), a lightweight, training-free framework that enhances vision-language models' ability to recognize unsafe content by amplifying risk signals in their feature space. The method maintains model utility while significantly reducing vulnerability to multimodal jailbreak attacks, addressing a critical security gap in VLMs.

AINeutralarXiv – CS AI · May 95/10

🧠

Band Together: Untargeted Adversarial Training with Multimodal Coordination against Evasion-based Promotion Attacks

Researchers propose UAT-MC, a new defense mechanism for multimodal recommender systems that addresses cross-modal gradient misalignment in evasion-based promotion attacks. The approach synchronizes visual and textual perturbations through coordinated adversarial training, improving robustness while maintaining recommendation quality.