#marl News & Analysis

15 articles tagged with #marl. AI-curated summaries with sentiment analysis and key takeaways from 50+ sources.

15 articles

AIBullisharXiv – CS AI · May 277/10

🧠

Decoupled Delay Compensation: Enhancing Pre-trained MARL Policies via Learned Dynamics Filtering

Researchers propose a modular state-estimation layer that enhances pre-trained multi-agent reinforcement learning (MARL) policies by compensating for communication delays and packet loss through learned dynamics filtering. The plug-and-play approach combines gated transition models with Kalman filtering to estimate current states from delayed observations, demonstrating significant robustness improvements without requiring retraining of original policies.

AIBullisharXiv – CS AI · Mar 57/10

🧠

HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

Researchers developed HALyPO (Heterogeneous-Agent Lyapunov Policy Optimization), a new approach to improve stability in human-robot collaboration through multi-agent reinforcement learning. The method addresses the 'rationality gap' between human and robot learning by using Lyapunov stability conditions to prevent policy oscillations and divergence during training.

AINeutralarXiv – CS AI · Jun 256/10

🧠

Offline Multi-agent Continual Cooperation via Skill Partition and Reuse

Researchers introduce COMAD, a framework for multi-agent reinforcement learning systems to continually discover and reuse coordination skills from offline data without catastrophic forgetting. The approach uses skill partitioning and density-based reusability estimation to enable agents to efficiently transfer knowledge across sequential tasks in open environments.

AINeutralarXiv – CS AI · Jun 256/10

🧠

GCT-MARL: Graph-Based Contrastive Transfer for Sample-Efficient Cooperative Multi-Agent Reinforcement Learning

Researchers introduce GCT-MARL, a transfer learning framework for multi-agent reinforcement learning that enables faster training across different environments by combining graph-based contrastive learning with adaptive alignment techniques. The method demonstrates significant convergence improvements over from-scratch training in both homogeneous and heterogeneous agent scenarios, while supporting continual learning across sequential tasks.

AINeutralarXiv – CS AI · Jun 236/10

🧠

Sim2O: Efficient Offline-to-Online MARL via Joint Action Composition

Researchers introduce Sim2O, a new framework for offline-to-online multi-agent reinforcement learning (MARL) that combines offline and online action proposals through dynamic blending rather than monolithic joint decisions. The minimalist approach leverages centralized value functions to identify high-value coordination strategies without auxiliary training, demonstrating significant performance improvements over existing baselines.

AIBullisharXiv – CS AI · Jun 236/10

🧠

Decentralized Autonomous Traffic Management through Corridor Networks

Researchers have developed a decentralized multi-agent reinforcement learning approach to manage autonomous aircraft traffic in Advanced Air Mobility (AAM) corridor networks without centralized coordination. The system successfully generalizes policies trained on single corridors to complex multi-corridor scenarios with merges, splits, and varying traffic conditions, suggesting scalable solutions for future autonomous aviation infrastructure.

AINeutralarXiv – CS AI · Jun 116/10

🧠

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

Researchers introduce DOM2, a diffusion-based offline multi-agent reinforcement learning algorithm that significantly improves policy expressiveness and generalization. The method achieves 20x better data efficiency and superior performance across standard benchmarks while maintaining robustness to environment shifts.

AIBullisharXiv – CS AI · Jun 116/10

🧠

Diffusing to Coordinate: Efficient Online Multi-Agent Diffusion Policies

Researchers introduce OMAD, an online multi-agent reinforcement learning framework that integrates diffusion-based generative models for improved policy coordination. The method achieves 2.5-5x improvements in sample efficiency across benchmark tasks by using relaxed policy objectives and joint distributional value functions to enable effective exploration without requiring tractable likelihood calculations.

AINeutralarXiv – CS AI · Jun 26/10

🧠

Explainable deep reinforcement learning reveals energy-efficient control strategies for turbulent drag reduction

Researchers developed a method combining multi-agent deep reinforcement learning with explainable AI techniques to optimize drag reduction in turbulent flows, achieving 34.44% drag reduction with only 0.43% energy input—significantly outperforming traditional opposition control methods.

AINeutralarXiv – CS AI · Jun 26/10

🧠

LLM-Guided Communication for Cooperative Multi-Agent Reinforcement Learning

Researchers propose LMAC, an LLM-driven communication protocol for multi-agent reinforcement learning that enables agents to reconstruct shared state information more accurately and uniformly. The approach iteratively refines communication strategies using explicit state-awareness criteria, demonstrating substantial performance improvements over existing communication baselines across multiple MARL benchmarks.

AINeutralarXiv – CS AI · Jun 16/10

🧠

Interaction-Breaking Adversarial Learning Framework for Robust Multi-Agent Reinforcement Learning

Researchers propose IBAL, an adversarial learning framework that makes multi-agent reinforcement learning systems robust against attacks that disrupt agent coordination through observation and action perturbations. The method addresses a gap in existing defenses by focusing on interaction-breaking attacks rather than value-oriented ones, demonstrating improved resilience across multiple scenarios.

AINeutralarXiv – CS AI · May 276/10

🧠

TABX: A High-Throughput Sandbox Battle Simulator for Multi-Agent Reinforcement Learning

Researchers introduce TABX, a high-throughput multi-agent reinforcement learning simulator built on JAX that enables GPU-accelerated testing of cooperative AI algorithms. The framework prioritizes modularity and customization, allowing systematic investigation of emergent agent behaviors across varying task complexities with significantly reduced computational overhead.

AINeutralarXiv – CS AI · May 126/10

🧠

Beyond Self-Play: Hierarchical Reasoning for Continuous Motion in Closed-Loop Traffic Simulation

Researchers propose a hierarchical reinforcement learning framework that combines multi-agent interaction reasoning with continuous motion control to improve behavioral realism in traffic simulations. The approach outperforms self-play methods by better capturing socially aware driving behaviors while maintaining safety and efficiency in closed-loop SUMO simulations.

AINeutralarXiv – CS AI · May 116/10

🧠

Dynamic one-time delivery of critical data by small and sparse UAV swarms: a model problem for MARL scaling studies

Researchers introduce a family of deterministic games designed to test Multi-Agent Reinforcement Learning (MARL) scalability for decentralized UAV swarm control tasked with relaying critical data. While baseline policies using Dijkstra's algorithm perform comparably to standard MARL algorithms for small agent counts, existing MARL approaches demonstrate significant scalability limitations as swarm size increases.

AIBullisharXiv – CS AI · Mar 176/10

🧠

MA-VLCM: A Vision Language Critic Model for Value Estimation of Policies in Multi-Agent Team Settings

Researchers propose MA-VLCM, a framework that uses pretrained vision-language models as centralized critics in multi-agent reinforcement learning instead of learning critics from scratch. This approach significantly improves sample efficiency and enables zero-shot generalization while producing compact policies suitable for resource-constrained robots.