🧠 AI🟢 BullishImportance 6/10

Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

arXiv – CS AI|Jacob Dineen, Aswin RRV, Zhikun Xu, Ben Zhou|April 7, 2026 at 04:00 AM

🤖AI Summary

Researchers introduce vocabulary dropout, a technique to prevent diversity collapse in co-evolutionary language model training where one model generates problems and another solves them. The method sustains proposer diversity and improves mathematical reasoning performance by +4.4 points on average in Qwen3 models.

Key Takeaways

→Co-evolutionary self-play training suffers from diversity collapse where proposer models converge to narrow problem distributions.
→Vocabulary dropout applies random masks to output logits during training to maintain curriculum diversity.
→Testing on Qwen3-4B and Qwen3-8B models showed sustained diversity across lexical, semantic, and functional metrics.
→The technique yielded solver improvements averaging +4.4 points at 8B scale with largest gains on competition-level benchmarks.
→Explicit action-space constraints similar to game rules can help sustain productive co-evolution in language models.