#process-reward News & Analysis

2 articles tagged with #process-reward. AI-curated summaries with sentiment analysis and key takeaways from 50+ sources.

2 articles

AINeutralarXiv – CS AI · Jun 236/10

🧠

Process-Reward Tactic Evolution for Long-Horizon Bioinformatics Workflows

Researchers introduce Process-Reward Tactic Evolution, a training framework that enables LLM agents to reliably execute complex bioinformatics workflows in Galaxy by accumulating reusable tactics from verified workflow rollouts. The approach combines process verification, curriculum learning, and tactic libraries to improve long-horizon task completion, biological correctness, and execution efficiency compared to baseline methods.

AINeutralarXiv – CS AI · Jun 116/10

🧠

ProcessThinker: Enhancing Multi-modal Large Language Models Reasoning via Rollout-based Process Reward

ProcessThinker introduces a novel post-training method for multimodal large language models that provides step-level process rewards without requiring explicit reward model training. By using rollout-based sampling to verify intermediate reasoning steps, the approach improves visual question answering across multiple benchmarks while reducing computational overhead compared to traditional process reward models.