Cloud World Model - RL Training API