Attention-guided Dynamic inference for model compression (Version intégrée)