La technique de bootstrap peut être utilisée pour calculer la variance ou l’écart type d’une statistique complexe ou peu commune (par exemple la médiane, un quantile, l’aire sous une courbe ROC pour mesures répétées…).
En général, par bootstrap, on réfère à la technique de rééchantillonnage qui, tel que son nom l'indique, consiste à « RÉ-échantillonner » à l’intérieur d’un échantillon. Ainsi, l’échantillon de départ est en quelques sortes considéré comme une « population » de laquelle sont tirées une série d’échantillons différents.
La première étape consiste à tirer avec remise plusieurs « rééchantillons » de grandeur identique à l’échantillon de départ. 200 rééchantillons sont généralement suffisants. On estime ensuite la variance de notre statistique par la variance des statistiques des rééchantillons (par exemple la variance des médianes des rééchantillons).
Si on souhaite construire un intervalle de confiance, on peut faire un histogramme à partir des statistiques des rééchantillons et vérifier s’il possède une forme approximativement normale. Dans ce cas, on pourra utiliser les propriétés de la loi normale et calculer un intervalle de confiance pour le paramètre en utilisant la forme θ ± 1.96 ES où l’erreur standard (ES) est égale à la racine carrée de la variance calculée plus tôt.
Référence: http://www.stat.wisc.edu/~larget/math496/bootstrap.html
Aucun commentaire:
Publier un commentaire