Les statistiques descriptives permettent d'analyser et de résumer des données. Moyenne, médiane, variance, quartiles et corrélation sont des outils essentiels au bac de Maths et dans la vie courante. Voici 5 fiches pour maîtriser ces notions.
Génère tes propres fiches de Mathématiques en 10 secondes →
La moyenne d'une série x₁, ..., xₙ est x̄ = (Σxᵢ)/n ou x̄ = Σ(xᵢ × nᵢ)/N (série avec effectifs). La médiane Me est la valeur qui partage la série en deux moitiés égales : 50% des valeurs en dessous, 50% au-dessus.
Question probable
Comment calculer la médiane d'une série statistique ?
Réponse
→Pour trouver la médiane : (1) Trier les données par ordre croissant. (2) Si n est impair : médiane = terme central, de rang (n+1)/2. Si n est pair : médiane = moyenne des termes de rang n/2 et n/2+1. Exemple : 3, 5, 7, 9, 11 (n=5) → Me = 7 (3e terme). Exemple : 2, 4, 6, 8 (n=4) → Me = (4+6)/2 = 5. La médiane est plus robuste que la moyenne aux valeurs extrêmes (outliers). Exemple : salaires — la médiane donne une meilleure idée du salaire "typique" que la moyenne (tirée vers le haut par les très hauts salaires).
Mnémotechnique
Médiane = valeur centrale (50%-50%). Impair : terme (n+1)/2. Pair : moyenne des deux termes centraux. Médiane résiste aux outliers.
1 / 5
MAT
Variance et écart-type
Définition
La variance est V = (1/n) Σ(xᵢ − xˉ)2 = (1/n)Σxi2 − xˉ2 (formule de König-Huygens). L'écart-type σ = \sqrtV mesure la dispersion des données autour de la moyenne. Plus σ est grand, plus les données sont dispersées.
Question probable
Comment calculer l'écart-type d'une série ?
Réponse
→Série : 2, 4, 4, 4, 5, 5, 7, 9. x̄ = (2+4+4+4+5+5+7+9)/8 = 40/8 = 5. V = [(2−5)2+(4−5)2+(4−5)2+(4−5)2+(5−5)2+(5−5)2+(7−5)2+(9−5)2]/8 = [9+1+1+1+0+0+4+16]/8 = 32/8 = 4. σ = 4 = 2. Formule de König-Huygens : V = (1/n)Σxi2 − xˉ2 = (4+16+16+16+25+25+49+81)/8 − 25 = 232/8 − 25 = 29 − 25 = 4 ✓. Cette formule est souvent plus rapide à calculer.
Mnémotechnique
V = (1/n)Σ(xi−xˉ)2 = (1/n)Σxi2 − xˉ2. σ = \sqrtV. König-Huygens : V = moyenne des carrés − carré de la moyenne.
2 / 5
MAT
Quartiles et boîte à moustaches
Définition
Q₁ est le premier quartile (25% des données en dessous), Q₂ = médiane (50%), Q₃ est le troisième quartile (75%). L'intervalle interquartile IQR = Q₃ − Q₁ mesure la dispersion centrale. La boîte à moustaches représente min, Q₁, Me, Q₃, max.
Question probable
Comment construire et interpréter une boîte à moustaches ?
Réponse
→Construction : (1) Trier les données. (2) Trouver min, Q₁, Me, Q₃, max. (3) La boîte va de Q₁ à Q₃ (avec une ligne pour Me). Les moustaches vont du min à Q₁ et de Q₃ au max (ou jusqu'à 1,5 × IQR au-delà des quartiles, les valeurs au-delà étant des outliers). Interprétation : la boîte contient 50% des données centrales ; les moustaches montrent la dispersion totale. Les boîtes permettent de comparer des distributions : une boîte large indique plus de dispersion. L'asymétrie se voit si la médiane n'est pas au centre de la boîte.
Mnémotechnique
Q₁ = 25%, Me = 50%, Q₃ = 75%. IQR = Q₃−Q₁. Boîte : |moustache|−−−[Q₁|Me|Q₃]−−−|moustache|. Boîte large = données dispersées.
3 / 5
MAT
Corrélation linéaire
Définition
Le coefficient de corrélation linéaire r mesure la force et le sens de la relation linéaire entre deux variables X et Y. r ∈ [−1 ; 1]. r proche de 1 : forte corrélation positive. r proche de −1 : forte corrélation négative. r proche de 0 : pas de corrélation linéaire.
Question probable
Comment calculer et interpréter le coefficient de corrélation ?
Réponse
→r = (1/n × Σ(xᵢ−x̄)(yᵢ−ȳ)) / (σx×σγ) = cov(X,Y) / (σxσγ). En pratique, la calculatrice donne r. Si |r| ≥ 0,9 (souvent 0,87 en lycée) : corrélation forte → on peut ajuster une droite. La droite de régression de Y en X passe par G(x̄, ȳ) et a pour équation y − ȳ = r(σγ/σx)(x − x̄). Attention : corrélation = causalité. Deux variables peuvent être corrélées sans que l'une cause l'autre (corrélation fallacieuse).
Mnémotechnique
r = cov(X,Y)/(σxσγ). r ∈ [−1;1]. |r| proche de 1 → corrélation forte. Droite de régression passe par G(x̄,ȳ). Corrélation = causalité.
4 / 5
MAT
Droite de régression et prévision
Définition
La droite de régression de Y en X (méthode des moindres carrés) est y = ax + b avec a = cov(X,Y)/V(X) et b = ȳ − ax̄. Elle passe par G(x̄, ȳ) et minimise la somme des carrés des résidus.
Question probable
Comment utiliser la droite de régression pour faire une prévision ?
Réponse
→Étapes : (1) Calculer x̄, ȳ, σx, σγ, r. (2) Vérifier que |r| est suffisamment proche de 1 pour justifier un ajustement linéaire. (3) Calculer a = r ×σγ/σx et b = ȳ − ax̄. (4) Équation de la droite : y = ax + b. (5) Substituer la valeur de x pour faire la prévision. Exemple : si la droite est y = 2x + 5 et qu'on veut prévoir y pour x = 10, on obtient y = 25. Attention : extrapoler au-delà des données peut donner des résultats inexacts — la droite n'est valide que dans la plage des données observées.
Mnémotechnique
Droite régression : y = ax + b. a = cov/V(X) = r×σγ/σx. b = ȳ−ax̄. Toujours vérifier |r| avant d'utiliser. Passe par G(x̄,ȳ).
5 / 5
Génère tes fiches Mathématiques en 10 secondes
Colle ton cours de Mathématiques. FicheIA génère tes fiches structurées instantanément.