En statistiques, on distingue deux notions élémentaires : d'une part la population statistique, d'autre part les individus qui la composent. On définit alors un caractère qui peut être qualitatif (par exemple, une caractéristique physique), ou quantitatif (la taille).
Exemple : On prend comme population l'ensemble des élèves d'une classe. Le caractère étudié peut être la taille, ou bien encore la moyenne générale.
La plupart du temps, on range les données que l'on a recensées dans l'ordre croissant. Mais il est souvent utile de regrouper certaines valeurs de manière à construire des intervalles.
Définitions préliminaires :
Définition : Les valeurs du caractère, rangées dans l'ordre croissant, et les effectifs de cette valeur sont rassemblés dans ce qu'on appelle une série statistique
Remarque : pour faciliter certains calculs, on a souvent intérêt à calculer, en plus, les effectifs cumulés, définis ci-dessous.
Définitions : L'effectif cumulé croissant (respectivement décroissant) d'une valeur x est la somme des effectifs des valeurs y telles que : y £ x. (respectivement y > x ).
Définition : Soit N l'effectif d'une population. Une valeur d'effectif n a pour fréquence f égale à : n/ N
Définition : La valeur modale d'une série statistique est la valeur qui a l'effectif le plus important.
Il suffit de lire les données statistiques pour déterminer la valeur modale d'une série.
Définition : La médiane d'une série statistique est la valeur du caractère qui partage la population en deux effectifs égaux.
Définition : La moyenne arithmétique d'une série statistique est égale à la somme des produits [valeur X effectif correspondant] divisée par l'effectif total. Cette moyenne est notée :
(lire x barre)
Remarque : On parle également de moyenne pondérée pour définir la moyenne arithmétique, car on tient compte du " poids " de chaque valeur, plus ou moins important selon l'effectif.
Définition : dans une population, l'étendue est la différence entre la plus grande valeur prise par le caractère et la plus petite valeur prise.
Définition : Soit X une série statistique. On appelle variance de X la moyenne pondérée des nombres (x - )², (c'est à dire en multipliant chacun d'eux par l'effectif correspondant).
On note la variance de X : V(X)
Remarque : V(X) est toujours un nombre positif ou nul.
Définition : On appelle écart-type d'une série statistique, et on note s la racine carrée de la variance.
On a
Résultats admis : Pour calculer la variance, on calcule la moyenne des carrée x² des valeurs de la série X, en tenant compte de l'effectif de chacun d'elles; puis on retranche à cette moyenne le carré de x barre.
IMPORTANT : Quand les valeurs s'expriment dans une unité donnée (cm, kg…), la moyenne, et l'écart-type s'expriment dans cette même unité.