La mesure de la fiabilité dans les situations d’enquête est plus difficile et moins facilement exécutée que dans les études par observation.
Alors qu’il est possible d’observer une certaine action à plusieurs reprises, il n’est généralement possible de répéter une enquête qu’une seule fois. Cela conduit à la méthode test-retest, qui consiste à comparer deux tests pour connaître leur degré de fiabilité. La méthode consiste à administrer le test au même groupe d’individus à deux occasions différentes.
On détermine ensuite un coefficient test-retest parfois appelé coefficient de stabilité. Le coefficient de fiabilité, dans ce cas, est simplement le coefficient de corrélation produit-moment de Pearson entre les scores obtenus par les mêmes personnes lors des deux administrations du test.
La méthode est illustrée par un exemple ci-dessous.
Exemple de la méthode test-retest
Considérez un groupe d’adolescents à qui l’on a demandé de nommer quelques méthodes de contraception à un moment donné. Les réponses rapportées ont été enregistrées sous forme de chiffres 0, 1,2, etc.
A une date ultérieure, on a posé les mêmes questions au même groupe, et leurs réponses ont été enregistrées exactement de la même manière.
Le coefficient de corrélation calculé à partir de ces deux ensembles de scores nous fournit une mesure de la stabilité. Nous l’illustrons dans le tableau ci-joint, et Le coefficient de corrélation produit-moment est calculé comme suit :
Avec 8 df, le r de Pearson est significatif à 0,05 (une valeur de table de 0,632 est requise pour que r soit significatif). Ainsi, la fiabilité est établie à 0,745, une valeur acceptable pour ce type de test.
Le principal inconvénient de cette méthode est que si le retest est donné trop rapidement, le premier test sensibilise les répondants au sujet, et par conséquent, le répondant se souviendra des réponses déjà données et les répétera.
Ce qui conduit à des indicateurs de fiabilité biaisés dans la direction ascendante.
Deuxièmement, les opinions peuvent changer à cause des influences situationnelles avant le retest. Dans ces cas, il y a un biais vers le bas dans les scores de stabilité.
Cela implique que plus l’intervalle de temps entre deux administrations successives est long, plus le coefficient de corrélation est faible, ce qui indique une mauvaise fiabilité.