La préparation des données inclut plusieurs étapes : le traiement des données manquantes, des valeurs extrêmes, et des doublons.

Pour mener à bien cette étape, il convient de sélectioner le traitement adéquat, en fonction des caractéristiques du jeu de données (nature du jeu de données, objectif de l'analyse, nombre d'observations, type et nombre de variables).

L'article suivant décrit précisément la procédure et les règles à utiliser.