Ensuite, pour vérifier qu'un motif découvert est bien caractéristique d'une famille de séquences nous pouvons le tester contre une banque de séquences (par exemple : SwissProt, banque annotée par des experts; où la fonction des protéines est donnée systématiquement et de manière fiable).
Dans ses résultats, si le motif est bon (c'est à dire suffisament expressif), l'utilisateur :
- retrouve toutes les séquences de la famille considérée ou presque.
- ne retrouve aucune séquence d'une autre famille ou presque.
Il est également possible de le tester contre une
banque de motifs pour vérifier si le motif découvert a déjà été identifié. S'il existe ses propriétés biologiques sont décrites. Cela permet alors de caractériser son jeu de séquences ou de vérifier la cohérence de ses résultats.
Par exemple si le motif découvert est un site de fixation de facteur de transcription il peut être intéressant d'observer la cohérence entre les gènes étudiés et les informations concernant le(s) facteur(s) de transcription identifiés. Ces informations sont générallement contenues dans les banques de facteurs de transcription, de TFBS ou de modules de régulation.