Tutorial pattern << lien vers les méthodes de découverte de motifs

<< lien vers l'introduction

Outils de découverte de motifs conservés dans un jeu de séquences personnelles
Nom de l'outil Format des motifs retournés Méthode Type de séquences sources Description
STADEN
(Staden, 1989)
expressions régulières
(classe A)
algorithmique protéiques ou nucléiques Recherche des segments similaires dans un jeu de séquences protéiques ou nucléiques : soit les mots les plus fréquents, soit les mots présents dans le plus de séquences pour rechercher des séquences répétées, avec un nombre d'erreurs autorisé et une taille à définir par l'utilisateur.
PRATT
(Jonassen, 1997)
PRATT
(ExPASY)
PRATT
(Pasteur)
expressions régulières PROSITE
(classe F)
algorithmique protéiques De nombreux critères sont à fixer par l'utilisateur.
PRATT Advanced expressions régulières PROSITE
(classe F)
algorithmique protéiques ou nucléiques Il reprend le logiciel Pratt mais permet d'affiner la recherche en tolérant à une position donnée des acides aminés ayant les mêmes propriétés physico-chimiques et en ajoutant des filtres sur les résultats : en supprimant les motifs inclus les uns dans les autres et/ou en retenant uniquement les motifs ayant un nombre d'occurences par séquence constant. Enfin il peut découvrir des motifs dans des séquences nucléiques. Les résultats sont disponibles sous différents formats : HTML, CVS, XML et FASTA.
Cette version de Pratt a été développée sur la plateforme Genouest.
TERESIAS
(Rigoustsos, I. et A. Floratos, 1998)
expressions régulières algorithmique protéiques ou nucléiques
MoDEL
(Hernandez & al, 2004)
profile et alignement local
(classe C)
algorithmique protéiques ou nucléiques Il utilise deux méthodes : d'abord algorithmique, puis optimisation stochastique : il recherche des ségments similaires d'une certaine taille définie par l'utilisateur.
Cet outil a été interfacé sur la plateforme Genouest.
MEME
(Bayley et Elkan, 1994)
profile, HMM, et consensus stochastique protéiques ou nucléiques Il est surtout utilisé pour rechercher des motifs protéiques très conservés. Pour les motifs nucléiques de petite taille celui-ci se montre peu performant. Il utilise l'algorithme de Expectation-Maximization.
HMMER
(Krogh et al., 1994;Eddy, 1998; Durbin et al.,1998)
HMM stochastique protéiques ou nucléiques C'est une implantation du modèle de Markov caché (HMM, Hidden Markov Model) pour l'analyse de séquences biologiques. Il permet à partir d'un jeu de séquences de créer des HMM, de les comparer à des modèles homologues dans Pfam, et de créer un alignement de chaque séquence contre un consensus. Remarque : ce logiciel a permis de créer la banque de données HMMs Pfam.
SAM
(Sequence Alignement and Modeling software system; R.Hughey & al., 2003)
HMM stochastique protéiques ou nucléiques Collection d'outils pour utiliser les HMM pour l'analyse de séquences biologiques.
ScanProsite
(serveur ExPASY)
expressions régulières PROSITE ou PWM comparaison avec banques de données protéiques Il compare les séquences contre la banque de données PROSITE et ou UniProt (SwiwwProt+TrEMBL) pour trouver les motifs qu'elles contiennent.
PPSEARCH
(EBI)
expressions régulières PROSITE ou PWM comparaison avec banques de données protéiques Il compare les séquences contre la banque de données PROSITE pour trouver les motifs qu'elles contiennent. Il permet une sortie grahique (EBI).
PATTINPROT
(PBIL,2006)
expressions régulières PROSITE ou PWM comparaison avec banques de données protéiques Il scanne une banque de données protéique d'une ou plusieurs séquences pour un ou plusieurs motifs. Cet outil permet d'autoriser une ou plusieurs erreurs dans le ou les motifs et de préciser un seuil de similarité.
PFTOOLS : PFSCAN
(P. Bucher & al., 1996)
profile et HMM comparaison contre une libairie protéiques ou nucléiques Il compare les séquences contre une libairie de profiles
InterProScan
(EBI)
profile et HMM compare dans des banques de données protéiques compare les séquences dans des banques de données PROSITE, PFAM, PRINTS et d'autres banques de donnéees de familles et domaines au choix
Pfam HMM search
(TIGR)
profile et HMM compare dans des banques de données protéiques Il compare les séquences contre la banque de familles protéiques Pfam.
FingerPrintScan
(EBI)
profile et HMM compare dans des banques de données protéiques Il compare les séquences contre la banque d'empreintes protéiques PRINTS


<< lien vers les méthodes de découverte de motifs

<< lien vers l'introduction