Tutorial pattern << lien vers les méthodes de recherche de motifs

<< lien vers l'introduction

Outils de recherche de motifs connus dans des séquences personnelles, des génomes ou des banques de données
Nom de l'outil Format du motif type de motif séquence cible Description
PatternMatching Expressions régulières
PROSITE
protéique et nucléique séquences personnelles nucléiques ou protéiques au format FASTA Il peut rechercher plusieurs motifs.
Cet outil a été interfacé sur la plateforme Genouest.
WAPAM Expressions régulières
PROSITE
(automate pondéré)
protéique et nucléique banque de données publique ou génome ou séquences personnelles protéiques ou nucléiques au format FASTA Le motif est écrit au format PROSITE par l'utilisateur puis transformé en automate pondéré par WAPAM. Cet automate peut être modifié par l'utilisateur pour attribuer plus ou moins de poids à une transition (c'est à dire favoriser une base à une position plutôt qu'une autre ou tolérer plus ou moins d'erreurs dans le motif). Un manuel utilisateur est en ligne. Les résultats sont disponibles sous différents formats : HTML, CVS, XML et FASTA.
Cet outil a été développé par l'équipe de recherche Symbiose (IRISA/INRIA, Rennes) et interfacé par la plateforme Genouest.
RAMdbP
1995
Expressions régulières protéique une ou plusieurs banques de données protéiques au choix. La recherche de motifs peut se faire dans les banques protéiques : SwissProt, PiR-Nbrf, TrEMBL ou Nrl3D.
Fuzznuc (EMBOSS) Expressions régulières
PROSITE
nucléique séquences personnelles Formats des séquences : EMBL, FASTA, GCG, GDE, GENBANK, IG, NBRF, PIR, RAW and SWISSPROT. Une documentation est en ligne.
ScanACE
1999
profile nucléique séquence nucléique ScanACE (Scans for Nucleic Acid Conserved Elements) est un programme qui scanne une séquence nucléique pour rechercher les éléments qui matchent avec un motif nucléique. Il utilise l'approche de matrice pondérée dont les poids sont assignés par la méthode de Berg et von Hippel.ScanACE est également capable de retourner des informations sur l'environnement génomique de chaque site trouvé. Il n'y a pas d'interface Web, mais il est téléchargeable. Documentation du programme
Matrix-Scan (RSA Tools) profile nucléique séquence nucléique C'est un programme qui scanne une séquence nucléique pour rechercher les éléments qui matchent avec un motif nucléique. Un manuel utilisateur est en ligne.
Patser (RSA Tools) profile protéique ou nucléique séquences protéiques ou nucléiques Cet outil scanne les séquences avec une ou plusieurs position-specific scoring matrices (PSSM) pour identifier les instances des motifs correspondants. Un tutoriel est en ligne.
PatMatch expressions régulières nucléique ou protéique séquences de levure Ce programme permet de rechercher des courtes séquences (<20 bases) nucléique ou protéique, ou des motifs ambigüs ou dégénérés. Il utilise le même jeu de données que les programmes BLAST et FASTA de SGD. Il va rechercher des hits qui ne se superposent pas.
RAMdbN
1995
Expressions régulières protéique et nucléique le génome de Saccharomyces cerevisiae Il effectue une recherche sur l'un ou l'autre brin ou les deux.
scanProsite PROSITE ou identifiant PROSITE protéique PDB ou SwissProt ou TrEMBL ou séquences personnelles Descriptif de cet outil
3of5
2006
expressions régulières protéique ou nucléique séquences protéiques ou nucléiques Il peut décrire des motifs très ambigüs de type nofm ex :(3of5)(KR) signifie que l'on veut au moins 3 K et/ou R sur 5 positions. La synthaxe des expressions régulières est bien décrite sur l'interface de l'outil ainsi qu'une documentation sur son utilisation.
PROMI
2005
expressions régulières
PROSITE
protéique séquences personnelles ou de nombreux génomes au choix de bactéries, insectes ou plantes PROMI (PROfile analysis by Mutual Information) permet de choisir d'afficher les motifs cheuvauchants ou non. Une aide est disponible en ligne
MOTIF PROSITE ou HMM protéique banques de données protéiques publiques au choix (SwissProt, PDBSTR, GENE, PIR, PRF, NR-AA)
STAN expressions régulières basées sur les SVG protéique ou nucléique génomes entiers ou dans une grande séquence nucléique personnelle (limitée à 1Mb) La synthaxe du motif est basée sur les SVG ou String Variable Grammar. Celle-ci est détaillée sur l'interface de l'outil. C'est un langage plus expressif que le PROSITE pour décrire les palindromes et les répétitions. La recherche est très rapide car le génome ou la séquence est indexée en arbre des suffixes (manuel en ligne). Les résultats sont disponibles sous différents formats : HTML, CVS, XML et FASTA.
Cet outil a été développé par l'équipe de recherche Symbiose (IRISA/INRIA, Rennes) et interfacé sur la plateforme Genouest.
Genebee service
1992
PROSITE/alignements protéique banques protéiques SwissProt ou PDB Une aide est en ligne
Profit (EMBOSS) profile réalisé par Prophecy (EMBOSS) protéique ou nucléique un jeu de séquences ou une banque Descriptif
MAST
1998
profile nucléique banques de données spécialisées ou dans une séquence personnelle nucléique au format FASTA (1,000,000 caractères maximum) Documentation
Motifscanner
2005
profile nucléique séquences personnelles nucléiques au format FASTA C'est un programme qui peut être utilisé pour scanner des séquences nucléiques avec des modèles de motifs précompilés (pour de nombreux organismes). L'algorithme est basé sur un modèle de probabilité.
CREAD
2005
profile (Transfac) nucléique séquences personnelles nucléiques au format FASTA Les séquences personnelles nucléique au format FASTA sont indexées en arbre des suffixes. Cet outil n'est pas interfaçée.
FastFind consensus nucléique banques de données de cDNA Liste un jeu d'EST et cDNA qui contiennent le motif.


<< lien vers les méthodes de recherche de motifs

<< lien vers l'introduction