Tutorial pattern << lien vers les méthodes de découverte de TFBS

<< lien vers l'introduction


Outils de découverte de sites de fixation de facteurs de transcription conservés dans un jeu de séquences promotrices de gènes co-régulés
Nom de l'outil Format des motifs retournés Méthode Type de séquences sources Description
YMF
(Sinha & Trompa, 2002)
expressions régulières énumérative promotrices nucléiques qui doivent contenir moins de 10000 caractères Il détecte les motifs sur-représenté statistiquement dans les séquences. Il utilise des HMM qu'il a prédéfini pour certains organismes sinon l'utilisateur peut créer son propre modèle en entrant des séquences promotrices de l'organisme étudié. Il fonctionne mieux sur le navigateur Internet Explorer que sur Firefox.
Oligo-analysis
(RSA Tools, J. van Helden,1997-98)
expressions régulières énumérative promotrices nucléiques Il ne permet pas de trouver des motifs dont la séquence est variable. Il s'est montré efficace pour les génomes bactériens et les génomes de levures, de drosophile et d'Arabidopsis thaliana.
Dyad-analysis
(RSA Tools, J. van Helden,1998)
motifs structurés énumérative promotrices nucléiques C'est une extension de Oligo-analysis qui permet l'identification de motifs structurés composés de 2 blocs séparés par un spacer. Il implique que les blocs soient conservés à l'identique. Il s'est montré efficace pour les génomes bactériens et les génomes de levures, de drosophile et d'Arabidopsis thaliana.
Risotto
(Pisanti & al., 2006)
motifs structurés (classe F) énumérative promotrices nucléiques Comme Dyad-analysis il recherche des motifs structurés. La recherche est basée sur le parcours d'un arbre des suffixes à partir des séquences en entrée. Il est plutôt bien adapté pour les motifs long. Il teste ensuite la représentativité des résultats par une méthode appelée shuffling qui consiste à reprendre chaque séquence et à mélanger celle-ci pour en constiituer une nouvelle ayant le même biais. Cela permet alors d'observer les nouveaux résultats et évaluer si les résultats initiaux ne sont pas dûs au hasard en effectuant des calculs statistiques. Il a été interfacé sur la plateforme Genouest.
TRED : Motif Analysis DWE
(Pavel Sumazin et al.)
expressions régulières énumérative promotrices nucléiques L'interface propose lien vers un outil d'extraction de séquences promotrices. Il propose également des modèles de humains, souris et vertébrés.
SCOPE
(J.M. Carlson & al., 2007)
consensus ou PWM BEAM, PRISM, et SPACER promotrices nucléiques ou noms de gènes et nom d'espèce Il utilise 3 algorithmes spécifiques d'une catégorie de motifs : BEAM pour les motifs courts, PRISM pour les motifs courts dégénérés, et SPACER pour les motifs longs très dégénérés. Les résultats sont ensuite fusionnés et les meilleurs scores sont retenus. Il est rapide 1 à 5 minutes. Il donne une significativité statistique des résultats, et le nombre d'occurences. Il est configuré pour les génomes eucaryotes et procaryotes. Il s'est montré performant pour les procaryotes et les levures, moins pour les eucaryotes.
Bioprospector
(X Liu & al., 2001)
PWM Gibbs sampling promotrices nucléiques Il utilise l'algorithme de Gibbs sampling avec plus de flexibilités et de sensibilité. Ce programme a été testé sur les levures et les bactéries et a donné de bons résultats.
CompareProspector
(2004)
PWM Gibbs sampling et conservation inter-espèce promotrices nucléiques Pas d'aide diponible.
AlignACE
(Hughes et al.,2000;Roth et al.1998)
PWM Gibbs sampling promotrices nucléiques (moins de 50Kb) Il a donné de bons résultats sur la levure. Il est téléchargeable.
Motif sampler
(Thijs G. et al., 2001)
PWM Gibbs sampling+modèle de Markov caché promotrices nucléiques (nombre de séquences limité à 150) Pour améliorer les performances de cet outil il est possible de se baser sur certains organismes modèles dont ceux ci sont précalculés ou que l'utilisateur peut construire.
Gibbs
(A. Neuwald et al.,1995)
PWM Gibbs sampling promotrices nucléiques Manuel et tutoriel en ligne.
Ann-Spec1.0
(Workman et al, 2000)
PWM Gibbs sampling+réseaux neuronaux IDgenbank, Affy ID, yeast ID, yeast ORF, name ou yeast ORF ID. Pour le moment il n'est disponible que pour les génomes de levure et d'humain.
Improbizer
(Kent, 2000)
PWM EM séquences d'RNA ou DNA Il se base sur un modèle généré par l'utilisateur (il n'en a pas de précalculés). Une aide est disponible sur l'interface Web.
EmnEM1.0
(Moses et al. 2004)
PWM EM+phylogénie promotrices nucléiques Documentation. Il est à télécharger, il n'y a pas d'interface Web.
PhyloMe
(Saurabh Sinha et al., 2004)
PWM EM+phylogénie promotrices nucléiques Il est à télécharger, il n'y a pas d'interface Web.
PhyloGibbs
(Siddharthan R et al.,2005)
PWM EM+phylogénie promotrices nucléiques Il est à télécharger, il n'y a pas d'interface Web.
A-GLAM
(K. Tharakaraman et al., 2006)
PWM Gibbs sampling+PSI-Blast promotrices nucléiques Après avoir utilisé gibbs sampling il scanne les séquences pour trouver les occurences multiples d'éléments fonctionnels en utilisant PSI-Blast.
Il est téléchargeable, il n'y a pas d'interface Web.
TESS
(Jonathan Schug et al., 2003)
PWM, consensus utilisation des banques de données promotrices nucléiques Il peut identifier des TFBS en utilisant des séquence consensus ou des PWMs de TRANSFAC, JASPAR, IMD, et leur banque de données CBIL-GibbsMat. Vous pouvez utiliser TESS pour rechercher des motifs dans vos propres séquences.
FootPrinter 3.0
(m. Blanchette et M. Tompa, 2003)
consensus phylogénie recherche des courtes séquences très conservées dans des séquences régulatrices homologues non alignées selon le critère de parcimonie. Téléchargeable ou interface Web. Un manuel est en ligne
rVISTA
PWM phylogénie et utilisation de banques de données promotrices nucléiques Il aligne 2 à 100 séquences, puis utilise le programme Match de Transfac. Voir le descriptif
WEEDER H 1.0
(Giulio Pasevi et al, 2007)
phylogénie promotrices nucléiques homologues (weeder H) ou dans une seule espèce (Weeder) Il fait parti d'un ensemble d'outils de découverte de motifs dans des séquences nucléiques.Il analyse les séquences homologues pour rechercher les sites conservés. Voir le descriptif
Il est téléchargeable et possède une interface Web.
MULAN
dcode project (Ivan Ovcharenko et al.,2005)
PWM phylogénie et utilisation de banques de données Il utilise l'alignement multiple local pour trouver les TFBS conservés entre les espèces. Il utilise ensuite MultiTF pour identifier les TFBS en se basant sur la banque de données Transfac. Cet outil donne une bonne visualisation des résultats. Voir le descriptif
Opossum 1.3
(Ho-Sui SJ et al., 2005)
PWM utilisation de banques de données promotrices nucléiques Il combine une base de données de TFBSs conservés dans les promoteurs humains et de souris et de vers (C. elegans/C. briggsae) avec des méthodes statistiques pour l'identification de sites sur-représentés dans un jeu de séquences promotrices de gènes co-régulés. Voir le descriptif





Outils de découverte de modules de sites de fixation de facteurs de transcription dans un jeu de séquences promotrices de gènes co-régulés
Nom de l'outil Résultats Méthode Sources Description
TFBScluster
(Donaldson IJ et Göttgens B,2006)
fichier (texte ou HTML) contenant les positions dans le génome des clusters prédits, les gènes identifiés, etc. basé sur des données de régulation connues et phylogénie Nombre de TFBS attendus dans le cluster (max.5), puis leurs noms et l'organisme à comparer. Il recherche les clusters de TFBSs conservés entre les génomes de mammifères. Il existe deux versions de l'outil : une pour l'humain l'autre pour la souris. Voir le descriptif de l'outil
ModuleSearcher, TOUCAN
(Aerts S. et al, 2003)
basé sur des données de régulation connues un fichier GFF contenant une collection de matrices (Jaspar ou Transfac) Il détecte les clusters de TFBSs dans les séquences génomiques.
MotifCombinator
(Mamoru Kato et Tatsuhiko Tsunoda, 2007)
basé sur des données de régulation connues un fichier FASTA avec la séquence et un fichier contenant les données d'expression Utilise des méthodes de régression pour trouver des combinaisons de motifs de régulation. Il est basé sur le banque de données Jaspar pour récupérer les motifs ou ils sont rentrées manuellementVoir la description de l'outil
CMAnalyst
(A. Kel et al., 2006) projet Biobase.
analyse à composante principale séquences promotrices il utilise les modules de Transfac pour identifier des modules de régulation.Exemple d'utilisation. Formulaire Web
Cluster-Buster
(A. Kel et al., 2006) projet Biobase.
graphismes, positions des TFBS des modules identifiés méthode Utilise les séquences promotrices et des motifs prédéfinis ou rentrés par l'utilisateur (PWMs). Il existe une interface Web et il peut être également téléchargé. Description



Plateformes Web multi-outils pour l'analyse des régions de régulation
Nom de l'outil Format des motifs retournés Méthode Type de séquences sources Description
GEMSLauncher
MatInspector

(Genomatix
Cartharius et al., 2005)
PWM ou consensus basé sur des données de régulation connues promotrices nucléiques Suite d'outils pour l'analyse de promoteurs. MatInspector pour la recherche de TFBS sur-représentés dans un jeu de séquences ou une base de données. Il permet une analyse comparative de matrices avec une interface conviviale.
Logiciel payant.
BEARR
(Vinsensius B. Vega, 2004)
PWM, consensus basé sur des données connues identifiants de gènes à partir de données de microarray Il permet l'identification, l'extraction et l'analyse des régions régulatrices. Tutoriel en ligne
POXO
ex : POCO pour la découverte de TFBS
(Matti Kankainen et al., 2006)
consensus énumératif et comparaison de séquences séquences promotrices POXO regroupe plusieurs outils de découverte de motifs de type TFBS : évaluation fonctionnelle et regroupement de gènes co-régulés, extraction de séquences régulatrices, découverte de motifs et vérifications (recherche de motifs sur-représentés (POCO)).
CREDO
(Hindemitt, 2005)
différents algorithmes Ce logiciel réunit plusieurs algorithmes : AlignACE, DIALIGN, FootPrinter, MEMe, et MotifSampler, et permet de comparer les résultats. Voir le descriptif
PromAn
(A. Lardenois et al., 2006)
utilisation de motifs connus (consensus ou PWMs) pour les identifier et phylogénie séquences promotrices (20Kb max.) C'est un module Web dédié à l'analyse des promoteurs. Il combine des programmes de prédictions et des bases de données expérimentales (Jaspar et Transfac) afin d'identifier des sites de fixation de facteurs de transcription et les régions promotrices. Des méthodes phylogéniques et alignements multiples de séquences sont utilisés afin d'évaluer les prédictions. Une interface graphique interactive permet d'analyser les résultats. Descriptif de l'outil
Jannotatix
(M. Haeussler,2005)
Il permet de lancer des algorithmes de prédictions ou d'annotation d'un jeu de séquences. La principale application est la découverte de motifs dans les séquences promotrices.
TOUCAN2 (S. Aerts, 2004)
C'est un ensemble d'outils qui permettent d'analyser les séquences régulatrices de génomes de métazoaires : génomique comparative, détection de sites de fixation de facteurs de transcription et détection de modules de cis-régulation dans un jeu de gènes corégulés. Il inclut: MotifScanner, MotifLocator, ModuleSearcher, ModuleScanner, MotifSampler, AVID, LAGAN, BLASTZ, FootPrinter, Consensus, Match. Tutoriel en ligne et manuel en ligne.
RSA Tools
C'est un ensemble d'outils destinés à l'analyse de séquences. Tutoriel en ligne
DRAGON GENOME EXPLORER 1.0
(Vladimir B Bajic)
Ensemble d'outils et de bases de données pour analyser et extraire des données biologiques (surtout sur ADN, RNA, cDNA et EST). Description générale

Outils d'extraction de séquences promotrices
Nom de l'outil Organisme Description
Promoter retrieval page
Humain, Rat, Souris, autres par noms de gènes ou numéros d'accession
Sequence retrieval
Tous par noms de gènes ou numéros d'accession (NCBI). Manuel utilisateur en ligne
PEG
Tous par noms de gènes ou numéros d'accession (GeneBank). Il aligne des séquences d'ARNm sur le génome et retient la région en amont.. Pas d'interface Web. Téléchargeable.
RSA Tools
Tous Par noms de gènes ou IDs. Il aligne des séquences d'ARNm sur le génome et retient la région en amont. Tutoriel en ligne
PROMOSER
Humain, souris, rat Par séquences ou numéros d'accession GeneBank. Il aligne des séquences d'ARNm sur le génome et retient la région en amont. Description de l'outil
PromoterInspector
Il identifie la région promotrice en exploitant sa composition.
Dragon Promoter finder 1.5
Vertébrés Une séquence nucléique. Il identifie la région promotrice en exploitant sa composition
McPromoter
Il identifie la région promotrice en exploitant sa composition.
PromH
Utilise les séquences othologues. Aide en ligne
SCPD
Levure par noms de gènes
Yeastract
Levure Par noms de gènes. extrait des séquences de -1 à -1000
CEPDB C. elegans Par nom de gènes


<< lien vers les méthodes de découverte de TFBS

<< lien vers l'introduction