Sommaire

Bioinformatique

Le terme bioinformatique regroupe un ensemble de techniques et outils liées aux mathématiques et à l'informatique dont le but est l'interprétation des données biologiques. Ces données biologiques concernent essentiellement deux types de macromolécules : les acides nucléiques et les protéines.

La bioinformatique est devenue une discipline à part entière qui ne se cantonne pas aux deux disciplines qui la définissent terminologiquement mais englobe l'ensemble des sciences exactes et naturelles. Si nous voulons progresser dans notre connaissance des phénomènes du Vivant, il nous faut donc allier les compétences des chercheurs en biologie, chimie, physique, mathématiques et informatique.

Les récents progrès des programmes de séquençage des génomes (comme le projet Génome Humain achevé en 2003) ont ouvert de nouvelles perspectives dans les domaines de la biologie, de la santé et de l'agronomie :

Les énormes volumes de données biologiques ne sont plus susceptibles d'être traités manuellement. Ils nécessitent de faire appel au meilleur ami de l'homme dans le traitement automatique de l'information : l'ordinateur.

La bioinformatique permet au biologiste d'exploiter le formidable potentiel de connaissances contenues dans les banques de données et de les analyser. Elle permet à l'informaticien de mettre en oeuvre ses compétences en algorithmique et en programmation, en développement d'interface et de bases de données.

Alignement

Mon travail de recherche en bioinformatique a débuté dès 2001 sous la tutelle du Pr. Jin-Kao Hao qui a pris part à la création de la Ouest Génopôle. J'ai commencé par m'intéresser aux problèmes de l'Alignment par Paires de Séquences (Pairwise Sequence Alignment) et l'Alignement Multiple de Séquences (Multiple Sequence Alignment).

En 2002, Vincent Derrien, étudiant en DEA a implanté une première version de PLaSMA un nouvel algorithme d'alignement multiple basé sur une méthode dérivée de l'alignement progressif (utilisé par Clustal W) utilisant des blocs de séquences au lieu de séquences consensus. L'objectif de cet algorithme était d'améliorer la qualité de l'alignement final car l'emploi de séquences consensus tend à biaiser le résultat de l'alignement. Vincent Derrien effectue actuellement sa thèse au LERIA.

Pour en savoir plus sur l'alignement >>>

Phylogénie

En 2003, je me suis intéressé au problème de Reconstruction de Phylogénie. Adrien Goeffon, étudiant de DEA a créé un logiciel implantant plusieurs méthodes de recherche locale (Descente, Tabou, Recuit Simulé) afin de trouver un arbre phylogénétique optimal en utilisant le critère de Maximum de Parcimonie (Maximum Parsimony Criterion).

Nous avons conçu un algorithme génétique utilisant un opérateur de croisement DiBIP basé sur une distance topologique entre feuille, un algorithme mémétique (logiciel Hydra) ainsi qu'un recuit simulé (logiciel SA-MP) qui nous a permis d'améliorer 10 des résultats obtenus par l'algorithme mémétique.

Pour en savoir plus sur la phylogénie >>>

Recherche de motifs

Un motif (ou Pattern) au sens bioinformatique du terme représente une expression qui permet de caractériser un ensemble de séquences d'ADN, d'ARN ou de protéines. Le motif peut concerner les structures primaires, secondaires et tertiaires. Le motif trouve notamment son intérêt dans la caractérisation des fonctions des protéines : si on était capable d'exhiber un motif pour chaque fonction alors on serait en mesure de prédire automatiquement la fonction associée à une protéine.

On distingue deux étapes dans la recherche de motif :

Les deux problèmes rencontrés dans la recherche de motif concernent la définition du motif. Un motif est généralement défini à partir d'un ensemble référence de séquences qui possèdent la même fonction :

Stages Master 2

Ces stages sont effectués dans le cadre du Master 2 Bioinformatique de Rennes 1.

Thèses encadrées

Publications

lien >>

News