Enseignement
Module Libre Bioinformatique

 


Descriptif rapide

Intitulé : Initiation à la Bioinformatique
public concerné : L2 /L3 MPCIE/SVT
nombre d'ECTS : 3
nombre d'heures : 27h
horaires : Jeudi 13h30 - 16h00
dates :

Objectif du module

Le but de ce module est d'initier les étudiants de niveau L3 à la bioinformatique en leur faisant découvrir les connaissances, les techniques et les outils utilisés.

voir le fichier powerpoint d'introduction .

La bioinformatique est une discipline à part entière qui utilise un ensemble de techniques et d'outils issus des mathématiques, de la physique et de l'informatique dans le but d'analyser des données biologiques. Ces données biologiques concernent essentiellement deux types de macromolécules : les acides nucléiques et les protéines.

Les énormes volumes de données biologiques ne sont plus susceptibles d'être traités manuellement. Ils nécessitent l'utilisation de l'ordinateur pour le traitement automatique de l'information. Les données biologiques sont regroupées dans un grand nombre de bases de données, utilisables via Internet et le Web.

Les récents progrès des programmes de séquençage des génomes (comme le projet Génome Humain achevé en 2003) ont ouvert des voies dans les domaines de la biologie, de la santé et de l'agronomie.

La génomique s'intéresse à l'étude exhaustive des génomes : elle en analyse la structure afin d'identifier les gènes et les régions qui régulent l'expression de ces gènes. Cette régulation est assurée par la fixation de facteurs de transcription sur des régions particulières des gènes. Il en résulte un très grand nombre d'interactions protéine/ADN et protéine/protéine.

La protéomique étudie l'ensemble des protéines contenues dans une cellule (le protéome). Elle s'articule autour de trois thèmes majeurs : la prédiction de structures, la relation structure-fonction et la phylogénie.

D'autres voies sont en pleine expansion :
  • l'étude des réseaux d'interactions entre molécules (protéine/ADN, protéine/protéine, protéines/substrats, protéines/effecteurs,...). Le but est de décrire le fonctionnement global d'une cellule dans un environnement donné.
  • la modélisation moléculaire pour la conception de médicaments et l'étude de l'interaction entre macromolécules.
En conclusion :
  • La bioinformatique permet au biochimiste d'exploiter le formidable potentiel de connaissances contenues dans les banques de données et de les analyser.
  • Elle permet à l'informaticien de mettre eno oeuvre ses compétences en algorithmique et en programmation, en développement d'interface et de bases de données.
  • Enfin, si l'informatique permet d'accéder aux données, les statistiques permettent d'en décrire le contenu.

Contenu des enseignements
Les enseignements contiennent trois volets étroitement liés.
  • Biochimie :
    • Structure des acides nucléiques et des protéines, techniques d'analyse de ces structures et obtention des données biologiques
    • Codage et stockage de l'information biologique
    • Utilisation de quelques outils bioinformatiques :
      1. interrogation de bases de données
      2. recherche, analyse et comparaison de séquences polypeptidiques et nucléotidiques
      3. visualisation moléculaire et relation structure - fonction

  • Informatique :
    Les différents points abordés dans le volet Informatique concernent l'accès aux données (Internet, bases de données) ainsi que leur traitement.

    Le langage de programmation PHP se révèle approprié et permet également d'être combiné aux pages HTML :
    • le modèle client / serveur, communication sur internet
    • les bases de données (Langage SQL, application à MySQL)
    • le langage PHP

  • Statistiques :
    On s'attachera dans ce module à utiliser les statistiques descriptives et inférentielles sur les séquences nucléiques et protéiques issues des requêtes sur les bases de données (volet "Biochimie"), ce qui inclut :
    • l'analyse de variables quantitatives (comme la longueur des séquences)
    • l'analyse de variables qualitatives (comme la polarité des acides aminés)
    • l'analyse de la corrélation linéaire entre variables quantitatives et l'analyse d'indépendance entre variables qualitatives par le test du chi-deux
    • la comparaison de moyennes, la comparaison de pourcentages et l'adéquation d'effectifs à une loi probabiliste théorique
    • un survol rapide des méthodes multidimensionnelles (AFC,ACP, CAH, ...)
    On apprendra aux étudiant(e)s à accorder une attention toute particulière à la rédaction et au choix des graphiques associés aux calculs en fonction du public concerné par l'étude statistique.

Validation des connaissances
La validation des connaissances a lieu lors d'un examen terminal d'une durée de 2h.

Intervenants

Cours (Informatique)


Informations)

Mercredi 27 février, 2008 (Source Yahoo.fr)

WASHINGTON (AFP) - Des chercheurs américains sont parvenus à séquencer la quasi totalité du génome du maïs, une avancée importante qui permettra de produire de meilleures variétés pour répondre aux besoins croissants alimentaires et en biocarburant.

Il s'agit de la céréale la plus cultivée dans le monde, devançant légèrement le riz et le blé.

Le maïs devient aussi la deuxième grande céréale nourricière après le riz dont le génome est séquencé. Les Etats-Unis fournissent 44% de la production mondiale avec plus de 282 millions de tonnes en 2005.

"Ce premier séquençage du maïs est exaltant (...) car les scientifiques vont pouvoir analyser de façon précise et efficace le génome de la plante pour trouver des moyens d'améliorer sa culture et d'accroître ses rendements ainsi que sa résistance à la sécheresse et aux maladies", a expliqué Richard Wilson de l'Université Washington à St Louis (Missouri, centre) qui a conduit ce projet.

La première ébauche comprend environ 95% du génome du maïs et les chercheurs vont consacrer le restant de l'argent alloué à ce projet à peaufiner et finaliser le séquençage, selon ce scientifique.

"Quelques petites parties du génome sont encore manquantes (...) mais virtuellement toutes les informations sont là. Il y aura sans doute des modifications mineures aux séquences génétiques, nous ne nous attendons pas à des changements majeurs", a précisé Richard Wilson.

Le groupe de recherche a séquencé le génome d'une variété de maïs appelée B73 développée par les services de l'agriculture de l'Etat d'Iowa (centre) il y a plusieurs décennies.

Ce maïs, qui a un haut rendement, est très cultivé et fait également l'objet de nombreuses recherches en laboratoire.

"Le séquençage du génome va aider à décoder les secrets de la biologie du maïs, des informations qui peuvent être utilisées pour trouver les gènes qui rendent par exemple le maïs plus nutritif ou plus productif d'éthanol", a souligné Ralph Quadrano, un biologiste de l'Université Washington à St Louis et doyen de la faculté de biologie.

Le séquençage du maïs a été une tâche particulièrement ardue en raison de la taille de son génome et de la complexité des combinaisons génétiques.

Environ 80% des segments d'ADN sont répétés et le génome de maïs compte de 50.000 à 60.000 gènes, soit environ le double que pour le génome humain.

Richard Wilson présentera officiellement les résultats de ces travaux le 28 février à la conférence annuelle de génétique du maïs à Washington, précise le communiqué publié mardi sur le site internet de l'université.

Ce projet de 29,5 millions de dollars a été lancé en 2005 et est financé par la Fondation nationale américaine des sciences (NSF) ainsi que par les ministères américains de l'Agriculture et de l'Energie.

L'équipe de recherche compte également des scientifiques de l'université d'Arizona (sud-ouest), du Cold Spring Harbor Laboratory à New York (nord-est) et de l'université d'Iowa (centre).

marqueur eStat\'Perso