Nature UE
Cr¨¦dits ECTS 3
Volume horaire total 31
Volume horaire CM 9
Volume horaire TD 4
Volume horaire TP 18

Pr¨¦-requis

Bases de Unix/Linux, connexion, navigation rapide dans le syst¨¨me de fichiers Avoir des connaissances dans un langage de programmation, ex. Python, Bash.

Objectifs

? Initiation au travail d¡¯¨¦quipe ? Comprendre le principe et savoir utiliser des outils bio-informatiques d¨¦di¨¦s ¨¤ l¡¯analyse de s¨¦quences ? Apprendre ¨¤ construire une chaine de traitement efficace ? Utiliser une s¨¦lection de langages de programmation utilis¨¦s en bioinformatique (R, Bash) ? D¨¦velopper un sens critique par exemple en appliquant des analyses statistiques ? D¨¦velopper une m¨¦thode d¡¯analyse et une argumentation scientifique

PT招财进宝

? Ce module vise ¨¤ apprendre aux ¨¦tudiants comment manipuler et traiter de tr¨¨s gros volumes de donn¨¦es, tels que ceux qui d¨¦passent les capacit¨¦s actuelles des syst¨¨mes de calcul pour biologistes (e.g. Galaxy), tout en maximisant les moyens de calcul ¨¤ disposition pour produire rapidement des r¨¦sultats.
? A l'issue de ce module, les ¨¦tudiants auront la capacit¨¦ d'¨¦valuer ce qu'est un jeu de donn¨¦es NGS, d'¨¦valuer les moyens de calculs dont ils auront besoin pour atteindre les objectifs scientifiques dans les d¨¦lais demand¨¦s. Les ¨¦tudiant travailleront seuls sur leur probl¨¨me, mais en ¨¦quipe op¨¦rationnelle. La communication et l'entre-aide entre ¨¦tudiants est encourag¨¦e au cours des TP.


Cours magistraux (8h)
LA DONN?E NGS
I sources, d¨¦bits, volumes
II structures et informations
III transport, stockage, s¨¦curisation
LE LANGAGE DE SCRIPT
I origines
II interactions avec le syst¨¨me
III en choisir un... ou plusieurs
LES FLUX DE DONN?ES EN ACTIONS
I production
II transformation
III analyse et calculs
IV archivage des r¨¦sultats
V de la plomberie virtuelle
LA GESTION AUTOMATIS?E DES FLUX
I les temps relatifs du traitement de l'information
II processus et cpu
III entr¨¦es et sorties
IV maximiser l'usage des moyens de calcul
V architecturer le traitement
VI La "scalabilit¨¦", du prototype ¨¤ la production
Travaux Dirig¨¦s (4h)
PRODUIRE DES R?SULTATS EXPLOITABLES
I un "cahier de manip" en bio-informatique
II stocker les r¨¦sultats et/ou les proc¨¦dures ?
III reprendre un calcul partiel
IV penser calcul reproductible
Travaux pratiques (18h)
RNASEQ ET EXPRESSION DIFFERENTIELLE DE GENES
I Nettoyer ¨¤ haut d¨¦bit les donn¨¦es brutes, adapteurs/primers, nucl¨¦otides anonymes, poly-A, complexit¨¦, longueur, appairage, contaminations.
II ?valuer la qualit¨¦ de l'information retenue, fastqc.
III Positionner les s¨¦quences sur une r¨¦f¨¦rence, mapping haut d¨¦bit.
IV Design exp¨¦rimental et puissance statistique, facteurs, profondeur, r¨¦p¨¦titions et FDR.
V D¨¦tecter les g¨¨nes diff¨¦rentiels et inf¨¦rer une d¨¦cision.
VI Enrichir l'interpr¨¦tation par regroupement fonctionnel des g¨¨nes exprim¨¦s, GSEA.

Appartient ¨¤

Informations compl¨¦mentaires

? Initiation au travail d¡¯¨¦quipe ? Comprendre le principe et savoir utiliser des outils bio-informatiques d¨¦di¨¦s ¨¤ l¡¯analyse de s¨¦quences ? Apprendre ¨¤ construire une chaine de traitement efficace ? Utiliser une s¨¦lection de langages de programmation utilis¨¦s en bioinformatique (R, Bash) ? D¨¦velopper un sens critique par exemple en appliquant des analyses statistiques ? D¨¦velopper une m¨¦thode d¡¯analyse et une argumentation scientifique