Publi¨¦ le 26 octobre 2018 Mis ¨¤ jour le 26 octobre 2018

Un texte de la Minute Recherche par Catherine Barri¨¨re (GReD, unit¨¦ mixte de recherche Inserm, CNRS, Universit¨¦ Clermont Auvergne). La mol¨¦cule d¡¯ADN est le support de l¡¯information g¨¦n¨¦tique contenu dans toutes les cellules de notre organisme.

La mol¨¦cule d¡¯ADN est le support de l¡¯information g¨¦n¨¦tique contenu dans toutes les cellules de notre organisme. Dans le cadre du fonctionnement cellulaire, la lecture de parties de l¡¯ADN (g¨¨nes) produit des mol¨¦cules nomm¨¦es transcrits qui jouent un r?le dans la cellule soit directement, soit apr¨¨s traduction en prot¨¦ines. Les niveaux d¡¯expression des transcrits sont g¨¦n¨¦ralement finement r¨¦gul¨¦s au cours de la vie d¡¯une cellule. Leur d¨¦r¨¦gulation peut avoir des cons¨¦quences n¨¦fastes pour la cellule et notamment conduire au d¨¦veloppement de pathologies dont le cancer.

Chez l¡¯homme, la mol¨¦cule d¡¯ADN est constitu¨¦e pour moiti¨¦ d¡¯¨¦l¨¦ments de courte taille dits ?r¨¦p¨¦t¨¦s? car pr¨¦sents en des centaines de milliers d¡¯exemplaires. Compte tenu de leur grand nombre et de leur similitude de s¨¦quences, l¡¯implication de ces ¨¦l¨¦ments r¨¦p¨¦t¨¦s en biologie humaine est difficile ¨¤ ¨¦tudier. Pour autant, quelques exemples dans la litt¨¦rature indiquent que des ¨¦l¨¦ments r¨¦p¨¦t¨¦s appel¨¦s LINE-1 (ou L1) pourraient ¨ºtre responsables de la d¨¦r¨¦gulation de l¡¯expression d¡¯acteurs majeurs connus pour ¨ºtre impliqu¨¦s dans les processus de tumorigen¨¨se. En effet, certains L1 ont la capacit¨¦ de produire des lectures particuli¨¨res, d¨¦butant dans le L1 et se poursuivant dans la s¨¦quence d¡¯ADN voisine, formant des transcrits dits ? chim¨¨res ? (ou LCT). Ces LCT peuvent alors ¨ºtre responsables de la d¨¦r¨¦gulation de l¡¯expression de g¨¨nes contenus dans les s¨¦quences d¡¯ADN voisines des L1, notamment acteurs de la tumorigen¨¨se. Toutefois, l¡¯¨¦tendue de la production de LCT ¨¤ l¡¯¨¦chelle de l¡¯ensemble du g¨¦nome humain en contexte normal et tumoral reste inconnue.

CLIFinder (Chimeric Line Finder) est un nouveau logiciel bio-informatique d¨¦di¨¦ ¨¤ l¡¯identification pang¨¦nomique de LCT ¨¤ partir de donn¨¦es de s¨¦quen?age haut-d¨¦bit. Celui-ci permet d¡¯identifier l¡¯int¨¦gralit¨¦ de s¨¦quences transcrites dans un tissu (ou transcriptome). Ainsi, CLIFinder est capable de ?p¨ºcher?, parmi toutes les s¨¦quences d¡¯un transcriptome, de nombreux LCT compos¨¦s d¡¯une s¨¦quence de L1 et d¡¯une s¨¦quence unique du g¨¦nome. L¡¯outil CLIFinder est aujourd¡¯hui ¨¤ la disposition de la communaut¨¦ scientifique pour r¨¦aliser des analyses extensives dans diff¨¦rents tissus normaux mais aussi pathologiques. Notamment, de nombreux LCT ont ¨¦t¨¦ mis en ¨¦vidence sp¨¦cifiquement dans des tissus tumoraux, et seraient susceptibles de d¨¦r¨¦guler des acteurs importants de la tumorigen¨¨se tels que des oncog¨¨nes ou des g¨¨nes suppresseurs de tumeur.