Les mthodes de
reconstruction phylogntique cherchent reconstruire lÕhistoire volutive des
espces partir de squences biologiques. Le principe gnral de ce type de
mthode est de dfinir un critre que lÕon peut estimer pour un arbre et de
rechercher lÕarbre le meilleur au sens de ce critre.
Le maximum de parcimonie
est lÕun des plus anciens critres. Il sÕest ensuite vu supplant par le
maximum de vraisemblance. De nombreuses heuristiques pour optimiser la
vraisemblance ont t dveloppes. De nouvelles applications du maximum de
parcimonie rendent ce critre
nouveau pertinent.
LÕobjectif de ce stage
est de raliser un logiciel utilisant le critre de maximum de parcimonie qui
tire partie des heuristiques dveloppes dans le cadre du maximum de
vraisemblance. Ce logiciel devra pouvoir tre utilis au sein de notre
laboratoire et pouvoir tre diffus sur Internet. Ce qui implique une
validation importante du logiciel notamment au travers de tests unitaires
automatiques. LÕimplmentation se fera en C++ en sÕappuyant sur une librairie
dveloppe lÕUM2 (bio++ : http://kimura.univ-montp2.fr/BioPP/).
Remarque : C++,
algorithmique.
LÕobjectif de ce stage
est de dvelopper un outil permettant de faire des oprations simples sur des
arbres tiquets. Il faudra par exemple implmenter des mthodes pour le calcul
de distances entre 2 arbres, dÕarbres consensus, de r-enracinement et de
filtrage des feuilles. Ce logiciel devra pouvoir tre utilis au sein de notre
laboratoire et pouvoir tre diffus sur Internet. Ce qui implique une
validation importante du logiciel notamment au travers de tests unitaires
automatiques.
Remarque : C++,
algorithmique, graphes.
Les mthodes de
reconstruction phylogntique cherchent reconstruire lÕhistoire volutive des
espces partir de squences biologiques. Le principe gnral de ce type de
mthodes est de dfinir un critre que lÕon peut estimer pour un arbre et de
rechercher lÕarbre le meilleur au sens de ce critre. De plus en plus dÕtudes
phylogntiques sÕappuient non plus sur un seul gne mais sur un ensemble de
gnes. Une approche largement utilise dans le cadre dÕanalyses multignes
consiste concatner lÕensemble de ces donnes en un seul jeu de squences
alignes et utiliser une mthode conue lÕorigine pour traiter un seul gne.
LÕobjectif de ce stage et dÕessayer de prendre en compte le fait que les
donnes sont issues de plusieurs gnes afin dÕamliorer lÕheuristique
dÕoptimisation. LÕimplmentation se fera en C++ en sÕappuyant sur une librairie
dveloppe lÕUM2 (bio++ : http://kimura.univ-montp2.fr/BioPP/).
Remarque : C++,
algorithmique.