Réseaux de neurones à graphes multi-vues pour la segmentation sémantique d’images
La segmentation sémantique d’images constitue un défi important en vision par ordinateur, notamment pour l’imagerie médicale. Les réseaux de neurones convolutifs offrent de bons résultats mais peinent à saisir les relations spatiales complexes au sein d’une image. Cette thèse propose une approche par réseaux de neurones à graphes multivues (MVGNN), combinant plusieurs vues pour mieux représenter la diversité structurelle des données. Nous étudions différentes stratégies de fusion de graphes (précoce, intermédiaire et tardive) testées sur des jeux de données synthétiques et réels. Nos résultats montrent que la fusion multivue apporte en général une amélioration modérée mais régulière par rapport aux approches monovue, surtout lorsque les données d’entrainement sont limitées ou la segmentation difficile. Toutefois, ces progrès restent très dépendants de la qualité des données et du choix de la méthode de fusion. Les méthodes de consensus renforcent la robustesse, mais des limites persistent lorsque la segmentation initiale est de mauvaise qualité ou que le jeu de données est très hétérogène. En résumé, les MVGNN et la fusion de graphes constituent des pistes prometteuses pour la segmentation, mais leurs avantages sont surtout visibles dans certains cas complexes.
Entrée libre
- Fahed Abdallah
- Jean-Baptiste Fasquel