DI-UMONS : Dépôt institutionnel de l’université de Mons

Recherche transversale
Rechercher
(titres de publication, de périodique et noms de colloque inclus)
2014-02-01 - Divers/Autre - Français - 153 page(s)

Grosjean Philippe , "Guide méthodologique. Version actualisée de ZooPhytoImage avec refonte de l’interface graphique"

  • Codes CREF : Océanographie biologique (DI3191), Statistique appliquée (DI1133)
  • Unités de recherche UMONS : Ecologie numérique des milieux aquatiques (S807)
  • Instituts UMONS : Institut de Recherche sur les Systèmes Complexes (Complexys), Institut des Biosciences (Biosciences)
Texte intégral :

Abstract(s) :

(Français) Zoo/PhytoImage 4 est un logiciel « open source » basé sur R et ImageJ. Il sert au traitement d'images numériques de plancton obtenues à partir de différents appareils tels le FlowCAM, un scanner à plat, des micro- ou macrophotographies, etc. Le principe général consiste à détourer individuellement les particules planctoniques visibles sur les images, et ensuite à en extraire des mesures (appelées « attributs ») telles la taille, la forme, la répartition de la transparence, les textures, etc. Ces attributs sont ensuite utilisés par un outil de classification pour définir automatiquement le groupe taxonomique auquel appartient chaque particule. L'outil de classification est obtenu par apprentissage d'un algorithme de type « machine learning » qui établit un lien entre les attributs des particules et les groupes taxonomiques sur base d'un ensemble de particules d'identité connue (le set d'apprentissage qui est élaboré manuellement par l'opérateur sur base de quelques centaines ou milliers de particules d'exemple). Avant son utilisation, les performances de l'outil de classification sont vérifiées sur un ensemble indépendant d'autres particules connues (le set de test), ou par une méthode non biaisée d'estimation de l'erreur appelée « validation croisée ». Les résultats sont consignés dans un tableau de contingence à double entrée qui compare les identifications automatiques avec les identifications manuelles : la matrice de confusion. Zoo/PhytoImage 4 propose plusieurs outils diagnostics numériques et graphique pour déterminer si l'outil de classification offre des performances suffisantes, dont des visualisations nouvelles, comme le graphique « F-score » par groupe. Si l'outil de classification offre des performances trop faibles, Zoo/Phytoimage permet de tester divers remaniement des groupes taxonomiques pour améliorer le résultat. L'identification automatisée de particules planctoniques est un exercice difficile, et actuellement, le taux d'erreur reste trop grand pour un usage opérationnel tel quel (autour de 20-30 % d'erreur globale, mais les erreurs par groupe varient énormément et peuvent monter jusqu'à 90-100 % pour les groupes difficiles ou rares). Ainsi, une validation manuelle par un opérateur entrainé est nécessaire (reclassement sur base du visuel des vignettes). Ce travail est long et laborieux. Il limite grandement l'intérêt de l'automatisation. Un nouvelle technique de détection des particules suspectes, combinée à une modélisation et ensuite, une correction statistique de l'erreur, est implémentée dans Zoo/Phytoimage 4. Elle permet de réduire la fraction de vignettes à valider manuellement (par exemple, 20 à 40 % seulement), tout en conservant une erreur de l'ordre de 10 % maximum pour tous les groupes. Une interface graphique utilisateur améliorée est ajoutée à la version 4 pour permettre une validation partielle manuelle des vignettes avec un confort d'utilisation maximum. En plus de ce traitement, Zoo/PhytoImage 4 gère aussi les métadonnées, le stockage optimisé en espace disque et en vitesse de récupération de l'information. Enfin, ce logiciel calcule et extrait les variables dérivées d'intérêt comme les abondances, les biomasses, les biovolumes et/ou les spectres de tailles totaux et par groupe taxonomique. Il travaille en lot et est capable de traiter toute une série d'échantillons en une seule opération. Le livrable est le manuel utilisateur de la version 4 de Zoo/PhytoImage (en anglais) qui détaille tous ces outils du point de vue de l'utilisateur final. Il montre comment ces outils sont mis en pratique pour l'analyse de données, y compris sur base de petits exemples et des notes sont incluses aux endroits où des pièges dans l'utilisation du logiciel ont été identifiés. Les binaires et codes sources correspondant à cette version 4 de Zoo/PhytoImage sont mis à la disposition de l'IFREMER également. Le système couplé FlowCAM / ZooPhytoImage devient un outil véritablement opérationnel en 2014. Totalement adapté aux observations du phytoplancton réalisées dans le cadre du réseau d’observation REPHY, il permettra de mieux répondre aux sollicitations présentes et futures concernant l'évaluation de la qualité des eaux littorales et marines dans le cadre des exigences européennes, telles que la DCE et la DCSMM. Un des bénéfices immédiats sera par exemple pour l’acquisition des données nécessaires au calcul de l’indice abondance composant l’indicateur phytoplancton pour la DCE en Manche- Atlantique, indice qui est basé sur la proportion de taxons du micro-phytoplancton présents en quantité importante dans un échantillon.