Français Présentation English

Le projet MedGIFT

Démonstrations

Recherche d'images par le contenu visuel

La recherche d'images par le contenu visuel (CBIR - Content-based image retrieval) est un des domaines de recherche les plus actif dans le secteur de la vision par ordinateur des dix dernières années. L'accessibilité à des quantités importantes de documents visuel et multimédia ainsi que le développement de l'Internet font naître le besoin de méthodes d'accès aux données qui offrent plus que des recherches simples par texte ou par la comparaison exacte des champs des bases de données. Un grand nombre d'utilitaires a été développé pour formuler et exécuter des requêtes basées sur le contenu des documents et pour faciliter la navigation dans de grandes collections d'images.

Malgré cela, jusqu'à maintenant il n'y a pas encore eu de grandes avancées au niveau de la recherche dans les bases de données larges et variées avec des images de différentes natures. Il est important de souligner que la recherche par les caractéristiques visuels extraites automatiquement est seulement destinée à complémenter la recherche par le texte et non pas à la remplacer, ce qui ne sera probablement jamais le cas. Un des problèmes importants est la perte de l'information sémantique dans les caractéristiques extraites automatiquement.

On peut trouver sur Internet soit des versions de démonstration de certains systèmes soit seulement leur description, comme par exemple:

Recherche d'images médicales par le contenu

Dans le domaine médical, la quantité produite d'images et notamment d'images médicales ne cesse de croître. Ces images sont ainsi utilisées pour la diagnostique et la thérapie. Rien que pour le département de radiologie des Hôpitaux Universitaires de Genève le nombre d'images produit par jour atteint plus que 12,000 images (2002). Avec DICOM il existe un standard pour la communication d'images qui permet de stocker des informations sur le patient ainsi que les images associées.

Dans plusieurs articles, l'accès par le contenu aux images médicales a été proposé et des scénarios ont été évalués pour l'intégration de la recherche par le contenu dans les systèmes PACS (Picture Archiving and Retrieval System) ainsi que dans le processus diagnostique. Il y a aussi plusieurs articles sur les technologies de recherche d'images médicales. Malheureusement seulement un très petit pourcentage de ces systèmes est en ce moment intégré dans le processus diagnostique. A notre connaissance il y a seulement une étude sur les bénéfices cliniques possibles avec la recherche par le contenu visuel dans le domaine médical. Cette situation donne l'impression qu'il y a des médecins qui décrivent leurs besoins de systèmes et des informaticiens qui utilisent les données médicales pour évaluer leurs systèmes mais qu'il y a rarement un effort commun pour vraiment tester les technologies en pratique médicale.

Des informations sur quelques projets existants peuvent être trouvées à :

Nos projects pour la recherche d'images médicales

Recherche d'images pulmonaires: le projet Talisman
On a déjà fait quelques pas vers un système de recherche des images pulmonaires. Les premiers pas ne peuvent pas être faits d'une manière automatique. Un médecin doit fournir l'information nécessaire. Seulement avec une telle information est-il possible d'évaluer le système d'une manière propre. Des outils doivent être développés pour faciliter ce processus pour le médecin. A l'Université de Genève le système Casimage est un ensemble d'outils pour stocker des cas avec des images médicales. Le but de cette base de données est surtout l'enseignement et le stockage des cas intéressants, mais on peut aussi tout a fait imaginer son utilité pour l'aide à la diagnostique (case-based reasoning).

  • Créer une sélection de couches du scanner coupe fines qui représente bien le diagnostique;
  • connecter un diagnostique avec les couches sélectionnées;
  • donner une description verbale des anormalités du tissu;
  • marquage des régions dans chaque couche qui correspond le mieux au diagnostique.

Evaluation de la performances des machines de recherches et bases de données d'images de références
Actuellement on constate clairement un manque de base de données d'images médicales qui sont accessibles sans protection de droit d'auteur et qui contient un standard canonique pour l'évaluation de la qualité de requêtes. Pour une propre évaluation, plusieurs base de données avec des requêtes et standards canoniques seront nécessaires : Une base de données avec des images très variées (donc comme un PACS) ou le but est de trouver des images visuellement similaires plus des bases de données plus spécialisées (comme des CT coupes fines pulmonaires) qui permettent une évaluation à la base d'un diagnostique. Des bases de données accessible par Internet incluent la base Casimage qui contient plus que 8,200 images très variées qui peuvent être utilisé gratuitement. Cette base de données est accessible avec le standard MIRC qui contient encore d'autres bases de données d'images médicales. La fédération d'informatique médicale européenne (EFMI) a aussi créé une initiative pour le développement d'une base de données de référence pour l'évaluation des systèmes d'imagerie. Le National Library of Medicine aux états unies fournit également des ressources d'images médicales comme le visible human project.

Combinaison des caractéristiques visuels et textuels
Des caractéristiques visuels peuvent seulement être un complément aux recherches textuelles et non pas un remplacement. Probablement les meilleurs résultats vont être possibles avec une combinaison des caractéristiques visuels et textuels dans les mêmes requêtes. Selon nos connaissances ça n'était pas encore fait avec des images médicales. Une démonstration Web avec des images d'un musée se trouve à l'université de Monash.

Des autres aspects important du project medGIFT

En outre notre projet principal sur la recherche des images par le contenu visuel, le projet medGIFT travaille sur les architectures informatiques dans le domaine de la santé et de l'hôpital. Un point important est l'utilisation des grilles informatique (grid networks) pour distribuer le stockage et le calcul de large quantité de données. On fait partie de l'organisation healthGrid et on a plusieurs collaborations avec des organisations qui travaillent d'une manière très active sur les réseaux grilles comme le CERN ici à Genève et l' IN2P3 à Lyon en France.


[ 15.03.2006 ]