Haruspex

Haruspex est un outil heuristique pour l’analyse et l’exploration visuelle de corpus.
Il vise l’émergence de nouvelles connaissances dans l’interaction d’analyses qualitatives / quantitatives, et la valorisation de celles-ci.

Objectif

Calculer des proximités entre les textes d’un corpus:

  • sans modèle pré-défini
  • sans vocabulaire de référence
  • sans corpus d’entraînement

Haruspex se prête bien à l’analyse de textes contenant du vocabulaire spécialisé.
Il préfère les textes en français, même si l’anglais lui convient aussi.

Méthode

Créer un multi graphe pondéré de co-occurrences d’expression clés entre les textes d’un corpus. Cette phrase est décortiquée ci-après:

  • expressions-clés: un algorithme extrait les expression clés du corpus. Ces expressions sont nombreuses et précises. Il ne s’agit pas d’indexation avec des termes génériques, mais au contraire de terme spécifiques et discriminant au sein du corpus, c’est-à-dire utiles pour l’analyse. Néanmoins, il est possible de regrouper automatiquement certaines expression-clés par catégorie.
  • co-occurrence: si une expression-clé apparaît dans 2 textes du corpus, alors ces 2 textes sont liés par cette expression-clé partagée. Il s’agit d’un graphe de co-occurrences
  • multi-graphe: car 2 textes d’un corpus peuvent partager plusieurs expression clés co-occurrentes (l’inverse est même très rare)
  • pondéré: car chaque lien (c’est-à-dire chaque partage de co-occurrence) est pondéré suivant:
    • le pouvoir discriminant de l’expression-clé dans le corpus
    • le volume de co-occurrence partagé par les deux textes en question

De nombreuses opérations sont possibles, Haruspex insiste sur la dimension analyse de corpus et se détache des problématiques de partage de données ou de formalisation de données.

Résultats, exemple

Sur un réseau d’entretiens de chercheurs en chimie du solide, exemple de graphe (vue) obtenu par requête. Les liens en bleus sont relatifs à la physique, les rouges à la chimie, les gris sont de science indifférenciée. Les nœuds bleus sont des physiciens, les rouges des chimistes, les jaunes des industriels. Le diamètre d’un nœud correspond à son degré de connectivité.
On remarque que chaque lien est correspond à une expression-clé écrite sur l’arc. Ici, ce sont des sujets de recherche partagés, par exemple structure électroniqueoxyde de terres rareschamps des ligands ou encore des noms propres comme Institut Laue-Langevin.

Le graphe total comporte 100k liens dans ce cas. Il s’agit donc d’un graphe construit sur une requête particulière: uniquement les liens qui concernent la science et qui ont une pondération suffisantes. Les mots trop commun comme laboratoire ou CNRS ne sont donc pas présents.

Limites

  • Les corpus trop volumineux sont lourds à analyser autant du point de vue de la machine que du point de vue des résultats. Au delà de 600k mots, il faut segmenter en sous-corpus (cf point suivant)
  • Les corpus très hétérogènes empêchent l’extraction d’expression-clé intéressantes, l’analyse est pauvre. Il faut segmenter en sous-corpus.
  • Le manque d’information qualitative extérieure (connaissance, lecture préalable) peut entraîner des contre-sens d’interprétation des graphes.

Dépendances

  • Python 3.4
  • Neo4j > 2.x
  • py2neo v3

Optionnel mais recommandé:

Treetagger

  • treetagger développé par le département de Computational Linguistics de University of Stuttgart
  • wrapper python pour treetagger développé par Laurent Pointal du CNRS LMSI
    Permet d’obtenir des résultats sur la nature des mots de l’expression-clé. Augmente légèrement la précision.

Wikipédia

(Requiert une connexion internet et de la patience!)
Permet de requêter (http API) Wikipédia sur les expressions clés extraites afin de:

  • normaliser la forme des expressions extraites
  • supprimer quelques doublons (homonymes)
  • classer automatique les expression par catégories (portails Wikipédia)

Projet Nantes1900 primé au label Or des « Territoires innovants »

Nantes1900
Label Or dans la Catégorie culture « Territoires innovants » des Interconnectés

La ville de Nantes et le Musée d’histoire de Nantes du château des ducs de Bretagne, en partenariat avec Centrale Nantes et l’Université de Nantes, viennent de recevoir le label or dans la catégorie culture pour le projet Nantes 1900.

Nantes1900…
Ce dispositif numérique met en valeur une maquette du port de Nantes datant de 1900. Il permet au public de mieux s’approprier l’histoire de Nantes. Trois écrans tactiles placés devant la maquette du port de Nantes au début du XXe siècle permettent d’accéder à une base de connaissances contenant plus de 130 points d’intérêt et 350 photos de la période. Les points sélectionnés par l’utilisateur sont éclairés sur la maquette par des vidéoprojecteurs.
Le dispositif est visible au musée d’histoire de Nantes en salle 21, au château des ducs de Bretagne.

Cette oeuvre est le fruit d’un programme de recherche et développement réalisé à l’initiative du château des ducs de Bretagne, en collaboration avec le centre François Viète (Université de Nantes) et le laboratoire IRCCyN (Ecole Centrale de Nantes) et la collaboration technique de Devocité.

Plus d’infos ici : http://www.chateaunantes.fr/fr/nantes-1900

Ou le livre co-écrit en téléchargement PDF gratuit : http://boutique.chateaunantes.fr/produit/nantes-1900-la-maquette-du-port

 

Label Or dans la Catégorie culture « Territoires innovants » des Interconnectés .jpg

Reconstitution virtuelle et simulation réelle de la salle à manger de Néron

Depuis 2015 une collaboration originale est née entre Francoise Villedieu (archéologue, Centre Camille Jullian Aix Marseille – Ecole Française de Rome), Nathalie André (architecte, Institut de Recherche sur l’Architecture Antique, Aix Marseille) et Florent Laroche (chercheur en archéologie industrielle, IRCCyN).
Après avoir réalisé de nombreuses fouilles archéologiques, un premier modèle 3D de la salle à manger de Néron a été produit pour restituer la batimétrie. Cependant, afin de comprendre comment fonctionnait ce mécanisme extraordinaire qui permettait à la salle à manger de tourner sur elle-même à 360°, des simulation virtuelles ont été réalisées par l’Ecole Centrale de Nantes.

Pour mieux comprendre le sujet, voir la vidéo de présentation (https://lejournal.cnrs.fr/videos/lincroyable-salle-a-manger-tournante-de-neron) ainsi qu’une brève présentation (http://www.mmsh.univ-aix.fr/news/Documents/Neron_depliant_2810-1611.pdf).

L’amélioration du modèle virtuel est permanent et évolue en fonction des fouilles et des hypothèses formulées régulièrement.

En parallèle, le Musée d’Archéologie de Marseille organiser du 2 décembre 201affiche banquet.png6 au 21 juin 2017 une exposition sur le thème « le banquet, de Marseille à Rome, Plaisirs et jeux de pouvoir ». Bénéficiant du prestigieux partenariat de la surintendance de Rome et de l’École française de Rome, organisme responsable des fouilles archéologiques sur le Palatin à Rome, il a été décidé de proposer au public, une maquette physique en 3D de la « machina néronis » et de son mécanisme. Cette maquette sera une première mondiale dans le monde archéologique : elle permet de représenter ce bâtiment emblématique tout en soulignant les hypothèses des fouilles et est associé à un réel mécanisme simulable.

Elle est réalisée par l’équipe IS3P de l’IRCCyN – Matthieu Quantin, Eléna Puroski, Florent Laroche, Loic Jeanson. Impression 3D grâce au soutien du laboratoire IRCCyN – Ecole Centrale de Nantes, du Laboratoire Arc’Antique – Grand Patrimoine de Loire-Atlantique et de la plateformeC – Ping Nantes.

PastedGraphic-1.png   50219334852__6FF92F1A-F69D-4CA3-8E97-36A4FA95F93E.JPG

IMG_0014.jpg

Projet ANR RéSeed

http://www.reseed.fr

Acronyme RéSeed
Titre Rétro-conception SémantiquE d’objEts patrimoniaux Digitaux
Title Semantic reverse-engineering of digital heritage objects
Instrument de financement ANR DEFI 7 – Société de l’information et de la communication / Axe 1 – La Révolution numérique : rapports aux savoirs et à la culture
Durée 42 mois – 2016-2020
Partenaires 8 dont 4 laboratoires universitaires, 2 industriels et 2 institutions
RH globales 132 h.m
Budget 998086 € global – 656259 € subventionné

Résumé

Ce projet s’intègre dans le domaine de la rétro-conception (ou Reverse Engineering en anglais) et s’allie avec les besoins et les particularités liés au patrimoine. Les objectifs scientifiques s’inscrivent pleinement dans le Défi 7 de l’ANR qui permettra de construire notre future société de l’information et de la communication.

Aujourd’hui, la rétro-conception est largement utilisée dans l’industrie manufacturière afin de capturer l’information 3D des produits. Mais digitaliser les données physiques ne rend pas compte des connaissances portées par les produits, capitaliser ce savoir-faire est pourtant aujourd’hui crucial pour faire évoluer les produits de demain.

Pour atteindre ces objectifs, on distingue donc deux types d’approches :

  1. les démarches de gestion des connaissances classiques s’appuyant sur les sources sémantiques,
  2. et les outils de numérisation / modélisation 3D.

Cependant il n’existe pas à l’heure actuelle de processus alliant ces deux domaines et globalisant la démarche : les verrous technologiques résidant dans cette interdisciplinarité fondatrice conduisent à des verrous scientifiques nécessitant un alignement des modèles et une remise à plat des processus usuels des industriels.

Le projet ANR RéSeed vise à mettre en place une nouvelle méthodologie, un outil et un format interopérable pour permettre l’alliance de la digitalisation sémantique et physique des objets.

Proposal ANR format ReSeed + SPI-SHS 2.png

Avant d’appliquer les démarches sur l’industrie contemporaine il a été choisi de tester les approches sur un corpus déjà existant dont les connaissances ont été identifiées et dont la valeur intrinsèque n’est pas à renégocier : RéSeed sera testé sur le patrimoine industriel.

A terme, si l’ANR RéSeed est un succès, un rebouclage entre les connaissances du passé et les connaissances du présent sera envisagé. Sauvegarder, analyser et comprendre ces objets du « patrimoine passé » peut permettre de les transformer en « capital présent ». La transposition des connaissances du passé en connaissances contemporaines, lisibles et compréhensibles dans le système sociotechnique présent peut alors devenir source d’innovation pour anticiper notre futur.

Une attention particulière sera portée sur la qualification du processus mis en place. Appelés indicateurs de performances dans l’industrie manufacturière, RéSeed mettra en place une déontologie adaptée permettant de garantir l’authenticité et l’unicité des futurs objets numériques sémantiquement augmentés.

Ce projet ANR étant par nature trans-disciplinaire, le consortium constitué est également pluriel :

  • 4 laboratoires de recherche universitaire dont 3 en sciences pour l’Ingénieur et 1 en sciences Humaines et Sociales,
  • 2 entreprises dont 1 en sciences pour l’Ingénieur et 1 en sciences Humaines et Sociales,
  • 2 partenaires institutionnels apportant des cas d’études à échelle nationale tant dans le domaine scientifique que dans le domaine technique.

La durée prévue est de 48 mois ; elle permet de tenir compte des particularités liées aux contraintes, aux règles et aux eusses-et-coutumes des différentes disciplines du consortium.

Partenaires Nom du laboratoire
Ecole Centrale de Nantes (ECN) IRCCyN
Université de Nantes (UN) Centre François Viète (CFV)
Université de Technologie de Compiègne (UTC) Roberval
Université de Technologie de Troyes (UTT) LASMIS
MCC Héritage
DeltaCAD
Musée des Arts-et-Métiers (MAM)
Ministère de la culture (MIGPC)

Les impacts du projet sont nombreux et se situent sur plusieurs niveaux. Tant sur les emplois requis pour mettre en place le projet (2 thèses demandées, plusieurs enseignants-chercheurs et ingénieurs impliqués) que sur les retombées économiques pour les industriels fournisseurs de solutions logiciels ou de service. De plus, compte tenu du champ d’expérimentation défini pour RéSeed, le consortium  ambitionne de mettre à disposition des experts du patrimoine de nouveaux outils pour faciliter la digitalisation sémantique des objets. Ces outils permettent des accès multi-niveaux et visent, à terme, de mettre à disposition de tout citoyen les connaissances capitalisées. Entre autre, un label “patrimoine numérique 3D” sera étudié en accord avec le Consortium3D de la TGIR Huma-Num.

Plus d’infos ici : http://www.reseed.fr

Euradio Nantes – Mai 2016

Digital Humanities : Nantes 1900, un projet entre musée, patrimoine et numérique

Invité : Dr Florent Laroche, maître de conférences à Centrale Nantes – chercheur à l’IRCCyN (Institut de Recherche en Communications et Cybernétique de Nantes)

« Depuis plusieurs années, l’utilisation de la 3D n’est plus réservée à la seule production des images cinématographiques ni au monde du jeu vidéo. La 3D a intégré l’ensemble des activités intellectuelles et physiques de notre vie quotidienne tant personnelle que professionnelle. Le milieu muséographique n’a pas échappé à cette tendance. Il est partagé entre deux points de vue :
– une capitalisation historique à des fins de compréhension scientifique de notre patrimoine industriel,
– et une vulgarisation à destination du grand public.
L’enjeu de ces nouvelles approches réside alors dans la déontologie que chaque acteur du patrimoine est prêt à mettre en oeuvre pour aller au-delà des belles images figurant usuellement de faux artefacts de notre réalité passée. Notre équipe de recherche travaille depuis plus de dix ans dans ce domaine interdisciplinaire et a récemment finalisé un projet mené en partenariat avec le Musée d’Histoire de Nantes au Château des ducs de Bretagne. »

Une émission animée par Christine Evain.

Invités de l’émission :

Florent Laroche, Assistant Professor, IRCCyN Laboratory, Ecole Centrale de Nantes
Vincent Tourre, Assistant Professor, CRENAU Laboratory, Ecole Centrale de Nantes
Jean-Louis Kerouanton, Assistant Professor, CFV Laboratory, Université de Nantes
Benjamin Hervy, phD, engineer, Université d’Angers
Matthieu Quantin, phD student, IRCCyN Laboratory, Ecole Centrale de Nantes

Nantes1900 – inauguration le 17/9 18h

Après plusieurs années de recherche, c’est avec plaisir que le dispositif interactif Nantes 1900 est en place et opérationnel. Il met en relief et en Réalité Augmentée la maquette du port de Nantes dans la salle 21 du Musée d’histoire du château des ducs de Bretagne.

Sketchup Museo_bhervy Laroch V2 PTT

Il s’agit là d’un travail interdisciplinaire de longue haleine mené en étroite collaboration, et grande complicité; avec les équipes du Château des Ducs, le Centre Francois Viète et l’équipe IS3P de l’IRCCyN à Centrale Nantes. Un pilotage à plusieurs têtes avec un joli mariage dès l’origine entre SHS et sciences pour l’ingénieur. C’est tout l’objet de la Fédération de Recherche EPOTEC.FR

Pour marquer l’évènement, un ouvrage dédié à Nantes1900 sortira le jour même ; deux volets : l’objet Maquette réalisé par Duchesne et le projet digital, œuvre commune contemporaine, objet de la recherche scientifique.
ISBN 978-2-906 519-49-7

N’hésitez pas à venir voir l’application finale au Musée en salle 21.

L’inauguration officielle aura lieu le 17 septembre 2015 à 18h.

IMG_0036 PTT

Salon InnovativesSHS

Paris – Cité des Sciences et de l’industrie – 16 & 17 juin 2015

L’équipe d’EPOTEC présentera deux projets lors du salon InnovativesSHS organisé par le CNRS. Retrouvez nous à la cité des sciences de Paris du 16 au 17 juin prochains sur le stand n°47.

Deux applications en réalité augmentée/virtuelle seront à l’honneur: le pont transbordeur de Nantes et le rover Curiosity (projet Explornova). En avant-première, voici les deux marqueurs qui seront utilisés pour la réalité augmentée sur tablette:

Marqueurs pour les applications de réalité augmentée
Marqueurs pour les applications de réalité augmentée