Bilan

L'Idiap réinvente le travail d'équipe

Octobre 2012. Votre patron vous a invité à une séance de brainstorming dans la nouvelle salle de réunion de l'entreprise. Il n'a pas précisé que celle-ci est équipée des technologies dernier cri en matière de bureautique. A votre grande surprise, vous découvrez que sur l'écran du rétroprojecteur, tout ce qui est dit s'écrit instantanément dans une fenêtre avec des couleurs différentes en fonction de qui prend la parole. Régulièrement, le logiciel fait aussi des propositions de documents de référence sur le sujet abordé. De retour dans votre bureau, vous trouvez le résumé de cette réunion 2.0 avec juste les points qui vous concernent dans la pièce attachée d'un e-mail.Cette salle de réunion du futur existe aujourd'hui. Elle se trouve à Martigny, à l'Institut de recherche de l'Idiap. Là, depuis une dizaine d'années, quelques-uns des meilleurs chercheurs du monde dans le domaine des interfaces hommes-machines conduisent, sous la direction du pionnier de la reconnaissance vocale, Hervé Bourlard, des recherches pour améliorer la collaboration et la créativité au travail. Equipée de vingt-quatre micros directionnels, de sept caméras, d'une vidéoconférence et d'un capteur d'écriture au tableau, cette salle tient encore du laboratoire expérimental. Mais dans les ordinateurs, les logiciels sont prêts pour transformer le travail d'équipe. Lui-même à l'origine des algorithmes qu'on trouve depuis quelques années dans les systèmes de dictée automatique du commerce, Hervé Bourlard a commencé par se poser la question de la transformation en texte écrit de la conversation. «C'est plus complexe parce qu'il faut identifier qui parle, reconnaître des accents différents, tenir compte des interruptions ou des voix qui se chevauchent et transcrire des phrases qui ne sont pas justes grammaticalement.»La réunion intelligente«Nous nous aidons avec la vidéo», ajoute Andrei Popescu-Belis, l'un des chercheurs seniors de l'Idiap. «Grâce aux logiciels de reconnaissance de visage, la caméra identifie qui parle et quand.» Cette synergie entre les signaux audio et vidéo renseigne aussi les logiciels sur la qualité même des conversations. «En analysant la gestuelle, les intonations et les paroles, le programme détecte qui a le plus d'influence, qui a un agenda caché, etc.», poursuit Hervé Bourlard en désignant une fenêtre sur son PC où un graphique, élaboré en collaboration avec les spécialistes des sciences affectives de l'Université de Genève, mesure ces données.La capture de la conversation en amont permet de multiplier les applications en aval. Une fois structurés en texte, les discours sont interprétés par des «clouds tags» qui écrivent en gras les mots qui reviennent le plus souvent à un moment. Le programme les utilise pour faire des propositions de documents liés au sujet abordé. Il va les puiser dans la base de données de l'entreprise ou sur Internet. «On peut même aller plus loin, indique Hervé Bourlard. Imaginez que vous travaillez dans une multinationale où il y a 500 réunions par jour. Le logiciel identifie qu'au moment même où vous discutez d'un sujet, une autre équipe tient une réunion sur le même thème. Il propose d'ouvrir une vidéoconférence.» Et s'ils ne sont pas dans le même fuseau horaire?La réponse d'Hervé Bourlard ouvre le champ le plus spectaculaire de l'exploitation de ces données multimédias: la navigation. «On peut voir une réunion qui a été enregistrée quelques heures plus tôt et chercher avec notre moteur de recherche une séquence précise ou qui a dit quoi.» Et ce qui est possible quelques heures plus tôt l'est aussi pour n'importe quelle réunion enregistrée dans ce qui constituera, à terme, d'immenses bibliothèques multimédias de l'activité collaborative des entreprises.Quand le guide est un ordinateurAfin d'éviter que les utilisateurs ne se perdent dans ces données, l'Idiap a aussi développé des résumés automatiques des réunions à partir des minutes saisies en temps réel. Dès qu'un thème fort est identifié dans les discours, le programme retient, par exemple, la première phrase qui lance le sujet et celle qui le conclut pour générer un résumé que les participants trouveront ensuite dans un e-mail. Belge d'origine, Hervé Bourlard n'a pas résisté d'ajouter l'option BD parmi les formats possibles de ces résumés. Pour parvenir à de tels résultats, les chercheurs de l'Idiap ont fait un énorme travail sur la synchronisation des logiciels. Ils ne cachent pas qu'il faut encore des développements pour stabiliser ces programmes. Mais dans une démonstration chez Nestléavec un groupe de personnes prononçant l'anglais avec des accents différents, leurs logiciels sont parvenus à reconnaître plus de 80% des mots. Si bien que les transferts de technologie dans des entreprises spin-off sont envisagés pour 2010 déjà. D'ici là, les chercheurs de l'Idiap veulent améliorer l'ergonomie de leur salle de réunion du futur et peut-être y intégrer une table lumineuse qui s'éclaire en fonction du temps de parole de chacun développée dans le cadre de la collaboration EPFL-ECAL. «Ce qui nous intéresse, ce n'est plus de savoir comment améliorer la communication entre l'homme et l'ordinateur mais comment l'ordinateur peut améliorer la communication entre les hommes», conclut Hervé Bourlard.

ServiceLe moteur de recherche pour conférence de KlewelLa start-up valaisanne veut améliorer la vie des 440 000 personnes qui paient chaque année plus de 1000 dollars pour assister à une conférence.Combien de fois un conférencier s'est-il entendu demander à la fin de sa présentation: «Je peux avoir vos slides?» Klewel(contraction de voir et entendre en breton) propose d'automatiser ce service en filmant des milliers de conférences. Plutôt que de demander des centaines de présentations, les logiciels de cette spin-off de l'IDIAP les extraient des images vidéo et les traitent, quelle que soit la police de caractère. Publiées sur Internet ou sur l'Intranet de clients comme Nestlé, ces données sont ensuite explorées grâce à un moteur de recherche.Avec cette application, Klewel a filmé des conférences de l'ONU, de l'Unesco... Ces données l'ont aidé à développer son prochain service. En entraînant ses logiciels de reconnaissance vocale avec ces discours, la start-up finalise un moteur audio qui recherche dans les discours tel ou tel mot-clé. A partir de la fin de 2009, les utilisateurs de Klewel pourront retrouver le texte ou la séquence vidéo d'une présentation au moment précis qui les intéresse. Et derrière le marché des conférences, l'entreprise voit s'ouvrir celui des cours magistraux avec déjà un premier accord signé avec l'Open University en Grande-Bretagne.

 

Google Wave modernise l'e-mailEn mariant courrier électronique et message instantané, la société américaine espère réinventer la communication.L'image Avec la photo de ses contacts, un peu comme sur Facebook, Wave permet de sélectionner des destinataires pour qu'ils s'ajoutent à une conversation commencée par un message électronique. La fonction play-back permet de remonter ce qui a été dit et d'intervenir à n'importe quel point ou quel moment.Le partage Wave est conçu comme un «widget» que l'on peut intégrer sur son blog ou les commentaires de site pour animer une conversation en live. Le déplacement d'un clic de documents dans l'e-mail les rend visibles.

Les newsletters de Bilan

Le cercle des lecteurs

Le Cercle des Lecteurs est une plate-forme d'échanger sur tout ce qui touche votre magazine. C'est le reflet de vos opinions, et votre porte-parole le plus fidèle. Plus d'info


Image Footer

"Tout ce qui compte.
Pour vous."