Bilan

Le Google russe turbine pour le CERN

Yandex est le moteur de recherche le plus utilisé dans l’espace russophone. Mais c’est aussi la seule entreprise russe partenaire du CERN openlab. Retour sur deux ans de collaboration.
  • Les bureaux de Yandex. Crédits: Dr, Cern
  • Le CEO de Yandex, Arkady Volozh (à droite), et le directeur de la recherche au CERN, Sergio Bertolucci, lors d’une rencontre en janvier 2013. Crédits: Dr, Cern

Tout commence à la fin 2010. Les scientifiques de l’expérience LHCb (Large Hadron Collider beauty experiment, qui traque les particules contenant un quark b, appelé «beauté») sont contrariés. Ils sont noyés sous les milliards de données générées par chacune des collisions intervenues au sein de l’accélérateur. «LHCb était à la recherche de ressources additionnelles pour renforcer ses capacités de calcul. L’idée était d’essayer d’utiliser un moteur de recherche commercial pour identifier les événements rares au sein de nos immenses ensembles de données», confie Marco Cattaneo, computing project leader de l’expérience LHCb.

Andreï Goloutvin, responsable de l’expérience LHCb à l’époque, approche alors les dirigeants de Yandex qu’il connaît bien et qui sont enthousiasmés par la proposition. «Pour nous, l’exploration d’un nouveau domaine commençait: comment les algorithmes que nous avions développés pour des domaines spécifiques, comme la recherche sur internet, l’analyse des embouteillages ou le filtrage des spams, pourraient être utilisés dans un domaine complètement différent», se souvient Andrey Ustyuzhanin, responsable du partenariat Yandex-Cern, chez Yandex à Moscou.

En quelques secondes

La collaboration proprement dite se met en place au printemps 2011. Yandex commence par mettre des serveurs à disposition de l’expérience LHCb pour accroître la puissance de calcul. La société russe va ensuite utiliser la technologie de son moteur de recherche pour élaborer une classification des événements LHCb et, en avril 2012, Yandex met à disposition du CERN un moteur de recherche qui répond aux besoins spécifiques de l’expérience.

Les résultats sont éloquents. «La sélection de types d’événements particuliers au moyen de méthodes traditionnelles peut prendre plusieurs heures. Mais avec le système développé par Yandex les physiciens de l’expérience LHCb peuvent trouver en quelques secondes les événements rares qui sont pertinents pour leur analyse», se félicite Marco Cattaneo. Ce qui, au final, permet «d’économiser du temps et des capacités de calcul tout en accélérant le processus d’analyse de manière considérable».

Ces performances ont permis à Yandex de devenir sponsor associé du CERN openlab en janvier 2013. Ce partenariat privé-public entre le CERN et des entreprises actives dans les technologies de l’information et de la communication a pour mission de développer des solutions innovantes.

Les deux partenaires examinent aujourd’hui comment l’expertise de Yandex peut être réutilisée pour d’autres expériences et programmes scientifiques du CERN. De son côté, Yandex compte mettre à profit cette expérience pour optimiser son moteur de recherche commercial même si «un grand pas reste à faire avant de pouvoir en faire profiter le grand public», tempère Andrey Ustyuzhanin.

Reste que d’un point de vue commercial les applications sont considérables car elles concernent tous les secteurs qui nécessitent l’identification d’informations pertinentes noyées dans d’immenses ensembles de données: la génétique, le commerce électronique pour ce qui est des recommandations d’achat en fonction des sites visités, la reconnaissance optique et même la traduction.

Jean-Didier Revoin

Aucun titre

Lui écrire

Les newsletters de Bilan

Le cercle des lecteurs

Le Cercle des Lecteurs est une plate-forme d'échanger sur tout ce qui touche votre magazine. C'est le reflet de vos opinions, et votre porte-parole le plus fidèle. Plus d'info


Image Footer

"Tout ce qui compte.
Pour vous."