Gamers > CPU [Science]
Vendredi 6 août 2010
Article de John Timmer, paru sur Ars Technica.
Le numéro de Nature paru aujourd’hui contient un article écrit par une liste d’auteurs pour le moins inhabituelle. Après la collection standard d’académiciens, les derniers crédits sont… une communauté de jeux en ligne.
Les scientifiques se sont tournés vers les jeux vidéo pour de nombreuses raisons, après avoir étudié des épidémies virtuelles et suivi des communautés en ligne et leur comportements, ou simplement utilisé des jeux pour susciter de l’intérêt pour la science. Mais cette fois pourrait bien être une première, où les joueurs prennent une part active dans la production des résultats, en résolvant des problèmes dans la structure de protéines dans le jeu Foldit.
Selon une news de Foldit, le projet est apparu suite au projet de distributed computing appelé Rosetta@home. Le projet utilisait ce qui est devenu l’approche standard pour le travail scientifique à la maison : un économiseur d’écran qui, était un programme avec une façade graphique qui cherchait comment les protéines, qui sont composées de chaînes de molécules appelés acides aminés, adoptent leur forme tridimensionnelle finale.
Ceci est typiquement un problème de minimisation d’énergie. Les protéines ont tendance à former des structures qui conservent les parties hydrophobes à l’intérieur, à l’abri de l’eau dans laquelle la protéine est dissoute. Ils forment également des ponts avec les sections voisines en formant des liens hydrogènes et des interactions de charges. Maximisez ces types d’interactions et vous minimisez l’énergie mise en jeu.
Ça paraît simple, mais avec n’importe quoi de plus gros qu’une simple chaîne d’acides aminés, il existe un nombre de configurations tridimensionnelles potentielles considérables à être testées, ce qui peut mettre les plus gros ordinateurs sur les rotules.
L’algorithme de Rosetta scanne l’énorme paysage énergétique en prenant tout d’abord des configurations très différentes, puis essaye de minimiser les énergies en ajustant de moins en moins. Ceci lui permet de traiter de grosses portions du spectre structurel, mais parfois se bloque : le chemin entre sa configuration actuelle et le minimum d’énergie peut l’amener à travers un état d’énergie haute, ce qui empêcherait Rosetta de trouver la solution.
Apparemment, les utilisateurs du programme se sont aperçus que l’économiseur d’écran montrerait souvent le programme bloqué, très près d’une structure bien meilleure. Un des développeurs de Foldit confia que « les gens ont commencé à nous écrire en disant, ‘Je peux voire en quoi ça irait mieux comme ça.’ »
L’équipe de Rosetta décida de leur donner une chance de montrer qu’ils le pouvaient vraiment.
Des algorithmes, jusqu’aux cerveaux humains
Foldit suit une approche hybride. L’algorithme de Rosetta est utilisé pour créer un point de départ potentiel dans la structure de la protéine, et les utilisateurs ont ensuite à leur disposition tout un ensemble de commandes qui leur permet de modifier la protéine en trois dimensions ; l’interface graphique leur fournit un retour immédiat sur l’état d’énergie de la configuration.
Foldit utilise les mêmes conventions typiques que l’on trouve dans d’autres jeux vidéo, comme des problèmes structurels simples au début pour donner à l’utilisateur une courbe d’apprentissage lisse. Il emprunte aussi d’autres communautés de jeux en ligne : il y a des tableaux de scores, des rangs, des challenges par équipe ou individuels, des forums, etc.
Malgré le fait que seuls peu d’entre ceux qui ont joué à Rosetta ait quelque connaissance avancée en biochimie, les joueurs ont tendance à battre Rosetta lorsqu’il s’agit de résoudre des structures. Dans une suite de 10 challenges, ils ont battu le logiciel à 5 occasions et ont fait match nul 3 fois.
En retraçant les actions des meilleurs jours, les auteurs ont réussi à déterminer comment les excellentes capacités humaines à reconnaitre des motifs ont permis aux joueurs de dépasser l’ordinateur. Par exemple, ils étaient très bons pour détecter un acide aminé hydrophobe lorsqu’il dépassait de la surface de la structure, au lieu de se trouver à l’intérieur comme il devrait, et étaient prêts à réarranger la structure interne pour pouvoir remettre l’acide aminé à l’intérieur. Ces types de réarrangement étaient au-delà des capacités de Rosetta, puisque les changements d’énergie impliqués dans la transition sont tellement importants.
De la même manière, Rosetta était bon lorsqu’il s’agissait de faire le lien entre des parties de protéines à travers des interactions de charges et des liens hydrogènes, mais il est régulièrement à côté de l’objectif de très peu (un peu comme une fermeture éclair qui saute une dent). Translater chaque lien d’un unique partenaire est au-delà de ce que Rosetta peut faire, mais un humain en est capable de manière triviale.
Ceci ne signifie pas que l’algorithme de Rosetta n’a pas joué un rôle crucial dans Foldit. Les humains sont incroyablement mauvais lorsqu’il s’agit de commencer à partir d’une chaîne linéaire d’acides aminés ; ils ont besoin d’une idée, même grossière, de ce à quoi la protéine pourrait ressembler, avant de pouvoir reconnaître des motifs à optimiser. Avec un panel de 10 structures potentielles proposées par Rosetta, en revanche, les meilleurs joueurs étaient très forts pour choisir celui qui était le plus proche de la configuration optimale.
Les auteurs notent également que les différents joueurs avaient tendance à avoir des forces différentes. Certains arrivaient mieux à réaliser les gros ajustements qui permettaient d’arriver près d’un minimum d’énergie, tandis que d’autres étaient plus efficaces aux fins ajustements nécessaires à une optimisation complète de la structure. C’est là que la capacité de Foldit de permettre la compétition par équipes, où différents membres d’équipe pouvaient se charger de différentes parties de la tâche, a vraiment payé.
L’article de Nature est très clair sur le fait que des chercheurs dans d’autres domaines, dont l’astronomie, commence à essayer des approches similaires pour impliquer le public et les amener à contribuer autre chose que simplement en fournissant de la puissance de calcul. Du moment que le cerveau humain continue de fournir de meilleurs résultats que les ordinateurs sur certaines tâches, les chercheurs qui réussissent à capturer ces différences devraient obtenir un saut notable en performance.

