SDPD Internet Course


Semaine 8

Solution de structure 
Niveau 3
Localisation de molécule dans l'espace direct


Lectures

Les chimistes organiciens peuvent être capables de savoir quelle molecule est présente dans une maille cristalline en étudiant par RMN un échantillon en solution, par exemple, ou bien parce ce qu'ils ont greffé une molécule connue à une autre molécule déjà connue lors d'une nouvelle synthèse. Alors, connaissant les paramètres de maille et le groupe d'espace, une détermination de structure peut consister en la simple localisation de la molecule ou d'un fragment suffisamment important dans la maille. Il peut y avoir des additifs relativement lourds (Cl ou S ou autre) ou bien des petites molécules (eau, nitrate, ammonium...) qui devront être localisés simultanément, si le fragment connu n'est pas assez important en pourcentage (la localisation correcte de 80% en masse atomique peut ne pas donner une reliabilité inférieure à 30%) du contenu total de la maille. De très nombreux logiciels ont été programmés qui réalisent des rotations et translations du modèle structural dans la maille, jusqu'à trouver sa position correcte. Lorsque l'on ne dispose que de données de diffraction sur poudre, le problème se complique du fait du chevauchement des réflexions. A côté de l'approche la plus brutale qui consiste à une recherche systématique en suivant une grille (avec un pas de déplacement et de rotation), des approches plus élégantes et efficaces appliquent les méthodes Monte Carlo, de recuit simulé et aussi des algorithmes génétiques afin d'obtenir la meilleure position de la molécule. Les logiciels les plus élaborés parviennent à traiter des problèmes de localisation simultanée de plusieurs fragments, et aussi explorent les angles de torsion des molécules, qui peuvent varier par rapport à la molécule initiale.

De nombreuses conférences ont été données sur ce sujet aux congrès IUCr XVIII, Glasgow, 1999 et IUCr XIX à Genève, 2002. Cependant aucune de ces conférences n'est en ligne sur Internet. Par courtoisie de  Yuri Andreev, vous pouvez avoir accès à un document Powerpoint récent de sa conférence EPDIC8 (European Powder Diffraction International Conference, Uppsala, Sweden, 2002) (.html, ou le fichier Powerpoint zippé par Winzip .zip - gros fichier > 6Mo). Vous trouverez peu de publications récentes sur ce sujet en évolution constante (il se dépose même des brevets sur les algorithmes). Il serait tout de même bon de lire quelques articles de revue sur la question (voyez la banque de données SDPD et sa page d'articles de revue).

Plusieurs chapitres traitent de ces méthodes dans le livre récent :
B7- Structure Determination from Powder Diffraction Data 
        W.I.F. David, K. Shankland, L.B. McCusker, and Ch Baerlocher, 
        IUCr Monographs on Crystallography, Vol 13, 
        Oxford Science Publications, 2002. 

Vous pouvez aussi trouver des références de cas expérimentaux résolus avec le moteur de recherche par mot clé de la base de données SDPD :

Recherche de référence parmi les cas experimentaux

Utilisez les mots clé tels que : Monte, Carlo, simulated, annealing, model building, MB, genetic, algorithm, et aussi des noms de logiciels comme : patsee, dirdif, rotsearch, octopus, dash, druid, powdersolve, etc.

Il faut ici distinguer entre les logiciels qui ont été spécialement conçus pour traiter des données de diffraction de poudre (et qui tiennent compte du problème de chevauchement des réflexions), et les logiciels conçus pour des données de diffraction sur monocristal (DIRDIF, PATSEE pour des petites molecules). Il y a essentiellement 3 manières de traiter réellement le problème du chevauchement des réflexions des diagrammes de poudre :

  • Le diagramme de poudre lui-même (au moins une partie aux plus bas angles) est calculé pour chaque position et orientation du modèle dans la maille, et est comparé aux données expérimentales. C'est la méthode retenue pour le programme OCTOPUS, par exemple. Il n'est pas nécessaire d'extraire les facteurs de structure. Une reconstitution des données du diagramme de poudre pour tester chaque modèle peut être consommatrice de temps de calcul. Notez cependant qu'une extraction des "|Fobs|" est nécessairement réalisée au début, de façon à déterminer les meilleurs paramètres de profil et les meilleurs paramètres de maille qui seront ensuite réutilisés et fixés durant le reste des calculs.
  • Les "|Fobs|" préalablement extraits sont utilisés pour reconstruire un pseudo diagramme expérimental qui sera comparé aux pseudo diagrammes calculés  (d'après les |Fcalc|) pour chaque position/orientation du modèle.  Ceci permet de gagner du temps de calcul puisque ni le fond continu, ni les termes de lorentz-polarisation, ni l'asymétrie des profils (etc) n'ont besoin d'être calculés. Cette méthode est utilisée exclusivement dans le programme ESPOIR.
  • Une fonction d'accord est définie, incluant les "|Fobs|" extraits, leurs écart-types et les  |Fcalc|. Cette fonction est utilisée pour décider si une position/orientation de molécule survivra. Cette méthodes est employée dans le programme DASH distribué par le CCDC et aussi dans PSSP.


Au passage, il faut tout de même insister sur le fait que cette méthode de détermination de structure par localisation de molécule est aussi employée pour les grandes molécules, à partir de données de diffraction sur monocristal. Jetez un oeil aux méthodes  "Molecular Replacement" qui permettent de déterminer des structures de protéines (par exemple les logiciels AMORE, MOLREP, MRX, MODELLER ... - voyez quelques pages Web du CCP4). Ces programmes effectuent des recherches par translation et rotation pour localiser une molécule dans une maille, et aussi produisent des affinements de structure du type "rigid body" (bloc rigide). Pensez aussi aux logiciels du type "Isomorphous Replacement" (substitution isomorphe) (logiciel MIR).


Logiciel à télécharger

Actuellement, vous devez déjà avoir les logiciels Espoir, EXPO et Dirdif ou WinDirdif (monocristaux) qui ont déjà été mentionnés les semaines précédentes. Ils possèdent des options pour la localisation de molécule (poudre ou monocristal). 

Téléchargez également si vous le souhaitez, et si ce n'est pas déjà fait :

PSSP par P. Stephens (pages du CCP14).

FOX par Vincent Favre Nicollin, open source (pages du CCP14).

PATSEE par E. Egert et G.M. Sheldrick, open source (mais pour monocristaux) (article PDF avec exemple d'application).

Malheureusement, la liste est longue de logiciels non disponibles aisément (il suffit de contacter l'auteur, mais l'accès n'est pas direct sur internet) ou bien commerciaux :

OCTOPUS par M. Tremayne et al.,

DASH par W.I.F David et K. Shankland (commercial, distribué by CCDC),

PowderSolve commercial par Accelrys/MSI, 

ROTSEARCH par Jordi Rius.

Etc, voyez la liste des logiciels  dans la banque de données SDPD.

Aussi disponibles dans une autre catégorie, des logiciels de prédiction de structure opérant par optimisation de l'énergie en fonction de l'empilement des molécules :

PROMET par Angelo Gavezzotti,

HARDPACK par Rainer Rudert.

etc.

Nous sommes ici proches des méthodes de modèlisation moléculaire pour l'optimisation des modèles de molécules par des approches du type semi-empirique ou ab initio. En fait, le rapport entre le nombre de réflexions et le nombre de paramètres à affiner peut être si réduit, pour certaines molécules assez grosses, que des restrictions et des contraintes doivent être utilisées sur les distances interatomiques. La modélisation moléculaire peut aider à vérifier que tout est correct , et peut aider à localiser les atomes d'hydrogène, mais c'est une autre histoire (voyez la liste de discussion CCL).


Exercice

Un nouveau dérivé du pyrène (C16H10) est synthétisé avec pour formulation 
C17H12O. Un diagramme synchrotron est enregistré (longueur d'onde 0.79764 A). La qualité du diagramme n'est pas vraiment très bonne, du fait de la très petite quantité disponible de produit. Proposez une maille, un groupe d'espace, extrayez les  "|Fobs|", et finalement, localisez la molécule de pyrène dans la maille. Par commodité, les données ont été reformattées dans les standards de fichiers Bruker .uxd et .raw. Une calibration soignée permet d'être certain que le décalage de zéro est inférieur à |0.002|°(2-theta). La molécule de pyrène en coordonnées cartésiennes est fournie ici (pyrene.txt). Essayez de trouver le carbone et l'oxygène supplémentaires liés à la molécule de pyrène par synthèse de Fourier différence avec SHELXL, ou bien recherchez simultanément la molécule plus ces atomes supplémentaires avec le logiciel travaillant dans l'espace direct (ESPOIR, PSSP, FOX, etc). Ne faites aucun affinement par la méthode de Rietveld à ce stade.

Donnez le début du fichier .smh de CRYSFIRE, le groupe d'espace, vos coordonnées atomiques finales, les facteurs de reliabilité.


Principaux logiciels sélectionnés pour la correction

POWDERX pour estimer les positions angulaires des réflexions, CRYSFIRE pour indexer. FULLPROF pour extraire les "|Fobs|"; OVERLAP pour construire des jeux de données réduites; SHELXS-97 pour essayer les méthodes directes et ESPOIR pour localiser la molécule de pyrène. ORTEP-3 pour dessiner le résultat. SHELXL-97 pour affiner sous contraintes et réaliser les synthèses de Fourier différence syntheses, etc.


La session suivante sera consacrée à l'achèvement de la détermination de structure, incluant l'affinement par la méthode de Rietveld, niveau 1.
Bonne chance !