RESUME : La Protein Data Bank est une importante base de données biomoléculaires accessible sur Internet. Elle offre des informations relatives à des centaines de molécules protéiques ou nucléiques qui ont été décrites avec la plus grande précision : composition, séquence, structure et organisation spatiale. Ces molécules sont accessibles sous forme d'images bitmap, de fichiers textes informatifs ou de fichiers utilisables avec divers logiciels de manipulation d'images de synthèse tel que RASMOL. Parmi elles de très nombreuses molécules présentent un intérêt pédagogique (acides nucléiques, enzymes, molécules de l'immunité, médiateurs chimiques et leurs récepteurs membranaires).
Dans l'attente d'une connexion internet des établissements scolaires, un travail possible est la récupération, sur ce serveur, d'images de molécules et leur utilisation, en classe, par les élèves, sur des postes informatiques individuels, au moyen du logiciel Rasmol 2.5.
Les thèmes abordés ci-après concernent, en classe de 1°S, l'étude des relations séquence-structure-fonction protéique et, en classe de Terminale S, l'étude de molécules de l'immunité, un marqueur HLA et une immunoglobuline. Au préalable, voici quelques informations pratiques sur la Protéin Data Bank et le logiciel RASMOL.
1-INFORMATIONS TECHNIQUES
1-1- Naviguer dans la PROTEIN DATA BANK
(Adresse Internet : http://pdb.pdb.bnl.gov/ )
A partir de la page d'accueil vous pouvez accéder aux pages suivantes en cliquant les mots sensibles soulignés et colorés. (Structure du serveur au 10/02/97 : modifications possibles depuis cette date). Parmi les fonctions disponibles :
Pour obtenir un fichier molécule au format RASMOL
Les fichiers de molécules, utilisables sous RASMOL, portent l'extension .pdb. Ce sont des fichiers textes, contenant des informations sur la molécule, sa description complète (composition, séquence, structure) et des données sur les techniques de recherche ayant permis son exploration.
Searching and browsing the PDB
3DB Browser
Entrez l'identificateur (4 caractères) de la molécule désirée et lancer la recherche.
Dans la page obtenue choisissez par exemple
Biological ou Assymetric unit, pdb entry, [complete molecule]
Le fichier molécule est alors chargé, vous pouvez le sauvegarder. Il s'agit d'un fichier texte dont vous pouvez afficher le contenu à l'aide d'un traitement de texte. Son entête comporte des renseignements sur la molécule, son origine et sa structure. Le corps du fichier est la liste et les coordonnées des résidus de la molécule. Pour visualiser et manipuler la molécule vous devez utiliser le fichier sous RASMOL.
Pour connaître la liste des molécules disponibles au format RASMOL Searching and browsing the PDB
Indexed list of PDB entries
sélectionner le fichier molecule.idx
Une longue liste des molécules (une centaine de pages écran), classées par ordre alphabétique, apparaît. Notez soigneusement l'identificateur (4 caractères) des molécules susceptibles de vous intéresser.
Pour télécharger le logiciel RASMOL
Molecular biology servers
Rasmol Home page
Getting RASMOL puis Getting and intalling RASMOL
Vous devez alors choisir, en fonction de votre configuration informatique, la version de RASMOL qui vous intéresse. Ce choix déclenche le téléchargement du logiciel dans le répertoire de votre choix. Vous pouvez, suivant une méthode analogue obtenir les fichiers d'aides et la documentation. De nombreuses informations sur l'installation et l'utilisation du logiciel sont accessibles en plusieurs points du serveur (Software and related information, par exemple).
1-2- Utiliser le logiciel RASMOL
Le logiciel RASMOL est un outil de recherche mais surtout d'enseignement qui permet
- de visualiser des biomolécules en choisissant un mode de représentation pertinent orienté soit charpente moléculaire, soit composition chimique,
- manipuler facilement les molécules : orientations permettant une appréhension de sa configuration spatiale, codage adapté des couleurs, visualisation des différents composants ...
- explorer sa configuration : liaisons, atomes, groupements, chaînes, structures particulières ...
L'écran de travail du logiciel
une fenêtre de visualisation de la molécule dans laquelle on oriente, au moyen de la souris et d'ascenseurs, la molécule dans l'espace,
un menu déroulant offrant des commandes relatives à la gestion des fichiers et aux modes de visualisation de la molécule,
une ligne de commande permettant de modifier la molécule et sa représentation,
une aide dans laquelle on pourra rechercher les informations précises qui ne sont pas données dans ce bref rapport.
Les modes de représentation moléculaires
Visualisation des atomes constitutifs et de leur liaison
Ball and stick : boules (atomes) et bâtonnets (liaisons)
Wireframe : seules sont représentées les liaisons covalentes sous forme de cylindre
Spacefill : seuls sont représentés les atomes sous formes de sphères adjacentes
code couleur des atomes : C gris, O rouge, N bleu, S jaune, P orangé, H non visualisé, etc...
visualisation de la structure moléculaire
Backbone (" backbone " = épine dorsale) : seules sont conservées les liaisons entre alpha carbones (carbones liés aux radicaux CO et NH terminaux) de chaque acide aminé
Ribbons ou Strands : surface rubanée ou courbes passant par le backbone de la molécule
code couleur des structures : hélices alpha en magenta, feuillets bêta en jaune, coudes en bleu.
Il est également possible,
par le menu déroulant
de colorer la molécule par résidus (une couleur par type d'acide aminé ou par numéro dans la séquence), par chaîne ou segment ...
de visualiser les liaisons hydrogènes ou disulfure, d'afficher des axes ou des boîtes de rotation de la molécule à l'écran, de sauvegarder l'image à différents formats, d'imprimer ...
par la ligne de commande
de modifier les paramètres de fonctionnement du logiciel, d'éditer ou de modifier la molécule, de n'en sélectionner qu'une partie ou un type de constituant, etc.
.... ce qui demandera une étude approfondie de l'aide de RASMOL.
2- DE LA SEQUENCE A LA STRUCTURE PROTEIQUE
Le travail est réalisé sur une petite protéine de 50 AA : le facteur de croissance transformant humain.
-----------------------------------------------DOCUMENT ELEVE--------------------------------------------------
Recherche des constituants élémentaires de la protéine
Quels atomes constituent la molécule ?
Charger la protéine : File - Open - " gf.pdb "
Relever les informations relatives à sa taille : File - Informations
Afficher une représentation Ball & Sticks : Display - Ball & Sticks / Color - CPK
Les atomes sont représentés par des boules, les liaisons par des bâtonnets.
Code couleurs : C gris N bleu O rouge H non représentés S jaune P orangé
Lister les atomes entrant dans la composition de la molécule :
Quels groupements constituent la molécule ?
Afficher une représentation Backbone (backbone = épine dorsale de la protéine) et colorer les acides aminés : Display - Backbone /Color- Shapely / Options - Labels les noms des AA apparaissent
Lister quelques acides aminés constituant la protéine (chaque AA est désigné par les 3 premières lettres de son nom), en partant d'une de ses extrémités : leur enchaînement ordonné constitue la séquence polypeptidique de la protéine ou structure primaire.
Mise en évidence des structures secondaire et tertiaire de la protéine
 |
Quelle est la forme interne de la protéine ?
Afficher une représentation en ruban et repérer la configuration spatiale du polypeptide
Display Ribbons / Color - Structure / faire tourner la molécule
Les hélices (colorées en magenta), les feuillets (colorés en jaune) et les coudes (colorés en bleu) constituent la structure secondaire de la protéine. |
Quelle est la forme générale de la protéine ?
En faisant tourner la molécule observer la forme générale de la protéine. Les extrémités du polypeptide sont-elles très éloignées ?
On appelle structure tertiaire ce repli du polypeptide qui donne une forme générale globulaire à la protéine. |
Comment cette structure est-elle maintenue ?
Display - Backbone / Color- Shapely
Repérer l'AA cystéine CYS qui se reconnaît à sa couleur jaune
Quelle est la position de ces 6 AA dans la séquence polypeptidique ?
Quelle est leur position dans l'organisation spatiale de la protéine ?
Noter sur le schéma ci-contre les AA CYS avec leur numéro dans la séquence peptidique.
Semble t-il exister des liens privilégiés entre ces AA ?
Utiliser la ligne de commande pour visualiser un type particulier de liaison, les ponts disulfures :
SSBonds On Set SSBonds Sidechain
Entre quels AA s'établissent ces liaisons particulières ?
Display - Ball & Sticks / Color - CPK Set SSBonds Sidechain
Entre quels atomes s'établissent ces liaisons particulières ? |
 |
 |
Représenter sur le schéma ci-dessus les liaisons peptidiques par lesquelles ces 2 AA s'insèrent dans la charpente de la protéine.
Quel semble être le rôle de la liaison sulfure dans la forme générale de la molécule ?
Conclure en exprimant clairement comment la séquence polypeptidique détermine la structure de la protéine :
-------------------------------------------------------------------------------------------------
3- DE LA STRUCTURE A LA FONCTION PROTEIQUE
3-1- Etude d'une enzyme : la désoxyribonucléase
La molécule présentée ici est une désoxyribonucléase complexée à un tétranucléotide ATAA.
Fig. 1 : Une représentation en bâtons des liaisons ou en boules des atomes, une coloration des 2 chaînes présentes (la protéine enzymatique et l'acide nucléique) et une orientation convenable de la molécule dans l'espace font apparaître la complémentarité de forme entre l'enzyme et son substrat au niveau du site actif. |
 |
 |
Fig. 2 : Une représentation en rubans de la chaîne protéique, une orientation convenable de la molécule et une visualisation des ponts sulfures montrent l'importance du maintien de la structure tertiaire de la protéine enzymatique pour la conformation du site actif.
3-2- Etude d'un marqueur HLA
Molécule étudiée : HLA de classe 1 et de sérotype A 02 01 complexé avec un peptide de l'enveloppe du virus HIV-1. Identificateur PDB : 1HHG
Construction d'un modèle structural du marqueur HLA
Une représentation en rubans, une coloration par chaînes/segments et une orientation convenable de la molécule montrent un complexe de 3 protéines :
- la chaîne lourde (codée par le CMH) composée de ses 3 domaines a1, a2, a3
(90,182 et 275 AA),
- la b2 microglobuline (99 AA),
- le peptide viral (9 AA).
A l'issue de ce travail il est facile de proposer un modèle structural grossier des principaux domaines du marqueur positionnés par rapport à la membrane cellulaire.
Construction d'un modèle fonctionnel du marqueur HLA
Une représentation en rubans, une coloration par structures d'une vue plongeante de la molécule au niveau de la jonction des domaines a1 et a2, montrent le peptide logé dans une " corbeille " constituée d'un feuillet pour le fond et de 2 hélices a pour les bords.
Ce travail permet de proposer un modèle fonctionnel du marqueur identifié comme un présenteur d'antigène à la surface des cellules.
3-3 Etude d'une immunoglobuline
Molécule étudiée : Immunoglobuline G1 humaine coupée au niveau de la région charnière : on ne dispose que du segment FAB. Identificateur PDB : 2IG2
Construction d'un modèle structural d'une immunoglobuline
La représentation "boules et bâtonnets" montre un ensemble de 8 domaines globulaires disposés en V
Une représentation en rubans, une coloration par chaînes/segments et une orientation convenable de la molécule font apparaître la structure quaternaire de la protéine constituée de 2 ensembles symétriques de 2 chaînes reliées par des ponts sulfure :
- chaîne lourde composée d'un domaine CH constant et VH variable (227 AA),
- chaîne légère composée d'un domaine CL constant et VL variable (227 AA).
La structure de cette IgG peut être proposée comme modèle de base à la structure de l'ensemble des immunoglobulines membranaires ou circulantes.
 
Construction d'un modèle fonctionnel d'immunoglobuline
La même représentation en vue plongeante de la molécule au niveau de la jonction des domaines VH et VL, met en évidence le site de fixation de l'antigène. La structure tertiaire de la protéine, avec ses chaînes variables très repliées, fait apparaître le site de reconnaissance de l'antigène. En faisant tourner légèrement la molécule autour de l'axe orientant les chaînes lourdes et légères apparaît sa configuration spatiale. La variabilité des segments VH et VL explique la spécificité antigène-anticorps et l'importance du répertoire immunologique d'un individu.
Cette complémentarité de forme Ag Ac permet de proposer un modèle fonctionnel de l'immunoglobuline en tant que récepteur membranaire des lymphocytes B ou en tant qu'anticorps circulant. |
 |
 |
|