Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Validation of Crystallographic B Factors and Analysis of Ribosomal Crystal Structures

Negroni, Jacopo

German Title: Validierung der kristallographischen B-Faktoren und Analyse ribosomaler Kristallstrukturen

[thumbnail of phd_thesis_Jacopo_Negroni_final_20122011.pdf]
Preview
PDF, English
Download (32MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

In X-ray crystallography, validation tools assess the quality and the reliability of the structural models that crystallographers build and refine. These tools check both the consistency of physical, chemical and statistical properties of the model with the prior knowledge available in structural databases, and the agreement of the model with the diffraction data. B factors give important information about the spatial disorder of each atom around its rest position in a crystal, allowing one to infer the precision of atomic coordinates and dynamical properties of the macromolecule. The first part of the thesis work is focused on the development of a new validation tool for the distribution of isotropic B factors in crystallographic models. By means of a Bayesian approach the shifted Inverse-Gamma distribution (IGD*) is proposed as a reference distribution and a validation protocol is designed and developed to test this hypothesis. Starting from an empirical B factor distribution, the protocol returns the parameters estimates of the IGD* that best fits the B factor distribution and a p-value that is used to label the distribution as acceptable or suspicious. The protocol is then tested on a large data set of high-resolution protein structures from the PDB. From the distribution of the IGD* parameters it is possible to identify different groups of outliers, each characterized by peculiar features. Moreover, from the analysis of the distribution of p-values, the majority of the structures analysed have an acceptable B factor distribution and the agreement to the IGD* follows a hierarchical organization (whole asymmetric unit content, single chains and single domains). B factor distributions that do not satisfy the IGD* assumption usually correspond to models with problems with the deposited coordinates or diffraction data. In light of these results the developed protocol is proposed as an effective tool for the validation of B factor distributions in macromolecular crystallography. Furthermore, provided that the diffraction data are deposited in the PDB, a standard re-refinement protocol is confirmed to be a valid approach to rescue a B factor distribution from suspicious to acceptable, and to improve the quality of the results of the ensemble analysis performed with the ESCET framework if the starting data set contains models with suspicious B factor distributions. The validation protocol for B factor distributions finds a direct application in the second part of the thesis work, which is focused on the ensemble analysis with the ESCET framework of a selected data set of twenty-nine 30S ribosomal subunits from Thermus thermophilus. Thirteen refinement protocols are tested to improve, normalise and de-bias the selected structures, and to rescue models with suspicious B factor distributions. A comparative ensemble analysis is performed between the ribosomal models as deposited into the PDB and those obtained from the best refinement protocol in terms of refinement statistics and distribution of B factors. The cluster analysis is confirmed to be an effective method to automatically rationalise the structural information content of the data set. The observation that after re-refinement some structures moved to a different cluster confirms the existence of structural bias in the originally deposited structures and leads to the discovery of electron density that was not modelled in the deposited structure. Improvements of refinement statistics after re-refinement result in lower coordinate uncertainty estimates with positive effects on the results of the rigid body analysis. The main rigid bodies found on the 16S rRNA correspond to the domains known in the literature to move during the decoding process. Final remarks are given about the possible application of the presented validation tool for B factor distributions and about the importance of the availability of experimental data.

Translation of abstract (German)

In der Röntgenkristallographie werden Validierungswerkzeuge benutzt, um die Qualität und Zuverlässigkeit von Strukturmodellen, die Kristallographen erstellen und verfeinern, zu bemessen. Diese Werkzeuge überprüfen sowohl die Konsistenz physikalischer, chemischer und statistischer Parameter des Modells mit denen bereits bekannter Strukturen, als auch die Übereinstimmung mit den Beugungsdaten. Die B-Faktoren enthalten wichtige Informationen über die Genauigkeit der räumlichen Positionierung rund um die im Kristall bestimmte Position. Dies ermöglicht einerseits die Analyse der Genauigkeit der Atomkoordinaten und andererseits eine Einschätzung der dynamischen Eigenschaften des Makromoleküls. Der erste Teil dieser Dissertation beschätigt sich mit der Entwicklung eines neuen Werkzeugs zur Validierung der Verteilung isotroper B-Faktoren in kristallographischen Modellen. Ausgehend von einem bayesschen Ansatz wird die “shifted Inverse-Gamma distribution” (IGD*) als Referenzverteilung vorgeschlagen und ein Validierungsprotokoll zum Testen dieser Hypothese entwickelt. Ausgehend von der empirisch ermittelten Verteilung der BFaktoren, schätzt das Protokoll die Paramter der IGD*, welche die B-Faktor Verteilung am besten beschreiben, und berechnet einen p-Wert, um die Verteilung als aktzeptabel oder verdächtig zu klassifizieren. Das Protokoll wird gegen einen grossen Datensatz hochauflösender Strukturen aus der PDB getestet. Aus der Verteilung der IGD*-Parameter lassen sich verschiedene Gruppen von Ausreissern erkennen, die sich durch charakteristische Eigenschaften von anderen abgrenzen. Darüber hinaus zeigt die Analyse der p-Werte, dass die meisten der untersuchten Strukturen eine akzeptable Verteilung der B-Faktoren aufzeigen. Die Übereinstimmung mit der IGD* folgt hierbei einer hierarchischen. Organisation (gesamte asymmetrische Einheit, einzelne Molekülketten und einzelne Domänen). Modelle, deren B-Faktorverteilung nicht der IGD*-Annahme entsprichen, zeigen meist auch Unregelmässigkeiten bei den in der Datenbank hinterlegten Koordinatendaten oder aber auch bei den Streuungsdaten. Basierend auf den erhaltenen Ergebnissen wird das entwickelte Protokoll als effektives Werkzeug für die Validierung der B-Faktor Verteilung in der makromolekularen Kristallographie vorgeschlagen. DesWeiteren wird bestätigt, dass ein Standard Protokoll zum Re-Refinement (erneute Verfeinerung) ein geeignetes Instrument ist, die BFaktor Verteilung von verdächtig nach akzeptabel zu korrigieren. Dies führt ausserdem zu einer Qualitätsverbesserung der Ergbnisse für die Ensemble Analyse mit dem ESCET Paket für Fälle, bei denen der Startdatensatz Modelle mit verdächtigen B-Faktor Verteilungen enthält. Im zweiten Teil dieser Arbeit wird das Protokoll zur Validierung der B-Faktor Verteilung angewandt, um eine Ensemble Analyse mit dem ESCET Paket für 29 Datensätze der 30S Untereinheit des Ribosoms aus Thermus thermophilus durchzuführen. Dreizehn Protokolle werden getestet, um die jeweiligen Strukturen zu verbessern, zu normalisieren, Beeinflussungen durch benutzte Modelle zu korrigieren und Modelle mit verdächtiger BFaktor Verteilung anzupassen. Es wird eine vergleichende Ensemble Analyse zwischen den in der PDB hinterlegeten Strukturmodellen und den optimal verfeinerten (Refinement Statistik / B-Faktor Verteilung) Modellen vorgestellt. Es wird bestätigt, dass die Cluster Analyse die geeignete Methode ist, um automatisch die strukturspezifischen Informationen des Datensatzes systematisch zu erfassen. Durch das Re-Refinement werden einzelne Strukturen anderen Clustern zugeordnet, was zum einen die Existenz von strukturellen Fehlern in den hinterlegten Daten zeigt, und zum anderen zur Identifikation von Elektronendichte führt, die nicht zum Erstellen des veröffentlichten Strukturmodells benutzt wurde. Die Verbesserung der Verfeinerungsstatistiken führen zu höherer Genauigkeit der Koordinaten, was wiederum einen positiven Effekt auf die Ergebnisse der Rigid-Body Analyse hat. Die wichtigsten Rigid-Bodies der 16S rRNA, die gefunden wurden, korrespondieren mit den Domänen, für die in der Literatur eine koformationelle Bewegung während des Dekodierungs Prozesses beschrieben ist. Die Arbeit schliesst mit einem Ausblick auf mögliche Anwendungsfelder für das vorgestellte Protokoll zur Valdierung der B-Faktor Verteilung ab. Hierbei wird insbesondere die Bedeutung der Verfügbarkeit experimenteller Daten hervorgehoben.

Document type: Dissertation
Supervisor: Svergun, Dr. Dmitri
Date of thesis defense: 21 February 2012
Date Deposited: 23 Feb 2012 11:41
Date: 2012
Faculties / Institutes: Service facilities > Centre for Organismal Studies Heidelberg (COS)
DDC-classification: 570 Life sciences
Uncontrolled Keywords: Validation , Crystallographic B factor , Ribosome analysis
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative