Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

On the application of machine learning approaches in astronomy: Exploring novel representations of high-dimensional and complex astronomical data

Kügler, Sven Dennis

[thumbnail of thesis.pdf]
Preview
PDF, English
Download (29MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

The goal of the presented work is the application of data-driven methods on complex and high- dimensional astronomical databases. The focus of the work is the exploration of novel data representations in order to enable the use of statistical learning approaches in the analysis of data. With the help of diverse science cases, the advantages of the introduced approaches for classication, visualization and regression tasks are shown by applying the developed methodology to astronomical data. In the first part, an alternative approach for estimating redshifts of spectra by using the knowledge about the redshifts provided by the SDSS pipeline is presented. A novel data repre- sentation is employed which contains only information relevant for estimating the redshift and the detection of multiple redshift systems. Subsequently, a novel data representation for regu- larly sampled light curves based on recurrent networks is presented. This allows an explorative investigation of huge databases with unlabeled data. Finally, a new way of representing the static part of irregularly sampled light curves by a mixture of Gaussians is discussed. This represen- tation is more general than the extraction of features, as it allows the inclusion of photometric uncertainties and avoids the introduction of observational biases.

Translation of abstract (German)

Das Ziel der vorgestellten Arbeit ist die Anwendung datengetriebener Methoden auf komplexen und hoch-dimensionalen astronomischen Datenbanken. Der Schwerpunkt der Arbeit liegt dabei in der Erforschung neuer Datenrepräsentationen, um die Analyse der Daten mit Hilfe existierender Methoden des statistischen Lernen zu ermöglichen. Anhand von verschiedenen wissenschaftlichen Anwendungen werden die Vorteile der untersuchten Ansätze für Klassifizierungs-, Visualisierungs- und Regressionsaufgaben an astronomischen Daten aufgezeigt. Im ersten Teil der Arbeit wird eine alternative Methode zur Bestimmung von spektralen Rotverschiebungen vorgeschlagen, welche die, von SDSS bestimmten, Rotverschiebungen als Wissensbasis nutzt. Die neue Darstellungsweise der Daten enthält hierbei nur Informationen, welche für die Bestimmung der Rotverschiebung, sowie der Detektion von multiplen Rotverschiebungen, notwendig sind. Anschließend wird eine neuartige Repräsentation von regelmäßigen Zeitreihen vorgestellt, basierend auf wiederkehrenden neuronalen Netzen. Dies erlaubt eine explorative Untersuchung von großen nicht-klassifizierten Datenbanken. Danach wird die Verwendung von Gaußschen Mischverteilungsmodellen als Darstellung für den statischen Teil von unregelmäßigen Zeitreihen diskutiert. Diese Darstellung ist allgemeiner formuliert als die Darstellung durch einzelne Merkmale, da sie die Einbeziehung photometrischer Unsicherheiten ermöglicht und nicht durch systematische Beobachtungseffekte beeinflusst wird.

Document type: Dissertation
Supervisor: Heidt, Prof. Dr. Jochen
Date of thesis defense: 9 December 2015
Date Deposited: 17 Dec 2015 13:41
Date: 2015
Faculties / Institutes: The Faculty of Physics and Astronomy > Institute of Physics
DDC-classification: 004 Data processing Computer science
520 Astronomy and allied sciences
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative