NACH OBEN

Workflows für Proteomics-Daten aus Medizin und Lebenswissenschaften

Der Forschungsbereich „Medizinische Bioinformatik“ stellt zahlreiche bioinformatische Tools und Workflows bereit, die häufige Fragestellungen, z.B. nach der Identifikation und Quantifizierung von Proteinen und der statistische Datenanalyse im Bereich Medizin und Lebenswissenschaften abdecken. 
Darüber hinaus erstellen wir im Rahmen unsere Services maßgeschneiderte bioinformatische Lösungen bis hin zu maschinellem Lernen und unterstützen bei der Interpretation der Ergebnisse für wissenschaftliche Publikationen (
Turewicz et al. 2017). Hierzu kann jederzeit gerne und einfach mit uns Kontakt aufgenommen werden. Im Rahmen unserer Tool- und Workflow-Entwicklung legen wir großen Wert auf Nutzerfreundlichkeit. Einen Überblick mit einer Auswahl an Workflows finden Sie auf dieser Seite.

 

nach oben

Qualitätskontrolle auf Rohdaten und Identifizierungen

MaCProQC

In diesem Workflow werden massenspektrometrische Rohdaten ausgewertet und verschiedene Metriken zur Beurteilung der Datenqualität berechnet. Dazu zählen Kennzahlen, die allein auf den Rohdaten basieren, wie zum Beispiel die Anzahl aufgenommener MS1- und MS2-Spektren, TICs und Precursorladungen. Darüber hinaus werden mithilfe verschiedener Suchmaschinen Peptide identifiziert und daraus beispielsweise die Anzahl identifizierter Peptide und Proteine oder der Anteil von missed cleavages berechnet.

Verschiedene grafische Darstellungen dieser Kennzahlen sind in dem Workflow enthalten. Eine Hauptkomponentenanalyse wird aus den Kennzahlen berechnet, durch die möglicherweise in den Daten vorliegende systematische Verzerrungen erkennbar werden. Es werden gegebenenfalls Ausreißer-Proben sichtbar, die neu gemessen oder entfernt werden müssen. Am Anschluss an die Qualitätskontrolle kann die weitere Analyse der Daten fortgesetzt werden.

Workflow auf KNIME Hub

nach oben

Identifikation

PIA

PIA ist eine Toolbox für Proteininferenz- und Identifikationsanalysen für massenspektrometrische Daten. Mit PIA können Sie die Ergebnisse gängiger Suchmaschinen zur Identifizierung von Massenspektren vergleichen und sie miteinander kombinieren. Das Hauptaugenmerk von PIA liegt auf den integrierten Inferenz-Algorithmen, d.h. auf der Inferenz der Proteine aus den identifizierten Peptiden. Es erlaubt aber auch, Peptid-Spektrum-Matches (PSMs) anzusehen, FDR-Werte über verschiedene Suchmaschinenergebnisse hinweg zu berechnen und die Übereinstimmungen zwischen PSMs, Peptiden und Proteinen zu visualisieren. 

Publikationen:
Workflow auf KNIME Hub

nach oben

Quantifizierung

Calibra Curve

Calibra Curve ist ein nützliches und flexibles Werkzeug zur Kalibrierung von gezielten („targeted“) massenspektrometrie-basierten Messungen. Es ermöglicht eine automatisierte Bestimmung dynamischer linearer Bereiche und Quantifizierungsgrenzen sowohl für Targeted Proteomics als auch für ähnliche Assays. Die Software verwendet eine Vielzahl von Messgrößen zur Beurteilung der Genauigkeit der Kalibrierung und bietet intuitive Visualisierungen.

Publikation
Workflow auf KNIME Hub

KNIME-Workflow für Protein-Quantifizierung

Dieser Workflow umfasst die Konvertierung der Rohdaten zu mzML-Dateien, die Peptid-Identifizierung (unter Nutzung verschiedener Suchmaschinen), Protein-Inferenz, Feature Detection und Quantifizierung. Außerdem werden mzIdentML-Dateien erstellt, die für den Upload nach PRIDE genutzt werden können. Innerhalb des Workflows wird das Tool PIA für die Protein-Inferenz sowie OpenMS-KNIME-Knoten für weitere Funktionalitäten verwendet. Der Workflow ist auf die lokale Infrastruktur angepasst und auf einem internen KNIME-Server lauffähig. Der Workflow kann auf Anfrage zur Verfügung gestellt werden, bedarf dann aber einiger Anpassungen.

nach oben

Qualitätskontrolle und Normalisierung von quantitativen Daten

QC_quant

Dieser Workflow ist auf die Qualitätskontrolle von quantitativen Proteomik-Daten ausgelegt. Die Daten werden durch valide Werte, Boxplots und Hauptkomponentenanalyse visualisiert. Eine Normalisierung der Daten über Median, -Quantils- oder LOESS-Normalisierung ist möglich und kann mithilfe von MA-Plots beurteilt werden. Der Workflow erlaubt verschiedene Einstellungen, z.B. zur Logarithmierung der Daten und Farben für die Grafiken. 

Workflow auf Github (R-Skripte mit Tutorial)

nach oben

Statistische Auswertung

Differentielle Analyse von Proteindaten

Mithilfe dieses Workflows können Proteinmessungen aus zwei Gruppen von Proben mithilfe eines t-Tests statistisch miteinander verglichen werden. Die resultierenden p-Werte werden für multiples Testen adjustiert und gemeinsam mit den Fold changes in einen Volcano Plot dargestellt.