Aneta Sawikowska
Es werden umfassende Datenanalysen für Hochdurchsatz-LC-MS-Daten vorgestellt. Methoden der statistischen Analyse und Integration für multifaktorielle Experimente werden gezeigt. Beispieldatensätze stammen aus Studien zur Reaktion von Getreide auf Pathogeninfektionen und Gerste (Hordeum vulgare) unter Dürrestress. Primärmetaboliten, Sekundärmetaboliten und Proteine wurden analysiert.
Die Vorverarbeitung, Analyse und Visualisierung der Daten erfolgte im R-System. Die statistischen Analysen wurden mithilfe von Verfahren im Genstat-Paket durchgeführt. Es werden Methoden zur Integration und Visualisierung von Omic-Daten durch Netzwerke vorgestellt.
Die Korrelationsnetzwerke und differentiellen Korrelationsnetzwerke wurden erstellt, um die Beziehungen zwischen Metaboliten und Proteinen unter verschiedenen Bedingungen zu vergleichen. Merkmale werden durch Knoten dargestellt, Linien (Kanten) entsprechen Korrelationen zwischen den Merkmalspaaren. Module – Cluster mit stark korrelierten Merkmalen – werden erkannt. Hubs, also Merkmale mit vielen Verbindungen (Korrelationen mit anderen Merkmalen), werden angezeigt.
Die Korrelationsnetzwerkanalyse wurde mit dem WGCNA-Paket in R durchgeführt, die Pearson-Korrelationsmatrix wurde mithilfe einer Potenzfunktion in eine Adjazenzmatrix umgewandelt. Module wurden durch Clustering erkannt. Differenzielle Korrelationsnetzwerke wurden mithilfe des auf Fishers Z-Transformation basierenden Tests mit Bonferroni-Korrektur erstellt. Die Visualisierung der Netzwerke wurde in Cytoscape durchgeführt.
Die Algorithmen können an alle Hochdurchsatz-LC-MS-Daten angepasst werden.