Texas A&M analysiert Einzelzell-RNA-Sequenzierungsdaten mit MATLAB

Projekt fördert Quantencomputing-Anwendungen in den Biowissenschaften

„MATLAB bietet eine nahtlose und zuverlässige Umgebung für die Entwicklung von Quantencomputeralgorithmen. Sein Quantencomputerpaket bietet erhebliche Vorteile in Bezug auf Benutzerfreundlichkeit, Stabilität und Portabilität und hat unsere Forschung erheblich verbessert.“

Wichtigste Ergebnisse

  • Das MATLAB Support Package for Quantum Computing ermöglicht einfaches lokales Testen von Algorithmen für eine schnelle Entwicklung und Methodenvalidierung
  • MATLAB bietet Vorteile gegenüber anderer Quantencomputing-Entwicklungssoftware wie Qiskit® in Bezug auf Benutzerfreundlichkeit, Stabilität und Portabilität
  • Das MATLAB Support Package for Quantum Computing ist klar, gut strukturiert und leicht verständlich, sodass Quantenalgorithmen schnell implementiert werden können
Drei Diagramme, die eine Trajektorie der Zelldifferenzierung von embryonalen Stammzellen zu Endothelzellen zeigen, ein Liniendiagramm, das die standardisierte Genexpression über Pseudotime mit LASSO zeigt, und ein Graph, der QUBO verwendet und Unterschiede in den Genexpressionstrends hervorhebt.

In Panel C markieren grüne Linien die 18 Gene, die sowohl mit LASSO- als auch mit QUBO-basierten Methoden identifiziert wurden, während die nicht markierten Linien Gene darstellen, die ausschließlich mit der QUBO-basierten Methode identifiziert wurden.

Am College of Veterinary Medicine and Biomedical Sciences der Texas A&M University leitet Professor James Cai ein interdisziplinäres Projekt, bei dem Quantencomputing zur Analyse von Genexpressionsdaten auf Einzelzellebene eingesetzt wird. Das Team von Professor Cai nutzt gatterbasierte Quantencomputer, um Netzwerke aufzubauen, die zeigen, wie Gene sich gegenseitig regulieren. Sie verwenden außerdem eine Methode namens Simulated Quantum Annealing (QA) mit quadratischer unrestringierter binärer Optimierung (QUBO), um aus scRNA-seq-Daten wichtige Gene auszuwählen, die an der Veränderung und Entwicklung von Zellen beteiligt sind.

Die Tabu-Suche-Implementierung in MATLAB® wird für die simulierte Abkühlung zur Lösung von QUBO-Problemen verwendet. Beispielsweise identifizierte ein auf QUBO basierender Merkmalsauswahlalgorithmus 10 scheinbar nichtlineare Geninteraktionen aus den 50 Merkmalen, die ursprünglich aus 5.000 ausgewählt wurden. Unter diesen 50 Merkmalen überschnitten sich nur 18 mit denen, die mit der vergleichenden LASSO-Auswahlmethode identifiziert wurden. Dies zeigt, dass der QUBO-QA-Ansatz nicht nur die wichtigsten linearen Genexpressionen erfasst, sondern auch komplexe nichtlineare Genexpressionsmuster aufdeckt.

Statistics and Machine Learning Toolbox™ wird im gesamten Projekt umfassend eingesetzt, insbesondere in Datenverarbeitungs-Workflows. Professor Cai entwickelte die scGEAToolbox, um die Analyse von scRNA-seq-Daten in der MATLAB-Umgebung zu erleichtern. Sie enthält einen umfassenden Satz von Funktionen zur Datennormalisierung, Merkmalsauswahl, Zellclusterung, Zelltypannotation, Pseudozeitanalyse, Gennetzwerkkonstruktion, virtuellen Gen-Knockout-Analyse und Zell-Zell-Kommunikationsanalyse. Curve Fitting Toolbox™, Parallel Computing Toolbox™ und Image Processing Toolbox™ werden ebenfalls zur Visualisierung und zur Ergänzung von Analysen verwendet.

Das Projekt ist ein bahnbrechendes Beispiel dafür, wie Quantencomputing in den Biowissenschaften eingesetzt werden kann. Mit MATLAB können Forschende diese anfängliche Arbeit replizieren und darauf aufbauen, um die Anwendung des Quantencomputings, insbesondere für die Transkriptomik-Forschung, weiter voranzutreiben. Auf lange Sicht könnte sich dadurch die Art und Weise grundlegend ändern, wie Quantencomputer zur Entwicklung personalisierter Diagnosen und Behandlungen auf der Grundlage individueller genetischer Daten eingesetzt werden.