Statistics Toolbox

Hauptmerkmale

Explorative Datenanalyse

Statistics Toolbox bietet verschiedene Möglichkeiten zur Untersuchung von Daten: statistische Auswertungen mit interaktiven Grafiken, Algorithmen zur Clusteranalyse und beschreibende Statistik für große Datensätze.

Statistische Darstellung und interaktive Virtualisierung

Statistics Toolbox beinhaltet Plots und Diagramme, mit denen Sie Ihre Daten visuell untersuchen können. Die Toolbox vereint MATLAB®-Diagrammtypen mit Wahrscheinlichkeitsdiagrammen, Boxplots, Histogrammen, Scatter-Histogrammen, 3D-Histogrammen, Kontrolldiagrammen und Quantile-Quantile-Plots. Die Toolbox bietet auch spezielle Plots für multivariate Analysen, darunter Dendrogramme, Biplots, Parallelkoordinatenplots und Andrews-Diagramme.

Gruppen-Scatter-Matrix, die die Interaktionen von fünf Variablen darstellen.

Gruppen-Scatter-Matrix, die die Interaktionen von fünf Variablen darstellen.

Darstellung von multivariaten Daten (Beispiel)
So werden multivariate Daten mit verschiedenen statistischen Plots dargestellt.

Compact box plot with whiskers for response grouped by year to look for potential year-specific fixed effects.

Kompakter Boxplot mit Whiskers für nach Jahr gruppierten Antworten zur Suche nach potentiellen jahresspezifischen Fixed Effects.

Scatter-Histogramm aus einer Kombination von Scatter-Plots und Histogrammen zur Beschreibung der Beziehung zwischen Variablen.

Scatter-Histogramm aus einer Kombination von Scatter-Plots und Histogrammen zur Beschreibung der Beziehung zwischen Variablen.

Diagramm mit Vergleich der empirischen CDF für eine Probe aus einer extremen Werteverteilung mit einem Plot der CDF für die Stichprobenverteilung.

Diagramm mit Vergleich der empirischen CDF für eine Probe aus einer Extremwertverteilung mit einem Plot der CDF für die Stichprobenverteilung.

Plot comparing the empirical CDF for a sample from an extreme value distribution with a plot of the CDF for the sampling distribution.
Diagramm mit Vergleich der empirischen CDF für eine Probe aus einer Extremwertverteilung mit einem Plot der CDF für die Stichprobenverteilung.

Modellierung von Daten mit allgemeiner Extremwertverteilung (Beispiel)
So wird die allgemeine Extremwertverteilung mithilfe von Maximum-Likelihood-Schätzung angepasst.

Deskriptive Statistik

Mit Hilfe der deskriptiven Statistik können Sie potenziell große Datenmengen schnell verstehen und beschreiben. Die Statistics Toolbox umfasst verschiedene Berechnungsfunktionen:

Diese Funktionen helfen Ihnen dabei, Werte in einer Stichprobe mit wenigen hoch relevanten Zahlen zusammenzufassen.

Resampling-Techniken

Unter bestimmten Umständen ist eine Abschätzung einer zusammenfassenden Statistik mit Hilfe parametrischer Methoden nicht möglich. Für solche Fälle bietet die Statistics Toolbox Resampling-Techniken an, wie:

  • Zufälliges Sampling aus einem Datensatz mit oder ohne Ersatz
  • Allgemeine Bootstrapping-Funktion zur Abschätzung der Stichprobenstatistik mithilfe von Resampling
  • jackknife Funktion zur Abschätzung der Stichprobenstatistik mithilfe von Teilmengen der Daten
  • bootci Funktion zur Abschätzung von Konfidenzintervallen

Regression und ANOVA

Regressionen

Mit Hilfe der Regression können Sie eine kontinuierliche Variable als Funktion von einem oder mehreren Prädiktoren modellieren. Statistics Toolbox bietet vielfältige Regressionsalgorithmen, darunter lineare Regression, generalisierte lineare Modelle, nichtlineare Regression und Mixed-Effects-Modelle.

Lineare Regressionen

Die lineare Regression ist eine statistische Modellierungsmethode, um eine kontinuierliche abhängige Variable als Funktion von einer oder mehreren Prädiktorvariablen zu beschreiben. Sie können damit das Verhalten von komplexen Systemen verstehen und vorhersagen oder experimentelle, finanzielle und biologische Daten analysieren.

Die Toolbox bietet mehrere Arten linearer Regressionsmodelle und Optimierungsmethoden, darunter:

  • Einfach: Modell mit nur einem Prädiktor
  • Mehrfach: Modell mit mehreren Prädiktoren
  • Multivariat: Modell mit mehreren abhängigen Variablen
  • Robust: Modell auch bei Ausreißern
  • Schrittweise: Modell mit automatischer Variablenauswahl
  • Regularisiert: Modell, das mit redundanten Prädiktoren umgehen und Überanpassung durch Verwendung von Ridge-, Lasso- und elastischen Netz-Algorithmen vermeiden kann

Computational Statistics: Auswahl, Regularisierung und Verkleinerung von Merkmalen mit MATLAB 36:51
So gelingen exakte Anpassungen auch bei korrellierten Daten.

Nichtlineare Regression

Die nichtlineare Regressionen ist eine statistische Modellierungsmethode, mit der nichtlineare Beziehungen in experimentellen Daten beschrieben werden können. Nichtlineare Regressionsmodelle gelten im Allgemeinen als parametrisch, wobei das Modell als nichtlineare Gleichung beschrieben wird. Typischerweise werden Methoden für maschinelles Lernen für die nichtparametrische, nichtlineare Regression angewandt.

Die Toolbox bietet außerdem robuste nichtlineare Datenoptimierung, um mit Ausreißern im Datensatz umzugehen.

Fitting mit MATLAB: Statistiken, Optimierung und Kurvenanpassung 38:37
Anwendung von Regressions-Algorithmen mit MATLAB.

Generalisierte lineare Modelle

Generalisierte lineare Modelle sind ein Sonderfall von nichtlinearen Modellen, die lineare Methoden nutzenMit ihnen können abhängige Variablen Nicht-Normalverteilung aufweisenund über eine Verbindungsfunktion verfügen, die beschreibt, wie der erwartete Antwortwert mit den linearen Prädiktoren in Verbindung steht.

Statistics Toolbox unterstützt die Datenoptimierung generalisierter linearer Modelle mit den folgenden Antwortverteilungen:

  • Normal (Probit-Regression)
  • Binomial (logistische Regression)
  • Poisson
  • Gamma
  • Inverse Gauß-Verteilung

Datenoptimierung mit generalisierten linearen Modellen (Beispiel)
So werden generalisierte lineare Modelle mit glmfit und glmval optimiert und ausgewertet.

Mixed-Effects-Modelle

Lineare und nichtlineare Mixed-Effects-Modelle sind Generalisierungen von linearen und nichtlinearen Modellen für Daten, die erfasst und in Gruppen zusammengefasst werden. Diese Modelle beschreiben die Beziehung zwischen einer abhängigen Variable und unabhängigen Variablen mit Koeffizienten, die hinsichtlich einer oder mehrerer Gruppierungsvariablen variieren können.

Statistics Toolbox unterstützt die Optimierung von mehrstufigen oder hierarchischen Modellen mit eingebetteten und/oder gekreuzten Random Effects, die zur Durchführung einer Vielzahl von Studien genutzt werden können, wie z. B.:

  • Längsschnittstudie/Panelstudie
  • Modellerstellung mit Messwiederholung
  • Wachstumsmodellierung
Plot comparing Gross State Product for three states fitted using a multilevel mixed-effects model and ordinary least-squares.
Diagramm zum Vergleich des Bruttoinlandsprodukts von drei Bundesstaaten, optimiert mit einem mehrstufigen Mixed-Effects-Modell (links) und der Methode der kleinsten Quadrate (rechts). Die fitlme Funktion in der Statistics Toolbox kann Modelle mit größerer Vorhersagegenauigkeit erstellen, wenn Daten gesammelt und in Gruppen zusammengefasst werden.

Modellbewertung

Mit der Statistics Toolbox können Sie eine Modellbewertung für Regressionsalgorithmen vornehmen, unter Verwendung von Tests zur statistischen Signifikanz und Maßen der Anpassungsgüte, wie z. B.:

  • F-Test und T-Test
  • R2 und angepasstes R2
  • Kreuzvalidiertes mittleres Fehlerquadrat
  • Akaike Informationskriterium (AIC) und Bayes’ Informationskriterium (BIC)

Sie können Konfidenzintervalle sowohl für Regressionskoeffizienten als auch für vorhergesagte Werte berechnen.

Nichtparametrische Regression

Die Statistics Toolbox unterstützt auch nichtparametrische Regressionstechniken zur Erzeugung eines präzisen Fits, wenn kein explizites Modell, das die Beziehung zwischen Prädiktor und Antwort beschreibt, zur Verfügung steht. Nichtparametrische Regressionstechniken können umfassender als überwachtes maschinelles Lernen für Regression klassifiziert werden; dazu zählen sowohl Entscheidungsbäume als auch Regressionsbäume mit Boosting und Bagging.

Nicht-parametrische Anpassung 4:07
Entwickeln Sie ein prädiktives Modell, wenn Sie keine Funktion angeben können, die die Beziehung zwischen Variablen beschreibt.

ANOVA

Mit der Varianzanalyse (Analysis of Variance, ANOVA) können Sie Beispielvarianzen zu unterschiedlichen Quellen hinzufügen und bestimmen, ob die Abweichung innerhalb oder zwischen verschiedenen Populationsgruppen entsteht. Die Statistics Toolbox umfasst diese ANOVA Algorithmen und damit verbundene Techniken:

Maschinelles Lernen

Algorithmen für maschinelles Lernen verwenden Berechnungsmethoden, um Informationen direkt aus Daten zu „lernen“, ohne vorher eine bestimmte Gleichung als Modell zu übernehmen. Mit wachsender Anzahl von Stichproben, die zum Lernen zur Verfügung stehen, können diese Algorithmen ihre Leistung adaptiv steigern.

Maschinelle Lernverfahren mit MATLAB 3:02
Datenaufbereitung und Training von Modellen zu maschinellen Lernverfahren mit MATLAB

Klassifikation

Mit Klassifizierungsalgorithmen können Sie eine kategorische abhängige Variable als Funktion von einem oder mehreren Prädiktoren modellieren. Die Statistics Toolbox bietet eine Vielzahl parametrischer und nichtparametrischer Klassifikationsalgorithmen, wie:

Einführung in die Klassifizierung 9:00
Entwickeln Sie prädiktive Modelle zur Klassifizierung von Daten.

Sie können die Qualität des Fits für die resultierenden Klassifizierungmodelle mit Hilfe von Techniken bewerten, wie:

Clusteranalyse

Statistics Toolbox bietet verschiedene Algorithmen zur Datenanalyse durch k-Means, hierarchisches Clustering, Gaußsche Mischverteilungsmodelle oder Hidden Markov Models. Wenn die Clusteranzahl unbekannt ist, bietet die Toolbox Techniken zur Clusterschätzung, um die Anzahl der in den Daten vorhandenen Cluster basierend auf einer benutzerdefinierten Metrik zu bestimmen.

Plot showing natural patterns in gene expression profiles obtained from baker’s yeast.
Diagramm mit natürlichen Mustern in Genexpressionsprofilen bei Backhefe. Hauptkomponentenanalyse (PCA) und K-Means-Clustering-Algorithmen werden verwendet, um Cluster in den Profildaten zu finden.

Gencluster mithilfe von k-Means (Beispiel)
Erfahren Sie, wie Muster in Genexpressionsprofilen durch Untersuchung der Genexpressionsdaten entdeckt werden können.

Two-component Gaussian mixture model fit to a mixture of bivariate Gaussians.

Zwei-Komponenten-Gauß-Modell für eine Mischung von bivariaten Peak-Funktionen (Gauß).

Output from applying a clustering algorithm to the same example.
Ergebnis der Anwendung eines Clusteralgorithmus auf dasselbe Beispiel.
Dendrogram plot showing a model with four clusters.

Dendogramm eines Modells mit vier Clustern.

Clusteranalyse (Beispiel)
Verwendung von k-Means und hierarchischem Clustering, um natürliche Gruppierungen in Daten zu finden.

Regressionen

Mit Regressionsalgorithmen können Sie eine kontinuierliche abhängige Variable als Funktion von einem oder mehreren Prädiktoren modellieren. Die Statistics Toolbox bietet eine Vielzahl parametrischer und nichtparametrischer Klassifikationsalgorithmen, wie:

Computational Statistics: Auswahl, Regularisierung und Verkleinerung von Merkmalen mit MATLAB 36:51
So gelingen exakte Anpassungen auch bei korrellierten Daten.

Multivariate Statistik

Multivariate Statistik stellt Algorithmen und Funktionen zur Analyse von mehrfachen Variablen zur Verfügung. Üblicherweise beinhalten Anwendungen Verringerung der Dimensionalität durch Eigenschaftstransformation und Eigenschaftsauswahl sowie Untersuchung der Beziehungen zwischen Variablen mithilfe von Visualisierungstechniken wie Scatter-Plot-Matrizen und klassischer mehrdimensionaler Skalierung.

Angleichung einer orthogonalen Regression mit der Hauptkomponentenanalyse (Beispiel)
Implementierung der Deming-Regression (Total Least Squares).

Eigenschaftstransformation

Die Eigenschaftstransformation (manchmal auch als Merkmalsextraktion bezeichnet) ist eine Technik zur Verringerung der Dimensionalität, mit der bestehende Merkmale in neue Merkmale (Prädiktorvariablen) umgewandelt werden, wobei weniger aussagekräftige Merkmale weggelassen werden können. Die Toolbox bietet die folgenden Ansätze zur Eigenschaftstransformation:

Partial Least Squares Regression und Principal Components Regression (Beispiel)
Modell einer Antwortvariablen in Gegenwart von hoch korrelierten Prädiktoren.

Merkmalsauswahl

Merkmalsauswahl ist eine Technik zur Verringerung der Dimensionalität, bei der nur die Teilmenge der gemessenen Merkmale (Prädiktorvariablen) ausgewählt wird, die bei Modellierung der Daten die beste Vorhersage bietet. Sie ist nützlich, wenn Sie mit hochdimensionalen Daten arbeiten oder das Erfassen von Daten für alle Merkmale zu kostenintensiv ist.

Methoden der Merkmalsauswahl:

  • Die schrittweise Regression fügt Merkmale schrittweise hinzu oder entfernt sie, bis sich die Vorhersagegenauigkeit nicht mehr verbessert; sie kann zusammen mit linearen Regressions- oder generalisierten linearen Regressionsalgorithmen verwendet werden.
  • Die sequentielle Merkmalsauswahl ist der schrittweisen Regression ähnlich und kann zusammen mit jedem Algorithmus für überwachtes maschinelles Lernen und einem benutzerdefinierten Leistungsmaß verwendet werden.
  • Die Regularisierung (Lasso und elastisches Netz) nutzt Schrumpfungsschätzfunktionen zur Entfernung von redundanten Merkmalen, indem ihre Gewichtungen (Koeffizienten) auf null reduziert werden.

Die Merkmalsauswahl kann wie folgt verwendet werden:

  • Verbesserung der Genauigkeit eines Algorithmus für maschinelles Lernen
  • Leistungssteigerung bei sehr hochdimensionalen Daten
  • Verbesserung der Interpretierbarkeit des Modells
  • Verhinderung von Überanpassung

Auswahl von Merkmalen zur Klassifizierung von hochdimensionalen Daten (Beispiel)
Auswahl von wichtigen Merkmalen zur Krebserkennung.

Multivariate Visualisierung

Statistics Toolbox bietet Graphen und Tabellen, mit denen Sie multivariate Daten visuell untersuchen können, darunter sind:

  • Scatter-Plot-Matritzen
  • Dendrogramme
  • Biplots
  • Parallel-Koordinaten-Tabellen
  • Andrews-Diagramme
  • Glyph-Diagramme
Gruppen-Scatter-Plot-Matrix, die zeigt, wie das Modelljahr die unterschiedlichen Variablen beeinflusst.

Gruppen-Scatter-Plot-Matrix, die zeigt, wie das Modelljahr die unterschiedlichen Variablen beeinflusst.

Biplot, das die ersten drei Lasten einer Hauptkomponentenanalyse zeigt.

Biplot, das die ersten drei Lasten einer Hauptkomponentenanalyse zeigt.

Andrews-Diagramm, das die Auswirkung des Ursprungslandes auf die Variablen zeigt.

Andrews-Diagramm, das die Auswirkung des Herkunftslandes auf die Variablen zeigt.

Wahrscheinlichkeitsverteilungen

Die Statistics Toolbox bietet Funktionen und eine Anwendung zur Arbeit mit parametrischen und nichtparametrischen Wahrscheinlichkeitsverteilungen.

Sie können mit der Toolbox Proben aus über 40 verschiedenen Verteilungen berechnen, anpassen und erzeugen, darunter:

Hier finden Sie die komplette Liste der unterstützten Verteilungen.

Mit diesen Tools können Sie:

  • Verteilungen an Daten anpassen
  • Statistische Plots verwenden, um die Anpassungsgüte zu beurteilen
  • Wichtige Funktionen wie Wahrscheinlichkeitsdichtefunktionen und kumulative Verteilungsfunktionen berechnen
  • Zufällige und quasi-zufällige Zahlenreihen aus Wahrscheinlichkeitsverteilungen generieren

Fitten von Verteilungen an Daten

Mit der Distribution Fitting Anwendung können Sie Daten mithilfe vordefinierter univariater Wahrscheinlichkeitsverteilungen, einer nichtparametrischen (Kernel-glättenden) Schätzfunktion oder einer benutzerdefinierten Verteilung anpassen. Diese Anwendung unterstützt sowohl vollständige Daten als auch zensierte (zuverlässige) Daten. Sie können Daten ausschließen, Sessions speichern und laden und MATLAB Code erzeugen.

Visuelle Darstellung der Verteilungsdaten und zusammenfassender Statistiken.
Visuelle Darstellung der Verteilungsdaten (links) und einer zusammenfassenden Statistik (rechts). Mithilfe der Distribution Fitting Anwendung können Sie eine Normalverteilung mit Mittelwert und Varianz (in diesem Beispiel 16,9 bzw. 8,7) abschätzen.

Sie können Verteilungsparameter in der Befehlszeile (? Ist hier das command Window gemeint?) abschätzen oder Wahrscheinlichkeitsverteilungen konstruieren, die den gegebenen Parametern entsprechen.

Zusätzlich können Sie multivariate Wahrscheinlichkeitsverteilungen, darunter auch Gaußsche Misch-, multivariate Normal-, multivariate t- und Wishart-Verteilungen, erzeugen. Sie können Copulas verwenden, um multivariate Verteilungen durch Zusammenschluss beliebiger marginaler Verteilungen mit Hilfe von Korrelationsstrukturen zu erstellen.

Simulating Simulation abhängiger Zufallszahlen mit Copulas (Beispiel)
Erstellen von Verteilungen, die korrelierte multivariate Daten modellieren.

Mit der Toolbox können Sie benutzerdefinierte Verteilungen angeben und diese Verteilungen durch eine Maximum Likelihood Estimation fitten.

Fitten benutzerdefinierter eindimensionaler Verteilungen (Beispiel)
Durchführung der maximalen Wahrscheinlichkeitsabschätzung für gestutzte, gewichtete oder bimodale Daten.

Gütebewertung Gütebewertung eines Fits

Die Statistics Toolbox bietet statistische Plots zur Beurteilung, wie gut ein Datensatz zu einer bestimmten Verteilung passt. Die Toolbox enthält Wahrscheinlichkeitsplots für eine Vielzahl von Standardverteilungen, darunter Normal-, Exponential-, Extremwert-, lognormal-, Rayleigh- und Weibull-Verteilung. Sie können Wahrscheinlichkeitsplots aus vollständigen und zensierten Datensätzen generieren. Zusätzlich haben Sie die Möglichkeit, mit Hilfe von Quantile-Quantile-Plots zu bewerten, wie gut eine gegebene Verteilung mit einer Standard-Normalverteilung übereinstimmt.

Die Statistics Toolbox stellt auch Hypothesentests zur Verfügung, um zu beurteilen, ob ein Datensatz mit verschiedenen Wahrscheinlichkeitsverteilungen konsistent ist. Zu den Tests gehören:

  • Chi-Quadrat-Anpassungstests
  • Einseitige und zweiseitige Kolmogorov-Smirnov-Tests
  • Lillefros-Tests
  • Ansari-Bradley-Tests
  • Jarque-Bera-Tests

Analyse von Wahrscheinlichkeitsverteilungen

Statistics Toolbox stellt Funktionen zur Analyse von Wahrscheinlichkeitsverteilungen bereit, wie:

  • Wahrscheinlichkeitsdichtefunktionen
  • Kumulative Verteilungsfunktionen
  • Inverse kumulative Verteilungsfunktionen
  • Negative log-likelihood Funktionen

Erzeugen von Zufallszahlen

Die Statistics Toolbox bietet Funktionen zur Erzeugung pseudo-zufälliger und quasi-zufälliger Zahlenreihen aus Wahrscheinlichkeitsverteilungen. Sie können Zufallszahlen aus einer gefitteten oder konstruierten Wahrscheinlichkeitsverteilung generieren, indem Sie die Methode random nutzen.

MATLAB Code für die Konstruktion einer Poisson-Verteilung mit einem bestimmten Mittelwert und Erzeugung eines Vektors aus Zufallszahlen, der zu der Verteilung passt.
MATLAB Code für die Konstruktion einer Poisson-Verteilung mit einem bestimmten Mittelwert und Erzeugung eines Vektors aus Zufallszahlen, der zu der Verteilung passt.

Die Statistics Toolbox bietet auch Funktionen für:

  • Erzeugung von zufälligen Stichproben aus multivariaten Verteilungen, wie t, normal, Copulas und Wishart
  • Auswahl aus endlichen Populationen
  • die Durchführung von Latin-Hypercube-Sampling
  • die Erzeugung von Stichproben aus Pearson- und Johnson-Verteilungssystemen

Sie können auch quasi-zufällige Zahlenreihen generieren. Quasi-zufällige Zahlenreihen erzeugen in hohem Maße uniforme Stichproben aus dem Einheits-Hypercube. Quasi-zufällige Zahlenreihen können Monte Carlo-Simulationen häufig beschleunigen, da weniger Proben erforderlich sind, um eine volle Abdeckung zu erreichen.

Codegenerierung

MATLAB Coder ermöglicht die Generierung von portablem und lesbarem C-Code für über 100 Funktionen der Statistics Toolbox, darunter Wahrscheinlichkeitsverteilung und deskriptive Statistik. Der generierte Code lässt sich:

  • Eigenständig ausführen
  • Mit anderer Software integrieren
  • Zur Beschleunigen von Algorithmen einsetzen
  • Für die Implementierung auf Embedded Systemen nutzen

Beschleunigung von statistischen Berechnungen mithilfe von paralleler Berechnung

Statistics Toolbox kann zusammen mit der Parallel Computing Toolbox™ genutzt werden, um die Berechnungszeit zu verkürzen. Die Toolbox verfügt über eine integrierte Berechnungsunterstützung für Algorithmen wie Kreuzvalidierung, Bootstrapping und ermöglicht die Beschleunigung der Monte Carlo-Simulation oder anderer statistischer Probleme.

Mit der integrierten Unterstützung für paralleles Rechnen in der Statistics Toolbox können Sie statistische Berechnungen parallel durchführen, um die Geschwindigkeit zu erhöhen und die Ausführungszeit Ihrer Programme oder Funktionen zu reduzieren.

Reproduzierbare parallele Berechnungen

Sie können die Zufallszahlengenerierung beschleunigen und dabei die gleichen statistischen Eigenschaften der generierten Zufallszahlen ohne Parallelisierung beibehalten. So ist es möglich, dass Ihre Berechnung, die diese Zufallszahlen verwendet, vollständig reproduzierbar ist.

Hypothesentests, statistische Versuchsplanung und statistische Verfahrenskontrolle

Hypothesentests

Zufällige Variationen können es erschweren, festzustellen, ob Stichproben, die unter unterschiedlichen Bedingungen erhoben wurden, sich tatsächlich unterscheiden. Hypothesentests stellen ein effektives Werkzeug parat, um zu analysieren, ob Unterschiede zwischen Stichproben signifikant sind und weiterer Auswertung bedürfen oder mit zufälligen und erwarteten Datenabweichungen konsistent sind.

Die Statistics Toolbox unterstützt häufig verwendete parametrische und nichtparametrische Hypothesentestverfahren, darunter:

  • Ein-Stichproben- und Zwei-Stichproben-t-Tests
  • Nicht-parametrische Test für eine Stichprobe, gepaarte Stichproben und zwei unabhängige Stichproben
  • Verteilungstests (Chi-Quadrat, Jarque-Bera, Lillifors und Kolmogorov-Smirnov)
  • Vergleich von Verteilungen (Zwei-Stichproben Kolmogorov-Smirnov)
  • Tests auf Autokorrelation und Zufälligkeit
  • Lineare Hypothesentests von Regressionskoeffizienten

Auswählen einer Stichprobengröße (Beispiel)
Berechnung der für einen Hypothesentest erforderlichen Stichprobengröße.

Statistische Versuchsplanung

Mit Funktionen für die statistische Versuchsplanung (Design of Experiments, DOE) können Sie Pläne zur Erhebung von Daten für die statistische Modellierung erstellen und testen. Die Pläne zeigen, wie Dateneingaben kovariiert werden müssen, um Informationen über ihre Wirkung auf die Datenausgaben zu erhalten. Unterstützte Entwurfstypen sind u. a.:

  • Voll faktoriell
  • Teilfaktoriell
  • Response Surface (central composite und Box-Behnken)
  • D-optimal
  • Latin-Hypercube

Sie können die Statistics Toolbox verwenden, um eine veränderte Versuchsplanung zu definieren, zu analysieren und zu visualisieren. Es ist beispielsweise möglich, Wirkungen und Eingabeinteraktionen durch ANOVA, lineare Regression und Response Surface Modellierung abzuschätzen und dann die Ergebnisse in Haupteffektplots, Interaktionsplots und Multi-vari-Charts anzusehen.

Fitten eines Entscheidungsbaums an Daten.

Fitten eines Entscheidungsbaums an Daten. Mit den Fittingmöglichkeiten der Statistics Toolbox können Sie einen Entscheidungsbaum durch Zeichnen eines Diagramms der Entscheidungsregel und Gruppierung der Zuweisungen visualisieren.

Modell einer chemischen Reaktion für ein Experiment mit Hilfe der DOE- und Oberflächenfittingmöglichkeiten der Statistics Toolbox.

Modell einer chemischen Reaktion für ein Experiment mit Hilfe der DOE- und Oberflächenfittingmöglichkeiten der Statistics Toolbox.

Statistische Prozesskontrolle

Die Statistics Toolbox stellt eine Reihe von Funktionen zur Verfügung, die statistische Prozesssteuerung (SPC) ermöglichen. Mit diesen Funktionen können Sie Produkte oder Prozesse durch Auswertung der Prozessvariabilität überwachen und verbessern. Mit SPC-Funktionen können Sie:

  • Gage-Wiederholbarkeits- und Reproduzierbarkeitsstudien durchführen
  • Prozessfähigkeiten schätzen
  • Kontrolldiagramme erstellen
  • Westen Electric- und Nelson-Steuerregeln auf Kontrolldiagrammdaten anwenden
Kontrolldiagramme der Prozessdaten und Verletzungen der Western Electric-Kontrollregeln.

Kontrolldiagramme der Prozessdaten und Verletzungen der Western Electric-Kontrollregeln. Statistics Toolbox stellt eine Vielzahl von Kontrolldiagrammen und Kontrollregeln zur Überwachung und Bewertung von Produkten oder Verfahren zur Verfügung.

Probieren Sie Statistics Toolbox

Testsoftware anfordern

Einführung in MATLAB

Webinar anzeigen