Standardabweichung und Variationskoeffizient. Was ist Standardabweichung? Verwenden Sie die Standardabweichungsfunktion, um die Standardabweichung in Excel zu berechnen

Standardabweichung(Synonyme: Standardabweichung, Standardabweichung, quadratische Abweichung; verwandte Begriffe: Standardabweichung, Standardaufstrich) – in der Wahrscheinlichkeitstheorie und Statistik der häufigste Indikator für die Streuung der Werte einer Zufallsvariablen relativ zu ihrer mathematischen Erwartung. Bei begrenzten Arrays von Stichprobenwerten wird anstelle des mathematischen Erwartungswerts das arithmetische Mittel der Stichprobenmenge verwendet.

Enzyklopädisches YouTube

  • 1 / 5

    Die Standardabweichung wird in Maßeinheiten der Zufallsvariablen selbst gemessen und bei der Berechnung des Standardfehlers des arithmetischen Mittels, bei der Konstruktion von Konfidenzintervallen, bei der statistischen Prüfung von Hypothesen und bei der Messung der linearen Beziehung zwischen Zufallsvariablen verwendet. Definiert als Quadratwurzel der Varianz einer Zufallsvariablen.

    Standardabweichung:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ;
    • (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)

    Hinweis: Sehr oft gibt es Abweichungen zwischen den Namen von MSD (Root Mean Square Deviation) und STD (Standard Deviation) und ihren Formeln. Beispielsweise wird im Modul numPy der Programmiersprache Python die Funktion std() als „Standardabweichung“ beschrieben, während die Formel die Standardabweichung (Division durch die Wurzel der Stichprobe) widerspiegelt. In Excel ist die Funktion STANDARDEVAL() anders (Division durch die Wurzel von n-1). Standardabweichung (Schätzung der Standardabweichung einer Zufallsvariablen X relativ zu seiner mathematischen Erwartung basierend auf einer unvoreingenommenen Schätzung seiner Varianz):

    s (\displaystyle s)

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).) Wo σ 2 (\displaystyle \sigma ^(2)) - - Streuung; x ich (\displaystyle x_(i)) ich tes Element der Auswahl;

    n (\displaystyle n)

    Es ist zu beachten, dass beide Schätzungen verzerrt sind. Im Allgemeinen ist es unmöglich, eine unvoreingenommene Schätzung zu erstellen. Die auf der unverzerrten Varianzschätzung basierende Schätzung ist jedoch konsistent.

    Gemäß GOST R 8.736-2011 wird die Standardabweichung mit der zweiten Formel dieses Abschnitts berechnet. Bitte überprüfen Sie die Ergebnisse.

    Drei-Sigma-Regel

    Drei-Sigma-Regel (3 σ (\displaystyle 3\sigma )) – fast alle Werte einer normalverteilten Zufallsvariablen liegen im Intervall (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Genauer gesagt: Mit einer Wahrscheinlichkeit von ungefähr 0,9973 liegt der Wert einer normalverteilten Zufallsvariablen im angegebenen Intervall (vorausgesetzt, der Wert x ¯ (\displaystyle (\bar (x))) wahr und nicht als Ergebnis der Probenverarbeitung erhalten).

    Wenn der wahre Wert x ¯ (\displaystyle (\bar (x))) unbekannt ist, sollten Sie es nicht verwenden σ (\displaystyle \sigma ), A S. Somit wird die Drei-Sigma-Regel in die Drei-Regel umgewandelt S .

    Interpretation des Standardabweichungswerts

    Ein größerer Standardabweichungswert zeigt eine größere Streuung der Werte im dargestellten Satz mit dem Durchschnittswert des Satzes; ein kleinerer Wert zeigt dementsprechend an, dass die Werte in der Menge um den Durchschnittswert gruppiert sind.

    Wir haben zum Beispiel drei Zahlenmengen: (0, 0, 14, 14), (0, 6, 8, 14) und (6, 6, 8, 8). Alle drei Sätze haben Mittelwerte von 7 und Standardabweichungen von 7, 5 und 1. Der letzte Satz weist eine kleine Standardabweichung auf, da die Werte im Satz um den Mittelwert gruppiert sind; Der erste Satz weist den größten Standardabweichungswert auf – die Werte innerhalb des Satzes weichen stark vom Durchschnittswert ab.

    Im Allgemeinen kann die Standardabweichung als Maß für die Unsicherheit betrachtet werden. Beispielsweise wird in der Physik die Standardabweichung verwendet, um den Fehler einer Reihe aufeinanderfolgender Messungen einer bestimmten Größe zu bestimmen. Dieser Wert ist sehr wichtig, um die Plausibilität des untersuchten Phänomens im Vergleich zum von der Theorie vorhergesagten Wert zu bestimmen: Wenn der Durchschnittswert der Messungen stark von den von der Theorie vorhergesagten Werten abweicht (große Standardabweichung), dann sollten die erhaltenen Werte bzw. die Methode zu deren Ermittlung noch einmal überprüft werden. wird mit dem Portfoliorisiko identifiziert.

    Klima

    Angenommen, es gibt zwei Städte mit der gleichen durchschnittlichen Tageshöchsttemperatur, aber eine liegt an der Küste und die andere in der Ebene. Es ist bekannt, dass Städte an der Küste viele unterschiedliche maximale Tagestemperaturen aufweisen, die niedriger sind als Städte im Landesinneren. Daher wird die Standardabweichung der maximalen Tagestemperaturen für eine Küstenstadt geringer sein als für die zweitgrößte Stadt, obwohl der Durchschnittswert dieses Wertes gleich ist, was in der Praxis bedeutet, dass die Wahrscheinlichkeit, dass die maximale Lufttemperatur ansteigt Jeder Tag im Jahr wird höher sein als der Durchschnittswert, höher für eine Stadt im Landesinneren.

    Sport

    Nehmen wir an, dass es mehrere Fußballmannschaften gibt, die nach bestimmten Parametern bewertet werden, zum Beispiel nach der Anzahl der erzielten und kassierten Tore, den Torchancen usw. Höchstwahrscheinlich wird die beste Mannschaft in dieser Gruppe bessere Werte haben auf weitere Parameter. Je kleiner die Standardabweichung des Teams für jeden der dargestellten Parameter ist, desto vorhersehbarer ist das Ergebnis des Teams. Andererseits ist es für ein Team mit einer großen Standardabweichung schwierig, das Ergebnis vorherzusagen, was wiederum durch ein Ungleichgewicht erklärt wird, beispielsweise eine starke Verteidigung, aber einen schwachen Angriff.

    Die Verwendung der Standardabweichung der Teamparameter ermöglicht es, bis zu einem gewissen Grad das Ergebnis eines Spiels zwischen zwei Teams vorherzusagen und die Stärken und Schwächen der Teams und damit die gewählten Kampfmethoden einzuschätzen.

    Das Excel-Programm erfreut sich sowohl bei Profis als auch bei Laien großer Beliebtheit, da Anwender aller Erfahrungsstufen damit arbeiten können. Beispielsweise kann jeder mit minimalen „Kommunikations“-Kenntnissen in Excel ein einfaches Diagramm zeichnen, ein anständiges Schild anfertigen usw.

    Gleichzeitig ermöglicht Ihnen dieses Programm sogar die Durchführung verschiedener Arten von Berechnungen, beispielsweise Berechnungen, was jedoch einen etwas anderen Schulungsstand erfordert. Wenn Sie jedoch gerade erst begonnen haben, sich mit diesem Programm vertraut zu machen, und sich für alles interessieren, was Ihnen dabei hilft, ein fortgeschrittener Benutzer zu werden, ist dieser Artikel genau das Richtige für Sie. Heute erzähle ich Ihnen, was die Standardabweichungsformel in Excel ist, warum sie überhaupt benötigt wird und genau genommen, wann sie verwendet wird. Lass uns gehen!

    Was ist das

    Beginnen wir mit der Theorie. Die Standardabweichung wird üblicherweise als Quadratwurzel bezeichnet, die aus dem arithmetischen Mittel aller quadrierten Differenzen zwischen den verfügbaren Werten sowie deren arithmetischem Mittel ermittelt wird.

    Dieser Wert wird übrigens üblicherweise als griechischer Buchstabe „Sigma“ bezeichnet. Die Berechnung der Standardabweichung erfolgt entsprechend der STANDARDEVAL-Formel; das Programm erledigt dies für den Benutzer selbst.

    Der Kern dieses Konzepts besteht darin, den Grad der Variabilität eines Instruments zu ermitteln, das heißt, es ist auf seine Weise ein aus der deskriptiven Statistik abgeleiteter Indikator. Es identifiziert Änderungen in der Volatilität eines Instruments über einen beliebigen Zeitraum. Die STDEV-Formeln können verwendet werden, um die Standardabweichung einer Stichprobe zu schätzen, wobei boolesche Werte und Textwerte ignoriert werden.

    Formel

    Die in Excel automatisch bereitgestellte Formel hilft bei der Berechnung der Standardabweichung in Excel. Um es zu finden, müssen Sie den Formelabschnitt in Excel suchen und dann den Abschnitt mit dem Namen STANDARDEVAL auswählen. Das ist also sehr einfach.

    Danach erscheint vor Ihnen ein Fenster, in dem Sie Daten für die Berechnung eingeben müssen. Insbesondere sollten zwei Zahlen in spezielle Felder eingegeben werden, woraufhin das Programm selbst die Standardabweichung für die Stichprobe berechnet.

    Zweifellos sind mathematische Formeln und Berechnungen ein ziemlich komplexes Thema, mit dem nicht alle Benutzer auf Anhieb zurechtkommen. Wenn man jedoch etwas tiefer geht und sich das Thema genauer ansieht, stellt sich heraus, dass nicht alles so traurig ist. Ich hoffe, Sie können sich davon am Beispiel der Berechnung der Standardabweichung überzeugen.

    Video zur Hilfe

    Standardabweichung:

    Hinweis: Sehr oft gibt es Abweichungen zwischen den Namen von MSD (Root Mean Square Deviation) und STD (Standard Deviation) und ihren Formeln. Beispielsweise wird im Modul numPy der Programmiersprache Python die Funktion std() als „Standardabweichung“ beschrieben, während die Formel die Standardabweichung (Division durch die Wurzel der Stichprobe) widerspiegelt. In Excel ist die Funktion STANDARDEVAL() anders (Division durch die Wurzel von n-1). Beim statistischen Testen von Hypothesen, wenn eine lineare Beziehung zwischen Zufallsvariablen gemessen wird. (Schätzung der Standardabweichung einer Zufallsvariablen(Schätzung der Standardabweichung der Zufallsvariablen Boden, die Wände um uns herum und die Decke,

    relativ zu seiner mathematischen Erwartung basierend auf einer unvoreingenommenen Schätzung seiner Varianz): - Streuung; wo ist die Streuung; - Der Boden, die Wände um uns herum und die Decke,

    tes Element der Auswahl; - Stichprobengröße; - Arithmetisches Mittel der Stichprobe:

    Drei-Sigma-Regel

    Drei-Sigma-Regel() – fast alle Werte einer normalverteilten Zufallsvariablen liegen im Intervall. Genauer gesagt: Mit einer Konfidenz von mindestens 99,7 % liegt der Wert einer normalverteilten Zufallsvariablen im angegebenen Intervall (vorausgesetzt, der Wert ist wahr und wurde nicht durch Stichprobenverarbeitung ermittelt).

    Wenn der wahre Wert unbekannt ist, sollten wir ihn nicht verwenden, sondern den Boden, die Wände um uns herum und die Decke. S. Somit wird die Drei-Sigma-Regel in die Drei-Sigma-Regel umgewandelt: Boden, Wände um uns herum und Decke. S .

    Interpretation des Standardabweichungswerts

    Ein großer Wert der Standardabweichung zeigt eine große Streuung der Werte in der dargestellten Menge mit dem Durchschnittswert der Menge; ein kleiner Wert zeigt dementsprechend an, dass die Werte in der Menge um den Mittelwert gruppiert sind.

    Wir haben zum Beispiel drei Zahlenmengen: (0, 0, 14, 14), (0, 6, 8, 14) und (6, 6, 8, 8). Alle drei Sätze haben Mittelwerte von 7 und Standardabweichungen von 7, 5 und 1. Der letzte Satz weist eine kleine Standardabweichung auf, da die Werte im Satz um den Mittelwert gruppiert sind; Der erste Satz weist den größten Standardabweichungswert auf – die Werte innerhalb des Satzes weichen stark vom Durchschnittswert ab.

    Im Allgemeinen kann die Standardabweichung als Maß für die Unsicherheit betrachtet werden. Beispielsweise wird in der Physik die Standardabweichung verwendet, um den Fehler einer Reihe aufeinanderfolgender Messungen einer bestimmten Größe zu bestimmen. Dieser Wert ist sehr wichtig, um die Plausibilität des untersuchten Phänomens im Vergleich zum von der Theorie vorhergesagten Wert zu bestimmen: Wenn der Durchschnittswert der Messungen stark von den von der Theorie vorhergesagten Werten abweicht (große Standardabweichung), dann sollten die erhaltenen Werte bzw. die Methode zu deren Ermittlung noch einmal überprüft werden.

    Praktische Anwendung

    In der Praxis können Sie anhand der Standardabweichung bestimmen, wie stark die Werte in einer Menge vom Durchschnittswert abweichen können.

    Klima

    Angenommen, es gibt zwei Städte mit der gleichen durchschnittlichen Tageshöchsttemperatur, aber eine liegt an der Küste und die andere im Landesinneren. Es ist bekannt, dass Städte an der Küste viele unterschiedliche maximale Tagestemperaturen aufweisen, die niedriger sind als Städte im Landesinneren. Daher wird die Standardabweichung der maximalen Tagestemperaturen für eine Küstenstadt geringer sein als für die zweitgrößte Stadt, obwohl der Durchschnittswert dieses Wertes gleich ist, was in der Praxis bedeutet, dass die Wahrscheinlichkeit, dass die maximale Lufttemperatur ansteigt Jeder Tag im Jahr wird höher sein als der Durchschnittswert, höher für eine Stadt im Landesinneren.

    Sport

    Nehmen wir an, dass es mehrere Fußballmannschaften gibt, die nach bestimmten Parametern bewertet werden, zum Beispiel nach der Anzahl der erzielten und kassierten Tore, den Torchancen usw. Höchstwahrscheinlich wird die beste Mannschaft in dieser Gruppe bessere Werte haben auf weitere Parameter. Je kleiner die Standardabweichung des Teams für jeden der dargestellten Parameter ist, desto vorhersehbarer ist das Ergebnis des Teams. Andererseits ist es für ein Team mit einer großen Standardabweichung schwierig, das Ergebnis vorherzusagen, was wiederum durch ein Ungleichgewicht erklärt wird, beispielsweise eine starke Verteidigung, aber einen schwachen Angriff.

    Die Verwendung der Standardabweichung der Teamparameter ermöglicht es, bis zu einem gewissen Grad das Ergebnis eines Spiels zwischen zwei Teams vorherzusagen und die Stärken und Schwächen der Teams und damit die gewählten Kampfmethoden einzuschätzen.

    Technische Analyse

    Siehe auch

    Literatur

    * Borovikov, V. STATISTIK. Die Kunst der Datenanalyse am Computer: Für Profis / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 S. - ISBN 5-272-00078-1.

    Kluge Mathematiker und Statistiker haben einen zuverlässigeren Indikator entwickelt, wenn auch für einen etwas anderen Zweck – durchschnittliche lineare Abweichung. Dieser Indikator charakterisiert das Maß der Streuung der Werte eines Datensatzes um ihren Durchschnittswert.

    Um das Maß der Datenstreuung anzuzeigen, müssen Sie zunächst entscheiden, anhand welcher Daten diese Streuung berechnet werden soll – normalerweise ist dies der Durchschnittswert. Als nächstes müssen Sie berechnen, wie weit die Werte des analysierten Datensatzes vom Durchschnitt entfernt sind. Es ist klar, dass jeder Wert einem bestimmten Abweichungswert entspricht, uns interessiert jedoch die Gesamtbewertung, die die gesamte Bevölkerung abdeckt. Daher wird die durchschnittliche Abweichung anhand der üblichen arithmetischen Mittelformel berechnet. Aber! Um jedoch den Durchschnitt der Abweichungen zu berechnen, müssen diese zunächst addiert werden. Und wenn wir positive und negative Zahlen addieren, heben sie sich gegenseitig auf und ihre Summe tendiert gegen Null. Um dies zu vermeiden, werden alle Abweichungen modulo berücksichtigt, d. h. alle negativen Zahlen werden positiv. Jetzt zeigt die durchschnittliche Abweichung ein verallgemeinertes Maß für die Streuung der Werte. Als Ergebnis wird die durchschnittliche lineare Abweichung nach folgender Formel berechnet:

    A– durchschnittliche lineare Abweichung,

    (Schätzung der Standardabweichung einer Zufallsvariablen– der analysierte Indikator, mit einem Strich darüber – der Durchschnittswert des Indikators,

    N– Anzahl der Werte im analysierten Datensatz,

    Ich hoffe, dass der Summationsoperator niemanden erschreckt.

    Die nach der angegebenen Formel berechnete durchschnittliche lineare Abweichung spiegelt die durchschnittliche absolute Abweichung vom Durchschnittswert für eine bestimmte Grundgesamtheit wider.

    Im Bild ist die rote Linie der Durchschnittswert. Die Abweichungen jeder Beobachtung vom Mittelwert werden durch kleine Pfeile angezeigt. Sie werden modulo genommen und aufsummiert. Dann wird alles durch die Anzahl der Werte dividiert.

    Um das Bild zu vervollständigen, müssen wir ein Beispiel geben. Nehmen wir an, es gibt ein Unternehmen, das Stecklinge für Schaufeln herstellt. Jeder Schnitt sollte 1,5 Meter lang sein, aber was noch wichtiger ist, sie sollten alle gleich lang sein oder mindestens plus oder minus 5 cm lang sein. Allerdings werden unvorsichtige Arbeiter 1,2 m oder 1,8 m abschneiden. Der Direktor des Unternehmens beschloss, eine statistische Analyse der Länge der Stecklinge durchzuführen. Ich habe 10 Stücke ausgewählt und ihre Länge gemessen, den Durchschnitt ermittelt und die durchschnittliche lineare Abweichung berechnet. Es stellte sich heraus, dass der Durchschnitt genau das war, was benötigt wurde – 1,5 m. Die durchschnittliche lineare Abweichung betrug also durchschnittlich 16 cm Arbeiter. Tatsächlich habe ich keinen wirklichen Nutzen dieses Indikators gesehen, also habe ich mir selbst ein Beispiel ausgedacht. In der Statistik gibt es jedoch einen solchen Indikator.

    Streuung

    Wie die durchschnittliche lineare Abweichung spiegelt auch die Varianz das Ausmaß der Streuung der Daten um den Mittelwert wider.

    Die Formel zur Berechnung der Varianz sieht folgendermaßen aus:

    (für Variationsreihen (gewichtete Varianz))

    (für nicht gruppierte Daten (einfache Varianz))

    Wobei: σ 2 – Streuung, Xi– Wir analysieren den Quadratindikator (Vorzeichenwert), – den Durchschnittswert des Indikators, f i – die Anzahl der Werte im analysierten Datensatz.

    Die Streuung ist das durchschnittliche Quadrat der Abweichungen.

    Zuerst wird der Durchschnittswert berechnet, dann wird die Differenz zwischen jedem Original- und Durchschnittswert genommen, quadriert, mit der Häufigkeit des entsprechenden Attributwerts multipliziert, addiert und dann durch die Anzahl der Werte in der Grundgesamtheit dividiert.

    In reiner Form wie dem arithmetischen Mittel oder dem Index wird die Dispersion jedoch nicht verwendet. Es handelt sich vielmehr um einen Hilfs- und Zwischenindikator, der für andere Arten statistischer Analysen verwendet wird.

    Eine vereinfachte Methode zur Berechnung der Varianz

    Standardabweichung

    Um die Varianz für die Datenanalyse zu verwenden, wird die Quadratwurzel der Varianz gezogen. Es stellt sich das sogenannte heraus Standardabweichung.

    Standardabweichung wird übrigens auch Sigma genannt – nach dem griechischen Buchstaben, der sie bezeichnet.

    Die Standardabweichung charakterisiert natürlich auch das Maß der Datenstreuung, kann nun aber (im Gegensatz zur Varianz) mit den Originaldaten verglichen werden. In der Regel liefern quadratische Mittelwerte in der Statistik genauere Ergebnisse als lineare. Daher ist die Standardabweichung ein genaueres Maß für die Streuung der Daten als die lineare mittlere Abweichung.

    Eines der wichtigsten Werkzeuge der statistischen Analyse ist die Berechnung der Standardabweichung. Mit diesem Indikator können Sie die Standardabweichung für eine Stichprobe oder eine Grundgesamtheit schätzen. Erfahren Sie, wie Sie die Standardabweichungsformel in Excel verwenden.

    Lassen Sie uns sofort bestimmen, was die Standardabweichung ist und wie ihre Formel aussieht. Diese Größe ist die Quadratwurzel des arithmetischen Mittels der Quadrate der Differenz zwischen allen Größen in der Reihe und ihrem arithmetischen Mittel. Für diesen Indikator gibt es einen identischen Namen: Standardabweichung. Beide Namen sind völlig gleichwertig.

    Aber in Excel muss der Benutzer dies natürlich nicht berechnen, da das Programm alles für ihn erledigt. Erfahren Sie, wie Sie die Standardabweichung in Excel berechnen.

    Berechnung in Excel

    Mit zwei speziellen Funktionen können Sie den angegebenen Wert in Excel berechnen STDEV.V(basierend auf der Stichprobenpopulation) und STDEV.G(basierend auf der Gesamtbevölkerung). Das Funktionsprinzip ist absolut dasselbe, sie können jedoch auf drei Arten aufgerufen werden, auf die wir weiter unten eingehen werden.

    Methode 1: Funktionsassistent


    Methode 2: Registerkarte „Formeln“.


    Methode 3: Manuelle Eingabe der Formel

    Es gibt auch eine Möglichkeit, den Aufruf des Argumentfensters überhaupt zu vermeiden. Dazu müssen Sie die Formel manuell eingeben.


    Wie Sie sehen, ist der Mechanismus zur Berechnung der Standardabweichung in Excel sehr einfach. Der Benutzer muss lediglich Zahlen aus der Grundgesamtheit oder Verweise auf die Zellen eingeben, die sie enthalten. Alle Berechnungen werden vom Programm selbst durchgeführt. Es ist viel schwieriger zu verstehen, was der berechnete Indikator ist und wie die Berechnungsergebnisse in der Praxis angewendet werden können. Aber das zu verstehen, bezieht sich bereits mehr auf den Bereich der Statistik als auf das Erlernen des Umgangs mit Software.