Середнє квадратичне відхилення та коефіцієнт варіації. Що таке стандартне відхилення - використання функції стандотклон для розрахунку стандартного відхилення в excel

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середня арифметична сукупність вибірок.

Енциклопедичний YouTube

  • 1 / 5

    Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійної зв'язки. Визначається як квадратний корінь з дисперсії випадкової величини .

    Середньоквадратичне відхилення:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac(n)(n-1))\sigma ^(2)))=(\sqrt ((\frac(1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Примітка: Дуже часто зустрічаються різночитання в назвах СКО (Середньоквадратичного відхилення) та СТО (Стандартного відхилення) за їх формулами. Наприклад, у модулі numPy мови програмування Python функція std() описується як "standart deviation", тоді як формула відображає СКО (розподіл на корінь з вибірки). У Excel функція СТАНДОТКЛОН() інша (розподіл на корінь з n-1).

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar(x))\right) ^(2))).)

    де σ 2 (\displaystyle \sigma ^(2))- дисперсія; x i (\displaystyle x_(i)) - i-й елемент вибірки; n (\displaystyle n)- Обсяг вибірки; - середня арифметична вибірки:

    x = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+ldots +x_(n)).)

    Слід зазначити, що обидві оцінки є зміщеними. У загальному випадку незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

    Відповідно до ГОСТ Р 8.736-2011 середньоквадратичне відхилення вважається за другою формулою цього розділу. Будь ласка, звірте результати.

    Правило трьох сигм

    Правило трьох сигм (3 σ (\displaystyle 3\sigma )) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі (x − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина x ¯ (\displaystyle (\bar(x)))справжня, а чи не отримана внаслідок обробки вибірки).

    Якщо ж справжня величина x ¯ (\displaystyle (\bar(x)))невідома, то слід користуватися не σ (\displaystyle \sigma ), а s. Таким чином, правило трьох сигм перетворюється на правило трьох s .

    Інтерпретація величини середньоквадратичного відхилення

    Більше значення середньоквадратичного відхилення показує більший розкид значень у представленій множині із середньою величиною множини; менше значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз. ототожнюється із ризиком портфеля.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

    Програма Excel цінується як професіоналами, так і любителями, адже працювати з нею може користувач будь-якого рівня підготовки. Наприклад, кожен бажаючий з мінімальними навичками спілкування з Екселем може намалювати простенький графік, зробити пристойну табличку і т.д.

    Разом з тим, ця програма навіть дозволяє виконувати різноманітні розрахунки, наприклад, розрахунок, але для цього вже необхідний дещо інший рівень підготовки. Втім, якщо ви тільки почали тісне знайомство з цією прогою і цікавитеся всім, що допоможе вам стати більш розвиненим користувачем, ця стаття вам. Сьогодні я розповім, що є середньоквадратичним відхиленням формула в excel, навіщо вона взагалі потрібна і, власне кажучи, коли застосовується. Поїхали!

    Що це таке

    Почнемо з теорії. Середнім квадратичним відхиленням прийнято називати квадратний корінь, отриманий із середнього арифметичного всіх квадратів різниць між наявними величинами, а також їх середнім арифметичним. До слова, цю величину прийнято називати грецькою літерою "сигма". Стандартне відхилення розраховується за формулою СТАНДОТКЛОН, відповідно програма робить це за користувача сама.

    Суть цього поняття у тому, щоб виявити ступінь мінливості інструмента, тобто, це, свого роду, індикатор родом з описової статистики. Він виявляє зміни волатильності інструменту у будь-якому часовому проміжку. За допомогою формул СТАНДОТКЛОН можна оцінити стандартне відхилення під час вибірки, при цьому логічні та текстові значення ігноруються.

    Формула

    Допомагає розрахувати середнє квадратичне відхилення Excel формула, яка автоматично передбачена в програмі Excel. Щоб її знайти, необхідно знайти в Екселі розділ формули, а вже там вибрати ту, що має назву СТАНДОТКЛОН, тому дуже просто.

    Після цього перед вами з'явиться віконце, в якому потрібно буде ввести дані для обчислення. Зокрема, у спеціальні поля слід вписати два числа, після чого програма сама вирахує стандартне відхилення щодо вибірки.

    Безперечно, математичні формули та розрахунки – питання досить складне, і не всі користувачі з ходу можуть впоратися з ним. Тим не менш, якщо копнути трохи глибше і трохи детальніше розібратися в питанні, виявляється, що не все так і сумно. Сподіваюся, на прикладі обчислення середньоквадратичного відхилення ви переконалися в цьому.

    Відео на допомогу

    При статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами.

    Середньоквадратичне відхилення:

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини Підлога, стіни навколо нас і стеля, xщодо її математичного очікування на основі незміщеної оцінки її дисперсії):

    де - дисперсія; - Підлога, стіни навколо нас і стеля, i-й елемент вибірки; - Обсяг вибірки; - середнє арифметичне вибірки:

    Слід зазначити, що обидві оцінки є зміщеними. Загалом незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

    Правило трьох сигм

    Правило трьох сигм() - Практично всі значення нормально розподіленої випадкової величини лежать в інтервалі. Більш строго - не менше ніж з 99,7% достовірністю значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина істинна, а не отримана в результаті обробки вибірки).

    Якщо ж справжня величина невідома, слід користуватися не , а Підлога, стіни навколо нас і стеля, s. Таким чином, правило трьох сигм перетворюється в правило трьох Підлога, стіни навколо нас і стеля, s .

    Інтерпретація величини середньоквадратичного відхилення

    Велике значення середньоквадратичного відхилення показує великий розкид значень у представленій множині із середньою величиною множини; Маленьке значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    Загалом середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз.

    Практичне застосування

    На практиці середньоквадратичне відхилення дозволяє визначити, наскільки значення у множині можуть відрізнятися від середнього значення.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньою денною температурою, але одне розташоване на узбережжі, а інше всередині континенту. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

    Технічний аналіз

    також

    Література

    * Боровиків, Ст. STATISTICA. Мистецтво аналізу даних на комп'ютері: Для професіоналів/В. Боровиков. - СПб. : Пітер, 2003. – 688 с. - ISBN 5-272-00078-1.

    Мудрі математики та статистики вигадали більш надійний показник, хоча й дещо іншого призначення – середнє лінійне відхилення. Цей показник характеризує міру розкиду значень сукупності даних навколо їхнього середнього значення.

    Для того, щоб показати міру розкиду даних потрібно спочатку визначитися, щодо чого цей самий розкид буде вважатися - зазвичай це середня величина. Далі потрібно порахувати, наскільки значення аналізованої сукупності даних далеко від середньої. Зрозуміло, що кожному значенню відповідає деяка величина відхилення, але нас цікавить загальна оцінка, що охоплює всю сукупність. Тому розраховують середнє відхилення за формулою звичайної середньої арифметичної. Але! Але для того, щоб розрахувати середнє відхилення, їх потрібно спочатку скласти. І якщо ми складемо позитивні та негативні числа, то вони взаємознищаться і їхня сума буде прагнути до нуля. Щоб цього уникнути, всі відхилення беруться за модулем, тобто всі негативні числа стають позитивними. Ось тепер середнє відхилення показуватиме узагальнену міру розкиду значень. У результаті середньо лінійне відхилення буде розраховуватися за формулою:

    a- Середнє лінійне відхилення,

    x– аналізований показник, з рисою зверху – середнє значення показника,

    n– кількість значень у аналізованій сукупності даних,

    оператор підсумовування, сподіваюся, нікого не лякає.

    Розраховане за зазначеною формулою середнє лінійне відхилення відбиває середнє абсолютне відхилення від середньої величини за цією сукупністю.

    На малюнку червона лінія – це середнє значення. Відхилення кожного спостереження середнього вказані маленькими стрілочками. Саме вони беруться за модулем і підсумовуються. Потім усе поділяється на кількість значень.

    Для повноти картини слід навести ще й приклад. Припустимо, є фірма з виробництва живців для лопат. Кожен черешок має бути 1,5 метра завдовжки, але, що ще важливіше, усі мають бути однаковими або, принаймні, плюс-мінус 5 см. Проте недбайливі працівники то 1,2 м відпилять, то 1,8 м. Дачники незадоволені . Вирішив директор фірми провести статистичний аналіз довжини живців. Відібрав 10 штук і заміряв їх довжину, знайшов середню та розрахував середнє лінійне відхилення. Середня вийшла якраз, що треба - 1,5 м. А ось середнє лінійне відхилення вийшло 0,16 м. Ось і виходить, що кожен живець довший або коротший, ніж потрібно в середньому на 16 см. Є, про що поговорити з працівниками . Насправді я не зустрічав реального використання цього показника, тому приклад вигадав сам. Проте у статистиці є такий показник.

    Дисперсія

    Як і середнє лінійне відхилення, дисперсія також відбиває міру розкиду даних навколо середньої величини.

    Формула для розрахунку дисперсії виглядає так:

    (Для варіаційних рядів (зважена дисперсія))

    (Для несгрупованих даних (проста дисперсія))

    Де: σ 2 – дисперсія, Xi- аналізований показник (значення ознаки), - середнє значення показника, fi - кількість значень в аналізованій сукупності даних.

    Дисперсія – це середній квадрат відхилень.

    Спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат, множиться на частоту відповідного значення ознаки, складається і потім ділиться на кількість значень у даній сукупності.

    Однак у чистому вигляді, як, наприклад, середня арифметична, або індекс, дисперсія не використовується. Це скоріше допоміжний та проміжний показник, який використовується для інших видів статистичного аналізу.

    Спрощений спосіб розрахунку дисперсії

    Середньоквадратичне відхилення

    Щоб використовувати дисперсію для аналізу даних з неї витягують квадратний корінь. Виходить так зване середньоквадратичне відхилення.

    До речі, стандартне відхилення ще називають сигмою – від грецької літери, якою його означають.

    Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними. Як правило, середньоквадратичні показники у статистиці дають точніші результати, ніж лінійні. Отже, середньоквадратичне відхилення є точнішим показником міри розсіювання даних, ніж середнє лінійне відхилення.

    Одним із основних інструментів статистичного аналізу є розрахунок середнього квадратичного відхилення. Даний показник дозволяє зробити оцінку стандартного відхилення за вибіркою або генеральною сукупністю. Давайте дізнаємося, як використовувати формулу визначення середньоквадратичного відхилення в Excel.

    Відразу визначимо, що являє собою середньоквадратичне відхилення і як виглядає його формула. Ця величина є коренем квадратним із середнього арифметичного числа квадратів різниці всіх величин ряду та їхнього середнього арифметичного. Існує тотожне найменування цього показника - стандартне відхилення. Обидві назви цілком рівнозначні.

    Але, природно, що в Екселі користувачеві не доводиться це вираховувати, оскільки за нього робить програма. Давайте дізнаємося, як порахувати стандартне відхилення в Excel.

    Розрахунок у Excel

    Розрахувати вказану величину в Екселі можна за допомогою двох спеціальних функцій СТАНДОТКЛОН.(за вибірковою сукупністю) та СТАНДОТКЛОН.Г(за генеральною сукупністю). Принцип їхньої дії абсолютно однаковий, але викликати їх можна трьома способами, про які ми поговоримо нижче.

    Спосіб 1: майстер функцій


    Спосіб 2: вкладка "Формули"


    Спосіб 3: ручне введення формули

    Існує також спосіб, коли взагалі не потрібно буде викликати вікно аргументів. Для цього слід запровадити формулу вручну.


    Як бачимо, механізм розрахунку середньоквадратичного відхилення в Excel дуже простий. Користувачеві потрібно лише ввести числа із сукупності або посилання на комірки, які їх містять. Усі розрахунки виконує сама програма. Набагато складніше усвідомити, що ж є показник, що розраховується, і як результати розрахунку можна застосувати на практиці. Але розуміння цього вже належить більше до сфери статистики, ніж навчання роботи з програмним забезпеченням.