Семінар Статистична перевірка гіпотез
Код роботи: 825
Вид роботи: Семінар
Предмет: Соціологія
Тема: Статистична перевірка гіпотез
Кількість сторінок: 6
Дата виконання: 2016
Мова написання: українська
Ціна: безкоштовно
Глибокий статистичний аналіз включає порівняння різних критеріїв (коефіцієнтів) та перевірку гіпотез про їх істотність для більш повного розуміння результатів. Розглянемо трохи докладніше, як саме проходить процес перевірки статистичних гіпотез.
Під гіпотезою в статистиці розуміють припущення про розподіл випадкової величини. Так,гіпотезою є припущення, що деякий розподіл (наприклад, за віком тощо) має середнє значення 20. Або при розв′язуванні задач, які полягають в оцінці різниці між результатами, одержаними під час різних експериментів.
Наприклад: введення нової технології може спричинити позитивний вплив на певний процес виробництва або не чинити такого впливу, і якщо цей вплив встановлено, то чиє він результатом застосування нової технології, чи випадкового збігу обставин. Прикладом також може бути питання про вплив медичних препаратів на стан хворого, вплив введення до харчового продукту нової компоненти на склад крові, шлункового соку і багато інших. Крім того, необхідно встановити істотність такого впливу. Для цього експерименти проводять по різних контрольних групах (вибірках) і порівнюють результати (вибіркові середні груп, параметри генеральної та вибіркової сукупностей).
Критерій перевірки гіпотези надає метод перевірки, в результаті якого з′ясовується, вірна чи невірна данагіпотеза, тобто “приймається” вона чи “відкидається”. Якщо відхилення експериментальних даних від гіпотези мале і є випадковим – гіпотеза приймається, якщо ж це відхилення не можна вважати випадковим і мова йде про так зване істотне відхилення –гіпотеза відхиляється.
Отже, суть перевірки гіпотез полягає у тому, щобвизначити, узгоджуються чи ні результати експерименту з гіпотезою, випадковими чи не випадковими є розбіжності між гіпотезою і даними вибіркового обстеження. Гіпотеза, відхилення від якої приписують випадку, називається нульовою і позначається Н0. Тобто вона формулюється як відсутність розбіжності (нульова розбіжність) між середніми вибірок (пар вибірок хі – уі = d) чи невідомим параметром генеральної сукупності G та заданим параметром b у регресійному рівнянні. Найчастіше це гіпотеза, яку належить перевірити. Зміст гіпотези записують після двокрапки Н0: G[чи x] = b[чи y] (d = 0).
Кожній нульовій гіпотезі протиставляють альтернативну Н1. При формулюванні Н1 враховується вагомість відхилень (G – b): для додатних відхилень Н1:
G > b, для від′ємних Н1 : G < b, для тих і для інших - Н1 : G[чи x] ¹ b[чи у] (d ¹ 0). Отже, коли вибіркові (експериментальні) дані суперечать гіпотезі Н0, вона відхиляється. Коли ці дані узгоджуються з гіпотезою Н0, вона не відхиляється.
Статистична перевірка гіпотез неминуче пов′язана з ризиком прийняття помилкового рішення. Ризик І – помилка першого роду – відхилення правильної нульової гіпотези.
Ймовірність зробити таку помилку дорівнює a. Ризик ІІ – помилка другого роду – нульова гіпотеза приймається (невідхилення Н0), хоча насправді правильною є альтернативна. Ймовірність зробити цю помилку дорівнює 1 – b, де b - ймовірність того, що помилка ІІ роду не буде зроблена – так звана потужність критерія. Ці ризики конкуруючі, і зменшення ймовірності одного (a) зумовлює збільшення ймовірності іншого (b).
Наприклад: нехай нульова гіпотеза означає, що визначена партія товарів відповідає умовам якості. Якщо ця партія відхиляється, хоча гіпотеза відповідає дійсності, це – помилка першого роду. В такому випадку говорять про ризик виробника товарів. Якщо ж партія приймається, хоча вона і не відповідає умовам якості, то має місце помилка другого роду, так званий ризик споживача. Оскільки уникнути ризиків неможливо, а наслідки їх, як правило рівновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати той ризик, який пов′язаний з більшими втратами. Ймовірності ризиків наведемо в таблиці
Прийнята гіпотеза |
|
Невідома дійсність |
||
Н0 вірна – Н1 невірна |
|
Н0 невірна – Н1 вірна |
||
|
|
|||
Н0 |
Правильне рішення |
Р = 1 |
– a |
Помилка ІІ роду Р = 1 – b |
Н1 |
Помилка І роду |
Р = a |
|
Правильне рішення Р = b |
Правило за яким гіпотеза Н0 відхиляється або не відхиляється (приймається), називається статистичним критерієм (функцією критерія). Ця функція є ні що інше, як вибіркова функція Z(х1, х2, …, хn / Н0), тобто статистична характеристика Z. Розподіл критерія за умови правильності нульової гіпотези звичайно вважається відомим: він може бути як нормальним чи критеріальним розподілом – c2, t-, F-розподіл. Кожне значення характеристики має певну ймовірність. Межу малоймовірності називають рівнем істотності a- це ймовірність ризику І, тобто ймовірність відхилення вірної Н0(помилки першого роду), а тому залежно від змісту гіпотези Н0 і наслідків її відхилення рівень істотності визначають у кожному конкретному дослідженні. Звичайно вибирають один з рівнів a, для яких існують табульовані значення статистичних характеристик критеріїв Z1-a. Це a = 0,10; 0,05; 0,025; 0,01.
Значення статистичної характеристики критерія Z1-a поділяє множину вибіркових значень Z на дві частини: а) область допустимих значень і б) критичну область. Якщо вибіркове значення потрапляє в критичну область Z > Z1-a , гіпотеза Н0 відхиляється, якщо в область допустимих значень Z < Z1-a – не відхиляється. Саме тому значення Z1-a називають критичним. Залежно від того, як сформульована альтернативна Н1 гіпотеза, критична область може бути односторонньою (лівосторонньою чи правосторонньою): Н0: х = y та відповідно H1: x < y чи H1: x > y; або двосторонньою:
Н0 : х = y; H1 : x ≠ y.
Наприклад: проводиться вибірковий контроль стану хворих до лікування та після. Тобто необхідно визначити, чи істотним є вплив лікувальних препаратів, чи випадковим. Нульова гіпотеза формується на припущенні, що відхилення випадкові, а альтернативна передбачає, що курс лікування збільшує шанси хворого на одужання (при такому формулюванні Н1 проводиться правостороння перевірка). Або відомо, що 40% студентів мають ПК. За даними вибіркового обстеження певного курсу отримано співвідношення 46%. Чи дійсно вірна Н1 : 0,46 ¹ 0,40 чи ця різниця випадкова.
Отже, статистична гіпотеза перевіряється в такій послідовності:
1) формулюють нульову Н0 та альтернативну Н1 гіпотези;
2) вибирають статистичну характеристику Z, за значеннями якої перевіряють правильність гіпотези Н0;
3) визначають рівень істотності a і відповідне йому критичне значення Z1-a (від формулювання гіпотез Н0 та Н1 критична область може бути одно- чи двосторонньою);
4) прийняття рішення – за результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики Z, яке порівнюють з критичним: якщо Z > Z1-a - гіпотеза Н0 відхиляється, при Z < Z1-a - не відхиляється.
Під критичними значеннями статистичної характеристики розуміють теоретичні (табличні) її значення, обчислені для певного розподілу і з відповідним рівнем істотності (ймовірності) та ступенів вільності (чисел, що показують різницю між кількістю різних дослідів [спостережень] та кількістю констант k [параметрів, що оцінюються], знайдених завдяки цим дослідам незалежно один від одного.
Наприклад: у разі простої лінійної регресії оцінюються 2 параметри – a та b (k = 2), якщо кількість спостережень позначити n, то маємо n – 2 ступенів вільності.
Поняття ступені вільності – одне з найбільш важливих понять статистики. Це питання досить важке для розуміння, тому для його пояснення обмежимося спрощеним трактуванням, у відповідності з яким для сукупності спостережень, що розглядається, число ступенів вільності співпадає з числом незалежних одне від одного спостережень. Нехай відомо, що сума 10-ти чисел дорівнює 27. Перші 9-ть з цих 10-ти чисел можуть бути будь-якими, наприклад 30, 35, 40, 45, 50, 55, 60, 65 та 70, що в сумі дасть 450. Однак, це означає, що останнє, 10-те число обов′язково повинно дорівнювати –423, тому, що коли це буде не так – ми не отримаємо відомого нам сумарного значення, рівного 27. Це останнє, 10-те, число уже не є незалежним. Тобто, в даному прикладі маємо 9-ть ступенів вільності – на одиницю менше загальної кількості розглянутих 10-ти чисел. Або ще такий приклад: дослідження зв′язку між стресами та захворюваннями. В експерименті приймало участь 40 чоловік. Загальна кількість відвідувань їми лікаря складала 100 відвідувань. За тими ж причинами, що і в прикладі з 10 числами, сума яких складала 27, наявність цього сумарного значення 100 також говорить про те, що число ступенів вільності даних, які є в нашому розпорядженні, складає (N – 1) чи 40 – 1 = 39.
При нормальному розподілі перевірка гіпотез здійснюється з використанням таблиць Лапласа. Якщо вибірка малого обсягу, то для перевірки критерію використовується t-розподіл Стьюдента. Порівнюючи вибірки парами цей критерій можна застосовувати для будь-якого числа вибірок.
Процедура перевірки гіпотез використовується при порівнянні вибіркових характеристик (середньої, частки, дисперсії) з відповідними нормативами, порівнянні характеристик двох вибіркових сукупностей, оцінюванні істотності розбіжностей двох розподілів, у регресійно-кореляціному аналізі у чому ми могли впевнитися на попередніх заняттях з відповідних тем.