Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Методичні вказівки до практичного заняття №15 Навчальна дисципліна Інформаційні технології у фармації

Скачати 327.24 Kb.

Методичні вказівки до практичного заняття №15 Навчальна дисципліна Інформаційні технології у фармації




Скачати 327.24 Kb.
Сторінка2/3
Дата конвертації08.05.2017
Розмір327.24 Kb.
ТипМетодичні вказівки
1   2   3

1. Перевірка гіпотези про відповідність (згоду) законів розподілу.

Задача. У пологовому будинку зафіксовано масу новонароджених хлопчиків і результати подано наступним інтервальним варіаційним рядом:

m (кг)

[2,0; 2,6[

[2,6; 3,2]

[3,2; 3,8[

[3,8; 4,4[

[4,4; 5,0[

[5,0; 5,6[

[5,6; 6,2[

nm

5

8

35

43

22

15

2

Перевірити на рівні значущості 0,05 (надійність 0,95), чи підпорядковується маса новонароджених хлопчиків нормальному закону розподілу.
Поло́ги - фізіологічний процес, який завершує вагітність; вихід з тіла матері зрілого плода і плаценти та зародкових оболонок.
Хлопець скорочено хлоп або хлопак - молода неодружена особа чоловічої статі, дитина чи підліток чоловічої статі. Молодий чоловік, юнак, парубок, легінь.
Полого́вий буди́нок - лікувально-профілактичний заклад в системі Міністерства охорони здоров'я, який, подає акушерську та гінекологічну допомогу вагітним, роділлям, породіллям і медичну новонародженим дітям.

Теоретична довідка.

У практиці статистичних досліджень закон розподілу G(x) досліджуваної величини Х (генеральної сукупності) часто є невідомим, але на основі вибіркових спостережень (за емпіричною функцією розподілу або функцією густини розподілу, наприклад) можна зробити припущення, що він має певний вид F(x) (нормальний, експоненційний, рівномірний тощо).

Спостере́ження (англ. observation, рос. наблюдение) - метод наукового дослідження, що полягає в активному (систематичному, цілеспрямованому, планомірному) та навмисному сприйнятті об'єкта, в ході якого здобувається знання про зовнішні сторони, властивості й відносини досліджуваного об'єкта.
Дослі́дження, до́сліди - (широко розуміючи) пошук нових знань або систематичне розслідування з метою встановлення фактів; (вузько розуміючи) науковий метод (процес) вивчення чого-небудь.
Тоді постає задача перевірки відповідності спостережуваного розподілу теоретичному розподілу F(x). Законом F(x) може бути як деякий теоретичний закон розподілу, так і емпіричний закон розподілу деякої іншої величини (це відповідає задачі перевірки того, що дві спостережувані величини мають однакові емпіричні закони розподілу). На практиці особливо часто виникає необхідність перевірки того, що досліджувана величина має нормальний розподіл.
Необхідність - система зв'язків і відносин, що зумовлює зміну, поступальний рух, розвиток у жорстко визначеному напрямку з жорстко визначеними результатами. Іншими словами, необхідність - це такий зв'язок, що обов'язково призводить до певної події.

Задача перевірки відповідності (згоди) двох законів розподілу належить до задач перевірки статистичних гіпотез (нуль-гіпотеза Н0: G(x)=F(x) – закон розподілу величини Х описується функцією розподілу F(x); альтернативна гіпотеза Н1: G(x)≠F(x) – закон розподілу величини Х не описується функцією розподілу F(x). Розв’язання цієї задачі ґрунтується на застосуванні спеціальних критеріїв, які називаються критеріями згоди.

Принцип використання критеріїв згоди полягає в тому, що за експериментальними даними розраховується значення ζексп певної статистики, розподіл якої відомий, і отримане експериментальне значення критерію, порівнюється з критичним значенням ζкр критерію, що визначається за відомим розподілом статистики. В залежності від співвідношення між ζексп та ζкр, приймається рішення про відхилення або прийняття гіпотези Н0.

Існує декілька критеріїв згоди: Пірсона, Колмогорова – Смірнова, Мозеса – Смірнова та інші. Одним з широковживаних є критерій Пірсона, застосування якого може бути автоматизоване за допомогою ПЕТ Excel, завдяки наявності у ньому вбудованих функцій для роботи з розподілом .

Критерієм перевірки гіпотези про згоду законів розподілу є статистика



, (3)

де k – число класів;



N – об’єм вибірки;

mi – частота і-го класу (спостережувана у вибірці);

pi – теоретична ймовірність приналежності величини Х до і-го класу;

– теоретична частота і-го класу (розрахована для теоретичного розподілу F(x)).

Ця статистика описується розподілом з степенів свободи, де l – число незалежних параметрів розподілу.

Перевірка згоди законів розподілу за допомогою критерія виконується за наступною схемою.

1) Дані вибірки об’єму N подаються інтервальним варіаційним рядом частот,який містить k інтервалів (класів):



x

[a0;a1)

[a1;a2)

...

[aі-1;aі)

...

[ak-1;ak]

m

m1

m2

...

mi

...

mk

  1. Виходячи з припущення, що величина Х має розподіл F(x), визначаються ймовірності приналежності її до кожного інтервалу (класу)

і відповідні теоретичні частоти для класів

.

В результаті утворюється інтервальний варіаційний ряд теоретичних частот:



x

[a0;a1[

[a1;a2[

...

[aі-1;aі[

...

[ak-1;ak[

p

p1

p2




pi




pk

n

n1

n2

...

ni

...

nk

  1. За формулою (12.
    Результат, пі́дсумок, (заст. ску́ток, вислід) - кінцевий наслідок послідовності дій. Можливі результати містять перевагу, незручність, вигоду, збитки, цінність і перемогу. Результат є етапом діяльності, коли визначено наявність переходу якості в кількість і кількості в якість.
    1) розраховується експериментальне значення критерію .

  2. За заданим рівнем значущості α (або надійності γ) і числом степенів свободи ν визначається критичне значення критерія .

  3. Виконується порівняння значень та і приймається рішення щодо гіпотези про згоду законів розподілу : якщо < , то немає підстав відхиляти гіпотезу Н0: G(x)=F(x), у протилежному випадку гіпотезу Н0 слід відхилити на користь гіпотези Н1:.G(x)≠F(x).


Практичне виконання

    1. Завантажити робочу книгу „Khi2_Test.xls” з даними вибірки (130 значень) і заготовкою розрахункової таблиці (рис.4 ), яка знаходиться на файловому сервері.


Рис.4. Зразок робочого аркуша для перевірки відповідності закону розподілу.


1.2. В комірку J2 ввести задане значення надійності (0,95), а в комірки С2 і D2 ввести відповідно формули для розрахунку середнього значення і стандартного відхилення, задавши для них аргументом стовпчики А і В, в яких міститься вибірка.
Станда́ртне відхи́лення (англ. standard deviation) або середнє квадратичне відхилення, позначається як S або σ. - у теорії ймовірності і статистиці найпоширеніший показник розсіювання значень випадкової величини відносно її математичного сподівання.

1.3. В комірки E2:E9 занести межеві точки інтервалів (класів), задані в умові задачі (числа 2; 2,6; 3,2; 3,8; 4,4; 5; 5,6; 6,2).

1.4. В комірки F2:F9 занести формулу для знаходження частот по інтервалах. Формула являє собою формулу масива і використовує функцію ЧАСТОТА .Для її створення потрібно:

– виділити діапазон F2:F9, в якому будуть знаходитись частоти по інтервалах;

– викликати майстра функцій і обрати у категорії Статистические функцію ЧАСТОТА;


  • задати аргументом Массив_данных функції ЧАСТОТА стовпчики А та В, які містять елементи вибірки, а аргументом Массив_интервалов – стовпчик Е, в якому знаходяться значення меж інтервалів, після чого натиснути кнопку ОК у вікні майстра;

  • натиснути клавішу F2, а потім – комбінацію клавіш Ctrl Shift Enter (це необхідно для відображення масиву, який повертається функцією ЧАСТОТА у призначеному діапазоні комірок); в результаті в комірках F2:F9 з’являється масив інтервальних частот {0; 6; 8; 36; 43; 22; 13; 2}.

Зауваження. Функція ЧАСТОТА є функцією масива, тобто її результат являє собою не окреме значення, а впорядковану групу чисел – масив, який повертається функцією в одній комірці, причому в ній відображається тільки одне значення.. Для того, щоб масив було відображено у відповідному діапазоні комірок, потрібно при виділеному діапазоні результату натиснути клавіші F2, а потім Ctrl Shift Enter.

1.5. У комірки G2:G9 ввести формули для розрахунку ймовірності приналежності випадкової величини до заданих класових інтервалів при нормальному розподілі N(μ, σ) з параметрами, розрахованими у комірках C2 і D2. Ця ймовірність Pk для k-го інтервалу розраховується в даному випадку за формулою



, (4)

оскільки перевіряється нормальний розподіл (функція розподілу ймовірності стандартного нормального розподілу).

Функція розподілу ймовірностей - В теорії ймовірностей це функція, яка повністю описує розподіл ймовірностей випадкової величини.



Зауваження. При розрахунку теоретичних частот приналежності випадкової величини до заданих інтервалів замість першого інтервалу [2;2,6[ ,береться інтервал ]-∞; 2,6[, а замість останнього [5,6; 6,2] – інтервал [5,6; ∞[. Це має забезпечити виконання умови нормування.

Для створення формул:

– у комірку G3 вести формулу „=НОРМСТРАСП((Е3-$С$2)/$D$2)”;

– у комірку G4 ввести формулу

– „=НОРМСТРАСП((Е4-$С$2)/$D$2))–НОРМСТРАСП((Е3-$С$2)/$D$2)”;

– скопіювати формулу з комірки G4 до комірок G5:G8;

– у комірку G9 ввести формулу „1– НОРМСТРАСП((Е8–$С$2)/$D$2)”.


    1. У комірки Н3:Н9 ввести формули для розрахунку теоретичних частот приналежності випадкової величини до класових інтервалів



де mk – теоретична частота k-го інтервалу, N – об´єм вибірки.

Для цього у комірку Н3 вводиться формула „=G3*СЧЁТ(А:В)”, яка потім копіюється до решти комірок діапазону.



    1. У комірки І3:І9 ввести формули для розрахунку доданків критерію χ2

,

для чого у комірку І3 ввести формулу „=(Н3–F3)^2/H3” і скопіювати її до решти комірок діапазону.

1.8. У комірку К2 ввести формулу розрахунку експериментального значення критерію χ2, яка обчислює суму чисел комірок діапазону І3:І9.


    1. У комірку L2 ввести формулу для знаходження критичного значення критерію χ2, для чого застосовується функція ХИ2ОБР, яка належить до категорії Статистические. Формула є такою: „=ХИ2ОБР(1–J2;СЧЁТ(Е:Е)-1-1-2”.

Зауваження. Число ступенів вільності розподілу χ2 (другий аргумент функції ХИ2ОБР) дорівнює , де k – число класових інтервалів, q – число параметрів розподілу, що перевіряється. Число класових інтервалів на 1 менше числа їх меж (тому k=СЧЁТ(Е:Е)–1), число параметрів нормального розподілу q=2.

    1. У комірку F13 ввести слово „Висновок” і встановити для неї напівжирний шрифт синього кольору. Для цього слід скористатися діалоговим вікном Шрифт, яке викликається командою Формат/Ячейки.

    2. Об’єднати комірки G13:L13 і встановити для об’єднаної комірки напівжирний шрифт червоного кольору.
      Черво́ний - колір з мінімальною частотою, що сприймається людським оком. Діапазон червоних кольорів в спектрі з довжиною хвилі 630-760 нанометрів, межа сприйняття залежить від віку. Один з трьох «основних» кольорів в системі RGB, додатковий колір до нього - синьо-зелений.


    3. Ввести у комірку G13 (об’єднану) формулу для формування висновку =ЕСЛИ(K3

    4. В результаті у комірці з’явиться висновок щодо гіпотези про нормальність розподілу вибірки.
      Емпірична функція розподілу - це функція розподілу реалізації випадкової величини, яку будують за результатами вимірювань (спостережень).


    5. Записати висновок у протокол і зберегти робочу книгу у своїй робочій теці.

За допомогою довідкової системи ознайомитись з інформацією по функції ХИ2ОБР та занотувати основні відомості.

    1. Змінити довільним чином число елементів вибірки та їх значення і пересвідчитись, що робочий аркуш перераховується автоматично.
      Автоматиза́ція - один з напрямів науково-технічного прогресу, спрямований на застосування саморегульованих технічних засобів, економіко-математичних методів і систем керування, що звільняють людину від участі в процесах отримання, перетворення, передачі і використання енергії, матеріалів чи інформації, істотно зменшують міру цієї участі чи трудомісткість виконуваних операцій.


    2. Завдання для самостійного виконання.

Виконати перевірку на рівні значущості 0,05 нормальності закону розподілу величини, заданої наступною вибіркою (80 значень):

13,6 10,5 11,1 12,2 11,7 14,7 12,3 11,4 14,7 11,5 13,1 12,3 12,6 11,7 12,5 11,6 11,9 10,6 10,9 11,4 11,9 12,3 11,9 11,2 12,0 12,2 11,6 12,6 11,4 14,3 12,7 12,0 11,7 10,3 10,9 11,5 11,9 11,4 10,7 10,7 14,5 11,0 12,7 13,0 14,0 11,6 11,6 12,1 12,5 13,8 12,9 11,2 13,5 12,3 12,1 10,4 12,8 12,8 11,3 11,2 10,9 12,6 10,0 10,8 11,6 12,4 12,0 11,1 12,1 12,5 10,8 9,9 9,7 13,5 13,5 11,9 11,7 12,8 10,9 14,2.




  1. Перевірка гіпотези про рівність дисперсій двох нормальних сукупностей.

Задача. Досліджується вміст флавоноїдів у лікарській рослині по двох регіонах. Результати вимірювань процентного вмісту флавоноїдів подані двома вибірками:

Регіон Х: 2,30; 2,25; 2,40; 2,10; 2,20; 2,35.

Флавоноїди - похідні фенольних сполук, жовті, коричневі пігменти рослин. Вони виявляють різноманітну фітотерапевтичну дію. Зустрічаються в багатьох рослинах у вигляді глікозидів, а також і в чистому вигляді.
Вимі́рювання - пізнавальний процес визначення числового значення вимірюваної величини, а також дія, спрямована на знаходження значення фізичної величини дослідним шляхом, порівнюючи її з одиницею вимірювання за допомогою засобів вимірювальної техніки.

Регіон Y: 2,80; 2,90; 3,25; 2,85; 3,30; 2,80; 3,30; 2,85.

Потрібно перевірити, чи відрізняються дисперсії розподілу вмісту флавоноїдів по регіонах X та Y.



Теоретична довідка.

Нуль-гіпотеза формулюється як твердження про рівність дисперсій у двох сукупностях: Н0 : σх= σy. Формулювання альтернативної гіпотези визначає вид критичної області і алгоритм перевірки.

Коли потрібно перевірити відмінність, а не вид відношення між дисперсіями, то має місце 2-стороння критична область, так що нульова і альтернативна гіпотези формулюються наступним чином:

Н0 : σх= σy – дисперсії сукупностей однакові;

Ді́лення (також діління́)- в математиці, бінарна операція, що обернена множенню.

Н1 : σхσy – дисперсії сукупностей відмінні.

Критерієм перевірки гіпотези є статистика



(5)

з розподілом Фішера – Снедекора і числом ступенів вільності , де – дисперсії сукупностей X та Y відповідно, – об´єми вибірок X та Y відповідно.

Для обраного рівня значущості α визначаються (за таблицями при ручному розв´язанні задачі або за допомогою спеціальних функцій програмних засобів) нижнє і верхнє критичні значення критерію Fcr1 i Fcr2.. За таблицями визначають тільки верхнє критичне значення Fcr2, а нижнє розраховують за формулою

Висновок щодо нуль-гіпотези робиться на основі порівняння розрахованого за формулою (5) значення критерію з критичними точками Fcr1 i Fcr2.. Якщо Fcr1 < F < Fcr2 , то нуль-гіпотеза приймається (тобто на заданому рівні значущості α, або з вірогідністю γ =1-α, дисперсії сукупностей вважаються однаковими). Якщо ж F < Fcr1 або F > Fcr2 , то нуль-гіпотеза відхиляється (тобто з вірогідністю γ =1-α, дисперсії сукупностей вважаються суттєво різними).

Процедура перевірки може бути спрощена, якщо першою розлядати сукупність, яка має більшу оцінку дисперсії, щоб розраховане значення критерію було F>1. Тоді, якщо F > Fcr2, то приймається, що дисперсії сукупностей відмінні (гіпотеза Н0 відкидається).
Практичне виконання


    1. Перевірка гіпотези про рівність дисперсій за допомогою вбудованих функцій.

2.1.1. Створити робочий аркуш за зразком рис.5.

У стовпчиках А та В розмістити першу (Х) і другу (Y) вибірки відповідно. Комірки D17:G17 об´єднати для запису висновку.

До комірок F2, F3 занести формули для розрахунку дисперсій сукупностей X та Y відповідно. У комірці F6 створити формулу (5) розрахунку критерію F. У комірках F8, F9 розмістити формули для визначення числа ступенів вільності .

Озна́чення, ви́значення чи дефіні́ція (від лат. definitio) - роз'яснення чи витлумачення значення (сенсу) терміну чи поняття. Слід зауважити, що означення завжди стосується символів, оскільки тільки символи мають сенс що його покликане роз'яснити означення.

Рис.5 Зразок робочого аркуша для перевірки гіпотези про рівність дисперсій.


До комірки F11 записати рівень значущості 0,05.

До коміркок F13, F14 занести формули для визначення за допомогою вбудованої функції FРАСПОБР верхньої і нижньої критичних точок Fcr1 i Fcr2. Оскільки перевіряється просто відмінність дисперсій (без спрямованості), то має місце 2-стороння критична область, тому критична точка визначається для ймовірності . Відповідно, верхня критична точка (комірка F13) визначається за формулою

=FРАСПОБР(F11/2;F8;F9),

а нижня критична точка (комірка F14) – за формулою

=1/F13.До комірки D17 (об´єднаної) записати формулу висновку:

=ЕСЛИ(И(F6>F14;F6

2.1.2. Відкрити і вивчити довідку по вбудованій функції FРАСПОБР, записати до протоколу основні моменти.

Протоко́л - (фр. protocole, пізньолат. protocollum з пізньогрец. Πρωτόκολλον (Πρώτο+κολλάω) - перший, передній+приклеюю) - перший лист, приклеєний до звитку папіруса чи нотаріального документа, на якому була написана дата.

1   2   3


Скачати 327.24 Kb.

  • Теоретична довідка .
  • Статистические
  • Зауваження.
  • Це має забезпечити виконання умови нормування.
  • Статистические.
  • (другий аргумент функції ХИ2ОБР) дорівнює , де k – число класових інтервалів
  • СЧЁТ(Е:Е)–1), число параметрів нормального розподілу q =2.
  • Шрифт
  • Завдання для самостійного виконання.
  • Перевірка гіпотези про рівність дисперсій двох нормальних сукупностей. Задача . Досліджується вміст флавоноїдів
  • Теоретична довідка.
  • Практичне виконання