Ნდობის ინტერვალი. ნდობის ინტერვალები ვინ შემოგვთავაზა ნდობის ინტერვალის გამოყენება

ნდობის ინტერვალის გამოთვლა ეფუძნება შესაბამისი პარამეტრის საშუალო შეცდომას. Ნდობის ინტერვალი გვიჩვენებს, თუ რა საზღვრებშია ალბათობა (1-a) სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა. აქ a არის მნიშვნელოვნების დონე, (1-a) ასევე ეწოდება ნდობის დონეს.

პირველ თავში ჩვენ ვაჩვენეთ, რომ, მაგალითად, არითმეტიკული საშუალოსთვის, ჭეშმარიტი პოპულაციის საშუალო მდგომარეობს საშუალო ცდომილების 2 საშუალო ცდომილების ფარგლებში, შემთხვევების დაახლოებით 95%-ში. ამრიგად, საშუალოს 95%-იანი ნდობის ინტერვალის საზღვრები იქნება ნიმუშის საშუალო ცდომილების ორჯერ მეტი, ე.ი. ჩვენ ვამრავლებთ საშუალოს საშუალო ცდომილებას ზოგიერთ ფაქტორზე, რომელიც დამოკიდებულია ნდობის დონეზე. საშუალოსა და საშუალების სხვაობისთვის აღებულია Student-ის კოეფიციენტი (Student-ის კრიტერიუმის კრიტიკული მნიშვნელობა), წილების წილისა და სხვაობისთვის - z კრიტერიუმის კრიტიკული მნიშვნელობა. კოეფიციენტისა და საშუალო ცდომილების ნამრავლს შეიძლება ეწოდოს ამ პარამეტრის ზღვრული შეცდომა, ე.ი. მაქსიმუმი, რაც შეგვიძლია მივიღოთ მისი შეფასებისას.

ნდობის ინტერვალი ამისთვის საშუალო არითმეტიკული : .

აქ არის ნიმუში საშუალო;

საშუალო არითმეტიკული ცდომილება;

s-ნიმუშის სტანდარტული გადახრა;

f = n-1 (სტუდენტის კოეფიციენტი).

ნდობის ინტერვალი ამისთვის არითმეტიკული საშუალებების განსხვავება :

აქ არის განსხვავება ნიმუშის საშუალებებს შორის;

- არითმეტიკული საშუალებების სხვაობის საშუალო ცდომილება;

s 1, s 2 -ნიმუში სტანდარტული გადახრები;

n1, n2

სტუდენტის კრიტერიუმის კრიტიკული მნიშვნელობა მნიშვნელოვნების მოცემული დონის a და თავისუფლების ხარისხით f=n1 +n2-2 (სტუდენტის კოეფიციენტი).

ნდობის ინტერვალი ამისთვის აქციები :

.

აქ d არის ნიმუშის წილი;

– საშუალო წილი შეცდომა;

– ნიმუშის ზომა (ჯგუფის ზომა);

ნდობის ინტერვალი ამისთვის იზიარებენ განსხვავებებს :

აქ არის განსხვავება ნიმუშის აქციებს შორის;

არის არითმეტიკული საშუალებების სხვაობის საშუალო შეცდომა;

n1, n2– ნიმუშის ზომები (ჯგუფების რაოდენობა);

z კრიტერიუმის კრიტიკული მნიშვნელობა მოცემულ მნიშვნელოვნების დონეზე a ( , , ).

ინდიკატორების სხვაობის ნდობის ინტერვალების გამოთვლით, ჩვენ, პირველ რიგში, პირდაპირ ვხედავთ ეფექტის შესაძლო მნიშვნელობებს და არა მხოლოდ მის ქულების შეფასებას. მეორეც, ჩვენ შეგვიძლია გამოვიტანოთ დასკვნა ნულოვანი ჰიპოთეზის მიღების ან უარყოფის შესახებ და, მესამე, შეგვიძლია გამოვიტანოთ დასკვნა კრიტერიუმის ძალაზე.

ნდობის ინტერვალების გამოყენებით ჰიპოთეზების ტესტირებისას უნდა დაიცვან შემდეგი წესი:

თუ საშუალო სხვაობის 100(1-a)-პროცენტიანი ნდობის ინტერვალი არ შეიცავს ნულს, მაშინ განსხვავებები სტატისტიკურად მნიშვნელოვანია მნიშვნელოვნების დონეზე; პირიქით, თუ ეს ინტერვალი შეიცავს ნულს, მაშინ განსხვავებები არ არის სტატისტიკურად მნიშვნელოვანი.

მართლაც, თუ ეს ინტერვალი შეიცავს ნულს, მაშინ ეს ნიშნავს, რომ შედარების მაჩვენებელი შეიძლება იყოს ან მეტი ან ნაკლები ერთ ჯგუფში მეორესთან შედარებით, ე.ი. დაფიქსირებული განსხვავებები შემთხვევითია.

იმ ადგილის მიხედვით, სადაც ნული მდებარეობს ნდობის ინტერვალში, შეიძლება ვიმსჯელოთ კრიტერიუმის ძალაზე. თუ ნული ახლოსაა ინტერვალის ქვედა ან ზედა ზღვართან, მაშინ, შესაძლოა, შედარებული ჯგუფების უფრო დიდი რაოდენობით, განსხვავებები მიაღწევს სტატისტიკურ მნიშვნელობას. თუ ნული ახლოს არის შუა ინტერვალით, მაშინ ეს ნიშნავს, რომ ექსპერიმენტულ ჯგუფში ინდიკატორის ზრდაც და შემცირებაც თანაბრად სავარაუდოა და, ალბათ, ნამდვილად არ არის განსხვავებები.

მაგალითები:

ორი სხვადასხვა ტიპის ანესთეზიის გამოყენებისას ოპერაციული ლეტალობის შესადარებლად: პირველი ტიპის ანესთეზიის გამოყენებით ოპერაცია ჩაუტარდა 61 ადამიანს, 8 გარდაიცვალა, მეორის გამოყენებით - 67 ადამიანი, 10 გარდაიცვალა.

d 1 \u003d 8/61 \u003d 0.131; d 2 \u003d 10/67 \u003d 0.149; d1-d2 = - 0,018.

შედარებული მეთოდების ლეტალურობის სხვაობა იქნება დიაპაზონში (-0,018 - 0,122; -0,018 + 0,122) ან (-0,14; 0,104) 100(1-a) = 95% ალბათობით. ინტერვალი შეიცავს ნულს, ე.ი. ერთი და იგივე ლეტალობის ჰიპოთეზა ორი განსხვავებული ტიპის ანესთეზიით არ შეიძლება უარყოს.

ამრიგად, სიკვდილიანობა შეიძლება და შემცირდეს 14%-მდე და გაიზრდება 10,4%-მდე 95%-ის ალბათობით, ე.ი. ნული დაახლოებით შუაშია, ასე რომ, შეიძლება ითქვას, რომ, სავარაუდოდ, ეს ორი მეთოდი ნამდვილად არ განსხვავდება ლეტალურად.

ადრე განხილულ მაგალითში შედარება მოხდა სტუდენტების ოთხ ჯგუფში, რომლებიც განსხვავდებოდნენ საგამოცდო ქულებით. მოდით გამოვთვალოთ ნდობის ინტერვალები საშუალო დაჭერის დროის სტუდენტებისთვის, რომლებმაც ჩააბარეს გამოცდა 2 და 5 და ნდობის ინტერვალი ამ საშუალოებს შორის სხვაობისთვის.

სტუდენტის კოეფიციენტები გვხვდება სტუდენტის განაწილების ცხრილებიდან (იხ. დანართი): პირველი ჯგუფისთვის: = t(0.05;48) = 2.011; მეორე ჯგუფისთვის: = t(0.05;61) = 2.000. ამრიგად, ნდობის ინტერვალები პირველი ჯგუფისთვის: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , მეორე ჯგუფისთვის (156.55- 2.000 * 1.88. + 2.000 * 1.88 ; 160.3). ასე რომ, მათთვის, ვინც ჩააბარა გამოცდა 2-ზე, საშუალო დაჭერის დრო მერყეობს 157,8 ms-დან 166,6 ms-მდე, 95% ალბათობით, მათთვის, ვინც ჩააბარა გამოცდა 5-ზე - 152,8 ms-დან 160,3 ms-მდე, ალბათობით 95% .

თქვენ ასევე შეგიძლიათ შეამოწმოთ ნულოვანი ჰიპოთეზა საშუალებების ნდობის ინტერვალების გამოყენებით და არა მხოლოდ საშუალებებში სხვაობისთვის. მაგალითად, როგორც ჩვენს შემთხვევაში, თუ საშუალებების ნდობის ინტერვალები ერთმანეთს ემთხვევა, მაშინ ნულოვანი ჰიპოთეზის უარყოფა შეუძლებელია. იმისთვის, რომ უარვყოთ ჰიპოთეზა არჩეულ მნიშვნელოვნების დონეზე, შესაბამისი ნდობის ინტერვალები არ უნდა გადაფარდეს.

ვიპოვოთ ნდობის ინტერვალი საშუალო დაწნეხვის დროის სხვაობისთვის იმ ჯგუფებში, რომლებმაც გამოცდა ჩააბარეს 2 და 5. სხვაობა საშუალოებში: 162,19 - 156,55 = 5,64. სტუდენტის კოეფიციენტი: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. ჯგუფის სტანდარტული გადახრები ტოლი იქნება: ; . ჩვენ ვიანგარიშებთ საშუალებებს შორის სხვაობის საშუალო ცდომილებას: . ნდობის ინტერვალი: \u003d (5.64-1.982 * 2.87; 5.64 + 1.982 * 2.87) \u003d (-0.044; 11.33).

ასე რომ, საშუალო დაჭერის დროში სხვაობა ჯგუფებში, რომლებმაც გამოცდა ჩააბარეს 2-ზე და 5-ზე, იქნება -0.044 ms-დან 11.33 ms-მდე. ეს ინტერვალი მოიცავს ნულს, ე.ი. საშუალო დაწკაპუნების დრო მათთვის, ვინც გამოცდა წარმატებით ჩააბარა, შეიძლება გაიზარდოს და შემცირდეს მათთან შედარებით, ვინც გამოცდა არადამაკმაყოფილებლად ჩააბარა, ე.ი. ნულოვანი ჰიპოთეზის უარყოფა შეუძლებელია. მაგრამ ნული ძალიან ახლოს არის ქვედა ზღვართან, დაწნეხვის დრო ბევრად უფრო შემცირდება შესანიშნავი გამვლელებისთვის. ამრიგად, შეგვიძლია დავასკვნათ, რომ ჯერ კიდევ არსებობს განსხვავებები დაწკაპუნების საშუალო დროში მათ შორის, ვინც გაიარა 2-ით და 5-ით, ჩვენ უბრალოდ ვერ აღმოვაჩინეთ ისინი საშუალო დროის მოცემულ ცვლილებაზე, საშუალო დროის გავრცელებაზე და ნიმუშის ზომაზე.

ტესტის ძალა არის არასწორი ნულოვანი ჰიპოთეზის უარყოფის ალბათობა, ე.ი. იპოვნეთ განსხვავებები, სადაც ისინი რეალურად არიან.

ტესტის სიმძლავრე განისაზღვრება მნიშვნელობის დონის, ჯგუფებს შორის განსხვავებების სიდიდის, ჯგუფებში მნიშვნელობების გავრცელებისა და ნიმუშის ზომის მიხედვით.

Student-ის t-ტესტისთვის და დისპერსიის ანალიზისთვის შეგიძლიათ გამოიყენოთ მგრძნობელობის დიაგრამები.

კრიტერიუმის ძალა შეიძლება გამოყენებულ იქნას ჯგუფების საჭირო რაოდენობის წინასწარ განსაზღვრაში.

ნდობის ინტერვალი გვიჩვენებს, თუ რა საზღვრებშია მოცემული ალბათობით სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა.

ნდობის ინტერვალების დახმარებით შეგიძლიათ შეამოწმოთ სტატისტიკური ჰიპოთეზები და გამოიტანოთ დასკვნები კრიტერიუმების მგრძნობელობის შესახებ.

ლიტერატურა.

Glantz S. - თავი 6.7.

რებროვა O.Yu. - გვ.112-114, გვ.171-173, გვ.234-238.

Sidorenko E. V. - გვ. 32-33.

კითხვები მოსწავლეთა თვითშემოწმებისთვის.

1. რა ძალა აქვს კრიტერიუმს?

2. რა შემთხვევაშია საჭირო კრიტერიუმების სიმძლავრის შეფასება?

3. სიმძლავრის გამოთვლის ხერხები.

6. როგორ შევამოწმოთ სტატისტიკური ჰიპოთეზა ნდობის ინტერვალის გამოყენებით?

7. რა შეიძლება ითქვას კრიტერიუმის სიძლიერეზე ნდობის ინტერვალის გამოთვლისას?

Დავალებები.

ნდობის ინტერვალების შეფასება

სასწავლო მიზნები

სტატისტიკა ითვალისწინებს შემდეგს ორი ძირითადი ამოცანა:

    ჩვენ გვაქვს გარკვეული შეფასება, რომელიც ეფუძნება ნიმუშის მონაცემებს და გვსურს გავაკეთოთ გარკვეული ალბათური განცხადება იმის შესახებ, თუ სად არის შეფასებული პარამეტრის ნამდვილი მნიშვნელობა.

    ჩვენ გვაქვს კონკრეტული ჰიპოთეზა, რომელიც უნდა შემოწმდეს ნიმუშის მონაცემების საფუძველზე.

ამ თემაში განვიხილავთ პირველ პრობლემას. ჩვენ ასევე წარმოგიდგენთ ნდობის ინტერვალის განმარტებას.

ნდობის ინტერვალი არის ინტერვალი, რომელიც აგებულია პარამეტრის სავარაუდო მნიშვნელობის გარშემო და გვიჩვენებს, სად არის სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა აპრიორი მოცემულ ალბათობასთან.

ამ თემაზე მასალის შესწავლის შემდეგ თქვენ:

    ისწავლეთ რა არის შეფასების ნდობის ინტერვალი;

    ისწავლოს სტატისტიკური ამოცანების კლასიფიკაცია;

    დაეუფლოს ნდობის ინტერვალების აგების ტექნიკას, როგორც სტატისტიკური ფორმულების, ასევე პროგრამული ინსტრუმენტების გამოყენებით;

    ისწავლეთ ნიმუშის საჭირო ზომის განსაზღვრა სტატისტიკური შეფასებების სიზუსტის გარკვეული პარამეტრების მისაღწევად.

ნიმუშის მახასიათებლების განაწილება

T- განაწილება

როგორც ზემოთ განვიხილეთ, შემთხვევითი ცვლადის განაწილება ახლოსაა სტანდარტიზებულ ნორმალურ განაწილებასთან 0 და 1 პარამეტრებით. ვინაიდან ჩვენ არ ვიცით σ-ის მნიშვნელობა, ჩვენ მას ვცვლით გარკვეული შეფასებით s. რაოდენობას უკვე აქვს განსხვავებული განაწილება, კერძოდ, ან სტუდენტური განაწილება, რომელიც განისაზღვრება პარამეტრით n -1 (თავისუფლების გრადუსების რაოდენობა). ეს განაწილება ახლოს არის ნორმალურ განაწილებასთან (რაც უფრო დიდია n, მით უფრო ახლოსაა განაწილება).

ნახ. 95
წარმოდგენილია სტუდენტის განაწილება თავისუფლების 30 გრადუსით. როგორც ხედავთ, ის ძალიან ახლოს არის ნორმალურ განაწილებასთან.

ნორმალურ განაწილებასთან მუშაობის ფუნქციების მსგავსად NORMDIST და NORMINV, არსებობს t-დისტრიბუციასთან მუშაობის ფუნქციები - STUDIST (TDIST) და STUDRASPBR (TINV). ამ ფუნქციების გამოყენების მაგალითი შეგიძლიათ იხილოთ STUDRIST.XLS ფაილში (თარგი და გამოსავალი) და ნახ. 96
.

სხვა მახასიათებლების განაწილება

როგორც უკვე ვიცით, მოლოდინის შეფასების სიზუსტის დასადგენად, ჩვენ გვჭირდება t-განაწილება. სხვა პარამეტრების შესაფასებლად, როგორიცაა განსხვავება, საჭიროა სხვა განაწილება. ორი მათგანია F- განაწილება და x 2 -განაწილება.

ნდობის ინტერვალი საშუალოსთვის

Ნდობის ინტერვალიარის ინტერვალი, რომელიც აგებულია პარამეტრის სავარაუდო მნიშვნელობის გარშემო და გვიჩვენებს, სად არის სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა აპრიორი მოცემული ალბათობით.

ხდება ნდობის ინტერვალის აგება საშუალო მნიშვნელობისთვის შემდეგი გზით:

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერი გეგმავს შემთხვევით შეარჩიოს 40 ვიზიტორი მათგან, ვინც უკვე სცადა და სთხოვოს შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს შეაფასოს ქულების მოსალოდნელი რაოდენობა, რომელსაც ახალი პროდუქტი მიიღებს და ამ შეფასებისთვის აყალიბებს 95%-იან ნდობის ინტერვალს. Როგორ გავაკეთო ეს? (იხ. ფაილი SANDWICH1.XLS (თარგი და გამოსავალი).

გადაწყვეტილება

ამ პრობლემის გადასაჭრელად, შეგიძლიათ გამოიყენოთ. შედეგები წარმოდგენილია ნახ. 97
.

ნდობის ინტერვალი მთლიანი ღირებულებისთვის

ზოგჯერ, ნიმუშის მონაცემების მიხედვით, საჭიროა არა მათემატიკური მოლოდინის, არამედ მნიშვნელობების ჯამის შეფასება. მაგალითად, აუდიტორთან არსებულ სიტუაციაში, შეიძლება საინტერესო იყოს არა ინვოისის საშუალო ღირებულების, არამედ ყველა ინვოისის ჯამის შეფასება.

მოდით N იყოს ელემენტების საერთო რაოდენობა, n იყოს ნიმუშის ზომა, T 3 იყოს მნიშვნელობების ჯამი ნიმუშში, T" იყოს შეფასება მთლიანი პოპულაციის ჯამისთვის, შემდეგ და ნდობის ინტერვალი გამოითვლება ფორმულით, სადაც s არის ნიმუშის სტანდარტული გადახრის შეფასება, არის ნიმუშის საშუალო შეფასება.

მაგალითი

ვთქვათ, საგადასახადო ოფისს სურს შეაფასოს გადასახადის მთლიანი დაბრუნების ოდენობა 10000 გადასახადის გადამხდელზე. გადასახადის გადამხდელი ან იღებს თანხის დაბრუნებას ან იხდის დამატებით გადასახადებს. იპოვეთ 95% ნდობის ინტერვალი თანხის დაბრუნებისთვის, 500 ადამიანის ნიმუშის ზომის გათვალისწინებით (იხ. ფაილი REFUND AMOUNT.XLS (თარგი და გამოსავალი).

გადაწყვეტილება

ამ შემთხვევისთვის StatPro-ში არ არსებობს სპეციალური პროცედურა, თუმცა, თქვენ ხედავთ, რომ საზღვრების მიღება შესაძლებელია საშუალოს საზღვრებიდან ზემოთ ფორმულების გამოყენებით (ნახ. 98).
).

ნდობის ინტერვალი პროპორციისთვის

მოდით p იყოს მომხმარებელთა წილის მოლოდინი და pv იყოს ამ წილის შეფასება, მიღებული n ზომის ნიმუშიდან. შეიძლება აჩვენოს, რომ საკმარისად დიდი შეფასების განაწილება ახლოს იქნება ნორმასთან საშუალო p და სტანდარტული გადახრით . შეფასების სტანდარტული შეცდომა ამ შემთხვევაში გამოიხატება როგორც და ნდობის ინტერვალი, როგორც .

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერმა შემთხვევით შეარჩია 40 ვიზიტორი მათგან, ვინც უკვე სცადა და სთხოვა შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს შეაფასოს მოსალოდნელი პროპორცია. მომხმარებელთა, რომლებიც ახალ პროდუქტს 6 ქულაზე მაინც აფასებენ (ის მოელის, რომ ეს მომხმარებლები იქნებიან ახალი პროდუქტის მომხმარებლები).

გადაწყვეტილება

თავდაპირველად, ჩვენ ვქმნით ახალ სვეტს 1-ის საფუძველზე, თუ კლიენტის ქულა იყო 6 ქულაზე მეტი და 0-ზე სხვა შემთხვევაში (იხილეთ SANDWICH2.XLS ფაილი (თარგი და გამოსავალი).

მეთოდი 1

1-ის ოდენობის დათვლას ვაფასებთ წილს და შემდეგ ვიყენებთ ფორმულებს.

z cr-ის მნიშვნელობა აღებულია სპეციალური ნორმალური განაწილების ცხრილებიდან (მაგალითად, 1.96 95% ნდობის ინტერვალისთვის).

ამ მიდგომისა და კონკრეტული მონაცემების გამოყენებით 95% ინტერვალის ასაგებად მივიღებთ შემდეგ შედეგებს (ნახ. 99
). z cr პარამეტრის კრიტიკული მნიშვნელობა არის 1,96. შეფასების სტანდარტული შეცდომაა 0.077. ნდობის ინტერვალის ქვედა ზღვარი არის 0,475. ნდობის ინტერვალის ზედა ზღვარი არის 0,775. ამრიგად, მენეჯერს შეუძლია 95%-იანი დარწმუნებით დაუშვას, რომ მომხმარებელთა პროცენტი, რომლებიც ახალ პროდუქტს 6 ქულით ან მეტს აფასებენ, იქნება 47,5-დან 77,5-მდე.

მეთოდი 2

ამ პრობლემის მოგვარება შესაძლებელია სტანდარტული StatPro ინსტრუმენტების გამოყენებით. ამისათვის საკმარისია აღინიშნოს, რომ წილი ამ შემთხვევაში ემთხვევა Type სვეტის საშუალო მნიშვნელობას. შემდეგი განაცხადი StatPro/სტატისტიკური დასკვნა/ერთი ნიმუშის ანალიზიტიპი სვეტისთვის საშუალო მნიშვნელობის (მოლოდინის შეფასება) ნდობის ინტერვალის შესაქმნელად. ამ შემთხვევაში მიღებული შედეგები ძალიან ახლოს იქნება 1-ლი მეთოდის შედეგთან (სურ. 99).

ნდობის ინტერვალი სტანდარტული გადახრისთვის

s გამოიყენება როგორც სტანდარტული გადახრის შეფასება (ფორმულა მოცემულია 1-ელ ნაწილში). s შეფასების სიმკვრივის ფუნქცია არის chi-კვადრატი ფუნქცია, რომელსაც, t-განაწილების მსგავსად, აქვს n-1 გრადუსი თავისუფლება. არსებობს სპეციალური ფუნქციები ამ დისტრიბუციასთან მუშაობისთვის CHI2DIST (CHIDIST) და CHI2OBR (CHIINV).

ნდობის ინტერვალი ამ შემთხვევაში აღარ იქნება სიმეტრიული. საზღვრების პირობითი სქემა ნაჩვენებია ნახ. 100 .

მაგალითი

მანქანამ უნდა აწარმოოს 10 სმ დიამეტრის ნაწილები, თუმცა სხვადასხვა გარემოებების გამო ხდება შეცდომები. ხარისხის კონტროლერს ორი რამ აწუხებს: პირველი, საშუალო მნიშვნელობა უნდა იყოს 10 სმ; მეორეც, ამ შემთხვევაშიც, თუ გადახრები დიდია, მაშინ ბევრი დეტალი უარყოფილი იქნება. ყოველდღიურად აკეთებს ნიმუშს 50 ნაწილისგან (იხ. ფაილი QUALITY CONTROL.XLS (თარგი და გამოსავალი). რა დასკვნების გამოტანა შეუძლია ასეთ ნიმუშს?

გადაწყვეტილება

ჩვენ ვაშენებთ 95% ნდობის ინტერვალებს საშუალო და სტანდარტული გადახრისთვის გამოყენებით StatPro / სტატისტიკური დასკვნა / ერთი ნიმუშის ანალიზი(ნახ. 101
).

გარდა ამისა, დიამეტრის ნორმალური განაწილების დაშვების გამოყენებით, ჩვენ ვიანგარიშებთ დეფექტური პროდუქტების პროპორციას, მაქსიმალური გადახრის დაყენებით 0,065. საძიებო ცხრილის შესაძლებლობების გამოყენებით (ორი პარამეტრის შემთხვევა), ჩვენ ვაშენებთ უარყოფების პროცენტის დამოკიდებულებას საშუალო მნიშვნელობაზე და სტანდარტულ გადახრაზე (ნახ. 102).
).

ნდობის ინტერვალი ორი საშუალების სხვაობისთვის

ეს არის სტატისტიკური მეთოდების ერთ-ერთი ყველაზე მნიშვნელოვანი გამოყენება. სიტუაციის მაგალითები.

    ტანსაცმლის მაღაზიის მენეჯერს სურს იცოდეს, რამდენს მეტ-ნაკლებად ხარჯავს საშუალო მყიდველი ქალი მაღაზიაში, ვიდრე მამაკაცი.

    ორი ავიაკომპანია დაფრინავს მსგავსი მარშრუტებით. მომხმარებელთა ორგანიზაციას სურს შეადაროს განსხვავება ორივე ავიაკომპანიისთვის ფრენის საშუალო მოსალოდნელ დროებს შორის.

    კომპანია აგზავნის კუპონებს გარკვეული ტიპის საქონელზე ერთ ქალაქში და არ აგზავნის მეორეში. მენეჯერებს სურთ შეადარონ ამ ნივთების საშუალო შესყიდვები მომდევნო ორი თვის განმავლობაში.

    მანქანების დილერი ხშირად ხვდება დაქორწინებულ წყვილებს პრეზენტაციებზე. პრეზენტაციაზე მათი პირადი რეაქციების გასაგებად, წყვილებს ხშირად აკითხავენ ცალ-ცალკე. მენეჯერს სურს შეაფასოს ქალებისა და მამაკაცების რეიტინგების განსხვავება.

დამოუკიდებელი ნიმუშების საქმე

საშუალო განსხვავებას ექნება t-განაწილება n 1 + n 2 - თავისუფლების 2 გრადუსით. ნდობის ინტერვალი μ 1 - μ 2 გამოიხატება თანაფარდობით:

ამ პრობლემის გადაჭრა შესაძლებელია არა მხოლოდ ზემოაღნიშნული ფორმულებით, არამედ სტანდარტული StatPro ინსტრუმენტებით. ამისათვის საკმარისია მიმართოთ

ნდობის ინტერვალი პროპორციებს შორის სხვაობისთვის

მოდით იყოს აქციების მათემატიკური მოლოდინი. მოდით იყოს მათი ნიმუშის შეფასებები, რომლებიც აგებულია n 1 და n 2 ზომის ნიმუშებზე, შესაბამისად. შემდეგ არის სხვაობის შეფასება. ამრიგად, ამ განსხვავების ნდობის ინტერვალი გამოიხატება როგორც:

აქ z cr არის სპეციალური ცხრილების ნორმალური განაწილებიდან მიღებული მნიშვნელობა (მაგალითად, 1.96 95% ნდობის ინტერვალისთვის).

შეფასების სტანდარტული შეცდომა გამოიხატება ამ შემთხვევაში მიმართებით:

.

მაგალითი

მაღაზიამ, დიდი გაყიდვისთვის მომზადებისას, ჩაატარა შემდეგი მარკეტინგული კვლევა. 300 საუკეთესო მყიდველი შეირჩა და შემთხვევით დაიყო ორ ჯგუფად თითო 150 წევრისგან. ყველა შერჩეულ მყიდველს გაეგზავნა მოსაწვევები გაყიდვაში მონაწილეობის მისაღებად, მაგრამ მხოლოდ პირველი ჯგუფის წევრებს დაურთეს 5%-იანი ფასდაკლების უფლების მინიჭებული კუპონი. გაყიდვის დროს დაფიქსირდა 300-ვე შერჩეული მყიდველის შესყიდვები. როგორ შეუძლია მენეჯერს შედეგების ინტერპრეტაცია და განსჯის გაკეთება კუპონირების ეფექტურობის შესახებ? (იხილეთ COUPONS.XLS ფაილი (თარგი და გამოსავალი)).

გადაწყვეტილება

ჩვენი კონკრეტული შემთხვევისთვის, 150 კლიენტიდან, რომლებმაც მიიღეს ფასდაკლების კუპონი, 55-მა შეიძინა გაყიდვაში, ხოლო 150-დან, ვინც კუპონი არ მიიღო, მხოლოდ 35-მა შეიძინა (სურ. 103).
). შემდეგ ნიმუშის პროპორციების მნიშვნელობებია 0.3667 და 0.2333, შესაბამისად. ხოლო ნიმუშის სხვაობა მათ შორის უდრის შესაბამისად 0,1333-ს. 95%-იანი ნდობის ინტერვალის დაშვებით, ნორმალური განაწილების ცხრილიდან ვპოულობთ z cr = 1.96. ნიმუშის სხვაობის სტანდარტული ცდომილების გაანგარიშება არის 0,0524. საბოლოოდ, მივიღებთ, რომ 95% ნდობის ინტერვალის ქვედა ზღვარი არის 0.0307, ​​ხოლო ზედა ზღვარი არის 0.2359, შესაბამისად. მიღებული შედეგების ინტერპრეტაცია შესაძლებელია ისე, რომ ყოველი 100 მომხმარებელზე, რომელმაც მიიღო ფასდაკლების კუპონი, შეიძლება ველოდოთ 3-დან 23-მდე ახალ მომხმარებელს. თუმცა, გასათვალისწინებელია, რომ ეს დასკვნა თავისთავად არ ნიშნავს კუპონების გამოყენების ეფექტურობას (რადგან ფასდაკლებით ვკარგავთ მოგებას!). მოდით ვაჩვენოთ ეს კონკრეტულ მონაცემებზე. დავუშვათ, რომ საშუალო შესყიდვის თანხაა 400 რუბლი, აქედან 50 რუბლი. არის მაღაზიის მოგება. მაშინ მოსალოდნელი მოგება 100 მომხმარებელზე, რომლებმაც არ მიიღეს კუპონი, უდრის:

50 0,2333 100 \u003d 1166,50 რუბლი.

მსგავსი გამოთვლები 100 მყიდველისთვის, რომლებმაც მიიღეს კუპონი, იძლევა:

30 0,3667 100 \u003d 1100,10 რუბლი.

საშუალო მოგების 30-მდე შემცირება აიხსნება იმით, რომ ფასდაკლების გამოყენებით მყიდველები, რომლებმაც მიიღეს კუპონი, საშუალოდ შეიძენენ 380 რუბლს.

ამრიგად, საბოლოო დასკვნა მიუთითებს ამ კონკრეტულ სიტუაციაში ასეთი კუპონების გამოყენების არაეფექტურობაზე.

კომენტარი. ამ პრობლემის მოგვარება შესაძლებელია სტანდარტული StatPro ინსტრუმენტების გამოყენებით. ამისათვის საკმარისია ეს პრობლემა დავამციროთ მეთოდით ორი საშუალოს სხვაობის შეფასების პრობლემამდე და შემდეგ გამოვიყენოთ StatPro/სტატისტიკური დასკვნა/ორი ნიმუშის ანალიზიორ საშუალო მნიშვნელობას შორის სხვაობის ნდობის ინტერვალის შესაქმნელად.

ნდობის ინტერვალის კონტროლი

ნდობის ინტერვალის სიგრძე დამოკიდებულია შემდეგი პირობები:

    პირდაპირ მონაცემები (სტანდარტული გადახრა);

    მნიშვნელოვნების დონე;

    ნიმუშის ზომა.

ნიმუშის ზომა საშუალოს შესაფასებლად

ჯერ განვიხილოთ პრობლემა ზოგად შემთხვევაში. მოდით აღვნიშნოთ ჩვენთვის მოცემული ნდობის ინტერვალის სიგრძის ნახევრის მნიშვნელობა B (ნახ. 104).
). ჩვენ ვიცით, რომ ნდობის ინტერვალი X შემთხვევითი ცვლადის საშუალო მნიშვნელობისთვის გამოიხატება როგორც , სად . ვარაუდით:

და გამოვხატავთ n-ს, ვიღებთ.

სამწუხაროდ, ჩვენ არ ვიცით შემთხვევითი X ცვლადის დისპერსიის ზუსტი მნიშვნელობა. გარდა ამისა, ჩვენ არ ვიცით t cr-ის მნიშვნელობა, რადგან ის დამოკიდებულია n-ზე თავისუფლების გრადუსების რაოდენობის მიხედვით. ამ სიტუაციაში ჩვენ შეგვიძლია გავაკეთოთ შემდეგი. s-ის ნაცვლად, ჩვენ ვიყენებთ დისპერსიის გარკვეულ შეფასებას შესასწავლი შემთხვევითი ცვლადის ზოგიერთი ხელმისაწვდომი რეალიზაციისთვის. t cr მნიშვნელობის ნაცვლად, ვიყენებთ z cr მნიშვნელობას ნორმალური განაწილებისთვის. ეს საკმაოდ მისაღებია, რადგან სიმკვრივის ფუნქციები ნორმალური და t-განაწილებისთვის ძალიან ახლოსაა (გარდა მცირე n-ის შემთხვევისა). ამრიგად, სასურველი ფორმულა იღებს ფორმას:

.

ვინაიდან ფორმულა იძლევა, ზოგადად, არა მთელი რიცხვის შედეგებს, შედეგის ჭარბი დამრგვალება მიიღება, როგორც სასურველი ნიმუშის ზომა.

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერი გეგმავს შემთხვევით შეარჩიოს ვიზიტორთა რაოდენობა მათ შორის, ვინც უკვე სცადა და სთხოვოს შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს. შეაფასოს ქულების მოსალოდნელი რაოდენობა, რომელსაც მიიღებს ახალი პროდუქტი.პროდუქტი და გამოვსახოთ ამ შეფასების 95%-იანი ნდობის ინტერვალი. თუმცა, მას სურს, რომ ნდობის ინტერვალის ნახევარი არ აღემატებოდეს 0.3-ს. რამდენი ვიზიტორი სჭირდება მას გამოკითხვისთვის?

შემდეგნაირად:

Აქ რ ოწარის p წილადის შეფასება და B არის ნდობის ინტერვალის სიგრძის მოცემული ნახევარი. n-ის გაბერილი მნიშვნელობა შეიძლება მივიღოთ მნიშვნელობის გამოყენებით რ ოწ= 0.5. ამ შემთხვევაში, ნდობის ინტერვალის სიგრძე არ აღემატება მოცემულ მნიშვნელობას B-ს ნებისმიერი ჭეშმარიტი მნიშვნელობისთვის.

მაგალითი

ნება მიეცით მენეჯერს წინა მაგალითიდან დაგეგმოს შეაფასოს მომხმარებელთა პროპორცია, რომლებიც ამჯობინებენ ახალი ტიპის პროდუქტს. მას სურს ააგოს 90%-იანი ნდობის ინტერვალი, რომლის ნახევარი სიგრძე 0,05-ზე ნაკლები ან ტოლია. რამდენი კლიენტი უნდა იყოს შერჩეული შემთხვევით?

გადაწყვეტილება

ჩვენს შემთხვევაში, z cr = 1.645 მნიშვნელობა. ამიტომ, საჭირო რაოდენობა გამოითვლება როგორც .

თუ მენეჯერს ქონდა საფუძველი დაეჯერებინა, რომ p-ის სასურველი მნიშვნელობა არის, მაგალითად, დაახლოებით 0.3, მაშინ ამ მნიშვნელობის ზემოხსენებულ ფორმულაში ჩანაცვლებით, ჩვენ მივიღებთ შემთხვევითი ნიმუშის უფრო მცირე მნიშვნელობას, კერძოდ 228-ს.

განსაზღვრის ფორმულა შემთხვევითი ნიმუშის ზომები ორ საშუალებას შორის სხვაობის შემთხვევაშიდაწერილი როგორც:

.

მაგალითი

ზოგიერთ კომპიუტერულ კომპანიას აქვს მომხმარებელთა მომსახურების ცენტრი. ბოლო დროს იმატა მომხმარებელთა პრეტენზიებმა მომსახურების უხარისხობაზე. სერვის ცენტრში ძირითადად დასაქმებულია ორი ტიპის თანამშრომელი: მცირე გამოცდილების მქონე, მაგრამ გავლილი სპეციალური სასწავლო კურსები და დიდი პრაქტიკული გამოცდილების მქონე, მაგრამ არ გავლილი სპეციალური კურსები. კომპანიას სურს გაანალიზოს მომხმარებელთა საჩივრები ბოლო ექვსი თვის განმავლობაში და შეადაროს მათი საშუალო რაოდენობა თანამშრომლების ორი ჯგუფიდან. ვარაუდობენ, რომ ორივე ჯგუფის ნიმუშებში რიცხვები ერთნაირი იქნება. რამდენი თანამშრომელი უნდა იყოს შეყვანილი ნიმუშში, რომ მივიღოთ 95% ინტერვალი ნახევარი სიგრძით არაუმეტეს 2-ისა?

გადაწყვეტილება

აქ σ ots არის ორივე შემთხვევითი ცვლადის სტანდარტული გადახრის შეფასება იმ ვარაუდით, რომ ისინი ახლოსაა. ამრიგად, ჩვენს ამოცანაში, ჩვენ როგორმე უნდა მივიღოთ ეს შეფასება. ეს შეიძლება გაკეთდეს, მაგალითად, შემდეგნაირად. მომხმარებელთა საჩივრების მონაცემების დათვალიერებისას, ბოლო ექვსი თვის განმავლობაში, მენეჯერმა შეიძლება შეამჩნია, რომ თითო თანამშრომელს ჩვეულებრივ აქვს 6-დან 36-მდე საჩივარი. იმის ცოდნა, რომ ნორმალური განაწილებისთვის, პრაქტიკულად ყველა მნიშვნელობა არის არაუმეტეს სამი სტანდარტული გადახრა საშუალოდან, მას შეუძლია გონივრულად დაიჯეროს, რომ:

, საიდანაც σ ots = 5.

ამ მნიშვნელობის ფორმულაში ჩანაცვლებით, მივიღებთ .

განსაზღვრის ფორმულა შემთხვევითი ნიმუშის ზომა წილებს შორის სხვაობის შეფასების შემთხვევაშიროგორც ჩანს:

მაგალითი

ზოგიერთ კომპანიას აქვს ორი ქარხანა მსგავსი პროდუქტების წარმოებისთვის. კომპანიის მენეჯერს სურს შეადაროს ორივე ქარხნის ხარვეზის მაჩვენებლები. არსებული ინფორმაციით, ორივე ქარხანაში უარყოფის მაჩვენებელი 3-დან 5%-მდეა. სავარაუდოა, რომ ააშენოს 99% ნდობის ინტერვალი ნახევარი სიგრძით არაუმეტეს 0,005 (ან 0,5%). რამდენი პროდუქტი უნდა შეირჩეს თითოეული ქარხნიდან?

გადაწყვეტილება

აქ p 1ot და p 2ot არის 1 და 2 ქარხნების უარყოფის ორი უცნობი ფრაქციის შეფასება. თუ დავსვამთ p 1ots \u003d p 2ots \u003d 0.5, მაშინ მივიღებთ გადაჭარბებულ მნიშვნელობას n-სთვის. მაგრამ რადგან ჩვენს შემთხვევაში გვაქვს გარკვეული აპრიორი ინფორმაცია ამ აქციების შესახებ, ჩვენ ვიღებთ ამ აქციების ზედა შეფასებას, კერძოდ 0.05. ვიღებთ

პოპულაციის ზოგიერთი პარამეტრის შეფასებისას ნიმუშების მონაცემებიდან, სასარგებლოა არა მხოლოდ პარამეტრის წერტილის შეფასება, არამედ სანდო ინტერვალიც, რომელიც აჩვენებს, სად შეიძლება იყოს შეფასებული პარამეტრის ზუსტი მნიშვნელობა.

ამ თავში ასევე გავეცანით რაოდენობრივ მიმართებებს, რომლებიც გვაძლევს საშუალებას ავაშენოთ ასეთი ინტერვალები სხვადასხვა პარამეტრებზე; ისწავლეს ნდობის ინტერვალის სიგრძის კონტროლის გზები.

ჩვენ ასევე აღვნიშნავთ, რომ ნიმუშის ზომის შეფასების პრობლემა (ექსპერიმენტის დაგეგმვის პრობლემა) შეიძლება გადაწყდეს სტანდარტული StatPro ინსტრუმენტების გამოყენებით, კერძოდ StatPro / სტატისტიკური დასკვნა / ნიმუშის ზომის შერჩევა.

კონსტანტინე კრავჩიკი ნათლად განმარტავს, რა არის ნდობის ინტერვალი სამედიცინო კვლევაში და როგორ გამოვიყენოთ იგი

„კატრენ-სტილი“ აგრძელებს კონსტანტინე კრავჩიკის სამედიცინო სტატისტიკის სერიის გამოცემას. ორ წინა სტატიაში ავტორი შეეხო ისეთი ცნებების ახსნას, როგორიცაა და.

კონსტანტინე კრავჩიკი

მათემატიკოს-ანალიტიკოსი. სპეციალისტი მედიცინასა და ჰუმანიტარულ მეცნიერებებში სტატისტიკური კვლევების დარგში

ქალაქი მოსკოვი

ძალიან ხშირად კლინიკურ კვლევებზე სტატიებში შეგიძლიათ იპოვოთ იდუმალი ფრაზა: "ნდობის ინტერვალი" (95% CI ან 95% CI - ნდობის ინტერვალი). მაგალითად, სტატიაში შეიძლება ითქვას: „სტუდენტის t-ტესტი გამოიყენებოდა განსხვავებების მნიშვნელოვნების შესაფასებლად, 95%-იანი ნდობის ინტერვალით გამოთვლილი“.

რა არის "95% სანდო ინტერვალის" მნიშვნელობა და რატომ გამოვთვალოთ იგი?

რა არის ნდობის ინტერვალი? - ეს არის დიაპაზონი, რომელშიც მოდის ნამდვილი საშუალო მნიშვნელობები პოპულაციაში. და რა, არის "არაჭეშმარიტი" საშუალო მაჩვენებლები? გარკვეული გაგებით, დიახ, აკეთებენ. ჩვენ განვმარტეთ, რომ შეუძლებელია მთელი პოპულაციის ინტერესის პარამეტრის გაზომვა, ამიტომ მკვლევარები კმაყოფილნი არიან შეზღუდული ნიმუშით. ამ ნიმუშში (მაგალითად, სხეულის წონის მიხედვით) არის ერთი საშუალო მნიშვნელობა (გარკვეული წონა), რომლითაც ჩვენ ვიმსჯელებთ საშუალო მნიშვნელობაზე მთელ ზოგად პოპულაციაში. თუმცა, ნაკლებად სავარაუდოა, რომ ნიმუშის საშუალო წონა (განსაკუთრებით მცირე) ემთხვევა საერთო პოპულაციის საშუალო წონას. აქედან გამომდინარე, უფრო სწორია გამოვთვალოთ და გამოიყენოთ ზოგადი პოპულაციის საშუალო მნიშვნელობების დიაპაზონი.

მაგალითად, დავუშვათ, რომ ჰემოგლობინის 95% ნდობის ინტერვალი (95% CI) არის 110-დან 122 გ/ლ-მდე. ეს ნიშნავს, რომ 95 % ალბათობით, ჰემოგლობინის ნამდვილი საშუალო მნიშვნელობა ზოგად პოპულაციაში იქნება 110-დან 122 გ/ლ-მდე. სხვა სიტყვებით რომ ვთქვათ, ჩვენ არ ვიცით საშუალო ჰემოგლობინის საერთო პოპულაციაში, მაგრამ შეგვიძლია მივუთითოთ ამ მახასიათებლის მნიშვნელობების დიაპაზონი 95% ალბათობით.

ნდობის ინტერვალები განსაკუთრებით ეხება ჯგუფებს შორის საშუალო განსხვავებას, ან რასაც ეფექტის ზომას უწოდებენ.

დავუშვათ, ჩვენ შევადარეთ რკინის ორი პრეპარატის ეფექტურობა: ერთი, რომელიც დიდი ხანია ბაზარზეა და ერთი, რომელიც ახლახან დარეგისტრირდა. თერაპიის კურსის შემდეგ შეფასდა ჰემოგლობინის კონცენტრაცია პაციენტთა შესწავლილ ჯგუფებში და სტატისტიკურმა პროგრამამ გამოთვალა ჩვენთვის, რომ განსხვავება ორ ჯგუფში საშუალო მნიშვნელობებს შორის 95% ალბათობით არის დიაპაზონში. 1,72-დან 14,36 გ/ლ-მდე (ცხრილი 1).

ჩანართი 1. დამოუკიდებელი ნიმუშების კრიტერიუმი
(ჯგუფები შედარებულია ჰემოგლობინის დონის მიხედვით)

ეს უნდა იქნას განმარტებული შემდეგნაირად: ზოგადი პოპულაციის პაციენტების ნაწილში, რომლებიც იღებენ ახალ პრეპარატს, ჰემოგლობინი საშუალოდ უფრო მაღალი იქნება 1,72-14,36 გ/ლ-ით, ვიდრე მათში, ვინც იღებდა უკვე ცნობილ პრეპარატს.

სხვა სიტყვებით რომ ვთქვათ, ზოგად პოპულაციაში, 95% ალბათობის მქონე ჯგუფებში ჰემოგლობინის საშუალო მნიშვნელობების განსხვავება ამ საზღვრებშია. მკვლევარის გადასაწყვეტია, ეს ბევრია თუ ცოტა. ამ ყველაფრის აზრი ის არის, რომ ჩვენ ვმუშაობთ არა ერთი საშუალო მნიშვნელობით, არამედ მნიშვნელობების დიაპაზონით, შესაბამისად, უფრო საიმედოდ ვაფასებთ განსხვავებას პარამეტრებში ჯგუფებს შორის.

სტატისტიკურ პაკეტებში, მკვლევარის შეხედულებისამებრ, შეიძლება დამოუკიდებლად შევიწროვდეს ან გაფართოვდეს ნდობის ინტერვალის საზღვრები. ნდობის ინტერვალის ალბათობების შემცირებით, ჩვენ ვიწროვებთ საშუალებების დიაპაზონს. მაგალითად, 90% CI-ზე საშუალების დიაპაზონი (ან საშუალო განსხვავებები) უფრო ვიწრო იქნება, ვიდრე 95% CI-ზე.

პირიქით, ალბათობის გაზრდა 99%-მდე აფართოებს მნიშვნელობების დიაპაზონს. ჯგუფების შედარებისას, CI-ის ქვედა ზღვარმა შეიძლება გადალახოს ნულოვანი ნიშანი. მაგალითად, თუ ჩვენ გავაფართოვეთ ნდობის ინტერვალის საზღვრები 99 %-მდე, მაშინ ინტერვალის საზღვრები მერყეობდა –1-დან 16 გ/ლ-მდე. ეს ნიშნავს, რომ ზოგად პოპულაციაში არის ჯგუფები, რომელთა შორის განსხვავება საშუალოდ შესწავლილი მახასიათებლისთვის არის 0 (M = 0).

ნდობის ინტერვალები შეიძლება გამოყენებულ იქნას სტატისტიკური ჰიპოთეზების შესამოწმებლად. თუ ნდობის ინტერვალი კვეთს ნულს, მაშინ ნულოვანი ჰიპოთეზა, რომელიც ვარაუდობს, რომ ჯგუფები არ განსხვავდებიან შესწავლილ პარამეტრში, მართალია. ზემოთ აღწერილია მაგალითი, როდესაც ჩვენ გავაფართოვეთ საზღვრები 99% -მდე. სადღაც ზოგადად მოსახლეობაში აღმოვაჩინეთ ჯგუფები, რომლებიც არანაირად არ განსხვავდებოდნენ.

ჰემოგლობინის სხვაობის 95% ნდობის ინტერვალი, (გ/ლ)


ფიგურა გვიჩვენებს ორ ჯგუფს შორის საშუალო ჰემოგლობინის სხვაობის 95% ნდობის ინტერვალის ხაზის სახით. ხაზი გადის ნულოვან ნიშნულს, შესაბამისად, არის განსხვავება ნულის ტოლი საშუალებებს შორის, რაც ადასტურებს ნულოვან ჰიპოთეზას, რომ ჯგუფები არ განსხვავდებიან. განსხვავება ჯგუფებს შორის მერყეობს -2-დან 5 გ/ლ-მდე, რაც ნიშნავს, რომ ჰემოგლობინი შეიძლება შემცირდეს 2 გ/ლ-ით ან გაიზარდოს 5 გ/ლ-ით.

ნდობის ინტერვალი ძალიან მნიშვნელოვანი მაჩვენებელია. მისი წყალობით, თქვენ ხედავთ, ჯგუფებში განსხვავებები მართლაც იყო საშუალების სხვაობით გამოწვეული თუ დიდი ნიმუშის გამო, რადგან დიდი ნიმუშით განსხვავებების პოვნის შანსი უფრო დიდია, ვიდრე მცირეზე.

პრაქტიკაში, ეს შეიძლება ასე გამოიყურებოდეს. ჩვენ ავიღეთ 1000 ადამიანის ნიმუში, გავზომეთ ჰემოგლობინის დონე და აღმოვაჩინეთ, რომ საშუალებებში სხვაობის ნდობის ინტერვალი არის 1,2-დან 1,5 გ/ლ-მდე. სტატისტიკური მნიშვნელოვნების დონე ამ შემთხვევაში გვ

ჩვენ ვხედავთ, რომ ჰემოგლობინის კონცენტრაცია გაიზარდა, მაგრამ თითქმის შეუმჩნევლად, მაშასადამე, სტატისტიკური მნიშვნელობა სწორედ ნიმუშის ზომის გამო გამოჩნდა.

ნდობის ინტერვალები შეიძლება გამოითვალოს არა მხოლოდ საშუალო, არამედ პროპორციებისთვის (და რისკის კოეფიციენტებისთვის). მაგალითად, ჩვენ გვაინტერესებს იმ პაციენტების პროპორციების ნდობის ინტერვალი, რომლებმაც მიაღწიეს რემისიას განვითარებული პრეპარატის მიღებისას. დავუშვათ, რომ 95% CI პროპორციებისთვის, ანუ ასეთი პაციენტების პროპორციისთვის, არის 0.60-0.80 დიაპაზონში. ამრიგად, შეგვიძლია ვთქვათ, რომ ჩვენს წამალს თერაპიული ეფექტი აქვს შემთხვევების 60-დან 80%-მდე.

სტატისტიკაში არსებობს ორი სახის შეფასება: წერტილი და ინტერვალი. ქულების შეფასებაარის ერთი ნიმუშის სტატისტიკა, რომელიც გამოიყენება პოპულაციის პარამეტრის შესაფასებლად. მაგალითად, ნიმუში ნიშნავს არის პოპულაციის საშუალო და შერჩევის დისპერსიის წერტილის შეფასება S2- პოპულაციის დისპერსიის ქულათა შეფასება σ2. ნაჩვენებია, რომ შერჩევის საშუალო არის მოსახლეობის მოლოდინის მიუკერძოებელი შეფასება. შერჩევის საშუალოს ეწოდება მიუკერძოებელი, რადგან ყველა ნიმუშის საშუალო ნიშნავს (იგივე ნიმუშის ზომით ) უდრის საერთო მოსახლეობის მათემატიკურ მოლოდინს.

ნიმუშის დისპერსიის მიზნით S2გახდა პოპულაციის დისპერსიის მიუკერძოებელი შემფასებელი σ2, ნიმუშის დისპერსიის მნიშვნელი ტოლი უნდა იყოს – 1 , მაგრამ არა . სხვა სიტყვებით რომ ვთქვათ, პოპულაციის ვარიაცია არის ყველა შესაძლო ნიმუშის ვარიაციების საშუალო.

პოპულაციის პარამეტრების შეფასებისას უნდა გვახსოვდეს, რომ ნიმუშის სტატისტიკა, როგორიცაა , დამოკიდებულია კონკრეტულ ნიმუშებზე. ამ ფაქტის გათვალისწინება, მოპოვება ინტერვალის შეფასებაზოგადი მოსახლეობის მათემატიკური მოლოდინი აანალიზებს ნიმუშის საშუალებების განაწილებას (დაწვრილებით იხ.). აგებულ ინტერვალს ახასიათებს გარკვეული ნდობის დონე, რაც არის ალბათობა იმისა, რომ ზოგადი პოპულაციის ჭეშმარიტი პარამეტრი სწორად არის შეფასებული. მსგავსი ნდობის ინტერვალები შეიძლება გამოყენებულ იქნას მახასიათებლის პროპორციის შესაფასებლად და საერთო მოსახლეობის ძირითადი განაწილებული მასა.

ჩამოტვირთეთ შენიშვნა ფორმატში ან ფორმატში, მაგალითები ფორმატში

ნდობის ინტერვალის აგება ზოგადი პოპულაციის მათემატიკური მოლოდინისთვის ცნობილი სტანდარტული გადახრით

ზოგადი პოპულაციის მახასიათებლის პროპორციისთვის ნდობის ინტერვალის აგება

ამ განყოფილებაში ნდობის ინტერვალის კონცეფცია ვრცელდება კატეგორიულ მონაცემებზე. ეს საშუალებას გაძლევთ შეაფასოთ მახასიათებლის წილი ზოგად პოპულაციაში ნიმუშის წილით = X/. როგორც აღინიშნა, თუ ღირებულებები და (1 - გვ)აღემატება 5 რიცხვს, ბინომალური განაწილება შეიძლება მიახლოებით ნორმალურზე. მაშასადამე, საერთო პოპულაციაში მახასიათებლის წილის შესაფასებლად შესაძლებელია ინტერვალის აგება, რომლის ნდობის დონე ტოლია (1 - α)x100%.


სადაც გვ- ფუნქციის ნიმუშის წილი, ტოლია X/, ე.ი. წარმატებების რაოდენობა გაყოფილი ნიმუშის ზომაზე, - თვისების წილი ზოგად პოპულაციაში, არის სტანდარტიზებული ნორმალური განაწილების კრიტიკული მნიშვნელობა, - ნიმუშის ზომა.

მაგალითი 3დავუშვათ, რომ ნიმუში ამოღებულია საინფორმაციო სისტემიდან, რომელიც შედგება ბოლო ერთი თვის განმავლობაში შესრულებული 100 ინვოისისგან. ვთქვათ, რომ ამ ანგარიშფაქტურებიდან 10 არასწორია. ამრიგად, = 10/100 = 0.1. 95% ნდობის დონე შეესაბამება კრიტიკულ მნიშვნელობას Z = 1.96.

ამრიგად, არსებობს 95%-იანი შანსი, რომ ინვოისების 4.12%-დან 15.88%-მდე შეცდომებს შეიცავდეს.

მოცემული ნიმუშის ზომისთვის, ნდობის ინტერვალი, რომელიც შეიცავს მახასიათებლის პროპორციას ზოგად პოპულაციაში, უფრო ფართოა, ვიდრე უწყვეტი შემთხვევითი ცვლადი. ეს იმიტომ ხდება, რომ უწყვეტი შემთხვევითი ცვლადის გაზომვები შეიცავს უფრო მეტ ინფორმაციას, ვიდრე კატეგორიული მონაცემების გაზომვები. სხვა სიტყვებით რომ ვთქვათ, კატეგორიული მონაცემები, რომლებიც იღებენ მხოლოდ ორ მნიშვნელობას, შეიცავს არასაკმარის ინფორმაციას მათი განაწილების პარამეტრების შესაფასებლად.

ATსასრული პოპულაციისგან მიღებული შეფასებების გაანგარიშება

მათემატიკური მოლოდინის შეფასება.კორექტირების ფაქტორი საბოლოო პოპულაციისთვის ( fpc) გამოიყენებოდა სტანდარტული შეცდომის შესამცირებლად კოეფიციენტით. პოპულაციის პარამეტრების შეფასებისთვის სანდო ინტერვალების გაანგარიშებისას, კორექტირების ფაქტორი გამოიყენება იმ სიტუაციებში, როდესაც ნიმუშები შედგენილია ჩანაცვლების გარეშე. ამრიგად, ნდობის ინტერვალი მათემატიკური მოლოდინისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

მაგალითი 4სასრულ პოპულაციისთვის კორექტირების ფაქტორის გამოყენების საილუსტრაციოდ, დავუბრუნდეთ ზემოთ მაგალით 3-ში განხილული ინვოისების საშუალო ოდენობის ნდობის ინტერვალის გამოთვლის პრობლემას. დავუშვათ, რომ კომპანია გამოსცემს თვეში 5000 ინვოისს და =110.27 აშშ დოლარი, = 28,95 დოლარი = 5000, = 100, α = 0.05, t99 = 1.9842. ფორმულის მიხედვით (6) ვიღებთ:

მახასიათებლის წილის შეფასება.უკუგების არჩევისას, ნდობის ინტერვალი იმ მახასიათებლის პროპორციისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

ნდობის ინტერვალები და ეთიკური საკითხები

მოსახლეობის შერჩევისა და სტატისტიკური დასკვნების ფორმულირებისას ხშირად ჩნდება ეთიკური პრობლემები. მთავარი ისაა, თუ როგორ ეთანხმება სინჯის სტატისტიკის ნდობის ინტერვალები და წერტილოვანი შეფასებები. საგამომცემლო პუნქტების შეფასებები შესაბამისი ნდობის ინტერვალების (ჩვეულებრივ 95% სანდოობის დონეზე) და ნიმუშის ზომის მითითების გარეშე შეიძლება იყოს შეცდომაში შემყვანი. ამან შეიძლება მომხმარებლისთვის შექმნას შთაბეჭდილება, რომ ქულების შეფასება არის ზუსტად ის, რაც მას სჭირდება მთელი პოპულაციის თვისებების პროგნოზირებისთვის. ამრიგად, აუცილებელია გვესმოდეს, რომ ნებისმიერ კვლევაში წინა პლანზე უნდა იყოს არა წერტილის, არამედ ინტერვალური შეფასებები. გარდა ამისა, განსაკუთრებული ყურადღება უნდა მიექცეს ნიმუშის ზომის სწორ არჩევანს.

ყველაზე ხშირად სტატისტიკური მანიპულაციების ობიექტს წარმოადგენს სხვადასხვა პოლიტიკურ საკითხზე მოსახლეობის სოციოლოგიური გამოკითხვის შედეგები. ამასთან, გამოკითხვის შედეგები დევს გაზეთების პირველ გვერდებზე, ხოლო შერჩევის შეცდომა და სტატისტიკური ანალიზის მეთოდოლოგია სადღაც შუაში იბეჭდება. მიღებული ქულების შეფასებების მართებულობის დასადასტურებლად საჭიროა მიეთითოს ნიმუშის ზომა, რომლის საფუძველზეც იქნა მიღებული ისინი, ნდობის ინტერვალის საზღვრები და მისი მნიშვნელოვნების დონე.

შემდეგი შენიშვნა

გამოყენებულია მასალები წიგნიდან Levin et al., სტატისტიკა მენეჯერებისთვის. - M.: Williams, 2004. - გვ. 448–462 წწ

ცენტრალური ლიმიტის თეორემააცხადებს, რომ საკმარისად დიდი ნიმუშის მოცულობის გათვალისწინებით, საშუალებების ნიმუშის განაწილება შეიძლება მიახლოებული იყოს ნორმალური განაწილებით. ეს ქონება არ არის დამოკიდებული მოსახლეობის განაწილების ტიპზე.

დავუშვათ, გვაქვს დიდი რაოდენობით ნივთები ზოგიერთი მახასიათებლის ნორმალური განაწილებით (მაგალითად, იგივე ტიპის ბოსტნეულის სრული საწყობი, რომლის ზომა და წონა იცვლება). გსურთ იცოდეთ საქონლის მთელი პარტიის საშუალო მახასიათებლები, მაგრამ არც დრო გაქვთ და არც მიდრეკილება გაზომოთ და აწონოთ თითოეული ბოსტნეული. თქვენ გესმით, რომ ეს არ არის საჭირო. მაგრამ რამდენი ცალი დაგჭირდებათ შემთხვევითი შემოწმებისთვის? სანამ ამ სიტუაციისთვის სასარგებლო ფორმულებს მოვიყვანთ, გავიხსენებთ აღნიშვნას. პირველ რიგში, ჩვენ რომ გავზომოთ ბოსტნეულის მთელი საწყობი (ელემენტების ამ კომპლექტს ეწოდება საერთო პოპულაცია), მაშინ ჩვენთვის ხელმისაწვდომი მთელი სიზუსტით გვეცოდინება მთელი ჯგუფის წონის საშუალო მნიშვნელობა. მოდით ვუწოდოთ ამას საშუალო X საშუალო გენი. - საერთო საშუალო. ჩვენ უკვე ვიცით, რა არის სრულად განსაზღვრული, თუ ცნობილია მისი საშუალო მნიშვნელობა და გადახრა. მართალია, ჯერჯერობით ჩვენ არ ვიცით არც X საშუალო გენი და არც ზოგადი პოპულაციის s. ჩვენ შეგვიძლია მხოლოდ ავიღოთ ნიმუში, გავზომოთ ჩვენთვის საჭირო მნიშვნელობები და გამოვთვალოთ ამ ნიმუშისთვის როგორც საშუალო მნიშვნელობა X საშუალო, ასევე სტანდარტული გადახრა S vyb. ცნობილია, რომ თუ ჩვენი ნიმუშის შემოწმება შეიცავს ელემენტების დიდ რაოდენობას (ჩვეულებრივ n-ზე მეტი 30-ზე) და ისინი აღებულია მართლაც შემთხვევით, მაშინ პოპულაციის s თითქმის არ განსხვავდება S ნიმუშებისგან. გარდა ამისა, შემთხვევისთვის ნორმალური განაწილებით, შეგვიძლია გამოვიყენოთ შემდეგი ფორმულები:

95% ალბათობით

99% ალბათობით

.

ზოგადად, Р(t) ალბათობით

კავშირი t სიდიდესა და P(t) ალბათობის მნიშვნელობას შორის, რომლითაც ჩვენ გვინდა ვიცოდეთ ნდობის ინტერვალი, შეიძლება ავიღოთ შემდეგი ცხრილიდან:

P(t) 0,683 0,950 0,954 0,990 0,997
1,00 1,96 2,00 2,58 3,00

ამრიგად, ჩვენ დავადგინეთ, თუ რა დიაპაზონშია საშუალო მნიშვნელობა ზოგადი პოპულაციისთვის (მიცემული ალბათობით).

თუ ჩვენ არ გვაქვს საკმარისად დიდი ნიმუში, ვერ ვიტყვით, რომ პოპულაციას აქვს s = S ნიმუშები. გარდა ამისა, ამ შემთხვევაში პრობლემურია ნიმუშის სიახლოვე ნორმალურ განაწილებასთან. ამ შემთხვევაში, ასევე გამოიყენეთ S s-ის ნაცვლად ფორმულაში:

მაგრამ t-ის მნიშვნელობა ფიქსირებული ალბათობისთვის P(t) დამოკიდებული იქნება n ნიმუშში ელემენტების რაოდენობაზე. რაც უფრო დიდია n, მით უფრო ახლოს იქნება მიღებული ნდობის ინტერვალი (1) ფორმულით მოცემულ მნიშვნელობასთან. t მნიშვნელობები ამ შემთხვევაში აღებულია სხვა ცხრილიდან (სტუდენტის t-ტესტი), რომელსაც ქვემოთ გთავაზობთ:

სტუდენტის t-ტესტი მნიშვნელობები ალბათობისთვის 0.95 და 0.99 

0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

მაგალითი 3კომპანიის თანამშრომლებიდან შემთხვევითობის პრინციპით 30 ადამიანი შეირჩა. ნიმუშის მიხედვით, აღმოჩნდა, რომ საშუალო ხელფასი (თვეში) არის 10 ათასი რუბლი, საშუალო კვადრატული გადახრით 3 ათასი რუბლი. 0,99 ალბათობით განსაზღვრეთ საშუალო ხელფასი ფირმაში. გადაწყვეტილება:პირობით, გვაქვს n = 30, X შდრ. =10000, S=3000, P=0.99. ნდობის ინტერვალის საპოვნელად ვიყენებთ სტუდენტის კრიტერიუმის შესაბამის ფორმულას. ცხრილის მიხედვით n \u003d 30 და P \u003d 0.99 ჩვენ ვპოულობთ t \u003d 2.756, შესაბამისად,

იმათ. სასურველი ნდობის ინტერვალი 27484< Х ср.ген < 32516.

ასე რომ, 0,99 ალბათობით, შეიძლება ითქვას, რომ ინტერვალი (27484; 32516) შეიცავს საშუალო ხელფასს კომპანიაში.
ვიმედოვნებთ, რომ გამოიყენებთ ამ მეთოდს ყოველ ჯერზე ელცხრილის გარეშე. გამოთვლები შეიძლება განხორციელდეს ავტომატურად Excel-ში. Excel ფაილში ყოფნისას დააჭირეთ fx ღილაკს ზედა მენიუში. შემდეგ, ფუნქციებს შორის აირჩიეთ ტიპი "statistical", ხოლო შემოთავაზებული სიიდან ველში - STEUDRASP. შემდეგ, მოთხოვნაზე, კურსორის განთავსებით "ალბათობის" ველში, ჩაწერეთ ორმხრივი ალბათობის მნიშვნელობა (ანუ ჩვენს შემთხვევაში, 0,95 ალბათობის ნაცვლად, თქვენ უნდა აკრიფოთ ალბათობა 0,05). როგორც ჩანს, ელცხრილი ისეა შექმნილი, რომ შედეგი პასუხობს კითხვას, რამდენად სავარაუდოა, რომ ჩვენ შეიძლება ვცდებოდეთ. ანალოგიურად, ველში "თავისუფლების ხარისხი" შეიყვანეთ მნიშვნელობა (n-1) თქვენი ნიმუშისთვის.

გააზიარეთ