หน้าเว็บ

วันเสาร์ที่ 26 พฤศจิกายน พ.ศ. 2554

ประชากรและกลุ่มตัวอย่าง

ประชากรและกลุ่มตัวอย่าง
Population and Samples

ประชากร
ประชากร(Population) หมายถึง กลุ่มของสิ่งต่างๆทั้งหมดที่ผู้วิจัยสนใจ ซึ่งอาจเป็นกลุ่มของสิ่งของ คน หรือเหตุการณ์ต่างๆ

กลุ่มตัวอย่าง
กลุ่มตัวอย่างกลุ่ม(Sample)หมายถึง  เป็นส่วนหนึ่งของประชากรที่ผู้วิจัยสนใจ กลุ่มตัวอย่างที่ดีหมายถึงกลุ่มตัวอย่างที่มีลักษณะต่างๆที่สำคัญครบถ้วนเหมือนกับกลุ่มประชากร เป็นตัวแทนที่ดีของกลุ่มประชากรได้
       การใช้กลุ่มตัวอย่างมาศึกษาค่าสถิติ(statistics) ซึ่งเป็นลักษณะที่ได้จากการวิเคราะห์กับกลุ่มตัวอย่าง อาจจะมีความผิดพลาดได้เมื่อนำไปใช้ประมาณค่าพารามิเตอร์ (parameter)  หรือลักษณะของประชากร (characteristics of population)   บางครั้งค่าสถิติที่ได้อาจประมาณต่ำกว่าค่าพารามิเตอร์ (underestimation) หรือประมาณเกินกว่าความเป็นจริงของลักษณะประชากร (overestimation) ซึ่งถ้าทำการศึกษาโดยการเลือกกลุ่มตัวอย่างประชากรจากประชากรเดิม (parent population) ด้วยขนาดของกลุ่มตัวอย่างเท่าเดิมโดยวิธีการสุ่ม(random) และใช้หลักการสุ่มโดยอาศัยความน่าจะเป็น  (probability  sampling) ความแปรผันของการประมาณค่าพารามิเตอร์จากการแจกแจงค่าสถิติที่นำมาใช้ในการประมาณจะแปรผันตามขนาดของกลุ่มตัวอย่าง โดยการแจกแจงของค่าสถิตินี้จะมีลักษณะการแจกแจงเข้าสู่การแจกแจงปกติ (normal distribution)  ซึ่งเรียกว่าการแจกแจงเชิงสุ่ม (sampling distribution)  โดยค่าคาดหวังของค่าสถิติตจะมีค่าเท่ากับค่าพารามิเตอร์ ความแปรผันหรือความคลาดเคลื่อนในการประมาณค่า ให้เป็นความเคลื่อนแบบสุ่ม (random error) หรือเรียกว่าเป็นความคลาดเคลื่อนเนื่องจากการเลือกตัวอย่าง (sampling error) หรือเรียกว่าเป็นความคลาดเคลื่อนมาตรฐาน (standard error) (เชิดศักดิ์  โฆวาสินธ์. 2545 : 52)
       ในการวิจัย นักวิจัยไม่ได้ศึกษากับกลุ่มตัวอย่างหลายๆกลุ่มจากประชากรเดียวกันเพื่อหาการแจกแจงเชิงสุ่ม  แต่จะศึกษากับกลุ่มตัวอย่างเพียงกลุ่มเดียว เพื่อหาการการแจกแจงของกลุ่มตัวอย่าง และให้ใช้ ทฤษฎี central limit theorem เชื่อมโยงความสัมพันธ์ของการแจกแจงเชิงสุ่ม และการแจงแจงของประชากร  ประมาณค่าพารามิเตอร์และค่าความคลาดมาตรฐานโดยระบุความมั่นใจหรือความคลาดเคลื่อนในการประมาณค่า   ดังนั้นในการใช้กลุ่มตัวอย่างศึกษาแทนประชากรจำเป็นต้องคำนึงถึง ความถูกต้อง (accuracy) ในการเป็นตัวแทนที่ดีของประชากร ซึ่งหมายถึง การไม่มีอคติ(bias)ในตัวอย่างที่ถูกเลือก หรือกล่าวได้ว่าโอกาสของการเลือกตัวอย่างมาศึกษาเพื่อประมาณค่าพารามิเตอร์สูงหรือต่ำกว่าความเป็นจริงมีพอๆกัน นอกจากนี้ยังต้องคำนึงถึงความแม่นยำในการประมาณค่าพารามิเตอร์ (precision of estimate) ซึ่งความแม่นยำนี้สามารถวัดได้จากค่าความคลาดเลื่อนในการประมาณค่า โดยค่าความคลาดเลื่อนต่ำจะให้ความแม่นยำในการประมาณค่าสูง ซึ่งค่าความคลาดเคลื่อนนี้ขึ้นอยู่กับกระบวนการเลือกกลุ่มตัวอย่าง เป็นความคลาดเคลื่อนจากการเลือกหน่วยตัวอย่าง(sampling error) ที่คาดเคลื่อนไปจากค่าพารามิเตอร์
       การเลือกกลุ่มตัวอย่างเพื่อเป็นตัวแทนของประชากรนั้นมีอยู่สองหลักการใหญ่คือ

1) หลักการอาศัยความน่าจะเป็น (probability sampling) หรือการเลือกอย่างสุ่ม (random selection) ซึ่งเป็นหลักการที่สมาชิกของประชากรแต่ละหน่วยมีความน่าจะเป็นในการถูกเลือกเท่าๆกันและทราบความน่าจะเป็นนั้น 

2) ไม่ใช้หลักการความน่าจะเป็น (nonprobability sampling)  เป็นการเลือกกลุ่มตัวอย่างที่ความน่าจะเป็นในการถูกเลือกของแต่ละหน่วยตัวอย่างไม่เท่ากัน หรือบางหน่วยมีโอกาสที่จะไม่ถูกเลือก
       ดังนั้นในการจะเห็นได้ว่าในการที่จะได้ว่าถ้าเราเลือกกลุ่มตัวอย่างโดยอาศัยหลักความน่าจะเป็น จะทำให้การประมาณค่าพารามิเตอร์ได้แม่นยำกว่า

ขั้นตอนการเลือกกลุ่มตัวอย่าง
  • กำหนด/นิยามประชากรเป้าหมาย
  •    รวบรวมสมาชิกทั้งหมดของประชากร
  •    กำหนดหน่วยของการสุ่มตัวอย่าง
  •    วางแผนการเลือกกลุ่มตัวอย่าง
  •    ทำการเลือกกลุ่มตัวอย่าง
การกำหนดขนาดกลุ่มตัวอย่าง
1. กำหนดกลุ่มตัวอย่างโดยใช้เกณฑ์
  •    จำนวนประชากรหลักร้อยใช้กลุ่มตัวอย่าง 15 – 30%
  •    จำนวนประชากรหลักพันใช้กลุ่มตัวอย่าง 10 – 15%
  •    จำนวนประชากรหลักหมื่นใช้กลุ่มตัวอย่าง 5 – 10 %

2.ใช้สูตรคำนวณ
2.1 กรณีไม่ทราบค่าพารามิเตอร์ ไม่ทราบจำนวนประชากร ทราบเพียงแต่ว่ามีจำนวนมาก
2.2 กรณีที่ทราบจำนวนประชากรและมีจำนวนไม่มาก

3.กำหนดขนาดกลุ่มตัวอย่างโดยใช้ตารางของ Krejcie and Morgan

ตารางแสดงจำนวนประชากรและจำนวนกลุ่มตัวอย่าง ของ Krejcie and Morgan

จำนวนประชากร
จำนวนกลุ่มตัวอย่าง
จำนวนประชากร
จำนวนกลุ่มตัวอย่าง
จำนวนประชากร
จำนวนกลุ่มตัวอย่าง
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
110
120
130
140
150
160
170
180
190
200
210
10
14
19
24
28
32
36
40
44
48
52
56
59
63
66
70
73
76
80
86
92
97
103
108
113
118
123
127
132
136
220
230
240
250
260
270
280
290
300
320
340
360
380
400
420
440
460
480
500
550
600
650
700
750
800
850
900
950
1000
1100
140
144
148
152
155
159
162
165
169
175
181
186
191
196
201
205
210
214
217
226
234
242
248
254
260
265
269
274
278
285
1200
1300
1400
1500
1600
1700
1800
1900
2000
2200
2400
2600
2800
3000
3500
4000
4500
5000
6000
7000
8000
9000
10000
15000
20000
30000
40000
50000
75000
100000
291
297
302
306
310
313
317
320
322
327
331
335
338
341
346
351
354
357
361
364
367
368
370
375
377
379
380
381
382
384


เทคนิคการสุ่มกลุ่มตัวอย่าง
1.การสุ่มโดยไม่คำนึงถึงความน่าจะเป็น
      ในบางครั้งการเลือกกลุ่มตัวอย่างโดยอาศัยความน่าจะเป็น โดยวิธีการสุ่มอาจจะไม่สามารถทำได้หรือทำได้ยาก การเลือกกลุ่มตัวอย่างโดยไม่อาศัยความน่าจะเป็นจึงถูกนำมาใช้ซึ่งการเลือกกลุ่มตัวอย่างแบบนี้จะมีลักษณะเป็นอัตวิสัย (subjective)  ซึ่งมักจะทำให้การประมาณค่าพารามิเตอร์ขาดความแม่นยำ  ดังนั้นในการเลือกกลลุ่มตัวอย่างแบบนี้มักจะใช้เมื่อไม่ต้องการอ้างอิงถึงลักษณะประชากร ส่วนใหญ่จะใช้กับงานวิจัยสำรวจข้อเท้จจริง (Exploration research) กับกลุ่มที่มีลักษณะเฉพาะและไม่ต้องการเปรียบเทียบกับกลุ่มอื่นๆ นอกจากนี้ยังมีเหตุผลทางด้านค่าใช้จ่ายและเวลา เพราะการเลือกตัวอย่างโดยไม่อาศัยความน่าเป็นจะมีค่าใช้จ่ายและเวลาน้อยกว่าอาศัยความน่าจะเป็น
1.1 การสุ่มโดยบังเอิญ (Accidental sampling) เป็นการสุ่มจาก
สมาชิกของประชากรเป้าหมายที่เป็นใครก็ได้ที่สามารถให้ข้อมูลได้ครบถ้วน การสุ่มโดยวิธีนี้ไม่สามารถรับประกันความแม่นยำได้ ซึ่งการเลือกวิธีนี้เป็นวิธีที่ด้อยที่สุด เพราะเป็นการเลือกตัวอย่างที่มีลักษณะสอดคล้องกับนิยามของประชากรที่สามารถพบได้และใช้เป็นอย่างได้ทันที
1.2 การสุ่มแบบโควตา (Quota sampling) เป็นการสุมตัวอย่างโดยจำแนก
ประชากรออกเป็นส่วนๆก่อน (strata)โดยมีหลักจำแนกว่าตัวแปรที่ใช้ในการจำแนกนั้นควรจะมีความสัมพันธ์กับตัวแปรที่จะรวบรวม หรือตัวแปรที่สนใจ และสมาชิกที่อยู่แต่ละส่วนมีความเป็นเอกพันธ์  ในการสุ่มแบบโควตา นี้มีขั้นตอนการดำเนินการดังนี้
               1.2.1 พิจารณาตัวแปรที่สัมพันธ์กับลักษณะของประชากรที่คำถามการวิจัยต้องการที่จะศึกษา เช่น เพศ ระดับการศึกษา
               1.2.2 พิจารณาขนาดของแต่ละส่วน(segment)ของประชากรตามตามตัวแปร
               1.2.3 คำนวณค่าอัตราส่วนของแต่ละส่วนของประชากร กำหนดเป็นโควตาของตัวอย่างแต่ละกลุ่มที่จะเลือก
               1.2. เลือกตัวอย่างในแต่ละส่วนของประชากรให้ได้จำนวนตามโควตา
1.3 การสุ่มตัวอย่างเฉพาะเจาะจง (purposive sampling) หรือบางครั้ง
เรียกว่าการสุ่มแบบพิจารณา (judgment sampling) เป็นการสุ่มตัวอย่างโดยใช้ดุลพินิจของผู้วิจัยในการกำหนดสมาชิกของประชากรที่จะมาเป็นสมาชิกในกลุ่มตัวอย่าง ว่ามีลักษณะสอดคล้องหรือเป็นตัวแทนที่จะศึกษาหรือไม่  ข้อจำกัดของการสุ่มตัวอย่างแบบนี้คือไม่สามารถระบุได้ว่าตัวอย่างที่เลือก จะยังคงลักษณะดังกล่าวหรือไม่เมื่อเวลาเปลี่ยนไป
1.4 การสุมกลุ่มตัวอย่างตามสะดวก (convenience sampling) การเลือกกลุ่มตัวอย่างโดยถือเอาความสะดวกหรือความง่ายต่อการรวบรวมข้อมูล  ข้อจำกัดของการสุ่มแบบนี้จะมีลักษณะเหมือนกับการสุ่มโดยบังเอิญ
           1.5 การสุมตัวอย่างแบบสโนว์บอลล์  (snowball sampling) เป็นการเลือกตัวอย่างในลักษณะการสร้างเครือข่ายข้อมูล เรียกว่า snowball sampling โดยเลือกจากหน่วยตัวอย่างกลุ่มแรก (จะใช้หรือไม่ใช้ความน่าจะเป็นก็ได้) และตัวอย่างกลุ่มนี้เสนอบุคคลอื่นที่มีลักษณะใกล้เคียงต่อๆไป

ข้อจำกัดของการสุ่มโดยไม่อาศัยความน่าจะเป็น
1.      ผลการวิจัยไม่สามารถอ้างอิงไปสู่ประชากรทั้งหมดได้ จะสรุปอยู่ในขอบเขตของกลุ่มตัวอย่างเท่านั้น ข้อสรุปนั้นจะสรุปไปหาประชากรได้ต่อเมื่อกลุ่มตัวอย่างมีลักษณะต่างๆที่สำคัญๆเหมือนกับประชากร
2.     กลุ่มตัวอย่างที่ได้นั้นขึ้นอยู่กับการตัดสินใจของผู้วิจัยและองค์ประกอบบางตัวที่ไม่สามารถควบคุมได้ และไม่มีวิธีการทางสถิติอย่างไรที่จะมาคำนวณความคลาดเคลื่อนที่เกิดจากการสุ่ม (sampling error)

2. การสุ่มโดยการคำนึงถึงความน่าจะเป็น(probability sampling)
2.1 การสุ่มอย่างง่าย (Simple random sampling)
       สมาชิกทั้งหมดของประชากรเป็นอิสระซึ่งกันและกัน  แล้วสุ่มหน่วยของการสุ่ม (Sampling unit) จนกว่าจะได้จำนวนตามที่ต้องการ  โดยแต่ครั้งที่สุ่ม สมาชิกแต่ละหน่วยของประชากรมีโอกาสถูกเลือกเท่าเทียมกัน  ซึ่งก่อนที่จะทำการสุ่มนั้น จะต้องนิยามประชากรให้ชัดเจน ทำรายการสมาชิกทั้งหมดของประชากร สุ่มตัวอย่างโดยใช้วิธีที่ทำให้โอกาสในการของสมาชิกแต่ละหน่วยในการถูกเลือกมีค่าเท่ากัน ซึ่งสามารถทำได้ 2 วิธี คือ
                 2.1.1 การจับฉลาก
                 2.1.2 การใช้ตารางเลขสุ่ม  (table of random number) ซึ่งตัวเลขในตารางได้มาจากการอาศัยคอมพิวเตอร์กำหนดค่า หรือบางครั้งสามารถใช้วิธีการดึงตัวอย่างโดยอาศัยโปรแกรมสำเร็จรูป
       ในการสุ่มอย่างง่าย มีข้อจำกัดคือ ประชากรต้องนับได้ครบถ้วน (finite population) ซึ่งบางครั้งอาจสร้างปัญหาให้กับนักวิจัย

2.2 การสุ่มแบบเป็นระบบ (systematic sampling)
ใช้ในกรณีที่ประชากรมีการจัดเรียงอย่างไม่ลำเอียง
   1) ประชากรหารด้วยจำนวนกลุ่มตัวอย่าง (K = N/n)
   2) สุ่มหมายเลข 1 ถึง K  (กำหนดสุ่มได้หมายเลข  r )
   3) r จะเป็นหมายเลขเริ่มต้น ลำดับต่อไป r + K, r +2K, r + 3K, …..
การสุ่มแบบเป็นระบบ โอกาสถูกเลือกของตัวอย่างไม่เป็นอิสระจากกัน เพราะเมื่อตัวอย่างแรกถูกสุ่มแล้ว  ตัวอย่างหน่วยอื่นก็จะถูกกำหนดให้เลือกตามมาโดยอัตโนมัติ โดยไม่มีการสุ่ม
3. การสุ่มแบบแบ่งชั้น (stratified random sampling)
เป็นการสุ่มกลุ่มตัวอย่างที่แบ่งกลุ่มประชากรออกเป็นกลุ่มย่อย (subgroup or
strata) เสียก่อนบน พื้นฐานของตัวแปรที่สำคัญที่ส่งผลกระทบต่อตัวแปรตาม โดยมีหลักในการจัดแบ่งกลุ่มแต่ละกลุ่มมีความเป็นเอกพันธ์ (Homogeneous) หรือกล่าวได้ว่า ในกลุ่มเดียวกันจะมีลักษณะคล้ายคลึงกันตามกลุ่มย่อยของตัวแปร  แต่จะมีความแตกต่างระหว่างกลุ่ม  จำนวนสมาชิกในกลุ่มย่อยจะถูกกำหนดให้เป็นสัดส่วน (proportion) ตามสัดส่วนที่ปรากฏในประชากร ซึ่งเรียกว่า การสุ่มแบบแบ่งชัดโดยใช้สัดสัด (proportion stratified sampling)  การสุ่มแบบแบ่งชั้นจะมีความเหมาะสมกับงานวิจัยที่สนใจความแตกต่างของลักษณะประชากรในระหว่างกลุ่มย่อย


4.การสุ่มตัวอย่างแบบกลุ่ม (cluster sampling)
ในกรณีที่ประชากรมีขนาดใหญ่ การสุ่มกลุ่มตัวอย่างโดยจัดกระทำกับรายการสมาชิกทุกๆหน่วยของประชากรอาจทำได้ยากหรือทำไม่ได้เลย ดังนั้นแทนที่จะใช้วิธีการสุมจากทุกหน่วย นักวิจัยสามารถสุ่มจากกลุ่มที่ถูกจัดแบ่งไว้อยู่แล้ว ซึ่งวิธีการแบบนี้เรียกว่าการสุ่มแบบกลุ่ม (cluster sampling)  สิ่งที่ควรคำนึงถึงการสุ่มแบบกลุ่ม มีดังนี้ (เชิดศักด์  โฆวาสินธ์.2545 : 62)
4.1   ความแตกต่างของลักษณะที่จะศึกษาระหว่างกลุ่ม (cluster) มีไม่มาก หรือเรียกว่ามีความเป็นเอกพันธ์ (homogeneous)
4.2  ขนาดของแต่ละกลุ่ม เท่ากันหรือแตกต่างกันไม่มากนัก เพราะเมื่อเลือกกลุ่มมาเป็นตัวอย่างแล้ว  การประมาณค่าพารามิเตอร์ จะมีลักษณะไม่อคติ (unbias estimation)  มากกว่า กรณีที่กลุ่มตัวอย่างในแต่กลุ่มมีขนาดแตกต่างกันมาก
4.3  ขนาดของกลุ่ม (cluster) ไม่มีคำตอบแน่นอนวาจำนวนหน่วยตัวอย่างที่ศึกษาในแต่ละกลุ่ม จะเป็นเท่าใด ขึ้นอยู่กับคำถามการวิจัยและความยากง่ายในการเก็บข้อมูล
4.4  การใช้วิธีการสุมแบบ multistage cluster sampling แท่นการใช้ single – stage มีเหตุผลดังนี้
å  ขนาดของแต่ละกลุ่ม ที่มีอยู่มีขนาดใหญ่เกินไปเกินกว่าขนาดตามกำหลังทางเศรษฐกิจ
å  สามารถหลีกเลี่ยงค่าใช้จ่ายที่เกิดขึ้นจากการแบ่งกลุ่ม ให้มีขนาดเล็กลงในแต่ละกลุ่ม
å  ผลของการแบ่งกลุ่ม (clustering) แม้จะมีขนาดเล็กลงแต่ในระหว่างกลุ่มที่จะศึกษายังมีความแตกต่างกันไม่มากนัก
å  การเลือกตัวอย่างของ compact cluster ให้ความยุ่งยากในกาเก็บรวบรมข้อมูล
4.5 ขนาดขอกลุ่มตัวอย่างหรือจำนวนกลุ่ม (cluster) ที่ต้องการในการเทียบเคียงจากการเลือกแบบการสุ่มอย่างง่าน (simple random sampling) ในการคำนวณขนาดกลุ่มตัวอย่าง โดยใช้จำนวนทั้งหมดของกลุ่ม ที่จัดแบ่งเป็นประชาการที่นำมาใช้ในการคำนวณ

5. การสุ่มแบบหลายขั้นตอน (multi-stage sampling)
   เป็นกระบวนการสุ่มกลุ่มตัวอย่างจากประชากรซึ่งดำเนินการสุ่มตั้งแต่ 3 ขั้นขึ้นไป


ไม่มีความคิดเห็น:

แสดงความคิดเห็น