ใช้วิธีการแบบคงที่เพื่อการวิจัย วิธีการทางสถิติ อัตราการเติบโตของห่วงโซ่

วิธีการทางสถิติ - วิธีการวิเคราะห์ข้อมูลทางสถิติ มีวิธีสถิติประยุกต์ที่สามารถนำไปใช้ในทุกด้านของการวิจัยทางวิทยาศาสตร์และภาคส่วนใดๆ ของเศรษฐกิจของประเทศ และวิธีการทางสถิติอื่นๆ ซึ่งการบังคับใช้นั้นจำกัดอยู่เพียงด้านใดด้านหนึ่งเท่านั้น นี่หมายถึงวิธีการต่างๆ เช่น การควบคุมการยอมรับทางสถิติ การควบคุมกระบวนการทางเทคโนโลยีทางสถิติ ความน่าเชื่อถือและการทดสอบ และการวางแผนการทดลอง

วิธีการวิเคราะห์ข้อมูลทางสถิติถูกนำมาใช้ในกิจกรรมของมนุษย์เกือบทุกด้าน ใช้เมื่อใดก็ตามที่จำเป็นเพื่อให้ได้มาและพิสูจน์เหตุผลของการตัดสินเกี่ยวกับกลุ่ม (วัตถุหรือหัวข้อ) ที่มีความแตกต่างภายในบางอย่าง ขอแนะนำให้แยกแยะกิจกรรมทางวิทยาศาสตร์และประยุกต์สามประเภทในสาขาวิธีการวิเคราะห์ข้อมูลทางสถิติ (ตามระดับความจำเพาะของวิธีการที่เกี่ยวข้องกับการแช่ในปัญหาเฉพาะ):

ก) การพัฒนาและการวิจัยวิธีการทั่วไป โดยไม่คำนึงถึงลักษณะเฉพาะของสาขาที่ประยุกต์ใช้

b) การพัฒนาและการวิจัยแบบจำลองทางสถิติของปรากฏการณ์และกระบวนการจริงตามความต้องการของกิจกรรมเฉพาะด้าน

ค) การประยุกต์วิธีการและแบบจำลองทางสถิติสำหรับการวิเคราะห์ทางสถิติของข้อมูลเฉพาะ

การวิเคราะห์ความแปรปรวนการวิเคราะห์ความแปรปรวน (จากภาษาละติน Dispersio - การกระจายตัว / ในภาษาอังกฤษ การวิเคราะห์ความแปรปรวน - ANOVA) ใช้เพื่อศึกษาอิทธิพลของตัวแปร (ปัจจัย) เชิงคุณภาพตั้งแต่หนึ่งตัวขึ้นไปต่อตัวแปรเชิงปริมาณขึ้นอยู่กับตัวแปรตัวเดียว (การตอบสนอง) พื้นฐานของการวิเคราะห์ความแปรปรวนคือ สมมติฐานที่ว่าตัวแปรบางตัวถือได้ว่าเป็นสาเหตุ (ปัจจัย ตัวแปรอิสระ) และปัจจัยอื่นๆ ที่เป็นผลลัพธ์ (ตัวแปรตาม) บางครั้งเรียกว่าตัวแปรอิสระ ปัจจัยควบคุมแม่นยำเพราะในการทดลองผู้วิจัยมีโอกาสที่จะเปลี่ยนแปลงและวิเคราะห์ผลลัพธ์ที่ได้

เป้าหมายหลักการวิเคราะห์ความแปรปรวน (ANOVA) คือการศึกษาความสำคัญของความแตกต่างระหว่างค่าเฉลี่ยโดยการเปรียบเทียบ (การวิเคราะห์) ของความแปรปรวน การแบ่งความแปรปรวนรวมออกเป็นหลายแหล่งทำให้สามารถเปรียบเทียบความแปรปรวนเนื่องจากความแตกต่างระหว่างกลุ่มกับความแปรปรวนเนื่องจากความแปรปรวนภายในกลุ่มได้ ถ้าสมมติฐานว่าง (ค่าเฉลี่ยเท่ากันในกลุ่มการสังเกตหลายกลุ่มที่เลือกจากประชากร) เป็นจริง การประมาณค่าความแปรปรวนที่เกี่ยวข้องกับความแปรปรวนภายในกลุ่มควรใกล้เคียงกับค่าประมาณความแปรปรวนระหว่างกลุ่ม หากคุณเพียงแค่เปรียบเทียบค่าเฉลี่ยในสองตัวอย่าง ANOVA จะให้ผลลัพธ์เดียวกันกับการทดสอบตัวอย่างอิสระ t ทั่วไป (หากเปรียบเทียบกลุ่มวัตถุหรือการสังเกตที่เป็นอิสระสองกลุ่ม) หรือตัวอย่างที่ขึ้นอยู่กับการทดสอบ t (หากเปรียบเทียบตัวแปรสองตัวที่เหมือนกัน ชุดของวัตถุหรือการสังเกต)


สาระสำคัญของการวิเคราะห์ความแปรปรวนประกอบด้วยการแบ่งความแปรปรวนรวมของลักษณะที่ศึกษาออกเป็นองค์ประกอบแต่ละส่วนที่กำหนดโดยอิทธิพลของปัจจัยเฉพาะ และการทดสอบสมมติฐานเกี่ยวกับความสำคัญของอิทธิพลของปัจจัยเหล่านี้ต่อลักษณะที่ศึกษา ด้วยการเปรียบเทียบองค์ประกอบความแปรปรวนซึ่งกันและกันโดยใช้การทดสอบ F ของฟิชเชอร์ จึงสามารถระบุสัดส่วนของความแปรปรวนรวมของคุณลักษณะผลลัพธ์ที่เกิดจากการกระทำของปัจจัยควบคุมได้

แหล่งที่มาของวัสดุสำหรับการวิเคราะห์ความแปรปรวน จะใช้ข้อมูลจากการศึกษาตัวอย่างสามตัวอย่างขึ้นไป ซึ่งอาจมีจำนวนเท่ากันหรือไม่เท่ากันก็ได้ ทั้งที่เชื่อมโยงและไม่ต่อเนื่องกัน ขึ้นอยู่กับจำนวนปัจจัยควบคุมที่ระบุ การวิเคราะห์ความแปรปรวนอาจเป็นปัจจัยเดียว (เมื่อศึกษาอิทธิพลของปัจจัยหนึ่งต่อผลการทดลอง) ปัจจัยสอง (เมื่อศึกษาอิทธิพลของปัจจัยสองปัจจัย) และปัจจัยหลาย (อนุญาตให้มีหนึ่งปัจจัย เพื่อประเมินไม่เพียงแต่อิทธิพลของแต่ละปัจจัยแยกกัน แต่ยังรวมถึงปฏิสัมพันธ์ของปัจจัยเหล่านั้นด้วย)

การวิเคราะห์ความแปรปรวนหมายถึงกับกลุ่มของวิธีการแบบพาราเมตริก ดังนั้นควรใช้เฉพาะเมื่อการแจกแจงได้รับการพิสูจน์แล้วว่าเป็นเรื่องปกติเท่านั้น

ใช้การวิเคราะห์ความแปรปรวนถ้าตัวแปรตามถูกวัดโดยใช้อัตราส่วน ช่วงเวลา หรือลำดับ และตัวแปรที่มีอิทธิพลมีลักษณะที่ไม่ใช่ตัวเลข (ขนาดของชื่อ)

ตัวอย่างงานในปัญหาที่แก้ไขได้โดยการวิเคราะห์ความแปรปรวน จะมีการตอบสนองในลักษณะตัวเลข ซึ่งได้รับอิทธิพลจากตัวแปรหลายตัวที่มีลักษณะระบุ เช่น การปันส่วนปศุสัตว์หลายประเภท หรือวิธีเก็บรักษา 2 วิธี เป็นต้น

ตัวอย่างที่ 1: ในระหว่างสัปดาห์ มีแผงร้านขายยาหลายแห่งเปิดในสถานที่ต่างกันสามแห่ง ในอนาคตเราจะเหลือเพียงคนเดียวเท่านั้น มีความจำเป็นต้องพิจารณาว่าปริมาณการขายยาที่แผงขายยามีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่ ถ้าใช่ เราจะเลือกตู้ที่มียอดขายเฉลี่ยต่อวันสูงสุด หากความแตกต่างของปริมาณการขายไม่มีนัยสำคัญทางสถิติ ตัวบ่งชี้อื่น ๆ ควรเป็นพื้นฐานในการเลือกคีออสก์

ตัวอย่างที่ 2: การเปรียบเทียบความแตกต่างระหว่างกลุ่ม ความเกี่ยวข้องทางการเมืองทั้งเจ็ดนั้นเรียงลำดับจากเสรีนิยมอย่างยิ่งไปจนถึงอนุรักษ์นิยมอย่างยิ่ง และใช้ความแตกต่างเชิงเส้นเพื่อทดสอบว่ามีแนวโน้มที่ไม่เป็นศูนย์สำหรับค่าเฉลี่ยของกลุ่มในการเพิ่มหรือไม่ นั่นคือ จะมีการเพิ่มขึ้นเชิงเส้นอย่างมีนัยสำคัญหรือไม่ในอายุเฉลี่ยเมื่อพิจารณากลุ่มที่ได้รับคำสั่ง ไปในทิศทางจากเสรีนิยมไปสู่อนุรักษ์นิยม

ตัวอย่างที่ 3: การวิเคราะห์ความแปรปรวนแบบสองปัจจัย จำนวนยอดขายของผลิตภัณฑ์นอกเหนือจากขนาดของร้านค้ามักได้รับอิทธิพลจากตำแหน่งของชั้นวางพร้อมกับผลิตภัณฑ์ด้วย ตัวอย่างนี้มีตัวเลขยอดขายรายสัปดาห์สำหรับเค้าโครงชั้นวางสี่ชั้นและขนาดร้านค้าสามขนาด ผลการวิเคราะห์แสดงให้เห็นว่าปัจจัยทั้งสอง ได้แก่ ตำแหน่งของชั้นวางสินค้าและขนาดของร้านค้า ส่งผลต่อจำนวนยอดขาย แต่ปฏิสัมพันธ์ของปัจจัยทั้งสองไม่มีนัยสำคัญ

ตัวอย่างที่ 4: Univariate ANOVA: การออกแบบบล็อกแบบเต็มแบบสุ่มพร้อมการรักษาสองวิธี มีการศึกษาผลของการผสมที่เป็นไปได้ทั้งหมดของไขมัน 3 ชนิดและหัวเชื้อแป้ง 3 ชนิดที่มีต่อการอบขนมปัง ตัวอย่างแป้งสี่ตัวอย่างที่นำมาจากแหล่งที่แตกต่างกันสี่แหล่งทำหน้าที่เป็นปัจจัยบล็อก จำเป็นต้องระบุความสำคัญของปฏิสัมพันธ์ของผู้ปลูกไขมัน หลังจากนี้ ให้ระบุความเป็นไปได้ต่างๆ ในการเลือกความแตกต่าง ซึ่งจะช่วยให้คุณทราบว่าชุดค่าผสมของระดับปัจจัยใดที่แตกต่างกัน

ตัวอย่างที่ 5: โมเดลการออกแบบเอฟเฟกต์ผสมแบบลำดับชั้น (คลัสเตอร์) ได้มีการศึกษาผลของหัวที่เลือกแบบสุ่มสี่หัวที่ติดตั้งบนเครื่องจักรที่มีต่อการเสียรูปของตัวจับยึดแคโทดแก้วที่ผลิตขึ้น (หัวถูกติดตั้งอยู่ในเครื่อง ดังนั้นหัวเดียวกันจึงไม่สามารถใช้กับเครื่องอื่นได้) เอฟเฟกต์ศีรษะถือเป็นปัจจัยสุ่ม สถิติ ANOVA ระบุว่าไม่มีความแตกต่างที่มีนัยสำคัญระหว่างเครื่อง แต่มีข้อบ่งชี้ว่าส่วนหัวอาจแตกต่างกัน ความแตกต่างระหว่างเครื่องทั้งหมดไม่สำคัญ แต่สำหรับสองเครื่องความแตกต่างระหว่างประเภทหัวนั้นมีความสำคัญ

ตัวอย่างที่ 6: วิเคราะห์การวัดซ้ำโดยใช้ตัวแปรเดียวโดยใช้การออกแบบการแบ่งส่วน การทดลองนี้จัดทำขึ้นเพื่อพิจารณาผลกระทบของการให้คะแนนความวิตกกังวลส่วนบุคคลต่อประสิทธิภาพการสอบในช่วงสี่ครั้งติดต่อกัน ข้อมูลได้รับการจัดระเบียบเพื่อให้สามารถดูเป็นกลุ่มย่อยของชุดข้อมูลทั้งหมด (“โครงเรื่องทั้งหมด”) ผลของความวิตกกังวลไม่มีนัยสำคัญ แต่ผลของความพยายามมีนัยสำคัญ

การวิเคราะห์ความแปรปรวนร่วมการวิเคราะห์ความแปรปรวนร่วมเป็นชุดวิธีการทางสถิติทางคณิตศาสตร์ที่เกี่ยวข้องกับการวิเคราะห์แบบจำลองการพึ่งพาค่าเฉลี่ยของตัวแปรสุ่มบางตัวพร้อมกันบนชุดของปัจจัยเชิงคุณภาพ (หลัก) และปัจจัยเชิงปริมาณ (ที่เกี่ยวข้อง) ปัจจัย F ระบุการรวมกันของเงื่อนไขที่ได้รับจากการสังเกต X, Y และอธิบายโดยใช้ตัวแปรตัวบ่งชี้ และในตัวแปรที่มาคู่กันและตัวแปรตัวบ่งชี้นั้น อาจเป็นได้ทั้งแบบสุ่มและแบบไม่สุ่ม (ควบคุมในการทดลอง)

หากตัวแปรสุ่ม Y เป็นเวกเตอร์ เราจะพูดถึงการวิเคราะห์ความแปรปรวนร่วมหลายตัวแปร

มักใช้การวิเคราะห์ความแปรปรวนร่วมก่อนการวิเคราะห์ความแปรปรวน เพื่อตรวจสอบความเป็นเนื้อเดียวกัน (ความเป็นเนื้อเดียวกัน ความเป็นตัวแทน) ของกลุ่มตัวอย่างการสังเกต X, Y สำหรับปัจจัยที่เกี่ยวข้องทั้งหมด

การวิเคราะห์ข้อมูลและสถิติเป็นสิ่งเดียวกัน หากสถิติเป็นหลักการพื้นฐานและแหล่งข้อมูล การวิเคราะห์ข้อมูลก็เป็นเครื่องมือสำหรับการวิจัย และบ่อยครั้งที่การวิเคราะห์ข้อมูลโดยไม่มีสถิติจะเป็นไปไม่ได้

รับวิดีโอการฝึกอบรม

สถิติคือการศึกษาปรากฏการณ์ใดๆ ในรูปแบบตัวเลข สถิติถูกใช้โดยการวิเคราะห์ข้อมูลในการวิจัยเชิงปริมาณ สิ่งที่ตรงกันข้ามคือเชิงคุณภาพโดยอธิบายสถานการณ์โดยไม่ใช้ตัวเลขในรูปแบบข้อความ

การวิเคราะห์เชิงปริมาณของข้อมูลทางสถิติดำเนินการในระดับช่วงเวลาและในระดับเหตุผล:

  • สเกลช่วงเวลาบ่งชี้ว่าตัวบ่งชี้ตัวใดตัวหนึ่งมีค่ามากกว่าหรือน้อยกว่าตัวอื่นมากเพียงใด และทำให้สามารถเลือกตัวบ่งชี้ที่มีคุณสมบัติอัตราส่วนคล้ายกันได้
  • ระดับเหตุผลแสดงจำนวนครั้งที่ตัวบ่งชี้ตัวใดตัวหนึ่งมีค่ามากกว่าหรือน้อยกว่าตัวอื่น แต่มีเพียงค่าบวกเท่านั้นซึ่งจะไม่สะท้อนถึงสถานะที่แท้จริงของกิจการเสมอไป

Data Mining ใช้งานที่ Mail.ru อย่างไร

รับวิดีโอการฝึกอบรม

วิธีการวิเคราะห์ข้อมูลทางสถิติ

ในการวิเคราะห์ข้อมูลทางสถิติ เราสามารถแยกแยะขั้นตอนการวิเคราะห์และเชิงพรรณนาได้ ขั้นตอนการอธิบายเป็นขั้นตอนสุดท้ายซึ่งรวมถึงการนำเสนอข้อมูลที่รวบรวมในรูปแบบกราฟิกที่สะดวก - ในกราฟแผนภูมิแดชบอร์ด ขั้นตอนการวิเคราะห์เป็นการวิเคราะห์ซึ่งประกอบด้วยการใช้วิธีใดวิธีหนึ่งต่อไปนี้:

  • การสังเกตทางสถิติ - การรวบรวมข้อมูลอย่างเป็นระบบเกี่ยวกับคุณลักษณะที่น่าสนใจ
  • สรุปข้อมูลซึ่งสามารถประมวลผลข้อมูลได้หลังจากการสังเกต อธิบายข้อเท็จจริงส่วนบุคคลเป็นส่วนหนึ่งของจำนวนทั้งสิ้นหรือสร้างกลุ่ม แบ่งข้อมูลออกเป็นกลุ่มตามลักษณะใด ๆ
  • การกำหนดค่าทางสถิติสัมบูรณ์และสัมพัทธ์ ค่าสัมบูรณ์จะให้คุณลักษณะเชิงปริมาณของข้อมูลเป็นรายบุคคล โดยไม่คำนึงถึงข้อมูลอื่น ปริมาณสัมพัทธ์อธิบายวัตถุหรือคุณลักษณะบางอย่างที่สัมพันธ์กับวัตถุอื่น
  • วิธีการสุ่มตัวอย่าง - ใช้ข้อมูลทั้งหมดในการวิเคราะห์ แต่เพียงบางส่วนที่เลือกตามกฎบางอย่าง (การสุ่มตัวอย่างสามารถสุ่ม แบ่งชั้น คลัสเตอร์ และโควต้า)
  • การวิเคราะห์สหสัมพันธ์และการถดถอย - ระบุความสัมพันธ์ระหว่างข้อมูลและสาเหตุที่ข้อมูลต้องพึ่งพาซึ่งกันและกัน กำหนดจุดแข็งของการพึ่งพานี้
  • วิธีอนุกรมเวลา - ติดตามความแรง ความเข้ม และความถี่ของการเปลี่ยนแปลงในวัตถุและปรากฏการณ์ ช่วยให้คุณสามารถประเมินข้อมูลในช่วงเวลาหนึ่งและทำให้สามารถทำนายปรากฏการณ์ได้

ซอฟต์แวร์การวิจัยทางสถิติ

การวิจัยทางสถิติสามารถดำเนินการโดยนักวิเคราะห์การตลาด:

สำหรับการวิเคราะห์เชิงคุณภาพของข้อมูลทางสถิติ คุณต้องมีความรู้เกี่ยวกับสถิติทางคณิตศาสตร์ หรือใช้โปรแกรมการรายงานและการวิเคราะห์ หรือไม่ทำเช่นนี้ บริษัทในยุโรปตระหนักดีถึงประโยชน์ของการวิเคราะห์ดังกล่าวมานานแล้ว ดังนั้นพวกเขาจึงจ้างนักวิเคราะห์ที่ดีซึ่งมีการศึกษาด้านคณิตศาสตร์หรือติดตั้งซอฟต์แวร์ระดับมืออาชีพสำหรับนักวิเคราะห์การตลาด การวิเคราะห์รายวันในบริษัทเหล่านี้ช่วยให้พวกเขาจัดระเบียบการซื้อสินค้า การจัดเก็บ และลอจิสติกส์ได้อย่างถูกต้อง ปรับจำนวนบุคลากรและตารางการทำงานได้

โซลูชันสำหรับการวิเคราะห์ข้อมูลอัตโนมัติช่วยให้นักวิเคราะห์การตลาดทำงานร่วมกับพวกเขาได้ ปัจจุบันมีโซลูชั่นที่สามารถใช้ได้แม้แต่กับบริษัทขนาดเล็ก เช่น Tableau ข้อได้เปรียบเมื่อเปรียบเทียบกับการวิเคราะห์ที่ดำเนินการโดยมนุษย์แต่เพียงผู้เดียว:

  • ค่าใช้จ่ายในการดำเนินการต่ำ (จาก 2,000 รูเบิลต่อเดือน - ณ เดือนกุมภาพันธ์ 2561)
  • การแสดงกราฟิกที่ทันสมัยของการวิเคราะห์
  • ความสามารถในการย้ายจากรายงานฉบับหนึ่งที่สมบูรณ์ยิ่งขึ้นไปยังอีกฉบับหนึ่งที่มีรายละเอียดมากขึ้นในทันที

ต้องการเรียนรู้วิธีการวิเคราะห์และรายงานอย่างรวดเร็วหรือไม่?

รับวิดีโอการฝึกอบรม

พื้นฐานของการวิเคราะห์ข้อมูลทางสถิติ

สถิติ"ชีวสถิติ".

1. ชื่อ;
2. ลำดับ;
3. ช่วงเวลา;

ตัวอย่าง

ตัวแทน

เฟรมที่เลือก การสุ่มตัวอย่างอย่างง่าย การสุ่มตัวอย่างตามช่วงเวลา

ตัวอย่างแบบแบ่งชั้น

กลุ่มและ การสุ่มตัวอย่างโควต้า

สมมติฐานว่าง

สมมติฐานทางเลือก พลัง

ความน่าจะเป็นของความมั่นใจ"


หัวข้อ: พื้นฐานของการวิเคราะห์ข้อมูลทางสถิติ
คำอธิบายโดยละเอียด:

หลังจากเสร็จสิ้นการวิจัยทางวิทยาศาสตร์ ทั้งขั้นพื้นฐานหรือเชิงทดลองแล้ว จะมีการดำเนินการวิเคราะห์ทางสถิติของข้อมูลที่ได้รับ เพื่อให้การวิเคราะห์ทางสถิติสามารถดำเนินการได้สำเร็จและเพื่อแก้ไขปัญหาที่ได้รับมอบหมาย ต้องมีการวางแผนการศึกษาอย่างเหมาะสม ด้วยเหตุนี้ หากไม่เข้าใจพื้นฐานของสถิติ จึงเป็นไปไม่ได้ที่จะวางแผนและประมวลผลผลลัพธ์ของการทดลองทางวิทยาศาสตร์ อย่างไรก็ตาม การศึกษาด้านการแพทย์ไม่เพียงแต่ให้ความรู้ด้านสถิติเท่านั้น แต่ยังให้ความรู้พื้นฐานของคณิตศาสตร์ขั้นสูงอีกด้วย ดังนั้น บ่อยครั้งที่มีคนเห็นความเห็นว่ามีเพียงนักสถิติเท่านั้นที่ควรจัดการกับปัญหาการประมวลผลทางสถิติในการวิจัยทางชีวการแพทย์ และนักวิจัยแพทย์ควรมุ่งเน้นไปที่ประเด็นทางการแพทย์ของงานทางวิทยาศาสตร์ของเขา การแบ่งงานด้านแรงงานที่เกี่ยวข้องกับความช่วยเหลือในการวิเคราะห์ข้อมูลนี้เป็นสิ่งที่สมเหตุสมผลอย่างยิ่ง อย่างไรก็ตามจำเป็นต้องมีความเข้าใจในหลักการของสถิติอย่างน้อยที่สุดเพื่อหลีกเลี่ยงการกำหนดปัญหาที่ไม่ถูกต้องต่อหน้าผู้เชี่ยวชาญการสื่อสารกับใครก่อนเริ่มการศึกษามีความสำคัญพอ ๆ กับในขั้นตอนการประมวลผลข้อมูล

ก่อนจะพูดถึงพื้นฐานการวิเคราะห์ทางสถิติจำเป็นต้องชี้แจงความหมายของคำว่า “ สถิติ". มีคำจำกัดความมากมาย แต่คำจำกัดความที่สมบูรณ์และกระชับที่สุดในความเห็นของเราคือคำจำกัดความของสถิติว่าเป็น "ศาสตร์แห่งการรวบรวม การนำเสนอ และการวิเคราะห์ข้อมูล" ในทางกลับกัน การใช้สถิติมาประยุกต์ใช้กับโลกที่มีชีวิตเรียกว่า “ไบโอเมตริกซ์” หรือ “ ชีวสถิติ".

ควรสังเกตว่าบ่อยครั้งที่สถิติลดลงเฉพาะกับการประมวลผลข้อมูลการทดลองเท่านั้นโดยไม่สนใจขั้นตอนของการได้มา อย่างไรก็ตาม ความรู้ทางสถิติเป็นสิ่งจำเป็นอยู่แล้วในระหว่างการวางแผนการทดลอง เพื่อให้ตัวบ่งชี้ที่ได้รับในระหว่างนั้นสามารถให้ข้อมูลที่เชื่อถือได้แก่ผู้วิจัย ดังนั้นเราจึงสามารถพูดได้ว่าการวิเคราะห์ทางสถิติของผลการทดลองเริ่มต้นก่อนที่จะเริ่มการศึกษาด้วยซ้ำ

อยู่ในขั้นตอนของการพัฒนาแผน ผู้วิจัยจะต้องเข้าใจอย่างชัดเจนว่าตัวแปรประเภทใดที่จะอยู่ในงานของเขา ตัวแปรทั้งหมดสามารถแบ่งออกเป็นสองประเภท: เชิงคุณภาพและเชิงปริมาณ ช่วงที่ตัวแปรสามารถใช้ได้ขึ้นอยู่กับขนาดของการวัด สามารถแยกแยะได้สี่ระดับหลัก:

1. ชื่อ;
2. ลำดับ;
3. ช่วงเวลา;
4. เหตุผล (ขนาดของความสัมพันธ์)

ระดับที่ระบุ (ขนาดของ "ชื่อ") มีเพียงการกำหนดทั่วไปสำหรับการอธิบายประเภทของวัตถุบางประเภท เช่น "เพศ" หรือ "อาชีพของผู้ป่วย" สเกลที่ระบุบอกเป็นนัยว่าตัวแปรจะใช้กับค่าที่ไม่สามารถกำหนดความสัมพันธ์เชิงปริมาณได้ ดังนั้นจึงเป็นไปไม่ได้ที่จะสร้างความสัมพันธ์ทางคณิตศาสตร์ระหว่างชายและหญิง การกำหนดตัวเลขทั่วไป (ผู้หญิง - 0, ผู้ชาย - 1 หรือในทางกลับกัน) ถูกกำหนดไว้โดยพลการและมีไว้สำหรับการประมวลผลด้วยคอมพิวเตอร์เท่านั้น สเกลที่ระบุนั้นมีคุณภาพในรูปแบบที่บริสุทธิ์ แต่ละหมวดหมู่ในระดับนี้จะแสดงตามความถี่ (จำนวนหรือสัดส่วนของการสังเกต เปอร์เซ็นต์)

มาตราส่วนลำดับ (ลำดับ) ระบุว่าแต่ละหมวดหมู่สามารถจัดเรียงจากน้อยไปหามากหรือจากมากไปหาน้อยได้ ในสถิติทางการแพทย์ ตัวอย่างคลาสสิกของระดับลำดับคือการไล่ระดับความรุนแรงของโรค ในกรณีนี้ เราสามารถจัดความรุนแรงตามลำดับจากน้อยไปหามากได้ แต่เรายังไม่มีโอกาสที่จะระบุความสัมพันธ์เชิงปริมาณ กล่าวคือ ไม่ทราบระยะห่างระหว่างค่าที่วัดในระดับลำดับหรือไม่สำคัญ ง่ายต่อการสร้างลำดับของค่าของตัวแปร "ความรุนแรง" แต่ไม่สามารถระบุได้ว่าสภาวะที่รุนแรงแตกต่างจากสภาวะปานกลางกี่ครั้ง

ระดับลำดับหมายถึงข้อมูลประเภทกึ่งปริมาณ และการไล่ระดับสามารถอธิบายได้ทั้งตามความถี่ (เช่นเดียวกับในระดับคุณภาพ) และโดยการวัดค่าส่วนกลาง ซึ่งเราจะกล่าวถึงด้านล่างนี้

สเกลช่วงเวลาและเหตุผลเป็นข้อมูลประเภทเชิงปริมาณล้วนๆ ในระดับช่วงเวลา เราสามารถระบุได้ว่าค่าหนึ่งของตัวแปรแตกต่างจากค่าอื่นมากเพียงใด ดังนั้น อุณหภูมิร่างกายที่เพิ่มขึ้น 1 องศาเซลเซียส ย่อมหมายถึงการเพิ่มขึ้นของความร้อนที่เกิดจากจำนวนหน่วยคงที่เสมอ อย่างไรก็ตาม สเกลช่วงเวลามีทั้งค่าบวกและค่าลบ (ไม่มีศูนย์สัมบูรณ์) ในเรื่องนี้ เป็นไปไม่ได้ที่จะบอกว่าอุณหภูมิ 20 องศาเซลเซียสอบอุ่นเป็นสองเท่าของอุณหภูมิ 10 องศา เราบอกได้เพียงว่าอุณหภูมิ 20 องศาอุ่นกว่า 10 เท่ากับ 30 องศาอุ่นกว่า 20 องศา

ระดับเหตุผล (ระดับความสัมพันธ์) มีจุดอ้างอิงจุดเดียวและค่าบวกเท่านั้น ในทางการแพทย์ ระดับเหตุผลส่วนใหญ่เป็นความเข้มข้น ตัวอย่างเช่น ระดับกลูโคส 10 มิลลิโมล/ลิตร จะเป็น 2 เท่าของความเข้มข้นเมื่อเทียบกับ 5 มิลลิโมล/ลิตร สำหรับอุณหภูมิ สเกลตรรกยะคือสเกลเคลวิน ซึ่งมีศูนย์สัมบูรณ์ (ไม่มีความร้อน)

ควรเสริมด้วยว่าตัวแปรเชิงปริมาณใดๆ ก็ตามสามารถมีความต่อเนื่องได้ เช่น ในกรณีของการวัดอุณหภูมิร่างกาย (นี่คือมาตราส่วนช่วงต่อเนื่อง) หรือแยกกัน ถ้าเรานับจำนวนเซลล์เม็ดเลือดหรือลูกหลานของสัตว์ทดลอง (นี่คือ ระดับเหตุผลแบบไม่ต่อเนื่อง)

ความแตกต่างเหล่านี้มีความสำคัญต่อการเลือกวิธีวิเคราะห์ผลการทดลองทางสถิติ ดังนั้น สำหรับข้อมูลที่ระบุ เราใช้การทดสอบไคสแควร์ และการทดสอบของนักเรียนที่รู้จักกันดีกำหนดให้ตัวแปร (ช่วงหรือจำนวนตรรกยะ) มีความต่อเนื่อง

หลังจากตัดสินใจคำถามเกี่ยวกับประเภทของตัวแปรแล้ว คุณควรเริ่มสร้าง ตัวอย่าง. ตัวอย่างคือกลุ่มเล็ก ๆ ของวัตถุบางประเภท (ในทางการแพทย์ - ประชากร) เพื่อให้ได้ข้อมูลที่แม่นยำอย่างยิ่ง จำเป็นต้องศึกษาวัตถุทั้งหมดของชั้นเรียนที่กำหนด อย่างไรก็ตาม ด้วยเหตุผลเชิงปฏิบัติ (มักเป็นทางการเงิน) มีการศึกษาเพียงส่วนหนึ่งของประชากรเท่านั้นซึ่งเรียกว่าตัวอย่าง ต่อจากนั้นการวิเคราะห์ทางสถิติช่วยให้ผู้วิจัยสามารถขยายรูปแบบที่ได้รับไปยังประชากรทั้งหมดได้อย่างแม่นยำในระดับหนึ่ง ที่จริงแล้ว สถิติทางชีวการแพทย์ทั้งหมดมีเป้าหมายเพื่อให้ได้ผลลัพธ์ที่แม่นยำที่สุดจากการสังเกตด้วยจำนวนน้อยที่สุด เนื่องจากการพิจารณาทางจริยธรรมก็มีความสำคัญเช่นกันเมื่อทำการวิจัยในมนุษย์ เราไม่สามารถทำให้ผู้ป่วยตกอยู่ในความเสี่ยงเกินความจำเป็นได้

การสร้างตัวอย่างได้รับการควบคุมโดยข้อกำหนดบังคับจำนวนหนึ่ง การละเมิดซึ่งอาจนำไปสู่ข้อสรุปที่ผิดพลาดจากผลการวิจัย ประการแรก ขนาดตัวอย่างมีความสำคัญ ความแม่นยำของการประมาณค่าพารามิเตอร์ที่ศึกษาขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง ที่นี่คุณควรใส่ใจกับคำว่า "ความแม่นยำ" ยิ่งกลุ่มที่ศึกษามีขนาดใหญ่เท่าใด ผลลัพธ์ที่นักวิทยาศาสตร์ได้รับก็จะมีความแม่นยำมากขึ้น (แต่ไม่จำเป็นต้องถูกต้องเสมอไป) เพื่อให้ผลการศึกษาตัวอย่างสามารถถ่ายโอนไปยังประชากรทั้งหมดโดยรวมได้ ตัวอย่างจะต้องเป็น ตัวแทน. ความเป็นตัวแทนของกลุ่มตัวอย่างถือว่าสะท้อนถึงคุณสมบัติที่สำคัญทั้งหมดของประชากร กล่าวอีกนัยหนึ่ง ในกลุ่มที่ศึกษา บุคคลที่มีเพศ อายุ อาชีพ สถานะทางสังคม ฯลฯ ต่างกันจะพบว่ามีความถี่เดียวกันกับประชากรทั้งหมด

อย่างไรก็ตาม ก่อนที่คุณจะเริ่มเลือกกลุ่มการศึกษา คุณควรพิจารณาความจำเป็นในการศึกษาประชากรเฉพาะกลุ่ม ตัวอย่างของประชากรอาจเป็นผู้ป่วยทุกรายที่มี nosology หรือคนในวัยทำงาน เป็นต้น ดังนั้น ผลลัพธ์ที่ได้รับสำหรับประชากรคนหนุ่มสาวในวัยทหารจึงไม่น่าจะสามารถคาดการณ์ได้กับสตรีวัยหมดประจำเดือน ชุดคุณลักษณะที่ประชากรที่ทำการศึกษาจะเป็นตัวกำหนด "ความสามารถทั่วไป" ของข้อมูลการศึกษา

ตัวอย่างสามารถเกิดขึ้นได้หลายวิธี วิธีที่ง่ายที่สุดคือการเลือกจำนวนวัตถุที่ต้องการจากประชากรหรือโดยใช้ตัวสร้างตัวเลขสุ่ม เฟรมที่เลือก(กรอบตัวอย่าง) วิธีการนี้เรียกว่า " การสุ่มตัวอย่างอย่างง่าย" หากคุณสุ่มเลือกจุดเริ่มต้นในกรอบการสุ่มตัวอย่าง แล้วหยิบวัตถุทุกวินาที ห้า หรือสิบ (ขึ้นอยู่กับขนาดกลุ่มที่ต้องการในการศึกษา) คุณจะได้รับ การสุ่มตัวอย่างตามช่วงเวลา. การสุ่มตัวอย่างแบบช่วงเวลาไม่ใช่การสุ่ม เนื่องจากความเป็นไปได้ที่ข้อมูลซ้ำเป็นระยะภายในกรอบการสุ่มตัวอย่างจะไม่ถูกแยกออก

สามารถสร้างสิ่งที่เรียกว่า “ ตัวอย่างแบบแบ่งชั้น” ซึ่งถือว่าประชากรประกอบด้วยหลายกลุ่มและโครงสร้างนี้ควรได้รับการทำซ้ำในกลุ่มทดลอง ตัวอย่างเช่น หากอัตราส่วนของผู้ชายต่อผู้หญิงในประชากรคือ 30:70 ดังนั้นในกลุ่มตัวอย่างแบบแบ่งชั้น อัตราส่วนควรจะเท่ากัน ด้วยแนวทางนี้ สิ่งสำคัญคือต้องไม่ทำให้ตัวอย่างสมดุลมากเกินไป กล่าวคือ เพื่อหลีกเลี่ยงความสม่ำเสมอของคุณลักษณะ มิฉะนั้น ผู้วิจัยอาจพลาดโอกาสที่จะพบความแตกต่างหรือความสัมพันธ์ในข้อมูล

นอกจากวิธีการสร้างกลุ่มที่อธิบายไว้แล้วยังมีอีกด้วย กลุ่มและ การสุ่มตัวอย่างโควต้า. อันแรกใช้ในกรณีที่การได้รับข้อมูลที่ครบถ้วนเกี่ยวกับกรอบตัวอย่างเป็นเรื่องยากเนื่องจากขนาดของมัน จากนั้นกลุ่มตัวอย่างจะถูกสร้างขึ้นจากหลายกลุ่มที่รวมอยู่ในประชากร โควต้าที่สองนั้นคล้ายกับการสุ่มตัวอย่างแบบแบ่งชั้น แต่การกระจายของวัตถุไม่สอดคล้องกับการกระจายตัวของประชากร

เมื่อกลับไปที่ขนาดตัวอย่างควรกล่าวว่ามีความสัมพันธ์อย่างใกล้ชิดกับความน่าจะเป็นของข้อผิดพลาดทางสถิติของประเภทที่หนึ่งและสอง ข้อผิดพลาดทางสถิติอาจเกิดจากการที่การศึกษาไม่ได้ศึกษาประชากรทั้งหมด แต่เป็นเพียงส่วนหนึ่งเท่านั้น ข้อผิดพลาดประเภทแรกคือการเบี่ยงเบนที่ผิดพลาด สมมติฐานว่าง. ในทางกลับกัน สมมติฐานว่างคือการสันนิษฐานว่ากลุ่มที่ศึกษาทั้งหมดนำมาจากประชากรทั่วไปกลุ่มเดียวกัน ซึ่งหมายความว่าความแตกต่างหรือความสัมพันธ์ระหว่างกลุ่มเหล่านั้นจะเป็นแบบสุ่ม หากเราทำการเปรียบเทียบกับการทดสอบวินิจฉัย ข้อผิดพลาดประเภทที่ 1 จะเป็นผลลัพธ์ที่เป็นบวกลวง

ข้อผิดพลาดประเภทที่สองเป็นการเบี่ยงเบนที่ไม่ถูกต้อง สมมติฐานทางเลือกความหมายก็คือความแตกต่างหรือความเชื่อมโยงระหว่างกลุ่มไม่ได้เกิดจากการบังเอิญ แต่เกิดจากอิทธิพลของปัจจัยที่กำลังศึกษา และอีกครั้ง การเปรียบเทียบกับการวินิจฉัย: ข้อผิดพลาดประเภท II เป็นผลลบที่ผิดพลาด ที่เกี่ยวข้องกับข้อผิดพลาดนี้คือแนวคิด พลังซึ่งบอกเราว่าวิธีการทางสถิติบางอย่างมีประสิทธิผลเพียงใดภายใต้เงื่อนไขและความไวที่กำหนด กำลังคำนวณโดยใช้สูตร: 1-β โดยที่ β คือความน่าจะเป็นของข้อผิดพลาดประเภท II ตัวบ่งชี้นี้ขึ้นอยู่กับขนาดตัวอย่างเป็นหลัก ยิ่งขนาดกลุ่มมีขนาดใหญ่เท่าใด ความน่าจะเป็นของข้อผิดพลาดประเภท II ก็จะยิ่งน้อยลง และพลังของการทดสอบทางสถิติก็จะยิ่งสูงขึ้นเท่านั้น การพึ่งพาอาศัยกันนี้เป็นกำลังสองเป็นอย่างน้อย กล่าวคือ การลดขนาดตัวอย่างลงครึ่งหนึ่งจะทำให้กำลังลดลงอย่างน้อยสี่เท่า กำลังขั้นต่ำที่ยอมรับได้ถือเป็น 80% และระดับข้อผิดพลาดประเภท I ที่ยอมรับได้สูงสุดคือ 5% อย่างไรก็ตาม ควรจำไว้เสมอว่าขอบเขตเหล่านี้ถูกกำหนดโดยพลการและอาจเปลี่ยนแปลงได้ขึ้นอยู่กับลักษณะและเป้าหมายของการศึกษา ตามกฎแล้ว ชุมชนวิทยาศาสตร์ยอมรับการเปลี่ยนแปลงอำนาจโดยพลการ แต่ในกรณีส่วนใหญ่ ระดับข้อผิดพลาดประเภทที่ 1 จะต้องไม่เกิน 5%

ที่กล่าวมาทั้งหมดเกี่ยวข้องโดยตรงกับขั้นตอนการวางแผนการศึกษา อย่างไรก็ตาม นักวิจัยหลายคนเข้าใจผิดว่าการประมวลผลข้อมูลทางสถิติเป็นเพียงการจัดการบางอย่างที่ดำเนินการหลังจากเสร็จสิ้นส่วนหลักของงานแล้ว บ่อยครั้งหลังจากเสร็จสิ้นการทดลองโดยไม่ได้วางแผนไว้ ความปรารถนาอันไม่อาจต้านทานดูเหมือนจะสั่งการวิเคราะห์ข้อมูลทางสถิติจากด้านข้าง แต่จาก "กองขยะ" แม้แต่นักสถิติก็ยังพบว่าเป็นการยากที่จะดึงผลลัพธ์ที่ผู้วิจัยคาดหวังออกมา ดังนั้นหากคุณมีความรู้ด้านชีวสถิติไม่เพียงพอควรขอความช่วยเหลือในการวิเคราะห์ทางสถิติก่อนเริ่มการทดลอง

เมื่อพิจารณาถึงขั้นตอนการวิเคราะห์ เราควรชี้ให้เห็นเทคนิคทางสถิติหลักสองประเภท: เชิงพรรณนาและเชิงสาธิต (เชิงวิเคราะห์) เทคนิคเชิงพรรณนาประกอบด้วยวิธีการที่ช่วยให้คุณนำเสนอข้อมูลในรูปแบบที่กะทัดรัดและเข้าใจง่าย ซึ่งรวมถึงตาราง กราฟ ความถี่ (สัมบูรณ์และสัมพัทธ์) การวัดแนวโน้มจากศูนย์กลาง (ค่าเฉลี่ย ค่ามัธยฐาน โหมด) และการวัดการกระจายตัวของข้อมูล (ความแปรปรวน ค่าเบี่ยงเบนมาตรฐาน ช่วงระหว่างควอไทล์ ฯลฯ) กล่าวอีกนัยหนึ่ง วิธีการอธิบายจะแสดงลักษณะของตัวอย่างที่กำลังศึกษา

วิธีที่ได้รับความนิยมมากที่สุด (แต่มักจะผิดพลาด) ในการอธิบายข้อมูลเชิงปริมาณที่มีอยู่คือการกำหนดตัวบ่งชี้ต่อไปนี้:

  • จำนวนการสังเกตในกลุ่มตัวอย่างหรือขนาดของมัน
  • ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต);
  • ค่าเบี่ยงเบนมาตรฐานคือการวัดว่าค่าของตัวแปรแปรผันไปมากเพียงใด

สิ่งสำคัญคือต้องจำไว้ว่าค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานเป็นการวัดแนวโน้มจากศูนย์กลางและการกระจายตัวในกลุ่มตัวอย่างจำนวนค่อนข้างน้อย ในตัวอย่างนี้ค่าของวัตถุส่วนใหญ่เบี่ยงเบนไปจากค่าเฉลี่ยโดยมีความน่าจะเป็นเท่ากันและการแจกแจงของพวกมันจะสร้าง "ระฆัง" แบบสมมาตร (เส้นโค้งแบบเกาส์เซียนหรือเกาส์ - ลาปลาซ) การกระจายนี้เรียกอีกอย่างว่า "ปกติ" แต่ในทางปฏิบัติของการทดลองทางการแพทย์นั้นเกิดขึ้นเพียง 30% ของกรณีเท่านั้น หากมีการกระจายค่าของตัวแปรแบบไม่สมมาตรสัมพันธ์กับศูนย์กลางจะเป็นการดีกว่าที่จะอธิบายกลุ่มโดยใช้ค่ามัธยฐานและควอนไทล์ (เปอร์เซ็นไทล์, ควอไทล์, เดซิล)

เมื่ออธิบายกลุ่มต่างๆ เสร็จสิ้นแล้ว จำเป็นต้องตอบคำถามเกี่ยวกับความสัมพันธ์ของพวกเขาและความเป็นไปได้ในการสรุปผลการศึกษากับประชากรทั้งหมด เพื่อจุดประสงค์นี้ จึงใช้วิธีการทางชีวสถิติตามหลักฐานเชิงประจักษ์ สิ่งเหล่านี้คือสิ่งที่นักวิจัยจดจำเป็นอันดับแรกเมื่อพูดถึงการประมวลผลข้อมูลทางสถิติ ขั้นตอนการทำงานนี้มักเรียกว่า "การทดสอบสมมติฐานทางสถิติ"

งานทดสอบสมมติฐานสามารถแบ่งออกเป็นสองกลุ่มใหญ่ กลุ่มแรกตอบคำถามว่ามีความแตกต่างระหว่างกลุ่มในระดับของตัวบ่งชี้บางตัวหรือไม่ เช่น ความแตกต่างในระดับของทรานซามิเนสในตับในผู้ป่วยโรคตับอักเสบและคนที่มีสุขภาพแข็งแรง กลุ่มที่สองช่วยให้คุณสามารถพิสูจน์ความสัมพันธ์ระหว่างตัวบ่งชี้ตั้งแต่สองตัวขึ้นไป เช่น การทำงานของตับและระบบภูมิคุ้มกัน

ในทางปฏิบัติ งานจากกลุ่มแรกสามารถแบ่งออกเป็นสองประเภทย่อย:

  • การเปรียบเทียบตัวบ่งชี้ในสองกลุ่มเท่านั้น (มีสุขภาพดีและป่วยชายและหญิง)
  • การเปรียบเทียบสามกลุ่มขึ้นไป (ศึกษาขนาดยาที่แตกต่างกัน)

ต้องคำนึงว่าวิธีการทางสถิติแตกต่างกันอย่างมีนัยสำคัญสำหรับข้อมูลเชิงคุณภาพและเชิงปริมาณ

ในสถานการณ์ที่ตัวแปรที่กำลังศึกษาเป็นตัวแปรเชิงคุณภาพและมีการเปรียบเทียบเพียงสองกลุ่มเท่านั้น ก็สามารถใช้การทดสอบไคสแควร์ได้ นี่เป็นเกณฑ์ที่ค่อนข้างทรงพลังและเป็นที่รู้จักอย่างกว้างขวาง อย่างไรก็ตาม จะไม่มีประสิทธิภาพเพียงพอหากจำนวนการสังเกตมีน้อย มีหลายวิธีในการแก้ปัญหานี้ เช่น การแก้ไขความต่อเนื่องของเยตส์ และวิธีการที่แน่นอนของฟิชเชอร์

หากตัวแปรที่กำลังศึกษาเป็นเชิงปริมาณ ก็สามารถใช้การทดสอบทางสถิติประเภทใดประเภทหนึ่งจากสองประเภทได้ เกณฑ์ของประเภทแรกจะขึ้นอยู่กับประเภทการกระจายตัวของประชากรที่เฉพาะเจาะจง และดำเนินการกับพารามิเตอร์ของประชากรกลุ่มนี้ การทดสอบดังกล่าวเรียกว่า "พาราเมตริก" และโดยปกติจะขึ้นอยู่กับสมมติฐานของการแจกแจงค่าแบบปกติ การทดสอบแบบไม่อิงพารามิเตอร์ไม่ได้ขึ้นอยู่กับสมมติฐานเกี่ยวกับประเภทการกระจายตัวของประชากร และไม่ได้ใช้พารามิเตอร์ บางครั้งเกณฑ์ดังกล่าวเรียกว่า "การทดสอบแบบไม่มีการกระจาย" สิ่งนี้มีข้อผิดพลาดในระดับหนึ่ง เนื่องจากเกณฑ์ที่ไม่ใช่พารามิเตอร์ใดๆ ถือว่าการแจกแจงในกลุ่มที่เปรียบเทียบทั้งหมดจะเหมือนกัน มิฉะนั้นอาจได้ผลลัพธ์ที่เป็นบวกลวง

มีการทดสอบพาราเมตริกสองแบบที่ใช้กับข้อมูลที่ดึงมาจากประชากรที่แจกแจงตามปกติ ได้แก่ การทดสอบ t-test ของนักเรียนเพื่อเปรียบเทียบสองกลุ่ม และการทดสอบ F ของ Fisher เพื่อทดสอบความเท่าเทียมกันของความแปรปรวน (หรือที่เรียกว่า การวิเคราะห์ความแปรปรวน) มีเกณฑ์ที่ไม่ใช่พารามิเตอร์มากกว่านั้นมาก การทดสอบที่แตกต่างกันจะแตกต่างกันไปตามสมมติฐานที่ใช้เป็นหลัก ในความซับซ้อนของการคำนวณ ในกำลังทางสถิติ ฯลฯ อย่างไรก็ตาม การทดสอบที่ยอมรับได้มากที่สุดในกรณีส่วนใหญ่คือการทดสอบวิลคอกซัน (สำหรับกลุ่มที่เกี่ยวข้อง) และการทดสอบแมนน์-วิทนีย์ หรือที่เรียกว่าการทดสอบ Wilcoxon สำหรับตัวอย่างอิสระ การทดสอบเหล่านี้สะดวกเนื่องจากไม่จำเป็นต้องมีสมมติฐานเกี่ยวกับลักษณะของการกระจายข้อมูล แต่หากปรากฏว่าตัวอย่างนั้นนำมาจากประชากรที่แจกแจงตามปกติ พลังทางสถิติของพวกมันก็จะไม่แตกต่างอย่างมีนัยสำคัญจากการทดสอบของนักเรียน

คำอธิบายที่สมบูรณ์ของวิธีการทางสถิติสามารถพบได้ในเอกสารเฉพาะทาง อย่างไรก็ตาม ประเด็นสำคัญคือการทดสอบทางสถิติแต่ละครั้งจำเป็นต้องมีชุดของกฎ (สมมติฐาน) และเงื่อนไขในการใช้งาน และการค้นหาเชิงกลของวิธีการต่างๆ มากมายเพื่อค้นหา "ความถูกต้อง" ” ผลลัพธ์เป็นสิ่งที่ยอมรับไม่ได้อย่างแน่นอนจากมุมมองทางวิทยาศาสตร์ ในแง่นี้ การทดสอบทางสถิติมีความคล้ายคลึงกับยา โดยแต่ละวิธีมีข้อบ่งชี้และข้อห้าม ผลข้างเคียง และความเป็นไปได้ที่จะไม่ได้ผล และอันตรายพอๆ กันคือการใช้การทดสอบทางสถิติที่ไม่สามารถควบคุมได้ เนื่องจากสมมติฐานและข้อสรุปขึ้นอยู่กับสิ่งเหล่านั้น

เพื่อให้เข้าใจประเด็นความแม่นยำของการวิเคราะห์ทางสถิติได้ครบถ้วนยิ่งขึ้น จึงจำเป็นต้องกำหนดและวิเคราะห์แนวคิด” ความน่าจะเป็นของความมั่นใจ"ความน่าจะเป็นของความเชื่อมั่นคือค่าที่ใช้เป็นขอบเขตระหว่างเหตุการณ์ที่น่าจะเป็นและเหตุการณ์ที่ไม่น่าเป็นไปได้ ตามเนื้อผ้าจะแสดงด้วยตัวอักษร "p" สำหรับนักวิจัยหลายคน จุดประสงค์เดียวของการวิเคราะห์ทางสถิติคือการคำนวณค่า p ที่เป็นที่ต้องการ ซึ่งดูเหมือนว่าจะใส่ลูกน้ำในวลีที่มีชื่อเสียงว่า "execute never be pardoned" ระดับความเชื่อมั่นสูงสุดที่ยอมรับได้คือ 0.05 ควรจำไว้ว่าความน่าจะเป็นของความเชื่อมั่นไม่ใช่ความน่าจะเป็นของเหตุการณ์บางอย่าง แต่เป็นเรื่องของความไว้วางใจ ด้วยการตั้งค่าความน่าจะเป็นของความเชื่อมั่นก่อนเริ่มการวิเคราะห์ ดังนั้นเราจึงกำหนดระดับความเชื่อมั่นในผลการวิจัยของเรา และอย่างที่คุณทราบ ความใจง่ายมากเกินไปและความสงสัยที่มากเกินไปส่งผลเสียต่อผลงานใดๆ เท่าๆ กัน

ระดับความเชื่อมั่นแสดงให้เห็นว่าความน่าจะเป็นสูงสุดของข้อผิดพลาดประเภท 1 เกิดขึ้นซึ่งผู้วิจัยถือว่ายอมรับได้ กล่าวอีกนัยหนึ่งคือการลดระดับความเชื่อมั่น การกระชับเงื่อนไขในการทดสอบสมมติฐาน จะเพิ่มโอกาสที่จะเกิดข้อผิดพลาดประเภทที่สอง ดังนั้นควรเลือกระดับความน่าจะเป็นของความเชื่อมั่นโดยคำนึงถึงความเสียหายที่อาจเกิดขึ้นจากการเกิดข้อผิดพลาดประเภทที่หนึ่งและที่สอง ตัวอย่างเช่น กรอบการทำงานที่เข้มงวดที่ใช้ในสถิติชีวการแพทย์ ซึ่งกำหนดสัดส่วนของผลลัพธ์ผลบวกลวงไม่เกิน 5% นั้นมีความจำเป็นอย่างยิ่ง เนื่องจากจากผลการวิจัยทางการแพทย์ มีการแนะนำหรือปฏิเสธการรักษาใหม่ และนี่คือ เป็นเรื่องของชีวิตคนหลายพันคน

โปรดทราบว่าค่า p นั้นไม่ได้ให้ข้อมูลมากนักสำหรับแพทย์ เนื่องจากเป็นเพียงตัวบ่งชี้ความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างอย่างผิดพลาดเท่านั้น ตัวบ่งชี้นี้ไม่ได้พูดอะไรเกี่ยวกับขนาดของผลการรักษาเมื่อใช้ยาภายใต้การศึกษาในประชากรทั่วไป จึงมีความเห็นว่า แทนที่จะใช้ระดับความน่าจะเป็นของความเชื่อมั่น ควรประเมินผลการศึกษาตามขนาดของช่วงความเชื่อมั่นจะดีกว่า ช่วงความเชื่อมั่นคือช่วงของค่าที่ค่าประชากรที่แท้จริง (สำหรับค่าเฉลี่ย ค่ามัธยฐาน หรือความถี่) อยู่ภายใน ด้วยความน่าจะเป็นที่แน่นอน ในทางปฏิบัติ จะสะดวกกว่าที่จะมีทั้งสองค่านี้ ซึ่งช่วยให้คุณสามารถตัดสินด้วยความมั่นใจมากขึ้นถึงการประยุกต์ใช้ผลลัพธ์ที่ได้รับกับประชากรโดยรวม

โดยสรุป ควรพูดอะไรสักสองสามคำเกี่ยวกับเครื่องมือที่นักสถิติหรือนักวิจัยใช้ซึ่งทำการวิเคราะห์ข้อมูลอย่างอิสระ การคำนวณด้วยตนเองหายไปนานแล้ว โปรแกรมคอมพิวเตอร์ทางสถิติในปัจจุบันทำให้สามารถวิเคราะห์ทางสถิติได้โดยไม่ต้องฝึกฝนทางคณิตศาสตร์อย่างจริงจัง ระบบที่มีประสิทธิภาพเช่น SPSS, SAS, R ฯลฯ ช่วยให้นักวิจัยใช้วิธีการทางสถิติที่ซับซ้อนและมีประสิทธิภาพ อย่างไรก็ตาม นี่ไม่ใช่เรื่องดีเสมอไป ผู้วิจัยสามารถทำการคำนวณและได้ตัวเลขผลลัพธ์บางส่วนโดยไม่ทราบระดับของการบังคับใช้ของการทดสอบทางสถิติ แต่ผลลัพธ์ที่ได้จะเป็นที่น่าสงสัยมาก ดังนั้นข้อกำหนดเบื้องต้นสำหรับการดำเนินการประมวลผลทางสถิติของผลการทดลองจะต้องเป็นความรู้ที่ดีเกี่ยวกับพื้นฐานทางคณิตศาสตร์ของสถิติ


วิธีการวิเคราะห์ข้อมูลทางสถิติมักจะแบ่งออกเป็นสองกลุ่มใหญ่: วิธีการวิเคราะห์ทางสถิติแบบตัวแปรเดียว และวิธีการแบบหลายตัวแปร

วิธีการวิเคราะห์แบบมิติเดียว- วิธีเหล่านี้เป็นวิธีการที่ใช้ในกรณีที่มีหน่วยวัดเดียวในการประเมินแต่ละองค์ประกอบของตัวอย่าง หรือหากมีหน่วยวัดเหล่านี้หลายหน่วย แต่ละตัวแปรจะถูกวิเคราะห์แยกกันจากตัวแปรอื่นๆ ทั้งหมด จุดเน้นของวิธีการเหล่านี้คือการวิเคราะห์ค่าเฉลี่ยและตัวบ่งชี้การเปลี่ยนแปลงของตัวแปร

การจำแนกประเภทของวิธีการแบบมิติเดียวนั้นดำเนินการตามลักษณะของข้อมูลต้นฉบับ (หน่วยเมตริกหรือไม่ใช่หน่วยเมตริก) ตลอดจนตามจำนวนและประเภทของตัวอย่าง ดังนั้น จึงแบ่งกลุ่มตัวอย่างออกเป็น ขึ้นอยู่กับ (คู่)- นี่คือตัวอย่างที่เกิดขึ้นจากประชากรทั่วไปกลุ่มหนึ่งและ เป็นอิสระตัวอย่างคือตัวอย่างที่ดึงมาจากประชากรที่แตกต่างกัน ในทางปฏิบัติ ตัวอย่างที่ดึงมาจากชั้นที่แตกต่างกัน (ในกรณีที่ใช้การสุ่มตัวอย่างแบบแบ่งชั้นหรือโควต้า) เช่น ชายและหญิง หรือกลุ่มผู้ตอบแบบสอบถามที่มีระดับรายได้ต่างกัน ถือว่าเป็นอิสระ

วิธีการวิเคราะห์ข้อมูลแบบมิติเดียว ได้แก่ :

· วิธีทดสอบสมมติฐาน (z-test, t-test, F-test, χ2-test ฯลฯ)

สำหรับการทดสอบสมมติฐานอย่างละเอียด โปรดดูที่ Gmurman V. E. ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์

· วิธีการวิเคราะห์อนุกรมการแจกแจงทางสถิติ

· การวิเคราะห์ความแปรปรวนทางเดียว

· วิธีการอื่นๆ

วิธีการวิเคราะห์หลายตัวแปร- วิธีการเหล่านี้เป็นวิธีการที่ใช้ในกรณีที่มีการใช้การวัดตั้งแต่สองการวัดขึ้นไปเพื่อประมาณค่าองค์ประกอบตัวอย่างแต่ละองค์ประกอบ และตัวแปรเหล่านี้ได้รับการวิเคราะห์พร้อมกัน จุดเน้นของวิธีการกลุ่มนี้อยู่ที่การวิเคราะห์ความสัมพันธ์ ความเชื่อมโยง และความคล้ายคลึงระหว่างตัวแปรอยู่แล้ว

วิธีการหลายมิติต่อไปนี้มีความโดดเด่น:

1) วิธีการระบุการขึ้นต่อกันระหว่างตัวแปรคือวิธีการที่ตัวแปรหนึ่งตัวหรือมากกว่านั้นขึ้นอยู่กับตัวแปรและตัวแปรอื่น ๆ เป็นอิสระ กลุ่มนี้รวมถึง:

· การวิเคราะห์ความสัมพันธ์และการถดถอย

· การวิเคราะห์ความแปรปรวนและความแปรปรวนร่วม

· การวิเคราะห์จำแนก;

·การวิเคราะห์ร่วม

2) วิธีการระบุการพึ่งพาอาศัยกันระหว่างตัวแปรเป็นวิธีการที่ยอมให้ข้อมูลถูกจัดกลุ่มตามความคล้ายคลึงกัน ในวิธีการเหล่านี้ไม่มีการแบ่งตัวแปรตามและอิสระ กลุ่มนี้รวมถึง:

· การวิเคราะห์คลัสเตอร์

· การวิเคราะห์ปัจจัย

· การปรับขนาดหลายมิติ

การเลือกวิธีการวิเคราะห์ข้อมูลขึ้นอยู่กับ:

· เป้าหมาย วัตถุประสงค์ สมมติฐานการทำงานของการวิจัยการตลาด

· ประเภทของการวิจัยทางการตลาด (เชิงสำรวจหรือบทสรุป เชิงพรรณนาหรือเหตุและผล)

· ประเภทของข้อมูลที่รวบรวม - ตัวแปรเมตริกและไม่ใช่เมตริก

· มาตราส่วนที่ใช้ในการศึกษา

· ขนาดและวิธีการของกลุ่มตัวอย่าง

· วิธีการรวบรวมข้อมูล

· ขอบเขตการใช้งานและข้อจำกัดของวิธีการวิเคราะห์ข้อมูลทางสถิติ

ในความเป็นจริง ขั้นตอนการวิจัยการตลาดก่อนหน้านี้ทั้งหมดจะกำหนดทางเลือกของกลยุทธ์การวิเคราะห์ข้อมูลไว้ล่วงหน้า ประสบการณ์และคุณสมบัติของผู้วิจัยเองมีบทบาทสำคัญ โดยสรุป เราสังเกตว่าวิธีวิเคราะห์ข้อมูลทางสถิติที่ซับซ้อนหลายตัวแปรไม่ได้ถูกนำมาใช้เสมอไป บ่อยครั้งที่ผู้วิจัยถูกจำกัดอยู่เพียงการวิเคราะห์ข้อมูลเบื้องต้น (พื้นฐาน) และการตีความแบบกราฟิกเท่านั้น

แน่นอนว่าต้องจำไว้ว่าการวิเคราะห์ข้อมูลการวิจัยการตลาดไม่ใช่ขั้นตอนสุดท้าย ตามมาด้วยการพัฒนาคำแนะนำเชิงปฏิบัติและการสร้างรายงานการวิจัย

ในการเลือกวิธีทางสถิติที่เหมาะสมสำหรับการวิเคราะห์ข้อมูลในการวิจัยทางจิตวิทยา คุณต้องเข้าใจวิธีพื้นฐานของการประมวลผลทางสถิติก่อนว่าคืออะไร ใช้ในกรณีใด เพื่อวัตถุประสงค์ใด และจะได้ผลลัพธ์ประเภทใด

การเลือกวิธีวิเคราะห์ข้อมูลทางสถิติขึ้นอยู่กับวัตถุประสงค์และวัตถุประสงค์ของการศึกษา วิธีหลักในการวิเคราะห์ข้อมูลทางสถิติที่ใช้กันอย่างแพร่หลายในการประมวลผลผลการวิจัยเชิงประจักษ์ในวิทยานิพนธ์หรือวิทยานิพนธ์ทางจิตวิทยามีดังนี้:

  • การคำนวณสถิติเชิงพรรณนา ตามกฎแล้วสถิติเชิงพรรณนาจะถูกคำนวณในวิทยานิพนธ์ระดับบัณฑิตศึกษาสาขาจิตวิทยาทั้งหมดโดยไม่มีข้อยกเว้น ส่วนใหญ่แล้วค่าเฉลี่ย (M) และส่วนเบี่ยงเบนมาตรฐาน (SD) จะถูกคำนวณสำหรับทุกระดับของวิธีการวิจัยทั้งหมด และข้อมูลเหล่านี้จะถูกป้อนลงในตารางผลลัพธ์หลักของการศึกษาเชิงประจักษ์ที่แนบมากับงาน บ่อยครั้งพวกเขาจะพิจารณาในย่อหน้าแรกของบทเชิงประจักษ์ โดยเปรียบเทียบกับข้อมูลเชิงบรรทัดฐานเกี่ยวกับวิธีการ และพิจารณาว่าตัวอย่างภายใต้การศึกษามีคุณสมบัติใด ๆ ที่ควรนำมาพิจารณาหรือที่ก่อให้เกิดข้อ จำกัด ในการตีความการวิจัย ผลลัพธ์.
  • การวิเคราะห์ความสัมพันธ์ - การระบุความสัมพันธ์ระหว่างระดับการวิจัย วิธีการนี้ช่วยให้คุณสามารถตรวจจับความสัมพันธ์เชิงเส้น (ตรงและย้อนกลับ) ระหว่างตัวแปรหรือไม่มีตัวแปรได้ การวิเคราะห์สหสัมพันธ์เป็นวิธีการหลักในการวิเคราะห์ข้อมูลทางสถิติในงานที่มีวัตถุประสงค์เพื่อศึกษาอิทธิพลของบางสิ่งบางอย่างต่อบางสิ่งบางอย่าง การพึ่งพา A กับ B
  • การวิเคราะห์ความแตกต่างทางสถิติคือกลุ่มวิธีการเปรียบเทียบตัวอย่างตั้งแต่สองตัวอย่างขึ้นไป ซึ่งรวมถึงวิธีการเปรียบเทียบตัวอย่างโดยใช้การทดสอบ Student, Mann-Whitney, Wilcoxon และอื่นๆ วิธีการทั้งหมดนี้ทำให้สามารถระบุได้ว่าความแตกต่างที่มีนัยสำคัญทางสถิติ (เชื่อถือได้) ระหว่างกลุ่มวิชาสองกลุ่มขึ้นไปเป็นอย่างไร เป็นวิธีการหลักในการประมวลผลข้อมูลทางคณิตศาสตร์ในการวิจัยที่มีวัตถุประสงค์เพื่อศึกษาลักษณะของกลุ่มหรือศึกษาความแตกต่างระหว่างกลุ่มรวมถึงความแตกต่างทางเพศ
  • วิธีการวิเคราะห์ข้อมูลทางสถิติหลายตัวแปรใช้ในการศึกษาที่มีลักษณะการศึกษาจำนวนมาก (ขนาดและวิธีการวิจัย) ในการวิจัยทางจิตวิทยา มักเป็นการวิเคราะห์ปัจจัยและการวิเคราะห์กลุ่ม วิธีการเหล่านี้ช่วยให้คุณสามารถจำแนกประเภท สรุป ลดจำนวนตัวแปรที่กำลังศึกษา แบ่งออกเป็นกลุ่มหรือชั้นเรียน และเข้าถึงลักษณะทั่วไปอีกระดับหนึ่งได้ การประมวลผลผลการวิจัยเชิงประจักษ์โดยใช้วิธีหลายตัวแปรถือเป็นการประมวลผลข้อมูลทางคณิตศาสตร์ "ระดับสูงสุด" ตามกฎแล้ววิทยานิพนธ์ซึ่งใช้วิธีการหลายตัวแปรจะอ้างว่าได้เกรดที่ดีเยี่ยมอย่างชัดเจน

บทความที่คล้ายกัน