สถิติเชิงพรรณนา: วัสดุ การนำเสนอข้อมูล สถิติเชิงอนุมาน ตัวอย่าง
ที่จริงแล้ว สถิติมีสองประเภท คือ สถิติอนุมานและสถิติเชิงพรรณนา
อย่างไรก็ตาม ในโอกาสนี้ เราจะพูดถึงรายละเอียดเพิ่มเติมเกี่ยวกับสถิติเชิงพรรณนาเท่านั้น
ก่อนที่เราจะลงลึกในเชิงพรรณนา คุณรู้หรือไม่ว่าสถิติคืออะไร?
หากคุณไม่รู้ว่าสถิติคืออะไร มาเลย ให้เราเข้าใจความหมายของสถิติก่อน นี่คือข้อมูลเพิ่มเติม
สารบัญ
ทำความเข้าใจสถิติ
สถิติ เป็นศาสตร์พิเศษในการเรียนรู้วิธีรวบรวมข้อมูล นำเสนอข้อมูล วิเคราะห์ข้อมูล และตีความข้อมูล
สถิติโดยทั่วไปทำงานโดยใช้ข้อมูลตัวเลขซึ่งเป็นผลมาจากทั้งการนับและผลลัพธ์ การวัดที่ดำเนินการโดยใช้ข้อมูลหมวดหมู่ที่จำแนกตามเกณฑ์ แน่นอน.
ข้อมูลจะถูกบันทึกและเก็บรวบรวมทั้งในรูปแบบของข้อมูลตัวเลขและข้อมูลหมวดหมู่ที่เรียกว่าการสังเกต
ตามทิศทางของการอภิปราย สถิติสามารถแบ่งออกเป็นสองประเภท ได้แก่ :
1. สถิติทางคณิตศาสตร์ (สถิติทางคณิตศาสตร์)
สถิติทางคณิตศาสตร์หรือเรียกอีกอย่างว่า สถิติเชิงทฤษฎี เป็นแอปพลิเคชั่นที่เน้นความเข้าใจหรือการสร้างแบบจำลองและเทคนิคทางสถิติต่างๆ ทางคณิตศาสตร์หรือทางทฤษฎี
2. สถิติประยุกต์ (สถิติประยุกต์)
ในขณะเดียวกัน สถิติประยุกต์เองก็เน้นไปที่การอภิปรายมากกว่า รวมถึงความเข้าใจในแนวคิดโดยสัญชาตญาณ ตลอดจนเทคนิคทางสถิติต่างๆ ที่ใช้ในสาขาวิทยาศาสตร์ต่างๆ
วิธีการทางสถิติ
วิธีการทางสถิตินั้นเป็นขั้นตอนที่ใช้กันทั่วไปในการรวบรวม นำเสนอ วิเคราะห์ และตีความข้อมูล
วิธีการต่างๆ ข้างต้นจะถูกจัดกลุ่มเป็น 2 กลุ่มใหญ่ๆ ได้แก่
- สถิติเชิงพรรณนา
- สถิติอนุมาน
ตามที่อธิบายไว้ก่อนหน้านี้ ในบทความนี้เราจะพูดถึงเฉพาะสถิติเชิงอนุมานเท่านั้น
สถิติเชิงพรรณนาหมายถึงอะไร? สำหรับรายละเอียดเพิ่มเติม โปรดอ่านบทความนี้ให้จบ
สถิติเชิงพรรณนา
สถิติเชิงพรรณนาเป็นวิธีการที่เกี่ยวข้องกับการรวบรวมหรือนำเสนอข้อมูลเพื่อให้ข้อมูลที่เป็นประโยชน์
สถิติแบ่งออกเป็นสองส่วน คือ สถิติพรรณนาและสถิติอนุมานซึ่งดำเนินการตามกิจกรรมที่ดำเนินการ
ยกตัวอย่าง สถิติเชิงพรรณนา ตัวเอง ได้แก่ :
- โต๊ะ
- ไดอะแกรม
- แผนภูมิ
- ปริมาณอื่นๆ ในนิตยสารและหนังสือพิมพ์
สำหรับตัวอย่างภาพ เราสามารถใช้กราฟผู้เข้าชมบนเว็บไซต์เป็นตัวอย่างภาพของเว็บไซต์ได้ สถิติเชิงพรรณนา นั่นคือ:
ด้วยการใช้สถิติเชิงพรรณนา ชุดข้อมูลต่างๆ สามารถนำเสนอได้กระชับและเรียบร้อย และสามารถให้ข้อมูลหลักจากชุดข้อมูลที่มีอยู่ได้
ข้อมูลที่ได้จากสถิติเชิงพรรณนาเหล่านี้รวมถึงขนาดของความเข้มข้นของข้อมูล ขนาดของการกระจายข้อมูล และแนวโน้มของคลัสเตอร์ข้อมูล รายละเอียดเพิ่มเติมจะดำเนินต่อไปด้านล่าง
แบบฟอร์มการนำเสนอข้อมูล กราฟฟิค ท่ามกลางคนอื่น ๆ:
- ฮิสโตแกรม
- แผนภูมิวงกลม
- Ogive
- รูปหลายเหลี่ยม
- แผนภาพลำต้นและใบ
การนำเสนอข้อมูล ตัวเลข มีหลายรูปแบบ ได้แก่ :
- เซ็นทรัลเทรนด์
- เปราะบาง
- ความเบ้
- สายวัด
- กระจายหรือกระจาย
การนำเสนอข้อมูลสถิติเชิงพรรณนา
การนำเสนอข้อมูลในหมวดหมู่เชิงพรรณนาสามารถอยู่ในรูปแบบของกราฟิกและตัวเลข รวมถึง:
1. การนำเสนอข้อมูลในรูปแบบกราฟิก
การนำเสนอข้อมูลในรูปแบบกราฟิกประกอบด้วยประเภทต่างๆ ได้แก่
- อันดับแรก ฮิสโตแกรม:
ฮิสโตแกรมเป็นกราฟของการกระจายความถี่ของตัวแปร
การแสดงฮิสโตแกรมโดยทั่วไปจะอยู่ในรูปแบบของบล็อก การนำเสนอข้อมูลนี้ประกอบด้วยแกนหลักสองแกนที่มีมุม 900 โดยที่เป็นแกน X และแกน Y
ความกว้างของลำแสงจะระบุระยะห่างจากขีดจำกัดคลาสช่วงเวลา ในขณะที่ความสูงของลำแสงจะระบุความถี่ของข้อมูล
- ประการที่สอง พาย แผนภูมิ:
แผนภูมิวงกลมหรือในภาษาชาวอินโดนีเซียเรียกว่าแผนภูมิวงกลมเป็นวงกลมที่แบ่งออกเป็นหลายภาค
ในแต่ละภาคสามารถระบุขนาดของเปอร์เซ็นต์หรือแบ่งสำหรับแต่ละกลุ่มได้
- ประการที่สาม รูปหลายเหลี่ยม:
รูปหลายเหลี่ยมคือกราฟของการแจกแจงความถี่ที่เป็นของตัวแปร
ลักษณะที่ปรากฏของรูปหลายเหลี่ยมโดยทั่วไปยังอยู่ในรูปของเส้นหักที่ได้จากการเชื่อมต่อยอดกับค่ากลางแต่ละระดับ
รูปหลายเหลี่ยมนี้ถูกใช้อย่างดีในแง่ของการเปรียบเทียบรูปร่างของการแจกแจงสองแบบ
- ประการที่สี่ Ogive:
Ogive เป็นรูปแบบภาพของการกระจายความถี่สะสมบนตัวแปร สำหรับตารางการแจกแจงความถี่ เรายังสามารถสร้าง ogives บวกและ ogives เชิงลบได้
- ประการที่ห้า แผนภูมิก้านใบ (ลำต้นและใบ):
Stem and Leaf Diagrams หรือที่รู้จักในชื่อ Stem and Leaf Charts เหมือนกับกราฟฮิสโตแกรม ความแตกต่างเพียงอย่างเดียวคือข้อมูลที่ได้รับนั้นดีกว่า
เนื่องจากแผนภาพใบลำต้นแสดงค่าจากการสังเกตเดิม
แผนภาพนี้จะอธิบายตัวเลขที่เป็นแท่งด้วย และด้านขวาของตัวเลขจะมีการเขียนตัวเลขที่เหลือ
2. การนำเสนอข้อมูลเชิงตัวเลข
ดังที่ได้กล่าวมาแล้ว การนำเสนอข้อมูลตัวเลขประกอบด้วยหลายประเภท เช่น
การนำเสนอข้อมูลตัวเลขประกอบด้วยหลายประเภท ได้แก่
- ประการแรก Central Trends
- ประการที่สองการกระจายหรือกระจาย
- ประการที่สาม เปราะบาง
- ประการที่สี่ ความเบ้
- ประการที่ห้า การวัดความเรียว
วิธีการพื้นฐาน ในสถิติพรรณนา
สถิติเชิงพรรณนามีวิธีการพื้นฐานอยู่ 2 วิธี คือ ตัวเลข และ กราฟิก.
-
แนวทางเชิงตัวเลข สามารถใช้คำนวณค่าสถิติจากชุดข้อมูลได้
ตัวอย่างเช่น: หมายถึงและ ส่วนเบี่ยงเบนมาตรฐาน.
สถิติเหล่านี้จะให้ข้อมูลเกี่ยวกับค่าเฉลี่ยตลอดจนข้อมูลโดยละเอียดเกี่ยวกับการกระจายข้อมูล -
วิธีการแบบกราฟิก เหมาะสมกว่าวิธีการเชิงตัวเลขเพื่อระบุรูปแบบบางอย่างในข้อมูล ในทางกลับกัน วิธีการเชิงตัวเลขนั้นแม่นยำและมีวัตถุประสงค์มากกว่า
ด้วยวิธีนี้ วิธีการเชิงตัวเลขและกราฟิกจะช่วยเสริมซึ่งกันและกัน ดังนั้นจึงเป็นเรื่องที่ฉลาดมากหากเราใช้ทั้งสองวิธีพร้อมกัน
ตัวแปรเดียวมีลักษณะหรือคุณลักษณะหลักสามประการ ได้แก่:
- การกระจายข้อมูล (การกระจายความถี่)
- การวัดความเข้มข้นหรือแนวโน้มศูนย์กลาง (แนวโน้มกลาง)
- ขนาดสเปรด (การกระจายตัว)
การกระจายข้อมูล
การจัดระเบียบ จัดระเบียบ และสรุปข้อมูลโดยการสร้างตารางมักจะมีประโยชน์ โดยเฉพาะอย่างยิ่งเมื่อเรากำลังทำงานเพื่อจัดการกับข้อมูลจำนวนมาก
ตารางประกอบด้วยรายการค่าข้อมูลที่อาจแตกต่างกัน (ทั้งข้อมูลเดี่ยวและข้อมูลที่จัดกลุ่ม) รวมถึงค่าความถี่
ความถี่จะอธิบายจำนวนครั้งหรือค่าข้อมูลที่เกิดขึ้นกับบางประเภท
การแจกแจงข้อมูลที่จัดเรียงไว้มักจะเรียกว่า การกระจายความถี่. ดังนั้น การกระจายความถี่จึงสามารถตีความได้ว่าเป็นรายการการกระจายข้อมูล (ทั้งข้อมูลเดี่ยวหรือข้อมูลกลุ่ม) ตามด้วยค่าความถี่
ข้อมูลจะถูกจัดกลุ่มเป็นหลายคลาสเพื่อให้เห็นลักษณะหรือคุณลักษณะที่สำคัญของข้อมูลได้อย่างรวดเร็ว
การกระจายความถี่ที่ง่ายที่สุดคือการแจกแจงที่แสดงรายการสำหรับแต่ละค่าของตัวแปรซึ่งมาพร้อมกับค่าความถี่ของมัน
การกระจายความถี่ เราสามารถแสดงได้สองวิธี โดย โต๊ะ หรือกับ แผนภูมิ.
การกระจายยังสามารถอธิบายได้โดยใช้ค่าเปอร์เซ็นต์ การนำเสนอการกระจายในรูปแบบของกราฟทำให้ง่ายต่อการแสดงลักษณะเฉพาะและแนวโน้มของชุดข้อมูล
กราฟข้อมูลเชิงปริมาณประกอบด้วยฮิสโตแกรม รูปหลายเหลี่ยมความถี่ และอื่นๆ
ในขณะที่แผนภูมิสำหรับข้อมูลเชิงคุณภาพ ได้แก่ แผนภูมิแท่ง แผนภูมิวงกลม และอื่นๆ
การกระจายความถี่จะทำให้เราเห็นรูปแบบในข้อมูลได้ง่ายขึ้น
อย่างไรก็ตาม เราจะสูญเสียข้อมูลเกี่ยวกับค่าส่วนบุคคล
แบบฟอร์มการจัดจำหน่าย
สิ่งสำคัญอย่างหนึ่งที่มี "คำอธิบาย" ของตัวแปรคือรูปร่างของการแจกแจง ซึ่งอธิบายความถี่ของช่วงต่างๆ ของค่าตัวแปร
โดยทั่วไปแล้ว ผู้วิจัยสนใจว่าการแจกแจงแบบปกติสามารถประมาณการแจกแจงได้มากน้อยเพียงใด
สถิติเชิงพรรณนาอย่างง่ายสามารถให้ข้อมูลบางอย่างที่เกี่ยวข้องกับปัญหานี้ได้
ตัวอย่างเช่น หากความเบ้ซึ่งวัดความสมมาตรของการกระจายข้อมูลไม่เท่ากับ 0 แสดงว่าการกระจายนั้นไม่สมมาตร (สมมาตร),.
และถ้าความเบ้เป็น 0 แสดงว่าข้อมูลมีการกระจายตามปกติ (แบบสมมาตร)
หากเคอร์โทซิสซึ่งวัดความคมชัดของการกระจายข้อมูลไม่เท่ากับ 0 การกระจายข้อมูลอาจราบเรียบหรือคมชัดกว่าการแจกแจงแบบปกติ
ค่าเคอร์โทซิสของการแจกแจงแบบปกติคือ 0
เราจะได้ข้อมูลที่แม่นยำมากขึ้นโดยใช้การทดสอบความปกติอย่างหนึ่ง คือ หาความน่าจะเป็นของ ตัวอย่างมาจากการสังเกตประชากรที่มีการกระจายตามปกติหรือไม่ (เช่น การทดสอบ Kolmogorov-Smirnov หรือการทดสอบ ชาปิโร-วิลก์ส'ดับเบิลยู)
แต่ในการทดสอบที่เป็นทางการเหล่านี้ ไม่มีใครสามารถแทนที่การตรวจสอบข้อมูลด้วยสายตาได้อย่างสมบูรณ์โดยใช้วิธีการแบบกราฟิก ตัวอย่างคือฮิสโตแกรม (กราฟแสดงการกระจายความถี่ของตัวแปร)
กราฟ (เช่น ฮิสโตแกรม) ช่วยให้เราสามารถประเมินความปกติของการแจกแจงเชิงประจักษ์ได้
เนื่องจากฮิสโตแกรมตามมาด้วยการซ้อนทับของเส้นโค้งปกติ
สิ่งนี้จะช่วยให้เราตรวจสอบลักษณะต่างๆ ของรูปร่างของการกระจายข้อมูลในเชิงคุณภาพได้
ตัวอย่างเช่น การแจกแจงอาจเป็นแบบไบโมดอล (มี 2 พีค) หรือแบบต่อเนื่องหลายรูปแบบ (มากกว่า 2 พีค)
นี่จะแสดงให้เห็นว่ากลุ่มตัวอย่างไม่เป็นเนื้อเดียวกันและองค์ประกอบมาจากประชากรสองกลุ่มที่แตกต่างกัน
ขนาดความเข้มข้น (Central Tendency)
ลักษณะที่สำคัญที่สุดประการหนึ่งในการแสดงการกระจายข้อมูลคือค่าของศูนย์สังเกตการณ์
ในแต่ละการวัดเลขคณิตที่ชี้ไปที่การแสดงค่าที่แสดงถึงค่ากลางหรือค่ากลางของชุดข้อมูล (ชุดของการสังเกต) เรียกว่า การวัดแนวโน้มส่วนกลาง central.
การวัดแนวโน้มส่วนกลางที่มักใช้มีสามประเภท ได้แก่:
- หมายถึง
- ค่ามัธยฐาน
- โหมด
จำนวนเฉลี่ย หรือเรียกอีกอย่างว่า เลขคณิต หรือที่เรามักเรียกกันว่า หมายถึง เพียงอย่างเดียวเป็นวิธีที่ใช้กันอย่างแพร่หลายที่สุดในการแสดงการวัดแนวโน้มจากส่วนกลาง
ค่าเฉลี่ยนี้คำนวณโดยการบวกค่าข้อมูลที่สังเกตได้ทั้งหมดแล้วหารด้วยจำนวนข้อมูล ค่าเฉลี่ยได้รับผลกระทบจากค่าที่มากเกินไป.
ค่ามัธยฐาน คือค่าที่แบ่งชุดการสังเกตออกเป็นสองส่วนเท่า ๆ กัน หรือ 50% ของการสังเกตที่อยู่ต่ำกว่าค่ามัธยฐานและ 50% อยู่เหนือค่ามัธยฐาน
ค่ามัธยฐาน จาก น การวัด/การสังเกต x1, x2 ,…, xน เป็นค่าการสังเกตที่อยู่ตรงกลางของคลัสเตอร์ข้อมูลหลังจากจัดเรียงข้อมูลแล้ว
ถ้าจำนวนการสังเกต (น) เป็นเลขคี่ ค่ามัธยฐานอยู่ตรงกลางของคลัสเตอร์ข้อมูล ในขณะที่ if น แม้ค่ามัธยฐานจะพบโดยการแก้ไข
นั่นคือวิธีที่ค่าเฉลี่ยของชุดข้อมูลสองชุดอยู่ตรงกลางของชุดข้อมูล
ค่ามัธยฐานไม่ได้รับผลกระทบจากค่าที่มากเกินไป.
โหมด เป็นหนึ่งในข้อมูลที่เกิดขึ้นบ่อยที่สุดหรือเกิดขึ้น
ในการพิจารณาการมีอยู่ของโหมด เราต้องจัดเรียงข้อมูลตามลำดับจากน้อยไปมาก แล้วตามด้วยการคำนวณความถี่
ค่าที่มีความถี่สูงสุด (มักปรากฏขึ้น) เรียกว่าโหมด
โหมดนี้ใช้สำหรับทั้งประเภทข้อมูลที่เป็นตัวเลขและหมวดหมู่
โหมดไม่ได้รับผลกระทบจากค่าที่มากเกินไป.
ลักษณะสำคัญสำหรับขนาดศูนย์ที่ดี
การวัดค่ากลาง (ค่าเฉลี่ย) เป็นค่าตัวแทนของการกระจายข้อมูล ดังนั้นต้องมีคุณสมบัติดังต่อไปนี้:
- ต้องพิจารณาชุดข้อมูลทั้งหมด
- ไม่ควรได้รับผลกระทบจากค่าสุดขีด
- ต้องมีความเสถียรตั้งแต่ตัวอย่างจนถึงตัวอย่าง
- จะต้องสามารถใช้สำหรับการวิเคราะห์ทางสถิติต่อไปได้
จากการวัดค่าส่วนกลางหลายๆ ค่า ค่าเฉลี่ยเกือบจะเป็นไปตามข้อกำหนดเหล่านี้ทั้งหมด ยกเว้นโดยมีเงื่อนไขว่าในจุดที่สอง ค่าเฉลี่ยจะได้รับผลกระทบจากค่าสุดขั้ว
ตัวอย่างเช่น ถ้ารายการคือ 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 แล้วค่าเฉลี่ย ค่ามัธยฐาน และโหมดทั้งหมดเท่ากับ 6
หากค่าสุดท้ายคือ 90 แทนที่จะเป็น 9 ค่าเฉลี่ยจะเป็น 14.10
ในขณะเดียวกัน ค่ามัธยฐานและโหมดจะไม่เปลี่ยนแปลง
แม้ว่าค่ามัธยฐานและโหมดจะดีกว่าในเรื่องนี้ แต่ก็ไม่เป็นไปตามข้อกำหนดอื่นๆ
ดังนั้น หมายถึง เป็นการวัดค่าส่วนกลางที่ดีที่สุดและมักใช้ในด้านการวิเคราะห์ทางสถิติ
เมื่อใดที่เราใช้ค่าศูนย์กลางต่างกัน
ค่าขนาดศูนย์กลางที่เหมาะสมที่จะใช้จะขึ้นอยู่กับลักษณะของข้อมูล ลักษณะของการกระจายความถี่ และวัตถุประสงค์
หากข้อมูลเป็นข้อมูลเชิงคุณภาพ จะใช้ได้เฉพาะโหมดเท่านั้น
ตัวอย่างเช่น หากเราสนใจที่จะทราบชนิดของดินทั่วไปในสถานที่หนึ่งๆ หรือรูปแบบการปลูกพืชในพื้นที่ เราก็สามารถใช้โหมดนี้ได้
อย่างไรก็ตาม ในทางกลับกัน หากข้อมูลเป็นเชิงปริมาณ เราสามารถใช้การวัดค่าส่วนกลางอย่างใดอย่างหนึ่งได้
หากข้อมูลเป็นเชิงปริมาณ เราต้องพิจารณาธรรมชาติของการกระจายความถี่ของคลัสเตอร์ข้อมูล
- หากการกระจายความถี่ของข้อมูลผิดปกติ (ไม่สมมาตร) ค่ามัธยฐานหรือโหมดจะเป็นการวัดที่เหมาะสมของศูนย์กลาง
- หากมีค่ามาก ไม่ว่าเล็กหรือใหญ่ ควรใช้ค่ามัธยฐานหรือโหมด
- หากการกระจายข้อมูลเป็นปกติ (สมมาตร) สามารถใช้การวัดค่าส่วนกลางทั้งหมดได้ ไม่ว่าจะเป็นค่ากลาง ค่ามัธยฐาน หรือโหมด
อย่างไรก็ตาม ค่าเฉลี่ยถูกใช้บ่อยกว่าค่าเฉลี่ยอื่นๆ เนื่องจากเป็นไปตามข้อกำหนดสำหรับการวัดศูนย์กลางที่ดี - เมื่อเราจัดการกับความเร็ว ความเร็ว และราคา การใช้ค่าเฉลี่ยฮาร์มอนิกจะเหมาะสมกว่า
หากเราสนใจการเปลี่ยนแปลงสัมพัทธ์ เช่น ในกรณีของการเติบโตของแบคทีเรีย การแบ่งเซลล์ และอื่นๆ ค่าเฉลี่ยเรขาคณิตเป็นค่าเฉลี่ยที่เหมาะสมที่สุดที่จะใช้
สถิติอนุมาน
สถิติอนุมานเป็นวิธีการที่สามารถใช้วิเคราะห์ข้อมูลผู้ปกครองกลุ่มเล็กๆ และตัวอย่างที่นำมาจากประชากร จนกระทั่งในการคาดการณ์และยังสามารถสรุปเกี่ยวกับกลุ่มข้อมูลหลักหรือประชากร
สถิติอนุมานคือบทสรุปของวิธีการหรือวิธีการทั้งหมดที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลบางส่วน ซึ่งจะมาถึงการคาดการณ์หรือสรุปเกี่ยวกับข้อมูลผู้ปกครองทั้งหมดของประชากร
ลักษณะทั่วไปที่เกี่ยวข้องกับสถิติอนุมานมีคุณสมบัติที่ไม่แน่นอน
เนื่องจากเป็นข้อมูลบางส่วนที่ได้รับจากข้อมูลบางส่วน ดังนั้นสิ่งที่ได้รับเป็นเพียงการคาดการณ์เท่านั้น
ตัวอย่างสถิติอนุมาน
ในบันทึกการสำเร็จการศึกษาที่ดำเนินการภายในห้าปีที่ผ่านมา ในโรงเรียนมัธยมปลาย นี่แสดงให้เห็นว่าประมาณ 72% ของนักเรียนมัธยมปลายจบการศึกษาด้วยคะแนนที่น่าพอใจ
ค่าตัวเลข 72% เป็นรูปแบบหนึ่งของสถิติเชิงพรรณนา
หากอิงจากสิ่งนี้ นักเรียนสามารถสรุปได้ว่าโอกาสที่เขาจะผ่านนั้นมีคะแนนที่น่าพอใจมาก
ค่านี้มากกว่า 70% เพื่อให้นักศึกษาได้ทำสถิติอนุมานซึ่งแน่นอนว่ามีลักษณะไม่แน่นอน
ตัวอย่างรูปภาพสถิติอนุมาน
ในสถิติอนุมาน การประมาณค่าพารามิเตอร์จะทำให้เกิดสมมติฐาน
และยังทดสอบสมมติฐานเพื่อให้ได้ข้อสรุปที่ใช้โดยทั่วไป
วิธีการหรือวิธีการนี้โดยทั่วไปจะเรียกว่า สถิติอุปนัย มันถูกเรียกเช่นนั้นเพราะข้อสรุปที่ได้มาจากข้อมูลจากเพียงส่วนหนึ่งของข้อมูลเท่านั้น
ข้อสรุปทางสถิติเชิงอนุมานนี้อิงจากข้อมูลบางส่วนเท่านั้นที่อาจทำให้ลักษณะของข้อมูลไม่แน่นอน
เพื่อให้เกิดความผิดพลาดในการตัดสินใจ ดังนั้นความรู้เกี่ยวกับทฤษฎีความน่าจะเป็นจึงมีความจำเป็นอย่างยิ่งในการใช้วิธีทางสถิติเชิงอนุมานต่างๆ
ฟังก์ชันทางสถิติเชิงอนุมาน
สถิติอนุมานหรือเรียกอีกอย่างว่าสถิติอุปนัยคือสถิติที่มีเป้าหมายในการประมาณค่าประชากรโดยทั่วไปโดยใช้ผลลัพธ์ตัวอย่าง
ซึ่งรวมถึงการประเมินเชิงทฤษฎีและการทดสอบเชิงทฤษฎี สถิติอนุมานมักจะใช้ทำอะไรหลายอย่าง เช่น
- ดำเนินการสรุปจากกลุ่มตัวอย่างไปยังประชากร
- ดำเนินการทดสอบสมมติฐาน
ขอบเขตของสถิติอนุมาน
หากอิงตามขอบเขตของการอภิปราย สถิติเชิงอนุมานอาจรวมถึง:
- ทฤษฎีความน่าจะเป็นหรือความน่าจะเป็น
- การกระจายทางทฤษฎี
- การวิเคราะห์ความแปรปรวนร่วม
- การสุ่มตัวอย่างและการสุ่มตัวอย่างการกระจาย
- การประมาณค่าประชากรหรือทฤษฎีประชากร
- การวิเคราะห์ความแปรปรวน
- การทดสอบสมมติฐาน
- การวิเคราะห์สหสัมพันธ์และการทดสอบนัยสำคัญ
- การวิเคราะห์การถดถอยสำหรับการพยากรณ์
ความแตกต่างระหว่างสถิติพรรณนาและสถิติอนุมาน
สถิติเชิงอนุมานและสถิติเชิงพรรณนาย่อมมีความแตกต่างอย่างแน่นอน ในที่นี้เราจะให้ความแตกต่างระหว่างสองสิ่งนี้
- สถิติเชิงพรรณนาจำกัดในการนำเสนอข้อมูลในรูปแบบของตาราง ไดอะแกรม หรือกราฟ และปริมาณอื่นๆ เท่านั้น
- แม้ว่าสถิติเชิงอนุมานจะไม่เพียงแต่รวมสถิติเชิงพรรณนาเท่านั้น แต่ยังสามารถใช้ในการประมาณค่าและสรุปผลไปยังประชากรจากกลุ่มตัวอย่างได้
เพื่อให้สามารถบรรลุข้อสรุปของสถิติอนุมานได้ เราต้องผ่านการทดสอบสมมติฐานหลายขั้นตอนและการทดสอบทางสถิติด้วย
ดังนั้นการทบทวนสั้น ๆ ของสถิติเชิงพรรณนาที่เราสามารถถ่ายทอดได้ หวังว่าการทบทวนสถิติเชิงพรรณนาข้างต้นสามารถใช้เป็นเอกสารการศึกษาของคุณได้