Monday 21 August 2017

ศูนย์ ที่สูงเกินจริง ไบนารี ตัวเลือก


ข้อสังเกต: คุณกำลังดูหน้าเว็บเวอร์ชันเก่า เนื้อหาใหม่สามารถพบได้ในโดเมนใหม่ของเรา stats. idre. ucla. edu นอกจากนี้คุณยังสามารถล้างแคชของเบราว์เซอร์และรีเฟรชหน้านี้ซึ่งควรเปลี่ยนเส้นทางคุณไปยังเนื้อหาที่อัปเดตโดยตรง ยินดีต้อนรับสู่สถาบันการศึกษาดิจิทัลและการศึกษา R Data Analysis ตัวอย่าง: Zero-Inflated Negative Binomial Regression การถดถอยเชิงลบแบบพหุคูณแบบไม่ขึ้นกับศูนย์เป็นศูนย์สำหรับการสร้างแบบจำลองตัวแปรนับที่มีศูนย์มากเกินไปและโดยปกติแล้วสำหรับตัวแปรผลลัพธ์ที่นับไม่ถนัด นอกจากนี้ทฤษฎีชี้ให้เห็นว่าค่าศูนย์ส่วนเกินจะถูกสร้างขึ้นโดยกระบวนการแยกจากค่าที่นับและจำนวนศูนย์ส่วนเกินสามารถจำลองได้อย่างอิสระ หน้านี้ใช้แพคเกจต่อไปนี้ ตรวจสอบว่าคุณสามารถโหลดได้ก่อนที่จะพยายามเรียกใช้ตัวอย่างในหน้านี้ ถ้าคุณไม่มีแพ็คเกจติดตั้งให้รัน: install. packages (packagename) หรือถ้าคุณเห็นว่าเวอร์ชันล้าสมัยให้รัน: update. packages () ข้อมูลเกี่ยวกับเวอร์ชั่น: รหัสสำหรับหน้านี้ได้รับการทดสอบใน R version 3.1.1 (2014-07-10) วันที่: 2014-08-11 ด้วย: boot 1.3-11 knitr 1.6 pscl 1.04.4 vcd 1.3-1 gam 1.09.1 ​​coda 0.16-1 mvtnorm 1.0-0 GGally 0.4.7 plyr 1.8.1 MASS 7.3-33 Hmisc 3.14-4 สูตร 1.1-2 การอยู่รอด 2.37-7 psych 1.4.5 reshape2 1.4 msm 1.4 phia 0.1-5 RColorBrewer 1.0-5 effects 3.0- 0 colorspace 1.2-4 lattice 0.20-29 pequod 0.0-3 car 2.0-20 ggplot2 1.0.0 โปรดทราบ: วัตถุประสงค์ของหน้านี้เพื่อแสดงวิธีการใช้คำสั่งการวิเคราะห์ข้อมูลต่างๆ ไม่ครอบคลุมทุกด้านของกระบวนการวิจัยที่นักวิจัยคาดว่าจะทำ โดยเฉพาะอย่างยิ่งไม่ครอบคลุมถึงการทำความสะอาดและการตรวจสอบข้อมูลการยืนยันสมมติฐานการวิเคราะห์แบบจำลองหรือการวิเคราะห์ติดตามผลที่เป็นไปได้ ตัวอย่างของการถดถอยสองค่าที่เป็นลบขั้วโลกตัวอย่างที่ 1 ผู้บริหารโรงเรียนศึกษาพฤติกรรมการเข้าชั้นเรียนของนักเรียนชั้นมัธยมศึกษาตอนต้นที่โรงเรียนสองแห่ง ตัวทำนายของจำนวนวันที่ขาดเรียนรวมถึงเพศของนักเรียนและคะแนนการทดสอบมาตรฐานในวิชาคณิตศาสตร์และภาษาศาสตร์ ตัวอย่างที่ 2 นักชีววิทยาสัตว์ป่าของรัฐต้องการหาจำนวนปลาที่ชาวประมงจับได้ที่อุทยานแห่งชาติ ผู้เข้าชมถูกถามว่าพวกเขาพักอยู่กี่วันมีกลุ่มเด็กกี่คนและมีปลากี่ตัวที่ถูกจับได้ ผู้เข้าชมบางรายไม่ตกปลา แต่ไม่มีข้อมูลว่าใครเป็นคนตกปลาหรือไม่ ผู้เข้าชมบางรายที่ทำปลาไม่จับปลาใด ๆ จึงมีจำนวนศูนย์ที่เกินในข้อมูลเนื่องจากคนที่ไม่ได้เป็นปลา คำอธิบายของข้อมูลให้ตัวอย่างที่ 2 จากด้านบน เรามีข้อมูลเกี่ยวกับ 250 กลุ่มที่ไปที่สวนสาธารณะ แต่ละกลุ่มได้รับคำถามเกี่ยวกับจำนวนปลาที่จับได้ (เด็ก) จำนวนเด็กที่อยู่ในกลุ่ม (เด็ก) จำนวนคนในกลุ่ม (คน) และพวกเขาพาค่ายไปเที่ยวสวน (ค่ายพักแรม) หรือไม่ . นอกเหนือไปจากการคาดการณ์จำนวนปลาที่จับได้แล้วยังมีความสนใจในการคาดการณ์การมีอยู่ของศูนย์ส่วนเกินนั่นคือความเป็นไปได้ที่กลุ่มจะจับปลาที่เป็นศูนย์ เราจะใช้ตัวแปรเด็ก บุคคล และค่ายพักแรมในรูปแบบของเรา ให้ดูที่ข้อมูล วิธีการวิเคราะห์ที่คุณอาจพิจารณาก่อนที่เราจะแสดงวิธีที่คุณสามารถวิเคราะห์สิ่งนี้ด้วยการวิเคราะห์เชิงลบแบบไม่เป็นศูนย์เชิงบวก 0 ให้พิจารณาวิธีอื่น ๆ ที่คุณอาจใช้ การถดถอย OLS - คุณอาจลองวิเคราะห์ข้อมูลเหล่านี้โดยใช้การถดถอย OLS อย่างไรก็ตามข้อมูลจำนวนมากไม่เป็นไปตามปกติและไม่ได้ประมาณด้วยการถดถอยของ OLS การถดถอย Poisson แบบพองด้วยศูนย์ - การถดถอย Poisson แบบพองตัวจะไม่ดีขึ้นเมื่อข้อมูลไม่ได้ถูกแทนที่อย่างมากเช่นเมื่อความแปรปรวนไม่มากไปกว่าค่าเฉลี่ย แบบจําลองแบบจําลอง - โมเดล Poisson หรือรูปแบบไบนารีเชิงลบอาจเหมาะสมกว่าถ้าไม่มีค่าศูนย์ส่วนเกิน การถดถอยสองค่าแบบพหุคูณที่ให้เป็นศูนย์ 0 รูปแบบที่เพิ่มขึ้นเป็นศูนย์ถือว่าสมมติฐานว่าไม่มีผลลัพธ์เป็นเพราะกระบวนการที่แตกต่างกันสองแบบ ตัวอย่างเช่นในตัวอย่างของการประมงที่นำเสนอในที่นี้กระบวนการทั้งสองมีอยู่ว่าเรื่องได้ตกปลาไปแล้วไม่ใช่การตกปลา หากไม่ได้ไปตกปลาผลที่เป็นไปได้ก็คือศูนย์ ถ้าไปตกปลาก็นับเป็นกระบวนการนับ ส่วนสองส่วนของรูปแบบที่ไม่มีการขยายตัวเป็นศูนย์เป็นแบบจำลองไบนารีซึ่งโดยปกติจะเป็นแบบจำลอง logit เพื่อสร้างแบบจำลองของกระบวนการทั้งสองซึ่งเป็นศูนย์ผลลัพธ์ที่เกี่ยวข้องและรูปแบบการนับในกรณีนี้เป็นรูปแบบสองทางลบเพื่อจำลองจำนวน กระบวนการ. จำนวนที่คาดหวังจะแสดงเป็นชุดของทั้งสองกระบวนการ ลองนึกถึงการตกปลาอีกครั้ง: เพื่อให้เข้าใจการถดถอยสองชั้นแบบลบที่เพิ่มขึ้น 0 ขั้วโลกให้เริ่มต้นด้วยรูปแบบไบนารีเชิงลบ มีหลาย parameterizations ของรูปแบบสองทางลบเราเน้น NB2 ฟังก์ชันความหนาแน่นของค่าความคลาดสองตัวเป็นลบคือ: (p) คือความน่าจะเป็นของความสำเร็จ (r) จากนี้เราจะได้รับฟังก์ชั่นโอกาสที่จะได้รับโดย: ที่นี่เราพบความเป็นไปได้ของค่าที่คาดหวัง (mu) ให้ข้อมูลและ (alpha) ซึ่งช่วยในการกระจายตัว โดยปกติแล้วจะแสดงเป็นโอกาสในการบันทึกซึ่งแสดงโดยสคริปต์ L (mathcal): ซึ่งสามารถแสดงในรูปแบบของเราได้โดยแทนที่ (mui) ด้วย (exp (xi beta)) เมื่อเปลี่ยนกลับเป็นรูปแบบค่าลบคูณสองที่เป็นศูนย์การแสดงออกของฟังก์ชันความเป็นไปได้ขึ้นอยู่กับว่าค่าที่สังเกตได้เป็นศูนย์หรือมากกว่าศูนย์ จากรูปแบบโลจิสติกของ (yi 1) เทียบกับ (y0): สุดท้ายให้สังเกตว่า R ไม่ได้ประมาณ (alpha) แต่ (theta), ผกผันของ (alpha) ตอนนี้ช่วยสร้างโมเดลของเราขึ้น เราจะใช้ตัวแปรเด็กและค่ายเพื่อสร้างแบบจำลองการนับในส่วนของโมเดลสองค่าลบและตัวแปรคนในส่วน logit ของแบบจำลอง เราใช้ pscl เพื่อเรียกใช้การถดถอยเชิงลบสองขั้วที่พองตัว เราเริ่มต้นด้วยการประมาณแบบจำลองที่มีตัวแปรที่น่าสนใจ ผลลัพธ์มีลักษณะคล้ายกับผลลัพธ์จากการถดถอยสองแบบของ OLS ใน R. ด้านล่างของการเรียกแบบจำลองคุณจะพบกลุ่มผลลัพธ์ที่มีค่าสัมบูรณ์ถดถอยเชิงลบสำหรับแต่ละตัวแปรพร้อมกับข้อผิดพลาดมาตรฐาน z-score และค่า p สำหรับค่าสัมประสิทธิ์ บล็อกที่สองเป็นไปตามรูปแบบเงินเฟ้อ ซึ่งรวมถึงค่าสัมประสิทธิ์ของ logit สำหรับทำนายค่าศูนย์ส่วนเกินพร้อมกับข้อผิดพลาดมาตรฐาน z-score และค่า p-value ตัวทำนายทั้งหมดในส่วนที่นับและอัตราเงินเฟ้อของแบบจำลองมีนัยสำคัญทางสถิติ โมเดลนี้เหมาะกับข้อมูลที่ดีกว่าโมเดลที่เป็นโมฆะนั่นคือแบบจำลองการสกัดกั้นเพียงอย่างเดียว เพื่อแสดงให้เห็นว่าเป็นกรณีนี้เราสามารถเปรียบเทียบกับรูปแบบปัจจุบันเป็นแบบโมฆะโดยไม่ต้องใช้ตัวพยากรณ์โดยใช้การทดสอบไคสแควร์ที่มีความแตกต่างของความเป็นไปได้ในการบันทึก จากผลลัพธ์ข้างต้นเราจะเห็นว่าโมเดลโดยรวมของเรามีนัยสำคัญทางสถิติ โปรดทราบว่าผลลัพธ์ของรูปแบบข้างต้นไม่ได้ระบุในรูปแบบใด ๆ หากรูปแบบที่ไม่มีการขยายศูนย์ของเราคือการปรับปรุงโดยการถดถอยสองค่ามาตรฐานเชิงลบ เราสามารถตรวจสอบได้โดยการเรียกใช้โมเดลสองค่ามาตรฐานที่เป็นค่าลบซึ่งสอดคล้องกันแล้วทำการทดสอบ Vuong ของทั้งสองโมเดล เราใช้แพคเกจ MASS เพื่อเรียกใช้การถดถอยเชิงลบสองมาตรฐานมาตรฐาน ตัวทำนายเด็กและค่ายพักแรมในส่วนของรูปแบบการถดถอยเชิงลบสองทางที่ทำนายจำนวนปลาที่จับได้ (ตัวนับ) เป็นตัวบ่งชี้ที่มีนัยสำคัญ คนทำนายในส่วนของรูปแบบ logit ที่ทำนายศูนย์มากเกินไปมีนัยสำคัญทางสถิติ สำหรับข้อมูลเหล่านี้การเปลี่ยนแปลงที่คาดไว้ในบันทึก (จำนวน) สำหรับการเพิ่มขึ้นของจำนวนหนึ่งหน่วยต่อลูกคือ -1.515255 ที่มีตัวแปรคงที่อื่น ๆ ค่ายพักแรม (ค่ายพักแรม 1) มีจำนวนไม้ที่คาดว่าจะสูงกว่าของผู้ที่ไม่ได้พักแรม (ค่ายพักแรม 0) ที่มีค่าคงที่อื่น ๆ อยู่ที่ 0.879051 อัตราการเข้าสู่ระบบของการเป็นศูนย์มากเกินไปจะลดลง 1.67 สำหรับทุกคนเพิ่มเติมในกลุ่ม กล่าวอีกนัยหนึ่งผู้คนในกลุ่มมีโอกาสน้อยที่ศูนย์จะไม่ตกปลา พูดได้ชัดว่ายิ่งกลุ่มคนที่อยู่ในนั้นใหญ่เท่าไรก็ยิ่งมีแนวโน้มว่าจะมีคนไปตกปลา การทดสอบ Vuong แสดงให้เห็นว่าแบบจำลองสองค่าลบที่เพิ่มขึ้นเป็นศูนย์เป็นการปรับปรุงที่สำคัญกว่าแบบจำลองสองขั้วมาตรฐาน เราจะได้รับช่วงความเชื่อมั่นสำหรับพารามิเตอร์และพารามิเตอร์ exponentiated โดยใช้ bootstrapping สำหรับรูปแบบไบนารีเชิงลบนี้จะเป็นอัตราส่วนความเสี่ยงที่เกิดขึ้นสำหรับรูปแบบอัตราเงินเฟ้อเป็นศูนย์อัตราต่อรอง เราใช้ชุดบูต อันดับแรกเราจะได้ค่าสัมประสิทธิ์จากรูปแบบเดิมของเราเพื่อใช้เป็นค่าเริ่มต้นสำหรับรูปแบบเพื่อเพิ่มความเร็วในการประมาณเวลา จากนั้นเราเขียนฟังก์ชันสั้น ๆ ที่ใช้ข้อมูลและดัชนีเป็นอินพุทและส่งกลับค่าพารามิเตอร์ที่เราสนใจในที่สุดเราจะส่งผ่านไปยังฟังก์ชันการบูตและทำซ้ำ 1200 ครั้งโดยใช้หิมะเพื่อแจกจ่ายไปทั่วทั้งสี่แกน โปรดทราบว่าคุณควรปรับจำนวนแกนให้ตรงกับที่เครื่องของคุณมีอยู่ นอกจากนี้สำหรับผลลัพธ์สุดท้ายหนึ่งอาจต้องการเพิ่มจำนวน replications เพื่อช่วยให้มั่นใจผลมั่นคง ผลลัพธ์คือค่าประมาณสลับและข้อผิดพลาดมาตรฐาน นั่นคือแถวแรกมีการประมาณค่าพารามิเตอร์แรกจากโมเดลของเรา ข้อที่สองมีข้อผิดพลาดมาตรฐานสำหรับพารามิเตอร์ตัวแรก คอลัมน์ที่สามประกอบด้วยข้อผิดพลาดมาตรฐาน bootstrapped ซึ่งมีขนาดใหญ่กว่าที่ประเมินโดย zeroinfl ตอนนี้เราจะได้รับช่วงความเชื่อมั่นสำหรับพารามิเตอร์ทั้งหมด เราเริ่มต้นในระดับเดิมที่มี CIs ที่ปรับแล้วและมีความลำเอียง เรายังเปรียบเทียบผลลัพธ์เหล่านี้กับช่วงความเชื่อมั่นปกติตามข้อผิดพลาดมาตรฐาน ช่วงความมั่นใจในการบูตเป็นอย่างมากกว้างกว่าค่าประมาณตามปกติ CIs bootstrapped มีความสอดคล้องกับ CIs มากขึ้นจาก Stata เมื่อใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ ตอนนี้เราสามารถประมาณอัตราส่วนความเสี่ยงที่เกิดขึ้น (IRR) สำหรับโมเดลสองค่าลบและอัตราเดิมพัน (OR) สำหรับโมเดลโลจิสติก (zero inflation) นี้จะทำโดยใช้รหัสเหมือนกันเกือบเหมือนก่อน แต่ผ่านฟังก์ชันการแปลงไปยังอาร์กิวเมนต์ h ของ boot. ci. ในกรณีนี้ exp เพื่อ exponentiate เพื่อให้เข้าใจรูปแบบของเราได้ดีขึ้นเราสามารถคำนวณจำนวนปลาที่คาดว่าจะได้จากการคาดการณ์ของเรา ในความเป็นจริงเนื่องจากเรากำลังทำงานร่วมกับตัวทำนายแบบแบ่งหมวดหมู่เราสามารถคำนวณค่าที่คาดไว้สำหรับชุดค่าผสมทั้งหมดโดยใช้ฟังก์ชัน expand. grid เพื่อสร้างชุดค่าผสมทั้งหมดและทำนายฟังก์ชันที่จะทำ สุดท้ายเราสร้างกราฟ สิ่งที่ต้องพิจารณาต่อไปนี้เป็นประเด็นที่คุณอาจต้องการพิจารณาในระหว่างการวิเคราะห์งานวิจัยของคุณ คำถามเกี่ยวกับพารามิเตอร์ over-dispersion โดยทั่วไปเป็นเรื่องที่ยุ่งยาก พารามิเตอร์การกระจายตัวที่มีขนาดใหญ่อาจเกิดจากรูปแบบที่ไม่ได้ระบุหรืออาจเกิดจากกระบวนการจริงที่มีการกระจายตัวมากกว่า การเพิ่มปัญหาการกระจายตัวสะกดไม่จำเป็นต้องปรับปรุงโมเดลที่ไม่ได้ระบุ แบบจำลองสองค่าที่เป็นค่าลบของพหุคูณที่พองตัวมีสองส่วนคือรูปแบบการนับจำนวนไบนารีในเชิงลบและโมเดล logit สำหรับทำนายค่าศูนย์ส่วนเกินดังนั้นคุณอาจต้องการตรวจสอบหน้าตัวอย่างการวิเคราะห์ข้อมูลดังกล่าวการถดถอยสองด้านและการถดถอยลอการิทึม Logit Regression เนื่องจากศูนย์พหุคูณแบบลบจะมีรูปแบบการนับและรูปแบบ logit แต่ละรูปแบบทั้งสองควรมีตัวพยากรณ์ที่ดี ทั้งสองรุ่นไม่จำเป็นต้องใช้ตัวทำนายเดียวกัน ปัญหาของการทำนายที่สมบูรณ์แบบการแยกหรือการแยกชิ้นส่วนอาจเกิดขึ้นได้ในส่วนโลจิสติกของแบบจำลองที่ไม่มีศูนย์ ข้อมูลจำนวนมากมักใช้ตัวแปรการเปิดเผยเพื่อระบุจำนวนครั้งที่เหตุการณ์อาจเกิดขึ้น คุณสามารถรวมการเปิดรับแสง (หรือที่เรียกว่าออฟเซต) ลงในโมเดลโดยใช้ฟังก์ชันชดเชย () ไม่แนะนำให้ใช้โมเดลสองค่าเชิงลบที่มีการขยายตัวเป็นศูนย์สำหรับตัวอย่างขนาดเล็ก สิ่งที่ถือว่าเป็นตัวอย่างเล็ก ๆ ดูเหมือนจะไม่ได้ถูกกำหนดไว้อย่างชัดเจนในวรรณคดี ค่า Pseudo-R-squared แตกต่างจาก OLS R-squareds โปรดดูคำถามที่พบบ่อย: อะไรคือ Pseudo R-squareds สำหรับการอภิปรายในหัวข้อนี้ R คู่มือการอ้างอิงออนไลน์ Long, J. S. 1997. โมเดลการถดถอยสำหรับตัวแปรจำแนกตามประเภทและ จำกัด Thousand Oaks, CA: สิ่งพิมพ์ Sage Everitt, BS และ Hothorn, T. คู่มือการวิเคราะห์ทางสถิติโดยใช้ R เนื้อหาของเว็บไซต์นี้ไม่ควรตีความว่าเป็นการรับรองเว็บไซต์ใด ๆ หนังสือหรือผลิตภัณฑ์ซอฟต์แวร์โดยมหาวิทยาลัยแห่งแคลิฟอร์เนีย GENMOD Procedure Zero - โมเดลที่พองตัวนับข้อมูลที่มีอุบัติการณ์ของศูนย์น้อยกว่าที่คาดไว้สำหรับการกระจายความน่าจะเป็นพื้นฐานของจำนวนสามารถจำลองด้วยการกระจายศูนย์ที่สูงเกินจริง ใน GENMOD การแจกจ่ายที่อ้างอิงสามารถเป็นได้ทั้งแบบปัวซองหรือแบบลบ ดู Lambert (1992), Long (1997) และคาเมรอนและ Trivedi (1998) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบที่ศูนย์พองตัว ประชากรประกอบด้วยสองประเภทของบุคคล ประเภทแรกจะให้ค่า Poisson หรือจำนวนการแจกไพ่ที่เป็นค่าลบของ Binomial ซึ่งอาจมีศูนย์ ประเภทที่สองจะให้จำนวนศูนย์เสมอ อนุญาตให้มีการแจกแจงต้นแบบหมายถึงและเป็นความน่าจะเป็นของการเป็นบุคคลประเภทที่สอง พารามิเตอร์นี้เรียกว่าความเป็นไปได้เป็นศูนย์อัตราเงินเฟ้อ และเป็นความน่าจะเป็นของการนับเป็นศูนย์ในส่วนที่เกินจากความถี่ที่คาดการณ์ไว้โดยการแจกแจงต้นแบบ คุณสามารถขอให้มีการแสดงความเป็นไปได้เป็นศูนย์อัตราเงินเฟ้อในชุดข้อมูลขาออกที่มีคำหลัก PZERO การแจกแจงความเป็นไปได้ของตัวแปรสุ่ม Poisson แบบขยายตัวที่ศูนย์ 0 จะถูกกำหนดโดยและการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเชิงลบสองข 0 จะถูกกำหนดโดยที่ k คือพารามิเตอร์การแจกแจงแบบสองชั้นในเชิงลบ โดยที่ h คือหนึ่งในฟังก์ชันการเชื่อมโยงแบบไบนารี: logit, probit หรือ log-log เพิ่มเติม ฟังก์ชัน link h คือลิงค์ logit โดยค่าเริ่มต้นหรือฟังก์ชัน link function ระบุไว้ในคำสั่ง ZEROMODEL ฟังก์ชันการเชื่อมโยง g คือฟังก์ชันการเชื่อมโยงล็อกตามค่าดีฟอลต์หรือฟังก์ชันการเชื่อมโยงที่ระบุไว้ในคำสั่ง MODEL สำหรับทั้งสองแบบปัวซองและไบนารีเชิงลบ ตัวแปรร่วมสำหรับการสังเกต i ถูกกำหนดโดยรูปแบบที่ระบุในคำสั่ง ZEROMODEL และตัวแปรร่วมจะถูกกำหนดโดยรูปแบบที่ระบุในคำสั่ง MODEL พารามิเตอร์การถดถอยและประมาณด้วยความเป็นไปได้สูงสุด ค่าเฉลี่ยและความแปรปรวนของ Y สำหรับปัวซองที่เพิ่มขึ้นเป็นศูนย์จะได้รับโดยและสำหรับ binomial เชิงลบที่ไม่เติมศูนย์โดยคุณสามารถขอให้ค่าเฉลี่ยของ Y แสดงผลสำหรับการสังเกตแต่ละครั้งในชุดข้อมูลที่ส่งออกด้วย PRED keyword. zeroinfl: Zero อาร์กิวเมนต์การนับถอยหลังของข้อมูลนับถอยหลังถูกส่งผ่านไปยัง zeroinfl. control ในการตั้งค่าเริ่มต้น รูปแบบการนับที่ไม่เติมด้วยศูนย์คือแบบจำลองการผสมแบบสององค์ประกอบซึ่งรวมมวลจุดที่ศูนย์และมีการแจกแจงที่เหมาะสม ดังนั้นจึงมีสองแหล่งที่มาจากศูนย์: เลขศูนย์อาจมาจากทั้งสองจุดและจากส่วนประกอบนับ โดยปกติแล้วรูปแบบการนับเป็นแบบปัวซองหรือการถดถอยของสองค่าลบ (ด้วยลิงค์ล็อก) การแจกแจงทางเรขาคณิตเป็นกรณีพิเศษของไบนารีเชิงลบที่มีพารามิเตอร์ขนาดเท่ากับ 1. สำหรับการจำลองสถานะที่ไม่ได้สังเกตการณ์ (ศูนย์เทียบกับนับ) จะมีการใช้แบบจำลองไบนารีที่สามารถวัดความเป็นไปได้ที่จะมีอัตราเงินเฟ้อเป็นศูนย์ ในกรณีที่ง่ายที่สุดเฉพาะกับดัก แต่อาจมี regressors สำหรับโมเดลอัตราเงินเฟ้อเป็นศูนย์นี้สามารถใช้โมเดลสองตัวที่มีลิงก์ต่างกันได้โดยทั่วไปคือ logit หรือ probit สูตรนี้สามารถใช้เพื่อระบุส่วนประกอบทั้งสองแบบได้: ถ้ามีการจัดสูตรของ y x1 x2 ให้ใช้ regressors เดียวกันในทั้งสองส่วนประกอบ นี่เท่ากับ y x 1 x 2 x 1 x 2 อาจมีการกำหนดชุด regressors ที่แตกต่างกันสำหรับองค์ประกอบนับและองค์ประกอบอัตราเงินเฟ้อเป็นศูนย์เช่น y x1 x2 z1 z2 z3 ให้รูปแบบข้อมูลนับ y x1 x2 ตามเงื่อนไข () รูปแบบศูนย์เงินเฟ้อ y z1 z2 z3 แบบจำลองเงินเฟ้อง่ายๆที่นับเป็นศูนย์ทั้งหมดมีความเป็นไปได้เหมือนกันกับขององค์ประกอบศูนย์สามารถระบุได้โดยสูตร y ค่าออฟเซ็ทสามารถระบุได้ทั้งสององค์ประกอบของรูปแบบที่เกี่ยวข้องกับรูปแบบการนับและอัตราเงินเฟ้อเป็นศูนย์: y x1 offset (x2) z1 z2 offset (z3) โดยที่ x2 ใช้เป็นค่าชดเชย (กล่าวคือมีสัมประสิทธิ์คงที่ถึง 1) ในองค์ประกอบที่นับและ z3 analogously ในองค์ประกอบ zero-inflation ตามกฎที่ระบุข้างต้น y x1 offset (x2) ถูกขยายไปเป็น y x1 offset (x2) x1 offset (x2) แทนที่จะใช้ wrapper offset () ภายในสูตร อาร์กิวเมนต์ชดเชยยังสามารถใช้ซึ่งกำหนดค่าชดเชยเฉพาะสำหรับรูปแบบการนับ ดังนั้นสูตร y x1 และออฟเซต x2 เท่ากับสูตร y x1 offset (x2) x1 พารามิเตอร์ทั้งหมดจะถูกประมาณด้วยความเป็นไปได้สูงสุดโดยใช้ optim มีตัวเลือกการควบคุมที่ตั้งไว้ใน zeroinfl. control ค่าเริ่มต้นสามารถจัดทำโดยประมาณตามอัลกอริทึม EM (ความคาดหวังสูงสุด) หรือโดย glm. fit (ค่าเริ่มต้น) ข้อผิดพลาดมาตรฐานมาจากตัวเลขโดยใช้เมทริกซ์ Hessian ที่ส่งกลับโดย optim ดูรายละเอียดจาก zeroinfl. control วัตถุแบบจำลองพอดีกลับเป็นของ zeroinfl ชั้นและคล้ายกับวัตถุ glm ติดตั้ง สำหรับองค์ประกอบเช่นค่าสัมประสิทธิ์หรือเงื่อนไขรายการจะถูกส่งกลับพร้อมกับองค์ประกอบสำหรับศูนย์และส่วนประกอบนับตามลำดับ ดูรายละเอียดด้านล่าง ชุดฟังก์ชันการถ่ายเอกสารมาตรฐานสำหรับวัตถุรูปแบบที่ติดตั้งสามารถใช้งานได้กับวัตถุ zeroinfl ระดับ รวมถึงวิธีการพิมพ์งานทั่วไป สรุป. COEF vcov logLik ส่วนเหลือ ทำนาย ติดตั้ง เงื่อนไข model. matrix ดู predict. zeroinfl สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการทั้งหมด วัตถุของคลาส zeroinfl กล่าวคือรายการที่มีส่วนประกอบรวมถึง

No comments:

Post a Comment