ตัวเลือกไบนารีตอนนี้ ฉะเชิงเทรา: ศูนย์ ที่สูงเกินจริง ไบนารี ตัวเลือก

ข้อสังเกต: คุณกำลังดูหน้าเว็บเวอร์ชันเก่า เนื้อหาใหม่สามารถพบได้ในโดเมนใหม่ของเรา stats. idre. ucla. edu นอกจากนี้คุณยังสามารถล้างแคชของเบราว์เซอร์และรีเฟรชหน้านี้ซึ่งควรเปลี่ยนเส้นทางคุณไปยังเนื้อหาที่อัปเดตโดยตรง ยินดีต้อนรับสู่สถาบันการศึกษาดิจิทัลและการศึกษา R Data Analysis ตัวอย่าง: Zero-Inflated Negative Binomial Regression การถดถอยเชิงลบแบบพหุคูณแบบไม่ขึ้นกับศูนย์เป็นศูนย์สำหรับการสร้างแบบจำลองตัวแปรนับที่มีศูนย์มากเกินไปและโดยปกติแล้วสำหรับตัวแปรผลลัพธ์ที่นับไม่ถนัด นอกจากนี้ทฤษฎีชี้ให้เห็นว่าค่าศูนย์ส่วนเกินจะถูกสร้างขึ้นโดยกระบวนการแยกจากค่าที่นับและจำนวนศูนย์ส่วนเกินสามารถจำลองได้อย่างอิสระ หน้านี้ใช้แพคเกจต่อไปนี้ ตรวจสอบว่าคุณสามารถโหลดได้ก่อนที่จะพยายามเรียกใช้ตัวอย่างในหน้านี้ ถ้าคุณไม่มีแพ็คเกจติดตั้งให้รัน: install. packages (packagename) หรือถ้าคุณเห็นว่าเวอร์ชันล้าสมัยให้รัน: update. packages () ข้อมูลเกี่ยวกับเวอร์ชั่น: รหัสสำหรับหน้านี้ได้รับการทดสอบใน R version 3.1.1 (2014-07-10) วันที่: 2014-08-11 ด้วย: boot 1.3-11 knitr 1.6 pscl 1.04.4 vcd 1.3-1 gam 1.09.1 coda 0.16-1 mvtnorm 1.0-0 GGally 0.4.7 plyr 1.8.1 MASS 7.3-33 Hmisc 3.14-4 สูตร 1.1-2 การอยู่รอด 2.37-7 psych 1.4.5 reshape2 1.4 msm 1.4 phia 0.1-5 RColorBrewer 1.0-5 effects 3.0- 0 colorspace 1.2-4 lattice 0.20-29 pequod 0.0-3 car 2.0-20 ggplot2 1.0.0 โปรดทราบ: วัตถุประสงค์ของหน้านี้เพื่อแสดงวิธีการใช้คำสั่งการวิเคราะห์ข้อมูลต่างๆ ไม่ครอบคลุมทุกด้านของกระบวนการวิจัยที่นักวิจัยคาดว่าจะทำ โดยเฉพาะอย่างยิ่งไม่ครอบคลุมถึงการทำความสะอาดและการตรวจสอบข้อมูลการยืนยันสมมติฐานการวิเคราะห์แบบจำลองหรือการวิเคราะห์ติดตามผลที่เป็นไปได้ ตัวอย่างของการถดถอยสองค่าที่เป็นลบขั้วโลกตัวอย่างที่ 1 ผู้บริหารโรงเรียนศึกษาพฤติกรรมการเข้าชั้นเรียนของนักเรียนชั้นมัธยมศึกษาตอนต้นที่โรงเรียนสองแห่ง ตัวทำนายของจำนวนวันที่ขาดเรียนรวมถึงเพศของนักเรียนและคะแนนการทดสอบมาตรฐานในวิชาคณิตศาสตร์และภาษาศาสตร์ ตัวอย่างที่ 2 นักชีววิทยาสัตว์ป่าของรัฐต้องการหาจำนวนปลาที่ชาวประมงจับได้ที่อุทยานแห่งชาติ ผู้เข้าชมถูกถามว่าพวกเขาพักอยู่กี่วันมีกลุ่มเด็กกี่คนและมีปลากี่ตัวที่ถูกจับได้ ผู้เข้าชมบางรายไม่ตกปลา แต่ไม่มีข้อมูลว่าใครเป็นคนตกปลาหรือไม่ ผู้เข้าชมบางรายที่ทำปลาไม่จับปลาใด ๆ จึงมีจำนวนศูนย์ที่เกินในข้อมูลเนื่องจากคนที่ไม่ได้เป็นปลา คำอธิบายของข้อมูลให้ตัวอย่างที่ 2 จากด้านบน เรามีข้อมูลเกี่ยวกับ 250 กลุ่มที่ไปที่สวนสาธารณะ แต่ละกลุ่มได้รับคำถามเกี่ยวกับจำนวนปลาที่จับได้ (เด็ก) จำนวนเด็กที่อยู่ในกลุ่ม (เด็ก) จำนวนคนในกลุ่ม (คน) และพวกเขาพาค่ายไปเที่ยวสวน (ค่ายพักแรม) หรือไม่ . นอกเหนือไปจากการคาดการณ์จำนวนปลาที่จับได้แล้วยังมีความสนใจในการคาดการณ์การมีอยู่ของศูนย์ส่วนเกินนั่นคือความเป็นไปได้ที่กลุ่มจะจับปลาที่เป็นศูนย์ เราจะใช้ตัวแปรเด็ก บุคคล และค่ายพักแรมในรูปแบบของเรา ให้ดูที่ข้อมูล วิธีการวิเคราะห์ที่คุณอาจพิจารณาก่อนที่เราจะแสดงวิธีที่คุณสามารถวิเคราะห์สิ่งนี้ด้วยการวิเคราะห์เชิงลบแบบไม่เป็นศูนย์เชิงบวก 0 ให้พิจารณาวิธีอื่น ๆ ที่คุณอาจใช้ การถดถอย OLS - คุณอาจลองวิเคราะห์ข้อมูลเหล่านี้โดยใช้การถดถอย OLS อย่างไรก็ตามข้อมูลจำนวนมากไม่เป็นไปตามปกติและไม่ได้ประมาณด้วยการถดถอยของ OLS การถดถอย Poisson แบบพองด้วยศูนย์ - การถดถอย Poisson แบบพองตัวจะไม่ดีขึ้นเมื่อข้อมูลไม่ได้ถูกแทนที่อย่างมากเช่นเมื่อความแปรปรวนไม่มากไปกว่าค่าเฉลี่ย แบบจําลองแบบจําลอง - โมเดล Poisson หรือรูปแบบไบนารีเชิงลบอาจเหมาะสมกว่าถ้าไม่มีค่าศูนย์ส่วนเกิน การถดถอยสองค่าแบบพหุคูณที่ให้เป็นศูนย์ 0 รูปแบบที่เพิ่มขึ้นเป็นศูนย์ถือว่าสมมติฐานว่าไม่มีผลลัพธ์เป็นเพราะกระบวนการที่แตกต่างกันสองแบบ ตัวอย่างเช่นในตัวอย่างของการประมงที่นำเสนอในที่นี้กระบวนการทั้งสองมีอยู่ว่าเรื่องได้ตกปลาไปแล้วไม่ใช่การตกปลา หากไม่ได้ไปตกปลาผลที่เป็นไปได้ก็คือศูนย์ ถ้าไปตกปลาก็นับเป็นกระบวนการนับ ส่วนสองส่วนของรูปแบบที่ไม่มีการขยายตัวเป็นศูนย์เป็นแบบจำลองไบนารีซึ่งโดยปกติจะเป็นแบบจำลอง logit เพื่อสร้างแบบจำลองของกระบวนการทั้งสองซึ่งเป็นศูนย์ผลลัพธ์ที่เกี่ยวข้องและรูปแบบการนับในกรณีนี้เป็นรูปแบบสองทางลบเพื่อจำลองจำนวน กระบวนการ. จำนวนที่คาดหวังจะแสดงเป็นชุดของทั้งสองกระบวนการ ลองนึกถึงการตกปลาอีกครั้ง: เพื่อให้เข้าใจการถดถอยสองชั้นแบบลบที่เพิ่มขึ้น 0 ขั้วโลกให้เริ่มต้นด้วยรูปแบบไบนารีเชิงลบ มีหลาย parameterizations ของรูปแบบสองทางลบเราเน้น NB2 ฟังก์ชันความหนาแน่นของค่าความคลาดสองตัวเป็นลบคือ: (p) คือความน่าจะเป็นของความสำเร็จ (r) จากนี้เราจะได้รับฟังก์ชั่นโอกาสที่จะได้รับโดย: ที่นี่เราพบความเป็นไปได้ของค่าที่คาดหวัง (mu) ให้ข้อมูลและ (alpha) ซึ่งช่วยในการกระจายตัว โดยปกติแล้วจะแสดงเป็นโอกาสในการบันทึกซึ่งแสดงโดยสคริปต์ L (mathcal): ซึ่งสามารถแสดงในรูปแบบของเราได้โดยแทนที่ (mui) ด้วย (exp (xi beta)) เมื่อเปลี่ยนกลับเป็นรูปแบบค่าลบคูณสองที่เป็นศูนย์การแสดงออกของฟังก์ชันความเป็นไปได้ขึ้นอยู่กับว่าค่าที่สังเกตได้เป็นศูนย์หรือมากกว่าศูนย์ จากรูปแบบโลจิสติกของ (yi 1) เทียบกับ (y0): สุดท้ายให้สังเกตว่า R ไม่ได้ประมาณ (alpha) แต่ (theta), ผกผันของ (alpha) ตอนนี้ช่วยสร้างโมเดลของเราขึ้น เราจะใช้ตัวแปรเด็กและค่ายเพื่อสร้างแบบจำลองการนับในส่วนของโมเดลสองค่าลบและตัวแปรคนในส่วน logit ของแบบจำลอง เราใช้ pscl เพื่อเรียกใช้การถดถอยเชิงลบสองขั้วที่พองตัว เราเริ่มต้นด้วยการประมาณแบบจำลองที่มีตัวแปรที่น่าสนใจ ผลลัพธ์มีลักษณะคล้ายกับผลลัพธ์จากการถดถอยสองแบบของ OLS ใน R. ด้านล่างของการเรียกแบบจำลองคุณจะพบกลุ่มผลลัพธ์ที่มีค่าสัมบูรณ์ถดถอยเชิงลบสำหรับแต่ละตัวแปรพร้อมกับข้อผิดพลาดมาตรฐาน z-score และค่า p สำหรับค่าสัมประสิทธิ์ บล็อกที่สองเป็นไปตามรูปแบบเงินเฟ้อ ซึ่งรวมถึงค่าสัมประสิทธิ์ของ logit สำหรับทำนายค่าศูนย์ส่วนเกินพร้อมกับข้อผิดพลาดมาตรฐาน z-score และค่า p-value ตัวทำนายทั้งหมดในส่วนที่นับและอัตราเงินเฟ้อของแบบจำลองมีนัยสำคัญทางสถิติ โมเดลนี้เหมาะกับข้อมูลที่ดีกว่าโมเดลที่เป็นโมฆะนั่นคือแบบจำลองการสกัดกั้นเพียงอย่างเดียว เพื่อแสดงให้เห็นว่าเป็นกรณีนี้เราสามารถเปรียบเทียบกับรูปแบบปัจจุบันเป็นแบบโมฆะโดยไม่ต้องใช้ตัวพยากรณ์โดยใช้การทดสอบไคสแควร์ที่มีความแตกต่างของความเป็นไปได้ในการบันทึก จากผลลัพธ์ข้างต้นเราจะเห็นว่าโมเดลโดยรวมของเรามีนัยสำคัญทางสถิติ โปรดทราบว่าผลลัพธ์ของรูปแบบข้างต้นไม่ได้ระบุในรูปแบบใด ๆ หากรูปแบบที่ไม่มีการขยายศูนย์ของเราคือการปรับปรุงโดยการถดถอยสองค่ามาตรฐานเชิงลบ เราสามารถตรวจสอบได้โดยการเรียกใช้โมเดลสองค่ามาตรฐานที่เป็นค่าลบซึ่งสอดคล้องกันแล้วทำการทดสอบ Vuong ของทั้งสองโมเดล เราใช้แพคเกจ MASS เพื่อเรียกใช้การถดถอยเชิงลบสองมาตรฐานมาตรฐาน ตัวทำนายเด็กและค่ายพักแรมในส่วนของรูปแบบการถดถอยเชิงลบสองทางที่ทำนายจำนวนปลาที่จับได้ (ตัวนับ) เป็นตัวบ่งชี้ที่มีนัยสำคัญ คนทำนายในส่วนของรูปแบบ logit ที่ทำนายศูนย์มากเกินไปมีนัยสำคัญทางสถิติ สำหรับข้อมูลเหล่านี้การเปลี่ยนแปลงที่คาดไว้ในบันทึก (จำนวน) สำหรับการเพิ่มขึ้นของจำนวนหนึ่งหน่วยต่อลูกคือ -1.515255 ที่มีตัวแปรคงที่อื่น ๆ ค่ายพักแรม (ค่ายพักแรม 1) มีจำนวนไม้ที่คาดว่าจะสูงกว่าของผู้ที่ไม่ได้พักแรม (ค่ายพักแรม 0) ที่มีค่าคงที่อื่น ๆ อยู่ที่ 0.879051 อัตราการเข้าสู่ระบบของการเป็นศูนย์มากเกินไปจะลดลง 1.67 สำหรับทุกคนเพิ่มเติมในกลุ่ม กล่าวอีกนัยหนึ่งผู้คนในกลุ่มมีโอกาสน้อยที่ศูนย์จะไม่ตกปลา พูดได้ชัดว่ายิ่งกลุ่มคนที่อยู่ในนั้นใหญ่เท่าไรก็ยิ่งมีแนวโน้มว่าจะมีคนไปตกปลา การทดสอบ Vuong แสดงให้เห็นว่าแบบจำลองสองค่าลบที่เพิ่มขึ้นเป็นศูนย์เป็นการปรับปรุงที่สำคัญกว่าแบบจำลองสองขั้วมาตรฐาน เราจะได้รับช่วงความเชื่อมั่นสำหรับพารามิเตอร์และพารามิเตอร์ exponentiated โดยใช้ bootstrapping สำหรับรูปแบบไบนารีเชิงลบนี้จะเป็นอัตราส่วนความเสี่ยงที่เกิดขึ้นสำหรับรูปแบบอัตราเงินเฟ้อเป็นศูนย์อัตราต่อรอง เราใช้ชุดบูต อันดับแรกเราจะได้ค่าสัมประสิทธิ์จากรูปแบบเดิมของเราเพื่อใช้เป็นค่าเริ่มต้นสำหรับรูปแบบเพื่อเพิ่มความเร็วในการประมาณเวลา จากนั้นเราเขียนฟังก์ชันสั้น ๆ ที่ใช้ข้อมูลและดัชนีเป็นอินพุทและส่งกลับค่าพารามิเตอร์ที่เราสนใจในที่สุดเราจะส่งผ่านไปยังฟังก์ชันการบูตและทำซ้ำ 1200 ครั้งโดยใช้หิมะเพื่อแจกจ่ายไปทั่วทั้งสี่แกน โปรดทราบว่าคุณควรปรับจำนวนแกนให้ตรงกับที่เครื่องของคุณมีอยู่ นอกจากนี้สำหรับผลลัพธ์สุดท้ายหนึ่งอาจต้องการเพิ่มจำนวน replications เพื่อช่วยให้มั่นใจผลมั่นคง ผลลัพธ์คือค่าประมาณสลับและข้อผิดพลาดมาตรฐาน นั่นคือแถวแรกมีการประมาณค่าพารามิเตอร์แรกจากโมเดลของเรา ข้อที่สองมีข้อผิดพลาดมาตรฐานสำหรับพารามิเตอร์ตัวแรก คอลัมน์ที่สามประกอบด้วยข้อผิดพลาดมาตรฐาน bootstrapped ซึ่งมีขนาดใหญ่กว่าที่ประเมินโดย zeroinfl ตอนนี้เราจะได้รับช่วงความเชื่อมั่นสำหรับพารามิเตอร์ทั้งหมด เราเริ่มต้นในระดับเดิมที่มี CIs ที่ปรับแล้วและมีความลำเอียง เรายังเปรียบเทียบผลลัพธ์เหล่านี้กับช่วงความเชื่อมั่นปกติตามข้อผิดพลาดมาตรฐาน ช่วงความมั่นใจในการบูตเป็นอย่างมากกว้างกว่าค่าประมาณตามปกติ CIs bootstrapped มีความสอดคล้องกับ CIs มากขึ้นจาก Stata เมื่อใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ ตอนนี้เราสามารถประมาณอัตราส่วนความเสี่ยงที่เกิดขึ้น (IRR) สำหรับโมเดลสองค่าลบและอัตราเดิมพัน (OR) สำหรับโมเดลโลจิสติก (zero inflation) นี้จะทำโดยใช้รหัสเหมือนกันเกือบเหมือนก่อน แต่ผ่านฟังก์ชันการแปลงไปยังอาร์กิวเมนต์ h ของ boot. ci. ในกรณีนี้ exp เพื่อ exponentiate เพื่อให้เข้าใจรูปแบบของเราได้ดีขึ้นเราสามารถคำนวณจำนวนปลาที่คาดว่าจะได้จากการคาดการณ์ของเรา ในความเป็นจริงเนื่องจากเรากำลังทำงานร่วมกับตัวทำนายแบบแบ่งหมวดหมู่เราสามารถคำนวณค่าที่คาดไว้สำหรับชุดค่าผสมทั้งหมดโดยใช้ฟังก์ชัน expand. grid เพื่อสร้างชุดค่าผสมทั้งหมดและทำนายฟังก์ชันที่จะทำ สุดท้ายเราสร้างกราฟ สิ่งที่ต้องพิจารณาต่อไปนี้เป็นประเด็นที่คุณอาจต้องการพิจารณาในระหว่างการวิเคราะห์งานวิจัยของคุณ คำถามเกี่ยวกับพารามิเตอร์ over-dispersion โดยทั่วไปเป็นเรื่องที่ยุ่งยาก พารามิเตอร์การกระจายตัวที่มีขนาดใหญ่อาจเกิดจากรูปแบบที่ไม่ได้ระบุหรืออาจเกิดจากกระบวนการจริงที่มีการกระจายตัวมากกว่า การเพิ่มปัญหาการกระจายตัวสะกดไม่จำเป็นต้องปรับปรุงโมเดลที่ไม่ได้ระบุ แบบจำลองสองค่าที่เป็นค่าลบของพหุคูณที่พองตัวมีสองส่วนคือรูปแบบการนับจำนวนไบนารีในเชิงลบและโมเดล logit สำหรับทำนายค่าศูนย์ส่วนเกินดังนั้นคุณอาจต้องการตรวจสอบหน้าตัวอย่างการวิเคราะห์ข้อมูลดังกล่าวการถดถอยสองด้านและการถดถอยลอการิทึม Logit Regression เนื่องจากศูนย์พหุคูณแบบลบจะมีรูปแบบการนับและรูปแบบ logit แต่ละรูปแบบทั้งสองควรมีตัวพยากรณ์ที่ดี ทั้งสองรุ่นไม่จำเป็นต้องใช้ตัวทำนายเดียวกัน ปัญหาของการทำนายที่สมบูรณ์แบบการแยกหรือการแยกชิ้นส่วนอาจเกิดขึ้นได้ในส่วนโลจิสติกของแบบจำลองที่ไม่มีศูนย์ ข้อมูลจำนวนมากมักใช้ตัวแปรการเปิดเผยเพื่อระบุจำนวนครั้งที่เหตุการณ์อาจเกิดขึ้น คุณสามารถรวมการเปิดรับแสง (หรือที่เรียกว่าออฟเซต) ลงในโมเดลโดยใช้ฟังก์ชันชดเชย () ไม่แนะนำให้ใช้โมเดลสองค่าเชิงลบที่มีการขยายตัวเป็นศูนย์สำหรับตัวอย่างขนาดเล็ก สิ่งที่ถือว่าเป็นตัวอย่างเล็ก ๆ ดูเหมือนจะไม่ได้ถูกกำหนดไว้อย่างชัดเจนในวรรณคดี ค่า Pseudo-R-squared แตกต่างจาก OLS R-squareds โปรดดูคำถามที่พบบ่อย: อะไรคือ Pseudo R-squareds สำหรับการอภิปรายในหัวข้อนี้ R คู่มือการอ้างอิงออนไลน์ Long, J. S. 1997. โมเดลการถดถอยสำหรับตัวแปรจำแนกตามประเภทและ จำกัด Thousand Oaks, CA: สิ่งพิมพ์ Sage Everitt, BS และ Hothorn, T. คู่มือการวิเคราะห์ทางสถิติโดยใช้ R เนื้อหาของเว็บไซต์นี้ไม่ควรตีความว่าเป็นการรับรองเว็บไซต์ใด ๆ หนังสือหรือผลิตภัณฑ์ซอฟต์แวร์โดยมหาวิทยาลัยแห่งแคลิฟอร์เนีย GENMOD Procedure Zero - โมเดลที่พองตัวนับข้อมูลที่มีอุบัติการณ์ของศูนย์น้อยกว่าที่คาดไว้สำหรับการกระจายความน่าจะเป็นพื้นฐานของจำนวนสามารถจำลองด้วยการกระจายศูนย์ที่สูงเกินจริง ใน GENMOD การแจกจ่ายที่อ้างอิงสามารถเป็นได้ทั้งแบบปัวซองหรือแบบลบ ดู Lambert (1992), Long (1997) และคาเมรอนและ Trivedi (1998) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบที่ศูนย์พองตัว ประชากรประกอบด้วยสองประเภทของบุคคล ประเภทแรกจะให้ค่า Poisson หรือจำนวนการแจกไพ่ที่เป็นค่าลบของ Binomial ซึ่งอาจมีศูนย์ ประเภทที่สองจะให้จำนวนศูนย์เสมอ อนุญาตให้มีการแจกแจงต้นแบบหมายถึงและเป็นความน่าจะเป็นของการเป็นบุคคลประเภทที่สอง พารามิเตอร์นี้เรียกว่าความเป็นไปได้เป็นศูนย์อัตราเงินเฟ้อ และเป็นความน่าจะเป็นของการนับเป็นศูนย์ในส่วนที่เกินจากความถี่ที่คาดการณ์ไว้โดยการแจกแจงต้นแบบ คุณสามารถขอให้มีการแสดงความเป็นไปได้เป็นศูนย์อัตราเงินเฟ้อในชุดข้อมูลขาออกที่มีคำหลัก PZERO การแจกแจงความเป็นไปได้ของตัวแปรสุ่ม Poisson แบบขยายตัวที่ศูนย์ 0 จะถูกกำหนดโดยและการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเชิงลบสองข 0 จะถูกกำหนดโดยที่ k คือพารามิเตอร์การแจกแจงแบบสองชั้นในเชิงลบ โดยที่ h คือหนึ่งในฟังก์ชันการเชื่อมโยงแบบไบนารี: logit, probit หรือ log-log เพิ่มเติม ฟังก์ชัน link h คือลิงค์ logit โดยค่าเริ่มต้นหรือฟังก์ชัน link function ระบุไว้ในคำสั่ง ZEROMODEL ฟังก์ชันการเชื่อมโยง g คือฟังก์ชันการเชื่อมโยงล็อกตามค่าดีฟอลต์หรือฟังก์ชันการเชื่อมโยงที่ระบุไว้ในคำสั่ง MODEL สำหรับทั้งสองแบบปัวซองและไบนารีเชิงลบ ตัวแปรร่วมสำหรับการสังเกต i ถูกกำหนดโดยรูปแบบที่ระบุในคำสั่ง ZEROMODEL และตัวแปรร่วมจะถูกกำหนดโดยรูปแบบที่ระบุในคำสั่ง MODEL พารามิเตอร์การถดถอยและประมาณด้วยความเป็นไปได้สูงสุด ค่าเฉลี่ยและความแปรปรวนของ Y สำหรับปัวซองที่เพิ่มขึ้นเป็นศูนย์จะได้รับโดยและสำหรับ binomial เชิงลบที่ไม่เติมศูนย์โดยคุณสามารถขอให้ค่าเฉลี่ยของ Y แสดงผลสำหรับการสังเกตแต่ละครั้งในชุดข้อมูลที่ส่งออกด้วย PRED keyword. zeroinfl: Zero อาร์กิวเมนต์การนับถอยหลังของข้อมูลนับถอยหลังถูกส่งผ่านไปยัง zeroinfl. control ในการตั้งค่าเริ่มต้น รูปแบบการนับที่ไม่เติมด้วยศูนย์คือแบบจำลองการผสมแบบสององค์ประกอบซึ่งรวมมวลจุดที่ศูนย์และมีการแจกแจงที่เหมาะสม ดังนั้นจึงมีสองแหล่งที่มาจากศูนย์: เลขศูนย์อาจมาจากทั้งสองจุดและจากส่วนประกอบนับ โดยปกติแล้วรูปแบบการนับเป็นแบบปัวซองหรือการถดถอยของสองค่าลบ (ด้วยลิงค์ล็อก) การแจกแจงทางเรขาคณิตเป็นกรณีพิเศษของไบนารีเชิงลบที่มีพารามิเตอร์ขนาดเท่ากับ 1. สำหรับการจำลองสถานะที่ไม่ได้สังเกตการณ์ (ศูนย์เทียบกับนับ) จะมีการใช้แบบจำลองไบนารีที่สามารถวัดความเป็นไปได้ที่จะมีอัตราเงินเฟ้อเป็นศูนย์ ในกรณีที่ง่ายที่สุดเฉพาะกับดัก แต่อาจมี regressors สำหรับโมเดลอัตราเงินเฟ้อเป็นศูนย์นี้สามารถใช้โมเดลสองตัวที่มีลิงก์ต่างกันได้โดยทั่วไปคือ logit หรือ probit สูตรนี้สามารถใช้เพื่อระบุส่วนประกอบทั้งสองแบบได้: ถ้ามีการจัดสูตรของ y x1 x2 ให้ใช้ regressors เดียวกันในทั้งสองส่วนประกอบ นี่เท่ากับ y x 1 x 2 x 1 x 2 อาจมีการกำหนดชุด regressors ที่แตกต่างกันสำหรับองค์ประกอบนับและองค์ประกอบอัตราเงินเฟ้อเป็นศูนย์เช่น y x1 x2 z1 z2 z3 ให้รูปแบบข้อมูลนับ y x1 x2 ตามเงื่อนไข () รูปแบบศูนย์เงินเฟ้อ y z1 z2 z3 แบบจำลองเงินเฟ้อง่ายๆที่นับเป็นศูนย์ทั้งหมดมีความเป็นไปได้เหมือนกันกับขององค์ประกอบศูนย์สามารถระบุได้โดยสูตร y ค่าออฟเซ็ทสามารถระบุได้ทั้งสององค์ประกอบของรูปแบบที่เกี่ยวข้องกับรูปแบบการนับและอัตราเงินเฟ้อเป็นศูนย์: y x1 offset (x2) z1 z2 offset (z3) โดยที่ x2 ใช้เป็นค่าชดเชย (กล่าวคือมีสัมประสิทธิ์คงที่ถึง 1) ในองค์ประกอบที่นับและ z3 analogously ในองค์ประกอบ zero-inflation ตามกฎที่ระบุข้างต้น y x1 offset (x2) ถูกขยายไปเป็น y x1 offset (x2) x1 offset (x2) แทนที่จะใช้ wrapper offset () ภายในสูตร อาร์กิวเมนต์ชดเชยยังสามารถใช้ซึ่งกำหนดค่าชดเชยเฉพาะสำหรับรูปแบบการนับ ดังนั้นสูตร y x1 และออฟเซต x2 เท่ากับสูตร y x1 offset (x2) x1 พารามิเตอร์ทั้งหมดจะถูกประมาณด้วยความเป็นไปได้สูงสุดโดยใช้ optim มีตัวเลือกการควบคุมที่ตั้งไว้ใน zeroinfl. control ค่าเริ่มต้นสามารถจัดทำโดยประมาณตามอัลกอริทึม EM (ความคาดหวังสูงสุด) หรือโดย glm. fit (ค่าเริ่มต้น) ข้อผิดพลาดมาตรฐานมาจากตัวเลขโดยใช้เมทริกซ์ Hessian ที่ส่งกลับโดย optim ดูรายละเอียดจาก zeroinfl. control วัตถุแบบจำลองพอดีกลับเป็นของ zeroinfl ชั้นและคล้ายกับวัตถุ glm ติดตั้ง สำหรับองค์ประกอบเช่นค่าสัมประสิทธิ์หรือเงื่อนไขรายการจะถูกส่งกลับพร้อมกับองค์ประกอบสำหรับศูนย์และส่วนประกอบนับตามลำดับ ดูรายละเอียดด้านล่าง ชุดฟังก์ชันการถ่ายเอกสารมาตรฐานสำหรับวัตถุรูปแบบที่ติดตั้งสามารถใช้งานได้กับวัตถุ zeroinfl ระดับ รวมถึงวิธีการพิมพ์งานทั่วไป สรุป. COEF vcov logLik ส่วนเหลือ ทำนาย ติดตั้ง เงื่อนไข model. matrix ดู predict. zeroinfl สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการทั้งหมด วัตถุของคลาส zeroinfl กล่าวคือรายการที่มีส่วนประกอบรวมถึง

ตัวเลือกไบนารีตอนนี้ ฉะเชิงเทรา

Monday, 21 August 2017

ศูนย์ ที่สูงเกินจริง ไบนารี ตัวเลือก

No comments:

Post a Comment