Quti diagramma
Tasviriy statistikada quti diagramma yoki quti chizmasi raqamli maʼlumotlarning joylashuvi, tarqalishi va egrilik guruhlarini ularning kvartillari orqali grafik koʻrsatish usuli hisoblanadi.[1] Quti hududidagi qutiga qoʻshimcha ravishda, qutidan yuqori va pastki kvartillardan tashqaridagi oʻzgaruvchanlikni koʻrsatadigan chiziqlar (ular bakenbarda deb ataladi) boʻlishi mumkin, shuning uchun uchastka quti va bakenbardali uchastka deb ham ataladi. Maʼlumotlar toʻplamining qolgan qismidan sezilarli darajada farq qiluvchi chegaralar qutidagi bakenbardadan tashqari alohida nuqtalar sifatida chizilishi mumkin.[2] Qutidagi chizmalar parametrik emas: ular asosiy statistik taqsimot haqida hech qanday taxminlarsiz statistik populyatsiya namunalarida oʻzgaruvchanlikni koʻrsatadi[3] (garchi Tukeyning qutisi bakenbarda uchun simmetriyani va ularning uzunligi uchun normallikni nazarda tutsada). Quti-syujetning har bir kichik boʻlimidagi intervallar maʼlumotlarning tarqalishi (tarqalishi) va egrilik darajasini koʻrsatadi, ular odatda besh raqamli xulosa yordamida tavsiflanadi. Bunga qoʻshimcha ravishda, quti syujeti turli L-baholovchilarni, xususan, kvartillar oraligʻi, oʻrta diapazon, diapazon, oʻrta diapazon va trimeanni vizual ravishda baholashga imkon beradi. Qutili diagramma gorizontal yoki vertikal ravishda chizilgan boʻlishi mumkin.
Tarixi
tahrirDiapazon-bar usuli birinchi marta Mary Eleanor Spear tomonidan 1952-yilda "Charting Statistics" kitobida[4] va yana 1969-yilda "Amaliy grafik uslublari" kitobida ishlatilgan.[5] Box-and-whisker chizmasi birinchi marta 1970-yilda John Tukey tomonidan kiritilgan bo'lib, u keyinchalik 1977-yilda "Exploratory Data Analysis" kitobida nashr etilgan.[6]
Elementlari
tahrirQuti diagramma - bu besh raqamli xulosaga asoslangan ma'lumotlar to'plamini ko'rsatishning standartlashtirilgan usuli: minimal, maksimal, namunaviy mediana va birinchi va uchinchi kvartillar.
- Minimal (Q0 yoki 0 foizli): maʼlumotlar toʻplamidagi eng past maʼlumotlar nuqtasi, har qanday chegaradan tashqari.
- Maksimal (Q4 yoki 100 foizli): ma'lumotlar to'plamidagi eng yuqori ma'lumotlar nuqtasi, har qanday o'zgaruvchanlikdan tashqari.
- Median (Q2 yoki 50-persentil): ma'lumotlar to'plamidagi o'rta qiymat.
- Birinchi kvartil (Q1 yoki 25 foizli): pastki kvartil qn (0,25) sifatida ham tanilgan, bu maʼlumotlar toʻplamining pastki yarmining medianasidir.
- Uchinchi kvartil (Q3 yoki 75 foizli): yuqori kvartil qn(0,75) sifatida ham tanilgan, bu ma’lumotlar toʻplamining yuqori yarmining medianasidir.
Quti uchastkasini qurish uchun foydalaniladigan minimal va maksimal qiymatlarga qo'shimcha ravishda, quti uchastkasini olish uchun ishlatilishi mumkin bo'lgan yana bir muhim element quyida ko'rsatilganidek, kvartillararo diapazondir (IQR):
- Kvartillararo diapazon (IQR) : yuqori va pastki kvartillar orasidagi masofa:
Misollar
tahrirCheksiz misollar
tahrirKun davomida bir qator soatlik harorat Farengeyt darajasida oʻlchandi. Yozilgan qiymatlar quyidagi tartibda keltirilgan (°F): 57, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81.
Maʼlumotlar toʻplamining quti chizmasi birinchi navbatda ushbu maʼlumotlar toʻplamining beshta tegishli qiymatini hisoblash orqali yaratilishi mumkin: minimal, maksimal, median (Q2), birinchi kvartil (Q1) va uchinchi kvartil (Q3).
Minimal — maʼlumotlar toʻplamining eng kichik soni. Bunday holda, minimal qayd etilgan kunlik harorat 57 ° F ni tashkil qiladi. Maksimal - maʼlumotlar toʻplamining eng katta soni. Bunday holda, maksimal qayd etilgan kunlik harorat 81 ° F ni tashkil qiladi. Median — bu tartiblangan maʼlumotlar toʻplamining „oʻrta“ raqami. Bu shuni anglatadiki, elementlarning aniq 50 % medianadan kichikroq va elementlarning 50 % medianadan kattaroqdir. Ushbu tartiblangan maʼlumotlar toʻplamining mediani 70 ° F.
Birinchi kvartil qiymati (Q1 yoki 25 foiz) buyurtma qilingan maʼlumotlar toʻplamining toʻrtdan birini belgilaydigan raqamdir. Boshqacha qilib aytganda, birinchi kvartildan kichik boʻlgan elementlarning aniq 25 % va undan katta boʻlgan elementlarning aniq 75 % mavjud. Birinchi kvartil qiymatini minimal va mediana orasidagi „oʻrta“ raqamni topish orqali osongina aniqlash mumkin. Soatlik haroratlar uchun 57 °F va 70 °F orasida topilgan „oʻrta“ raqam 66 °F ni tashkil qiladi.
Uchinchi kvartil qiymati (Q3 yoki 75-persentil) buyurtma qilingan maʼlumotlar toʻplamining toʻrtdan uch qismini belgilaydigan raqamdir. Boshqacha qilib aytganda, uchinchi kvartildan kichik boʻlgan elementlarning aniq 75 % va undan katta boʻlgan elementlarning 25 % mavjud. Uchinchi kvartil qiymatini median va maksimal oʻrtasidagi „oʻrta“ raqamni topish orqali osongina olish mumkin. Soatlik haroratlar uchun 70 ° F va 81 ° F orasidagi „oʻrta“ raqam 75 ° F ni tashkil qiladi.
Kvartallararo diapazonni yoki IQRni uchinchi kvartil qiymatidan (Q3) birinchi kvartil qiymatini (Q1) ayirish yoʻli bilan hisoblash mumkin:
Shuning uchun
Uchinchi kvartildan yuqori 1,5 IQR:
Birinchi kvartildan past 1,5 IQR :
Qutidagi uchastkaning yuqori moʻylov chegarasi uchinchi kvartildan 1,5 IQR yuqori boʻlgan eng katta maʼlumotlar qiymatidir. Bu yerda uchinchi kvartildan 1,5 IQR 88,5 °F va maksimal 81 °F ni tashkil qiladi. Shuning uchun, yuqori moʻylov 81 ° F boʻlgan maksimal qiymatda chiziladi. Xuddi shunday, quti uchastkasining pastki moʻylov chegarasi birinchi kvartildan 1,5 IQR ostida boʻlgan eng kichik maʼlumotlar qiymatidir. Bu yerda birinchi kvartildan pastda 1,5 IQR 52,5 °F, minimal esa 57 °F. Shuning uchun, pastki moʻylov 57 ° F boʻlgan minimal qiymatda chiziladi.
Chegarali misollar
tahrirYuqorida istisnosiz misol keltirilgan. Bu yerda chegaraviy qiymatlar bilan quti chizmasini yaratish uchun keyingi misol:
Ro'yxatga olingan haroratlar uchun tartiblangan to'plam (°F): 52, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75 , 76, 76, 78, 79, 89. Ushbu misolda faqat birinchi va oxirgi raqam o'zgartiriladi. Median, uchinchi chorak va birinchi chorak bir xil bo'lib qoladi.
Bunday holda, ushbu ma'lumotlar to'plamidagi maksimal qiymat 89 ° F va uchinchi kvartildan 1,5 IQR 88,5 ° F ni tashkil qiladi. Maksimal qiymat 1,5 IQR va uchinchi kvartildan kattaroqdir, shuning uchun maksimal chegara hisoblanadi. Shuning uchun, yuqori mo'ylov uchinchi kvartildan 1,5 IQR dan kichikroq eng katta qiymatda chiziladi, bu 79 ° F.
Xuddi shunday, ushbu ma'lumotlar to'plamidagi minimal qiymat 52 °F va birinchi kvartildan pastda 1,5 IQR 52,5 °F. Minimal 1,5 IQR minus birinchi kvartildan kichikroq, shuning uchun minimal qiymat ham chetga chiqadi. Shuning uchun, pastki mo'ylov birinchi kvartildan 1,5 IQR dan kattaroq eng kichik qiymatda chiziladi, bu 57 ° F.
Katta maʼlumot toʻplamlari
tahrirKoʻp sonli maʼlumotlar nuqtalarini oʻz ichiga olgan maʼlumotlar toʻplamidan quti syujetini olish uchun qoʻshimcha misol:
Empirik kvantlarni hisoblash uchun umumiy tenglama
tahrir- Ushbu maʼlumotlar nuqtalarining umumiy tartibini bildiradi.
Yuqoridagi misoldan foydalanib, 24 ta maʼlumot nuqtasi (n = 24), medianani, birinchi va uchinchi kvartilni matematik yoki vizual tarzda hisoblash mumkin. Mediana :
Birinchi kvartil :
Uchinchi kvartil :
Vizualizatsiya
tahrirGarchi quti syujetlari gistogramma yoki yadro zichligi taxminlaridan ko'ra ibtidoiy ko'rinishi mumkin bo'lsa-da, ular bir qator afzalliklarga ega. Birinchidan, quti diagrammasi statistiklarga bir yoki bir nechta ma'lumotlar to'plamida tezkor grafik tekshiruv o'tkazish imkonini beradi.
Qutidagi chizmalar ham kamroq joy egallaydi va shuning uchun bir nechta guruhlar yoki ma'lumotlar to'plami o'rtasidagi taqsimotlarni parallel ravishda solishtirish uchun ayniqsa foydalidir.
Nihoyat, gistogrammalarning umumiy tuzilishi va yadro zichligi bahosi mos ravishda qutilarning soni va kengligi texnikasini tanlash va tarmoqli kengligi tanlash bilan kuchli ta'sir qilishi mumkin.
Statistik taqsimotni ko'rib chiqish quti grafigiga qaraganda keng tarqalgan bo'lsa-da, normal N(0,s2) taqsimot uchun quti grafigini ehtimollik zichligi funksiyasi (nazariy gistogramma) bilan solishtirish va ularning xususiyatlarini bevosita kuzatish foydali bo'lishi mumkin.
Manbalar
tahrir- ↑ C., Dutoit, S. H.. Graphical exploratory data analysis.. Springer, 2012. ISBN 978-1-4612-9371-2. OCLC 1019645745.
- ↑ Grubbs, Frank E. (February 1969). „Procedures for Detecting Outlying Observations in Samples“. Technometrics. 11-jild, № 1. 1–21-bet.
- ↑ Richard., Boddy. Statistical Methods in Practice : for Scientists and Technologists.. John Wiley & Sons, 2009.
- ↑ Spear, Mary Eleanor. Charting Statistics. McGraw Hill, 1952 — 166-bet.
- ↑ Spear, Mary Eleanor.. Practical charting techniques. New York: McGraw-Hill, 1969. ISBN 0070600104. OCLC 924909765.
- ↑ Wickham, Hadley; Stryjewski, Lisa „40 years of boxplots“. Qaraldi: 24-dekabr 2020-yil.