В R, каква е разликата между dt (), pt () и qt (), по отношение на разпределението на студент t?


Отговор 1:

Това понякога е объркващо, реших да нарисувам малко картина, за да илюстрирам по-добре отговора си. Подобните функции са за основните разпределения на вероятностите, реализирани в R, и всички работят еднакво, в зависимост от префикса:

d - плътност, добива стойност на функцията на плътност в дадена точка

p - вероятност, дава CDF, т.е. вероятност за връщане на число, по-малко от аргумент на тази функция

q - квантил, обратен CDF, т.е. каква стойност е дадена квантила.

Нека да го обясня по-подробно. Нека разгледаме t разпределението с 30 градуса свобода, което ще бъде близо до нормалното разпределение.

qt (.95,30) ще върне 1,69, което е стойността на 95-ти перцентил от това разпределение. Това означава, че 95% от всички числа в нашето разпространение са по-малко от 1,69, а само 5% са по-големи. Това е обърнат CDF.

По същия начин, ако използвате pt (1.69,30), ще получите резултат, близък до 95%. Тази функция връща CDF, което е вероятност да получите число по-малко или равно на аргумента. Тъй като 1,69 е нашият 95-ти перцентил, стойността на CDF наистина е 95%.

dt (x, 30) ще даде стойност на функцията на плътност на вероятностите в x. За 1,69 е 0,096, което е доста ниско, докато за 0 е 50%.

Имайте предвид, че това не е вероятност да получите това число, За да получите вероятност, трябва да интегрирате функция за плътност в диапазон от стойности. Ето защо функцията на CDF е полезна, тъй като чрез изчисляване на разлика за две стойности можете да получите вероятност да получите число, което попада между тези две числа.


Отговор 2:

Предполагам, че това са функции на t-разпределението на Student и ще отговоря на тази основа.

dt () връща плътността на вероятността на t-разпределението за дадени степени на свобода. Мога да нарисувам t-разпределението с 9 градуса за свобода и да го покажа, както следва:

Това дава:

pt () дава опасните вероятности. Да предположим, че правите тест с по-ниска опашка и статистическата ви стойност на теста е равна на -2,75 със същите степени на свобода. След това можете да изчислите долната вероятност за опашка, както следва:

pt (-2,75, df = 9, по-нисък.tail = TRUE)

И вашият отговор е:

0.0112

Така че отхвърляте нулата си на 5%, но не на 1%, но сте близо.

qt () е обратната функция на t, която дава вероятност и получава квантил на t-разпределението обратно. Да предположим, че сте искали 99% интервал на доверие. Това ще остави 0,005 и в двата опашки (1 - 0,99) / 2. Тъй като използвах таблици, които преминаха от минус безкрайност до t, бих изчислил този квантил като:

qt (0.995, df = 9, по-нисък.tail = ИСТИНСКИ)

[1] 3.249836

>