Задачи для самостоятельного решения

Методы математической статистики

Коэффициент корреляции.

Величина cov(x;h) зависит от единиц измерения, в которых выражаются x и h. (Например, пусть x и h—линейные размеры некоторой детали. Если за единицу измерения принять 1 см, то cov(x;h) примет одно значение, а если за единицу измерения принять 1 мм, то cov(x;h) примет другое, большее значение (при условии cov(x;h)¹0)). Поэтому cov(x;h) неудобно принимать за показатель связи.

Чтобы иметь дело с безразмерным показателем, рассмотрим случайные величины

Такие случайные величины называются нормированными отклонениями случайных величин x и h.

Каждая из случайных величин x* и h* имеет центром (математическое ожидание) нуль и дисперсию, равную единице. Приведём доказательство для случайной величины x*.

Ковариация x* и h* называется коэффициентом корреляции случайных величин x и h (обозначается rxh).

 

Для независимых x и h rxh=0, так как в этом случае cov(x;h)=0

Обратного заключения сделать нельзя. Случайные величины могут быть связаны даже функциональной зависимостью (каждому значению одной случайной величины соответствует единственное значение другой случайной величины), но коэффициент их корреляции будет равен нулю.

Примеры:

1. Пусть случайная величина x симметрично распределена около нуля. Тогда Мx=0. Пусть h=x2. Тогда М(x h)=М(x3)=0, так x3 тоже симметрично распределена около нуля. С другой стороны МxМh=0, так как Мx=0. Таким образом .

2. Пусть закон совместного распределения случайных величин x и h задан таблицей

 

h

x

1

2

1

1/5

0

1/5

2

0

3/5

3/5

3

1/5

0

1/5

2/5

3/5

Проведём вычисления:

; ;

; .

Отсюда следует, что rxh=0. При этом очевидно, что имеет место функцио­нальная зависимость случай­ной величины h от случайной величины x.

Коэффициент корреляции rxh не меняет своей величины, если вместо случайной величины x рассматривать случайную величину x1=x+а или x2=kx (а и

 k—постоянные числа, > 0), так как при перемене начала координат или при изменении масштаба величины x нормированное отклонение не меняется. Сказанное в равной мере относится и к h.

Полезно запомнить формулу D(x±h)=Dx+Dh+2cov(x;h). Отсюда следует свойство дисперсии для независимых x и h: D(x±h)=Dx+Dh

Свойства коэффициента корреляции.

–1£rxh£1.

Если rxh=1, то h=kx+b, где k и b—константы, k>0.

Если rxh= –1, то h= kx+b, где k<0.

Если h=kx+b, (k¹0) или x=k1h+b1 (k1¹0), то

rxh=1 при ki>0; rxh= – 1 при ki<0 (i = 1,2).

Коэффициент корреляции rxh достигает своих предельных значений –1 и 1 в том и только в том случае, если все значения x и h концентрируется на некоторой прямой в плоскости x; h, то есть между x и h имеется линейная зависимость.

Если êrxhê<1, то такой линейной зависи­мости нет. Все же по мере приближения êrxhê к единице совместное распреде­ление x; h имеет тенденцию кон­центри­роваться вблизи некото­рой прямой линии и величину êrxhê можно считать мерой близости к полной линейной зависимости между x и h.

Можно дать определение корреляционной зависимости двух случайных величин x и h как связи между тенденциями роста x и h. Например, между x и h существует прямая корреляционная зависимость, если с ростом x случайная величина h имеет тенденцию возрастать. (Это означает, что при больших значениях x с большей вероятностью встречаются большие значения h). Если большим значениям x с большей вероятностью соответствуют меньшие значения h, то есть с ростом x случайная величина h имеет тенденцию убывать, говорят, что между x и h существует обратная корреляционная зависимость.

Глубина (или теснота) корреляционной зависимости (или связи) характеризуется коэффициентом rxh. Чем ближе êrxh ê к единице, тем теснее корреляционная зависимость.

Чем ближе зависимость между условным математическим ожиданием x и случайной величиной h к линейной, и чем теснее значения x группируются около условных математических ожиданий, тем глубже (теснее) корреляционная связь.

Можно говорить о совместном распределении двух непрерывных случайных величин. В большинстве случаев возможен переход от непрерывных случайных величин к совместному распределению двух дискретных случайных величин следующим образом.

Нужно разбить отрезок [a; b] изменения случайной величины x на равные отрезки [c0=a; c1]; [c1; c2]; [c2; c3],¼,[cn-1; cn=b]. За значение случайной величины x принять середину каждого отрезка.

Распределение Стьюдента.

Многие задачи статистики приводят к случайной величине вида

,

где x и h – независимые случайные величины, причем x – нормально распределенная случайная величина с параметрами Mx = 0 и Dx = 1, а h распределена по закону c2 c k степенями свободы.

Еще одним важным структурным компонентом ТВ являются случайные величины. Случайные величины ха-рактеризуются законами распределения, которые связывают значение случайной величины с ее вероятностью. Это позволяет установить закономерности изменения случайных величин в различных типовых ситуациях. Та-кие закономерности отображают функция распределения вероятности случайной величины и плотность вероятности случайной величины. Примером такой закономерности является так называемый нормальный закон распределения случайных величин (закон Гаусса).
Классическое определение вероятности