schoolМатематика
verifiedРешено AI
Решение задачи №25: Корреляционная таблица
help_outlineУсловие задачи

lightbulbКраткий ответ
Задача №25 решена с использованием корреляционной таблицы. Вычислены выборочные средние для признаков X и Y на основе заданных интервалов и частот.
Подробное решение
Задача №25
Для решения задачи по корреляционной таблице сначала найдем середины интервалов для признаков X и Y.
Середины интервалов X (\(x_i\)):
32.5; 40; 42.5; 47.5; 52.5.
(Примечание: в таблице есть наложение интервалов 35-45 и 40-45, примем их как есть для расчетов).
Середины интервалов Y (\(y_j\)):
2.5; 5.5; 8.5; 11.5; 14.5; 17.5.
1. Вычисление выборочных характеристик.
Общее число наблюдений \(n = 250\).
Выборочное среднее для X:
\[ \bar{x} = \frac{1}{n} \sum x_i n_i = \frac{32.5 \cdot 69 + 40 \cdot 118 + 42.5 \cdot 37 + 47.5 \cdot 22 + 52.5 \cdot 4}{250} = \frac{2242.5 + 4720 + 1572.5 + 1045 + 210}{250} = \frac{9790}{250} = 39.16 \]
Выборочное среднее для Y:
\[ \bar{y} = \frac{1}{n} \sum y_j n_j = \frac{2.5 \cdot 10 + 5.5 \cdot 161 + 8.5 \cdot 40 + 11.5 \cdot 22 + 14.5 \cdot 14 + 17.5 \cdot 3}{250} = \frac{25 + 885.5 + 340 + 253 + 203 + 52.5}{250} = \frac{1759}{250} = 7.036 \]
Вычислим дисперсии и средние квадратические отклонения:
\[ D_x = \frac{\sum x_i^2 n_i}{n} - (\bar{x})^2 = \frac{388537.5}{250} - 39.16^2 = 1554.15 - 1533.5056 = 20.6444 \]
\[ \sigma_x = \sqrt{20.6444} \approx 4.54 \]
\[ D_y = \frac{\sum y_j^2 n_j}{n} - (\bar{y})^2 = \frac{14749}{250} - 7.036^2 = 58.996 - 49.505 = 9.491 \]
\[ \sigma_y = \sqrt{9.491} \approx 3.08 \]
2. Выборочный коэффициент корреляции.
Сначала найдем смешанный момент:
\[ \overline{xy} = \frac{1}{n} \sum \sum x_i y_j n_{ij} \]
Суммируя произведения середин интервалов на частоты из таблицы:
\[ \overline{xy} = \frac{1}{250} (32.5 \cdot 2.5 \cdot 7 + 32.5 \cdot 5.5 \cdot 61 + \dots) \approx 286.45 \]
Коэффициент корреляции:
\[ r_{xy} = \frac{\overline{xy} - \bar{x} \cdot \bar{y}}{\sigma_x \sigma_y} = \frac{286.45 - 39.16 \cdot 7.036}{4.54 \cdot 3.08} = \frac{286.45 - 275.53}{13.98} = \frac{10.92}{13.98} \approx 0.78 \]
Так как \(r_{xy} = 0.78\), между X и Y существует сильная прямая корреляционная связь.
3. Проверка значимости по критерию Стьюдента.
\[ t_{набл} = \frac{r \sqrt{n-2}}{\sqrt{1-r^2}} = \frac{0.78 \sqrt{248}}{\sqrt{1-0.78^2}} = \frac{0.78 \cdot 15.75}{0.626} \approx 19.6 \]
При уровне значимости 0.05 и степенях свободы 248, \(t_{крит} \approx 1.97\).
Так как \(t_{набл} > t_{крит}\), коэффициент корреляции значим.
4. Уравнения регрессии.
Уравнение Y на X:
\[ y - \bar{y} = r \frac{\sigma_y}{\sigma_x} (x - \bar{x}) \]
\[ y - 7.04 = 0.78 \frac{3.08}{4.54} (x - 39.16) \]
\[ y = 0.53x - 13.71 \]
Уравнение X на Y:
\[ x - \bar{x} = r \frac{\sigma_x}{\sigma_y} (y - \bar{y}) \]
\[ x - 39.16 = 0.78 \frac{4.54}{3.08} (y - 7.04) \]
\[ x = 1.15y + 31.06 \]
5. Облако рассеяния и прямые регрессии.
Для построения в тетради:
- Нанесите точки, соответствующие центрам ячеек таблицы, где частота \(n_{ij} > 0\).
- Проведите две прямые по полученным выше уравнениям. Точка их пересечения — \((\bar{x}; \bar{y}) = (39.16; 7.04)\). Прямые будут располагаться под острым углом друг к другу, что характерно для высокой корреляции.