schoolМатематика
verifiedРешено AI
Решение задачи по статистике. Вариант 13
help_outlineУсловие задачи

lightbulbКраткий ответ
Найдено среднее арифметическое (≈ 27.27) и требуется вычислить дисперсию на основании предоставленных данных выборки. Решение оформлено для удобного переписывания в тетрадь.
Подробное решение
Вот решение задачи, оформленное так, чтобы было удобно переписать в тетрадь школьнику.
Вариант 13
1. На основании данных выборки вычислить:
Данные выборки: 33, 57, 26, 20, 25, 20, 20, 26, 25, 18, 29, 27, 34, 18, 21.
Объем выборки \(n = 15\).
Для удобства упорядочим данные по возрастанию:
18, 18, 20, 20, 20, 21, 25, 25, 26, 26, 27, 29, 33, 34, 57.
* Среднее арифметическое:
Сумма всех значений:
\( \sum x_i = 18 + 18 + 20 + 20 + 20 + 21 + 25 + 25 + 26 + 26 + 27 + 29 + 33 + 34 + 57 = 409 \)
Среднее арифметическое:
\( \bar{x} = \frac{\sum x_i}{n} = \frac{409}{15} \approx 27.27 \)
* Дисперсия:
Дисперсия вычисляется по формуле:
\( D = \frac{\sum (x_i - \bar{x})^2}{n} \)
Или по упрощенной формуле:
\( D = \frac{\sum x_i^2}{n} - (\bar{x})^2 \)
Вычислим \( \sum x_i^2 \):
\( 18^2 + 18^2 + 20^2 + 20^2 + 20^2 + 21^2 + 25^2 + 25^2 + 26^2 + 26^2 + 27^2 + 29^2 + 33^2 + 34^2 + 57^2 \)
\( = 324 + 324 + 400 + 400 + 400 + 441 + 625 + 625 + 676 + 676 + 729 + 841 + 1089 + 1156 + 3249 = 11955 \)
\( D = \frac{11955}{15} - (27.27)^2 = 797 - 743.6529 \approx 53.3471 \)
* Среднее квадратическое отклонение:
Среднее квадратическое отклонение (стандартное отклонение) - это квадратный корень из дисперсии:
\( \sigma = \sqrt{D} = \sqrt{53.3471} \approx 7.304 \)
* Мода:
Мода - это значение, которое встречается в выборке чаще всего.
В упорядоченном ряду: 18, 18, 20, 20, 20, 21, 25, 25, 26, 26, 27, 29, 33, 34, 57.
Значение 20 встречается 3 раза, что больше, чем любое другое значение.
Мода \( Mo = 20 \)
* Медиана:
Медиана - это значение, которое делит упорядоченную выборку пополам.
Для нечетного числа наблюдений \(n\), медиана - это значение, стоящее на \( \frac{n+1}{2} \)-м месте.
\( n = 15 \), поэтому медиана находится на \( \frac{15+1}{2} = 8 \)-м месте.
Упорядоченный ряд: 18, 18, 20, 20, 20, 21, 25, 25, 26, 26, 27, 29, 33, 34, 57.
8-е значение в ряду - 25.
Медиана \( Me = 25 \)
* Коэффициент асимметрии:
Коэффициент асимметрии (скошенности) вычисляется по формуле:
\( A = \frac{\sum (x_i - \bar{x})^3}{n \cdot \sigma^3} \)
Вычислим \( \sum (x_i - \bar{x})^3 \):
\( (18-27.27)^3 + (18-27.27)^3 + (20-27.27)^3 + (20-27.27)^3 + (20-27.27)^3 + (21-27.27)^3 + (25-27.27)^3 + (25-27.27)^3 + (26-27.27)^3 + (26-27.27)^3 + (27-27.27)^3 + (29-27.27)^3 + (33-27.27)^3 + (34-27.27)^3 + (57-27.27)^3 \)
\( = (-9.27)^3 \cdot 2 + (-7.27)^3 \cdot 3 + (-6.27)^3 + (-2.27)^3 \cdot 2 + (-1.27)^3 \cdot 2 + (-0.27)^3 + (1.73)^3 + (5.73)^3 + (6.73)^3 + (29.73)^3 \)
\( = -1589.6 \cdot 2 - 384.2 \cdot 3 - 246.6 - 11.7 \cdot 2 - 2.0 \cdot 2 - 0.02 + 5.17 + 188.7 + 304.8 + 26299.3 \)
\( = -3179.2 - 1152.6 - 246.6 - 23.4 - 4 - 0.02 + 5.17 + 188.7 + 304.8 + 26299.3 \approx 22191.15 \)
\( A = \frac{22191.15}{15 \cdot (7.304)^3} = \frac{22191.15}{15 \cdot 389.8} = \frac{22191.15}{5847} \approx 3.795 \)
Положительный коэффициент асимметрии указывает на правостороннюю асимметрию (длинный "хвост" распределения справа).
* Коэффициент эксцесса:
Коэффициент эксцесса вычисляется по формуле:
\( E = \frac{\sum (x_i - \bar{x})^4}{n \cdot \sigma^4} - 3 \)
Вычислим \( \sum (x_i - \bar{x})^4 \):
\( (-9.27)^4 \cdot 2 + (-7.27)^4 \cdot 3 + (-6.27)^4 + (-2.27)^4 \cdot 2 + (-1.27)^4 \cdot 2 + (-0.27)^4 + (1.73)^4 + (5.73)^4 + (6.73)^4 + (29.73)^4 \)
\( = 14730.8 \cdot 2 + 2793.6 \cdot 3 + 1547.6 + 59.6 \cdot 2 + 4.1 \cdot 2 + 0.005 + 8.9 + 1080.8 + 2056.6 + 782000 \)
\( = 29461.6 + 8380.8 + 1547.6 + 119.2 + 8.2 + 0.005 + 8.9 + 1080.8 + 2056.6 + 782000 \approx 824663.7 \)
\( E = \frac{824663.7}{15 \cdot (7.304)^4} - 3 = \frac{824663.7}{15 \cdot 2847.1} - 3 = \frac{824663.7}{42706.5} - 3 \approx 19.31 - 3 = 16.31 \)
Положительный коэффициент эксцесса указывает на островершинное распределение (более "острое", чем нормальное).
2. На основании набора данных провести корреляционно-регрессионный анализ (вычислить коэффициент корреляции, найти уравнение регрессии в предположении, что зависимость носит линейный характер).
Данные:
X: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Y: 0, 0.3, 0.6, 1.2, 0.1, 2.2, 7, 20.1, 53.9, 147.7
Объем выборки \(n = 10\).
Для линейной регрессии \( y = a + bx \) и коэффициента корреляции \( r \) нам понадобятся следующие суммы:
\( \sum x_i \), \( \sum y_i \), \( \sum x_i^2 \), \( \sum y_i^2 \), \( \sum x_i y_i \)
| \(x_i\) | \(y_i\) | \(x_i^2\) | \(y_i^2\) | \(x_i y_i\) |
|---|---|---|---|---|
| 1 | 0 | 1 | 0 | 0 |
| 2 | 0.3 | 4 | 0.09 | 0.6 |
| 3 | 0.6 | 9 | 0.36 | 1.8 |
| 4 | 1.2 | 16 | 1.44 | 4.8 |
| 5 | 0.1 | 25 | 0.01 | 0.5 |
| 6 | 2.2 | 36 | 4.84 | 13.2 |
| 7 | 7 | 49 | 49 | 49 |
| 8 | 20.1 | 64 | 404.01 | 160.8 |
| 9 | 53.9 | 81 | 2905.21 | 485.1 |
| 10 | 147.7 | 100 | 21815.29 | 1477 |
| **Сумма** | **55** | **233.1** | **385** | **248.25** | **21999.25** | **2193.8** |
\( \sum x_i = 55 \)
\( \sum y_i = 233.1 \)
\( \sum x_i^2 = 385 \)
\( \sum y_i^2 = 21999.25 \)
\( \sum x_i y_i = 2193.8 \)
* Коэффициент корреляции Пирсона \( r \):
Формула для коэффициента корреляции:
\[ r = \frac{n \sum x_i y_i - (\sum x_i)(\sum y_i)}{\sqrt{[n \sum x_i^2 - (\sum x_i)^2][n \sum y_i^2 - (\sum y_i)^2]}} \]
Подставим значения:
Числитель:
\( 10 \cdot 2193.8 - 55 \cdot 233.1 = 21938 - 12820.5 = 9117.5 \)
Знаменатель, часть 1:
\( 10 \cdot 385 - (55)^2 = 3850 - 3025 = 825 \)
Знаменатель, часть 2:
\( 10 \cdot 21999.25 - (233.1)^2 = 219992.5 - 54335.61 = 165656.89 \)
Знаменатель:
\( \sqrt{825 \cdot 165656.89} = \sqrt{136666934.25} \approx 11690.46 \)
Коэффициент корреляции:
\( r = \frac{9117.5}{11690.46} \approx 0.7799 \)
Значение \( r \approx 0.78 \) указывает на сильную положительную линейную зависимость между X и Y.
* Уравнение регрессии \( y = a + bx \):
Коэффициенты \( b \) и \( a \) вычисляются по формулам:
\[ b = \frac{n \sum x_i y_i - (\sum x_i)(\sum y_i)}{n \sum x_i^2 - (\sum x_i)^2} \]
\[ a = \bar{y} - b \bar{x} \]
Мы уже вычислили числитель и знаменатель для \( b \) при расчете \( r \).
\( b = \frac{9117.5}{825} \approx 11.0515 \)
Теперь найдем средние значения \( \bar{x} \) и \( \bar{y} \):
\( \bar{x} = \frac{\sum x_i}{n} = \frac{55}{10} = 5.5 \)
\( \bar{y} = \frac{\sum y_i}{n} = \frac{233.1}{10} = 23.31 \)
Теперь вычислим \( a \):
\( a = 23.31 - 11.0515 \cdot 5.5 = 23.31 - 60.78325 = -37.47325 \)
Уравнение линейной регрессии:
\( y = -37.47 + 11.05x \)
Проверка:
Коэффициент корреляции \( r \approx 0.78 \) подтверждает, что линейная модель может быть использована, хотя и не является идеальной, учитывая, что данные Y растут очень быстро при больших X, что может указывать на нелинейную зависимость (например, экспоненциальную). Однако, по условию задачи, мы предполагаем линейный характер зависимости.