Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.
Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).
Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.
На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.
Выборка. Объем. Размах
Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней
Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6
n = 6
Элементы выборки обозначаются с помощью переменных с индексами . Последний элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.
Обозначим элементы нашей выборки через переменные
Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.
- Размахом выборки называют разницу между самым большим и маленьким элементом выборки.
- В нашем случае, самым большим элементом выборки является элемент 250, а самым маленьким — элемент 150. Разница между ними равна 100
Среднее арифметическое
Понятие среднего значения часто используется в повседневной жизни.
Примеры:
- средняя зарплата жителей страны;
- средний балл учащихся;
- средняя скорость движения;
- средняя производительность труда.
Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.
Среднее арифметическое — это результат деления суммы элементов выборки на их количество.
Вернемся к нашему примеру
Узнаем сколько в среднем мы тратили в каждом из шести дней:
Средняя скорость движения
При изучении задач на движение мы определяли скорость движения следующим образом: делили пройденное расстояние на время. Но тогда подразумевалось, что тело движется с постоянной скоростью, которая не менялась на протяжении всего пути.
В реальности, это происходит довольно редко или не происходит совсем. Тело, как правило, движется с различной скоростью.
Когда мы ездим на автомобиле или велосипеде, наша скорость часто меняется. Когда впереди нас помехи, нам приходиться сбавлять скорость. Когда же трасса свободна, мы ускоряемся. При этом за время нашего ускорения скорость изменяется несколько раз.
Речь идет о средней скорости движения. Чтобы её определить нужно сложить скорости движения, которые были в каждом часе/минуте/секунде и результат разделить на время движения.
Задача 1. Автомобиль первые 3 часа двигался со скоростью 66,2 км/ч, а следующие 2 часа — со скоростью 78,4 км/ч. С какой средней скоростью он ехал?
Сложим скорости, которые были у автомобиля в каждом часе и разделим на время движения (5ч)
Значит автомобиль ехал со средней скоростью 71,08 км/ч.
Определять среднюю скорость можно и по другому — сначала найти расстояния, пройденные с одной скоростью, затем сложить эти расстояния и результат разделить на время. На рисунке видно, что первые три часа скорость у автомобиля не менялась. Тогда можно найти расстояние, пройденное за три часа:
- 66,2 × 3 = 198,6 км.
- Аналогично можно определить расстояние, которое было пройдено со скоростью 78,4 км/ч. В задаче сказано, что с такой скоростью автомобиль двигался 2 часа:
- 78,4 × 2 = 156,8 км.
- Сложим эти расстояния и результат разделим на 5
Задача 2. Велосипедист за первый час проехал 12,6 км, а в следующие 2 часа он ехал со скоростью 13,5 км/ч. Определить среднюю скорость велосипедиста.
Скорость велосипедиста в первый час составляла 12,6 км/ч. Во второй и третий час он ехал со скоростью 13,5. Определим среднюю скорость движения велосипедиста:
Мода и медиана
- Модой называют элемент, который встречается в выборке чаще других.
- Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров
- Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.
- Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат
Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.
- Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.
- Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:
- Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:
- Выпишем рост спортсменов отдельно:
- 180, 182, 183, 184, 185, 188, 190
В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.
- Медианой упорядоченной выборки называют элемент, располагающийся посередине.
- Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.
- В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану
- Но возможны случаи, когда количество элементов выборки чётно.
- К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:
- Построим этих шестерых спортсменов по росту:
- Выпишем рост спортсменов отдельно:
- 180, 182, 184, 186, 188, 190
В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.
В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.
- Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186
- Найдем среднее арифметическое элементов 184 и 186
Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.
- Поэтому более точное определение медианы зависит от количества элементов в выборке.
- Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.
- Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.
Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190
- Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:
- Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:
- 0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1
- Определим среднее арифметическое для данной выборки — получим значение 2,2
- По данному значению можно сказать, что в среднем у спортсменов 2,2 очка
- Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:
- 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6
- В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.
Частота
Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.
Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.
По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.
- Количество человек, повторяющих одно и то же число подтягиваний в данном случае являются частотой. Поэтому вторую строку таблицы переименуем в название «частота»:
- Такие таблицы называют таблицами частот.
- Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.
Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:
4 + 5 + 10 + 8 + 6 + 3 = 36
Относительная частота
- Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.
- Относительная частота равна отношению частоты на общее число элементов выборки.
- Вернемся к нашей таблице:
Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее.
Давайте заполним таблицу с помощью таких отношений:
- Выполним деление в этих дробях:
Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:
- Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.
Источник: http://spacemath.xyz/elementy-statistiki/
Статистическое изучение вариационных рядов и расчет средних величин
Понятие вариационного ряда. Первым шагом систематизации материалов статистического наблюдения является подсчет числа единиц, обладающих тем или иным признаком.
Расположив единицы в порядке возрастания или убывания их количественного признака и подсчитав число единиц с конкретным значением признака, получаем вариационный ряд.
Вариационный ряд характеризует распределение единиц определенной статистической совокупности по какому–либо количественному признаку.
Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).
Схематично вариационный ряд можно представить в виде табл.5.1:
Таблица 5.1
Вид вариационного ряда
Варианты (x) | Частоты (f) |
. | . |
. | . |
. | . |
Итого: | Σf |
В правой колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуют частостями и условно обозначают через , т.е. . Сумма всех частостей равна единице. Частости могут быть выражены и в процентах, и тогда их сумма будет равна 100%.
Варьирующие признаки могут носить разный характер. Варианты одних признаков выражаются в целых числах, например, число комнат в квартире, число изданных книг и т.д.
Эти признаки именуют прерывными, или дискретными. Варианты других признаков могут принимать любые значения в определенных пределах, как, например, выполнение плановых заданий, заработная плата и др.
Эти признаки называют непрерывными.
Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным, его внешний вид представлен в табл. 5.2:
Таблица 5.2
Распределение студентов по оценкам, полученным на экзамене
Оценки (х) | Количество студентов (f) | В % к итогу () |
2 | 1 | 5 |
3 | 2 | 10 |
4 | 10 | 50 |
5 | 7 | 35 |
Итого: | 20 | 100 |
Характер распределения в дискретных рядах изображается графически в виде полигона распределения, рис.5.1.
Рис. 5.1. Распределение студентов по оценкам, полученным на экзамене.
Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.
Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.
В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие.
Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.
Рассмотрим вид интервального ряда с равными интервалами, табл. 5.3:
Таблица 5.3
Распределение рабочих по выработке
Выработка, т.р. (х) | Число рабочих (f) | Кумулятивная частота (f´) |
80–100 | 5 | 5 |
100–120 | 10 | 15 = 5+10 |
120–140 | 20 | 35 = 15+20 |
140–160 | 10 | 45 = 35+10 |
160–180 | 5 | 50 = 45+5 |
Итого: | 50 |
Интервальный ряд распределения графически изображается в виде гистограммы, рис.5.2.
Рис.5.2. Распределение рабочих по выработке
Накопленная (кумулятивная) частота. В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.
Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения.
Для иллюстрации рядов распределения используются кумуляты и огивы.
Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята), рис.5.3.
Рис. 5.3. Кумулята распределения рабочих по выработке
Если шкалы частот и вариантов поменять местами, т.е. на оси абсцисс отражать накопленные частоты, а на оси ординат – значения вариантов, то кривая, характеризующая изменение частот от группы к группе, будет носит название огивы распределения, рис.5.4.
Рис. 5.4. Огива распределения рабочих по выработке
Вариационные ряды с равными интервалами обеспечивают одно из важнейших требований, предъявляемых к статистическим рядам распределения, обеспечение сравнимости их во времени и пространстве.
Плотность распределения. Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.
При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.
Составление вариационного ряда и его графическое изображение является первым шагом обработки исходных данных и первой ступенью анализа изучаемой совокупности. Следующим шагом в анализе вариационных рядов является определение основных обобщающих показателей, именуемых характеристиками ряда. Эти характеристики должны дать представление о среднем значении признака у единиц совокупности.
Средняя величина. Средняя величина представляет собой обобщенную характеристику изучаемого признака в исследуемой совокупности, отражающая ее типический уровень в расчете на единицу совокупности в конкретных условиях места и времени.
- Средняя величина всегда именованная, имеет ту же размерность, что и признак у отдельных единиц совокупности.
- Перед вычислением средних величин необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.
- Средняя, рассчитанная по совокупности в целом называется общей средней, а для каждой группы – групповыми средними.
- Существуют две разновидности средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая); структурные (мода, медиана, квартили, децили).
- Выбор средней для расчета зависит от цели.
Виды степенных средних и методы их расчета. В практике статистической обработки собранного материала возникают различные задачи, для решения которых требуются различные средние.
Математическая статистика выводит различные средние из формул степенной средней:
(5.1) |
где средняя величина; x – отдельные варианты (значения признаков); z – показатель степени (при z = 1 – средняя арифметическая, z = 0 средняя геометрическая, z = — 1 – средняя гармоническая, z = 2 – средняя квадратическая).
Однако вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности.
Наиболее часто встречающимся в статистике видом средних величин является средняя арифметическая. Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.
В зависимости от характера исходных данных средняя арифметическая определяется различными способами:
Если данные несгруппированные, то расчет ведется по формуле простой средней величины
, | (5.2) |
Если значение признака встречается несколько раз, то среднюю величину находят по формуле для сгруппированных данных и средняя величина будет называться среднеарифметическая взвешенная.
(5.3) |
Расчет средней арифметической в дискретном ряду происходит по формуле 3.4.
Расчет средней арифметической в интервальном ряду.
В интервальном вариационном ряду, где за величину признака в каждой группе условно принимается середина интервала, средняя арифметическая может отличаться от средней, рассчитанной по несгруппированным данным.
Причем, чем больше величина интервала в группах, тем больше возможные отклонения средней, вычисленной по сгруппированным данным, от средней, рассчитанной по несгруппированным данным.
При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. А затем рассчитывают среднюю величину по формуле средней арифметической взвешенной.
Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.
1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.
2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.
Если все варианты уменьшить или увеличить на какое- либо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.
Уменьшим все варианты x на a, т.е. x´ = x – a.
Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a, т.е. .
5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.
Пусть , тогда .
Отсюда , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.
Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5
(5.4) |
Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.
Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.
Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит долл.
Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.
Формулы для расчета следующие
– для невзвешенных значений, | (5.5) |
– взвешенная, | (5.6) |
где – варианты осредняемого признака; – произведение вариантов; f – частота вариантов.
Средняя геометрическая используется в расчетах среднегодовых темпов роста.
Средняя квадратическая.Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.
Средняя квадратическая величина рассчитывается по формуле
(5.7) |
В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.
Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл.5.4:
Таблица 5.4
Соотношение между средними величинами
Значение z | –1 | 0 | 1 | 2 |
Соотношение между средними |
Источник: https://www.ekonomstat.ru/uchebnoe-posobie-po-statistike/435-statisticheskoe-izuchenie-variacionnyh-rjadov-i.html
Относительная частота случайного события
- Теория вероятностей — это раздел математики, который изучает закономерности случайных событий.
- События можно считать случайными — это те, которые могут произойти, а могут и не произойти.
- Примерами таких событий являются: выпадение орла или решки при подбрасывании монеты; поражение мишени или промах при стрельбе; выпадение того или иного количества очков при бросании игрального кубика.
- Пример.
Провели испытания.
100 раз бросали игральный кубик и подсчитали, что 6 очков выпало 17 раз — частота рассматриваемого события, то есть выпадения очков.
Отношение частоты к общему числу испытаний называют относительной частотой этого события.
Пусть некоторое испытание проводилось многократно в одних и тех же условиях. При этом фиксировалось, произошло или нет некоторое интересующее нас событие А.
Если общее число испытаний — n, а число испытаний, при которых произошло событие А, — m. То m называют частотой события А, частное m и n— относительной частотой.
- Определение:
- Относительной частотой случайного события в серии испытаний называется отношение числа испытаний, в которых это событие наступило, к числу всех испытаний.
- В ходе исследований выяснилось, что относительная частота появления ожидаемого события при повторении опытов в одних и тех же условиях, может оставаться примерно одинаковой, незначительно отличаясь от некоторого числа р.
Пример.
При подбрасывании монеты отмечают те случаи, когда выпадает орёл.
Если монета однородна и имеет правильную геометрическую форму, то шансы выпадения орла или решки будут примерно одинаковы. Но при небольшом количестве бросков такой результат может не получиться.
- А вот если испытание проводиться большое количество раз, то относительная частота выпадения орла близка к относительной частоте выпадения решки.
- Многие учёные проводили такой эксперимент.
- Так, например, английский математик Карл Пирсон бросал монету 24 тысячи раз, и относительная частота выпадения орла оказалось равной 0,5005.
- А наш соотечественник, Всеволод Иванович Романовский, подбрасывая монету 80 тысяч 640 раз, нашёл, что относительная частота выпадения орла в его испытании была равна 0,4923.
Пример.
В непрозрачном мешке лежит 7 зелёных и 12 синих кубиков. За раз можно доставать только 1 из них. Какова вероятность того, что из мешка достанут синий кубик?
Всего в мешке 19 кубиков. Значит, n=19.
Синий кубик мы можем достать 12 раз. Получаем, что m=12.
Относительная частота равна:
Пример.
Определить относительную частоту появления буквы «о» в слове «достопримечательность».
Общее число букв, то есть n=21. А количество букв «о», то есть m=3.
Значит относительная частота:
Пример.
Отмечая число попаданий в корзину в каждой серии из 40 бросков, которые совершал баскетболист, получили такие данные:
Какова относительная вероятность попадания мяча в корзину для данного баскетболиста?
Определим общее число бросков. Было 5 серий по 40 бросков, то есть n=200.
Сосчитаем число попаданий в корзину:
Получили, что m=184.
Относительная вероятность попадания в корзину будет:
Пример.
Стрелок совершил 50 выстрелов. Относительная частота попадания в цель оказалась равной 0,88. Сколько раз он промахнулся?
Зная общее число выстрелов n=50 и относительную вероятность попадания p=0,88. Найдем число попаданий в цель:
- Стрелок попал в цель 44 раза.
- Найдём число промахов
- Стрелок промахнулся 6 раз.
Источник: https://videouroki.net/video/30-otnositiel-naia-chastota-sluchainogho-sobytiia.html
Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в EXCEL
Функция ЧАСТОТА( ) , английская версия FREQUENCY() , вычисляет частоту попадания значений в заданные пользователем интервалы и возвращает соответствующий массив чисел.
Функцией ЧАСТОТА() можно воспользоваться, например, для подсчета количества результатов тестирования, попадающих в определенные интервалы (См. Файл примера )
Синтаксис функции
- ЧАСТОТА ( массив_данных ; массив_интервалов )
- Массив_данных — массив или ссылка на множество ЧИСЛОвых данных, для которых вычисляются частоты.
- Массив_интервалов — массив или ссылка на множество интервалов, в которые группируются значения аргумента «массив_данных».
Функция ЧАСТОТА() вводится как формула массива после выделения диапазона смежных ячеек, в которые требуется вернуть полученный массив распределения (частот). Т.е.
после ввода формулы необходимо вместо нажатия клавиши ENTER нажать сочетание клавиш CTRL+SHIFT+ENTER .
Количество элементов в возвращаемом массиве на единицу больше числа элементов в массиве « массив_интервалов ». Дополнительный элемент в возвращаемом массиве содержит количество значений, превышающих верхнюю границу интервала, содержащего наибольшие значения (см. пример ниже).
Пример
Пусть в диапазоне А2:А101 имеется исходный массив чисел от 1 до 100.
Подсчитаем количество чисел, попадающих в интервалы 1-10; 11-20; …91-100.
Сформируем столбце С массив верхних границ диапазонов (интервалов). Для наглядности в столбце D сформируем текстовые значения соответствующие границам интервалов (1-10; 11-20; …91-100).
Для ввода формулы выделим диапазон Е2:Е12 , состоящий из 11 ячеек (на 1 больше, чем число верхних границ интервалов). В Строке формул введем =ЧАСТОТА($A$2:$A$101;$C$2:$C$11) . После ввода формулы необходимо нажать сочетание клавиш CTRL+SHIFT+ENTER . Диапазон Е2:Е12 заполнится значениями:
- в Е2 — будет содержаться количество значений из А2:А101 , которые меньше или равны 10;
- в Е3 — количество значений из А2:А101 , которые меньше или равны 20, но больше 10;
- в Е11 — количество значений из А2:А101 , которые меньше или равны 100, но больше 90;
- в Е12 — количество значений из А2:А101 , которые больше 100 (таких нет, т.к. исходный массив содержит числа от 1 до 100).
Примечание . Функцию ЧАСТОТА() можно заменить формулой = СУММПРОИЗВ(($A$5:$A$104>C5)*($A$5:$A$104 (См. Файл примера )
Источник: https://excel2.ru/articles/funkciya-chastota-podschet-chislovyh-znacheniy-v-ms-excel-chastota
Относительная частота
Не всякий опыт
может быть сведен к системе случаев.
Пусть, например, игральная кость не
симметрична, тогда какая-то грань будет
выпадать чаще других (условие
равновозможности событий не выполняется).
Тем не менее, и в этом случае для каждой
грани существует своя определенная
степень объективной возможности ее
появления.
Определение:
Относительной
частотой
события А
называется
отношение числа опытов, в которых
появилось событие А,
к общему числу опытов:
- где — число появлений событияА,
- n
– общее
число опытов. - Сопоставляя
определение вероятности и относительной
частоты, заключаем:
- Определение вероятности не требует, чтобы испытания проводились в действительности,
- Определение относительной частоты, предполагает, что испытания были проведены фактически.
Длительные
наблюдения показали, что если в одинаковых
условиях производятся опыты, в каждом
из которых число испытаний достаточно
велико, то относительная частота
обнаруживает свойство устойчивости:
в различных опытах относительная частота
изменяется мало (тем меньше, чем больше
производится испытаний), колеблясь
около некоторого постоянного числа.
Это число и есть вероятность появления
события.
Определение:Статической
вероятностью события
называется число, около которого
группируются значения относительной
частоты данного события в различных
сериях большого числа испытаний.
Свойства статической вероятности
(те же, что и для
классического определения вероятности)
-
если А — невозможное событие,
-
если А — достоверное событие.
Примеры:
-
По данным шведской статистики относительная частота рождения девочек за 1935г. По месяцам:
0,486 0,489 0,490 0,471 0,478 0,482 0,462 0,484 0,485 0,491 0,482 0,473.
Относительная
частота колеблется около числа 0,482.
Число бросаний | Число появлений герба | Относительная частота |
4 040 | 2 048 | 0,5069 |
12 000 | 6 019 | 0,5016 |
24 000 | 12 012 | 0,5005 |
Теорема Бернулли:
При достаточно
большом числе опытов вероятность
события, заключающегося в том, что
разность между частотой события и его
вероятностью становится сколь угодно
малой, неограниченно приближается к
единице.
Основные теоремы теории вероятности
- Определение:
Суммой двух
событий A+B
называется событие, состоящее в появлении
хотя бы одного из них. - Например: Если
событие А –
попадание в цель при первом выстреле,
событие B– попадание
в цель при втором выстреле, то C=A+B
– попадание в цель вообще, безразлично
при каком выстреле : при первом или при
втором или при обоих вместе. - Определение:
Суммой
нескольких событий называется событие,
состоящее в появлении хотя бы одного
из них. - Определение:
Произведением
двух событий AB
двух событий называется событие,
состоящее в совместном появлении события
А и
события B. - Например: Если
событие А –
появление дамы при вынимании карты из
колоды, событие B– появление
карты пиковой масти, то C=AB
– появление пиковой дамы. - Определение:
Событиеpng» width=»21″>называетсяпротивоположным
для А,
если оно выполняется тогда и только
тогда, когда не выполняется событие А. - При вычислении
вероятностей удобно бывает представить
сложные события в виде комбинации более
простых событий, применяя операции
сложения, умножения, а так же противоположные
событие. - Пример:
— попадание при первом выстреле,
Пусть событие В
— в результате
трех выстрелов будет только одно
попадание:
Источник: https://studfile.net/preview/1705072/page:2/
Основные статистические расчеты 2020
Период удержания Возврат Формула возврата срока хранения была введена ранее при обсуждении взвешенного по времени измерения возврата. Эта же формула применяется при применении к частотным распределениям (описания слегка изменены):
Формула 2. 16 R t = [(P t — P t — 1 + D t ) / P t — 1 ] Где: R t = возврат периода возврата за период времени (t) и P t = цена актива на конец периода t, P t — 1 = цена актива на конец периода времени (t — 1), D < t = распределения денежных средств, полученные в течение времени t |
Относительные и кумулятивные частоты
Относительная частота рассчитывается путем деления абсолютной частоты определенного интервала на общую совокупность.
Кумулятивная относительная частота представляет собой процесс, в котором относительные частоты объединяются вместе, чтобы показать процент наблюдений, которые падают на или ниже определенной точки.
Для иллюстрации относительной частоты и кумулятивной относительной частоты см. Следующее распределение частот для ежеквартальных возвратов за последние 10 лет для взаимного фонда:
Квартальный интервал возврата
Число наблюдений (абсолютная частота) | Относительная частота | Кумулятивная абсолютная частота | Кумулятивная относительная частота | -15% до -10% < 2 |
5. 0% | 2 | 5. 0% | от -10% до -5% | 1 |
2. 5% | 3 | 7. 5% | -5% до 0% | 5 |
12. 5% | 8 | 20. 0% | 0% до + 5% | 17 |
42. 5% | 25 | 62. 5% | + 5% до + 10% | 10 |
25. 0% | 35 | 87. 5% | + 10% до + 15% | 2 |
5. 0% | 37 | 92. 5% | + 15% до + 20% | 3 |
7. 5% | 40 | 100. 0% | В этом распределении имеется 40 наблюдений (последние 10 лет, четыре четверти в год), а относительная частота определяется путем деления числа во втором столбце на 40. Кумулятивная абсолютная частота (четвертая столбец) строится путем добавления частоты всех наблюдений на этой точке или ниже. Итак, для пятого интервала, + 5% — + 10%, мы обнаруживаем кумулятивную абсолютную частоту, добавляя абсолютную частоту в пятом интервале и все предыдущие интервалы: 2 + 1 + 5 + 17 + 10 = 35. Последний столбец, кумулятивная относительная частота, берет число в четвертом столбце и делит на 40, общее количество наблюдений. |
Гистограммы и частотные полигоны
Гистограмма представляет собой распределение частот, представленное в виде гистограммы, с числом наблюдений по оси Y и интервалами на X.
Распределение частот выше представлено в виде гистограммы на рисунке 2. 2 ниже: Рисунок 2. 2: Гистограмма
Возвратный многоугольник представляет линейную диаграмму, а не гистограмму. Вот данные из распределения частот, представленные с помощью возвращаемого многоугольника:
Рисунок 2. 3: Возвращаемый многоугольник |
Посмотрите!
Вас могут попросить описать данные, представленные для гистограммы или частотного многоугольника.Скорее всего, это будет связано с оценкой риска, указав, что есть два примера наиболее негативных результатов (например, кварталы ниже -10%, категория 1). Также вас могут спросить, как нормально распределяется график. Нормальные распределения подробно описаны ниже в этом учебном пособии. |
Центральная тенденция Термин «меры центральной тенденции» относится к различным методам, используемым для описания того, где большие группы данных сосредоточены в популяции или выборке. Здесь сказано иначе: если мы должны были вытащить одно значение или наблюдение из популяции или выборки, что бы мы обычно ожидали, что это значение? Для вычисления центральной тенденции используются различные методы. Наиболее часто используется среднее арифметическое или сумма наблюдений, деленная на количество наблюдений. |
Пример: Арифметическое среднее Например, если у нас есть 20 четвертей возвращаемых данных:
-1. 5% -2. 5% + 5. 6% + 10. 7% +0. 8% -7. 7% -10. 1% +2. 2% +12. 0% + 10. 9% -2. 6% +0. 2% -1. 9% -6. 2% + 17. 1% +4. 8% +9. 1% +3. 0% -0. 2% +1. 8% Мы находим среднее арифметическое, добавляя вместе 20 наблюдений, затем разделив их на 20. ((- 1,5%) + (-2,5%) + 5. 6% + 10. 7 % + 0. 8% + (7. 7%) + (-10.1%) + 2. 2% + 12. 0% + 10. 9% + (-2.6%) + 0. 2% + (-1,9%) + (-6,2%) + 17,1% + 4,8% + 9,1% + 3,0% + (-0,2%) + 1,8%) = 45. 5% Среднее арифметическое = 45. 5% / 20 = 2. 275% Среднее значение обычно интерпретируется как ответ на вопрос о том, какой будет наиболее вероятный результат или что представляет данные наиболее справедливо.
Среднее арифметическое значение используется для вычисления среднего значения населения (часто обозначаемого греческим символом μ), которое является средним арифметическим для всей совокупности. Население означает пример параметра и по определению оно должно быть уникальным.
То есть, у данной популяции может быть только одно среднее. Среднее значение выборки (обозначаемое X или X-bar) является средним арифметическим значением выборки. Это пример выборочной статистики и будет уникальным для конкретного образца.
Другими словами, пять образцов, взятых из одной и той же популяции, могут производить пять различных образцов.
В то время как среднее арифметическое является наиболее часто используемой мерой центральной тенденции, у нее есть недостатки, которые в некоторых случаях имеют тенденцию вводить в заблуждение при описании популяции или выборки. В частности, среднее арифметическое чувствительно к экстремальным значениям. Пример:
Например, скажем, мы имеем следующие пять наблюдений: -9000, 1. 4, 1. 6, 2. 4 и 3. 7. Среднее арифметическое -1798. 2 [(-9000 + 1. 4 + 1. 6 + 2. 4 + 3. 7) / 5], но -1798. 2 имеет мало смысла в описании нашего набора данных.
Выброс (-9000) снижает общее среднее значение. Статистики используют множество методов для компенсации выбросов, таких как, например, устранение самого высокого и самого низкого значения перед вычислением среднего значения. Например, отбрасывая -9000 и 3. 7, три оставшихся наблюдения имеют среднее значение 1,8, более значимое описание данных. Другой подход — использовать либо медианную, либо режимную, либо и то, и другое. Среднее взвешенное или среднее значение
Средневзвешенное или взвешенное среднее значение, применяемое к портфелю, принимает среднее значение возврата каждого класса активов и переносит его по распределению каждого класса.
Предположим, что менеджер портфеля имеет следующее распределение и среднюю годовую доходность, полученную для каждого класса: Класс актива
Вес портфеля
Среднегодовая доходность | U. S. Large Cap | 30% |
9. 6% | U. S. Mid Cap | 15% |
11. 2% | U. S. Small Cap | 10% |
7. 4% | Иностранные (Развитые Mkts.) | 15% |
8. 8% | Развивающиеся рынки | 8% |
14. 1% | Фиксированный доход (короткий / средний) | 12% |
4. 1% | Фиксированный доход (длительные сроки погашения) | 7% |
6. 6% | Денежный / денежный рынок | 3% |
2. 1% | Среднее взвешенное вычисляется путем взвешивания доходности по каждому классу и суммирования: | Возврат портфеля = (0,30) * (0,096) + (0,15) * (0,121) + (0. 10) * (0. 074) + (0. 15) * (0. 088) + (0. 08) * (0. 141) + (0. 12) * (0. 041) + (0 07) * (0. 066) + (0. 03) * (0. 021) = 8. 765% |
Медиана Медиана определяется как среднее значение в серии, которая сортируется либо по восходящей, либо по в порядке убывания.
В приведенном выше примере с пятью наблюдениями среднее или среднее значение составляет 1,6 (то есть два значения ниже 1,6 и два значения выше 1,6).
В этом случае медиана представляет собой гораздо более четкое указание на данные по сравнению со средним значением -1798. 2.
Режим
Режим определяется как особое значение, которое наиболее часто наблюдается. В некоторых приложениях режим является наиболее значимым описанием. Возьмите случай с портфелем из десяти паевых инвестиционных фондов и их соответствующими рейтингами: 5, 4, 4, 4, 4, 4, 4, 3, 2 и 1. Арифметический средний рейтинг — 3. 5 звезд. Однако в этом примере модальный рейтинг в четыре описывает большинство наблюдений и может рассматриваться как более справедливое описание.
Средневзвешенное значение
Среднее взвешенное значение часто встречается в проблемах портфеля, в которых различные классы активов взвешиваются в портфеле — например, если акции составляют 60% портфеля, то 0. 6 — это вес. Средневзвешенное значение вычисляется путем умножения среднего значения каждого веса на вес и затем суммирования продуктов.
Возьмем пример, когда акции взвешены на 60%, облигации 30% и наличные 10%. Предположим, что часть акций вернулась на 10%, облигации вернулись на 6%, а наличные — на 2%. Средневзвешенная доходность портфеля:
Акции (wtd) + облигации (wtd) + Денежные средства (wtd) = (0,6) * (0,1) + (0,3) * (0,6) + ( 0. 1) * (0. 02) = (0. 06) + (0. 018) + (0. 002) = 8% Геометрическое среднее Вначале мы ввели геометрическое среднее в вычислениях для взвешенная по времени производительность. Обычно это применяется к данным в процентах: доходности с течением времени или темпы роста. С серией n наблюдений статистики X среднее геометрическое (G) равно:
Формула 2. 1
7
G = (X 1 * X 2 < * X 3 * X 4 … * X n ) 1 / n Итак, если у нас есть четырехлетний период в что продажи компании выросли на 4%, 5%, -3% и 10%, вот расчет среднего геометрического значения: G = ((1.04) * (1. 05) * (0,97) * (1. 1)) |
1/4 — 1 = 3,9%.
Важно получить опыт использования среднего геометрического значения в процентах, который включает в себя объединение данных вместе: (1) добавить 1 к каждому проценту, (2) умножить все члены вместе, (3) перенести продукт на 1 / n и (4) вычесть 1 из результата. Значение гармоник вычисляется с помощью следующих шагов:
1. Принимая обратное каждому наблюдению, или 1 / X,
2. Добавляя эти термины вместе, 3. Усреднение суммы путем деления на n или общего числа наблюдений
4. Принимая во внимание этот результат. Среднее значение гармоник связано с вопросами о среднем усреднении доллара, но его использование ограничено. Средние арифметические, средневзвешенные и геометрические средние являются наиболее часто используемыми мерами и должны быть основным акцентом на изучение. Quartiles, Quintiles, Deciles и Percentiles. Эти термины наиболее связаны с случаями, когда точка центральной тенденции не является основной целью исследования. Например, в распределении пятилетних показателей эффективности для менеджеров денег нам может быть неинтересно среднего исполнителя (т. Е. Менеджера на уровне 50%), а скорее у тех, кто находится в топ-10% или топ-20% распространение. Напомним, что медиана по существу разделяет распределение пополам. В том же процессе квартили являются результатом распределения, разделенного на четыре части; квинтилии относятся к пяти частям; децили, 10 частей; и процентили, 100 частей. Менеджер во втором квинтиле будет лучше 60% (нижние три квинтиля) и ниже 20% (верхний квинтиль) (то есть где-то между 20% и 40% в процентилях). Менеджер в 21
st
процентили имеет 20 процентов выше, 79 процентов ниже.
Источник: https://ru.toptipfinance.com/basic-statistical-calculations