Как да изчислим средния резултат от оценките в excel. Как да намерите средната стойност в Excel

В повечето случаи данните са концентрирани около някаква централна точка. По този начин, за да се опише всеки набор от данни, е достатъчно да се посочи средната стойност. Нека разгледаме последователно три числови характеристики, които се използват за оценка на средната стойност на разпределението: средноаритметична, медиана и мода.

Средно аритметично

Средноаритметичната стойност (често наричана просто средна стойност) е най-често срещаната оценка на средната стойност на разпределение. Това е резултат от разделянето на сумата от всички наблюдавани числови стойности на техния брой. За извадка от числа X 1, X 2, ..., Xн, средната стойност на извадката (означена със символа ) равно на = (X 1 + X 2 + ... + Xн) / н, или

къде е средната извадка, н- размер на извадката, хи- i-ти елемент от извадката.

Изтеглете бележката във формата или примерите във формата

Помислете за изчисляване на средноаритметичната стойност на петгодишната средна годишна възвръщаемост на 15 много високорискови взаимни фонда (Фигура 1).

Ориз. 1. Средна годишна доходност на 15 много високорискови взаимни фонда

Средната извадка се изчислява, както следва:

Това е добра възвръщаемост, особено в сравнение с 3-4% от дохода, който вложителите на банки или кредитни съюзи са получили за същия период от време. Ако сортирате стойностите на възвръщаемостта, лесно е да видите, че осем фонда имат по-висока възвръщаемост, а седем - под средната. Средноаритметичната стойност действа като точка на равновесие, така че фондовете с ниски доходи да уравновесяват фондовете с висок доход. Всички елементи на извадката участват в изчисляването на средната стойност. Нито една от другите оценки на средната стойност на разпределението няма това свойство.

Кога да се изчисли средноаритметичната стойност.Тъй като средноаритметичната стойност зависи от всички елементи на извадката, наличието на екстремни стойности значително влияе на резултата. В такива ситуации средноаритметичната може да изкриви значението на числовите данни. Следователно, когато се описва набор от данни, съдържащ екстремни стойности, е необходимо да се посочи медианата или средноаритметичната и медиана. Например, ако премахнете възвръщаемостта на фонд RS Emerging Growth от извадката, средната възвръщаемост на извадката от 14 фонда ще намалее с почти 1% до 5,19%.

Медиана

Медианата е медианата на подреден масив от числа. Ако масивът не съдържа дублиращи се числа, тогава половината от неговите елементи ще бъдат по-малки и наполовина повече от медианата. Ако извадката съдържа екстремни стойности, по-добре е да се използва медианата, а не средноаритметичната стойност, за да се оцени средната стойност. За да изчислите медианата на извадка, първо трябва да я поръчате.

Тази формула е двусмислена. Резултатът му зависи от това дали числото е четно или нечетно. н:

  • Ако извадката съдържа нечетен брой елементи, медианата е (n + 1) / 2ти елемент.
  • Ако извадката съдържа четен брой елементи, медианата се намира между двата средни елемента на извадката и е равна на средното аритметично, изчислено за тези два елемента.

За да изчислите медианата на извадка от 15 много високорискови възвръщаемости на взаимни фондове, първо трябва да поръчате оригиналните данни (Фигура 2). Тогава медианата ще бъде срещу номера на средния елемент на извадката; в нашия пример №8. Excel има специална функция = MEDIANA (), която работи и с неподредени масиви.

Ориз. 2. Средно 15 средства

Значи медианата е 6,5. Това означава, че доходността на едната половина от фондовете с много високо ниво на риск не надвишава 6,5, докато доходността на другата половина не я надвишава. Имайте предвид, че медианата от 6,5 не е много по-висока от средната от 6,08.

Ако премахнем възвръщаемостта на фонда RS Emerging Growth от извадката, тогава медианата на останалите 14 фонда ще намалее до 6,2%, тоест не толкова значително, колкото средноаритметичната стойност (фиг. 3).

Ориз. 3. Средно 14 средства

мода

Терминът е въведен за първи път от Пиърсън през 1894 г. Модата е числото, което се появява най-често в извадката (най-модерен). Модата описва добре, например, типичната реакция на шофьорите на светофар да спрат шофирането. Класически пример за използване на модата е изборът на размера на произведената партида обувки или цвета на тапета. Ако едно разпределение има няколко режима, тогава се казва, че е мултимодално или мултимодално (има два или повече „върхове“). Мултимодалността на разпределението предоставя важна информация за естеството на изследваната променлива. Например, в проучванията на общественото мнение, ако една променлива представлява предпочитание или отношение към нещо, тогава мултимодалността може да означава, че има няколко определено различни мнения. Мултимодалността също служи като индикатор, че извадката не е хомогенна и наблюденията вероятно са генерирани от две или повече „покрити“ разпределения. За разлика от средноаритметичната стойност, отклоненията не влияят на модата. За непрекъснато разпределени случайни променливи, например за показателите за средната годишна възвръщаемост на взаимните фондове, модата понякога изобщо не съществува (или няма смисъл). Тъй като тези показатели могат да приемат голямо разнообразие от стойности, повтарящите се стойности са изключително редки.

Квартили

Квартилите са показатели, които най-често се използват за оценка на разпределението на данните при описание на свойствата на големи числови извадки. Докато медианата разделя подреден масив наполовина (50% от елементите на масива са по-малко от медианата и 50% повече), квартилите разделят подредения набор от данни на четири части. Стойностите на Q 1, медиана и Q 3 са съответно 25-ия, 50-ия и 75-ия персентил. Първият квартил, Q 1, е числото, което разделя извадката на две части: 25% от елементите са по-малко, а 75% са повече от първия квартил.

Третият квартил, Q 3, е числото, което също разделя извадката на две части: 75% от елементите са по-малко, а 25% са повече от третия квартил.

За изчисляване на квартилите във версии на Excel преди 2007 г. беше използвана функцията = QUARTILE (масив; част). Започвайки с версия Excel2010, се прилагат две функции:

  • = QUARTILE.INC (масив, част)
  • = QUARTILE.EXC (масив, част)

Тези две функции дават малко различни стойности (Фигура 4). Например, когато се изчисляват квартили на извадка, съдържаща данни за средната годишна доходност на 15 много високорискови взаимни фонда, Q 1 = 1,8 или –0,7 за QUARTILE.INCL и QUARTILE.EXCL, съответно. Между другото, функцията QUARTILE, която беше използвана по-рано, съответства на съвременната функция QUARTILE. За да изчислите квартилите в Excel с помощта на горните формули, не е необходимо да се подрежда масивът от данни.

Ориз. 4. Изчисляване на квартили в Excel

Да подчертаем отново. Excel може да изчислява квартили за едномерни дискретна сериясъдържащи стойностите на произволна променлива. Изчисляването на квартилите за честотно базирано разпределение е дадено в раздела по-долу.

Средна геометрична

За разлика от средноаритметичната, средната геометрична ви позволява да оцените степента на промяна в променливата във времето. Средната геометрична е коренът н-та степен от работата нстойности (в Excel се използва функцията = SRGEOM):

г= (X 1 * X 2 *… * X n) 1 / n

Подобен параметър - средната геометрична норма на възвръщаемост - се определя по формулата:

G = [(1 + R 1) * (1 + R 2) *… * (1 + R n)] 1 / n - 1,

където R и- норма на възвръщаемост за ити период от време.

Например, да предположим, че първоначалната инвестиция е $ 100 000. До края на първата година тя пада до нивото от $ 50 000, а до края на втората година се възстановява до първоначалните $ 100 000. Нормата на възвръщаемост на това инвестицията за двугодишен период е равна на 0, тъй като началният и крайният средства са равни помежду си. Въпреки това, средноаритметичната стойност на годишните норми на възвръщаемост е = (–0,5 + 1) / 2 = 0,25 или 25%, тъй като нормата на възвръщаемост през първата година R 1 = (50 000 - 100 000) / 100 000 = –0,5 , а във втория R 2 = (100 000 - 50 000) / 50 000 = 1. В същото време средната геометрична норма на възвръщаемостта за две години е: G = [(1–0,5) * (1 + 1 )] 1/2 - 1 = ½ - 1 = 1 - 1 = 0. По този начин средната геометрична отразява по-точно промяната (по-точно липсата на промени) в обема на инвестициите за двугодишен период, отколкото средноаритметичната .

Интересни факти.Първо, средната геометрична стойност винаги ще бъде по-малка от средната аритметична на едни и същи числа. Освен когато всички взети числа са равни едно на друго. Второ, като се имат предвид свойствата на правоъгълен триъгълник, можете да разберете защо средната стойност се нарича геометрична. Височината на правоъгълен триъгълник, спуснат до хипотенузата, е пропорционалната средна стойност между проекциите на катетите към хипотенузата, а всеки катет е средната пропорция между хипотенузата и нейната проекция към хипотенузата (фиг. 5). Това дава геометричен начин за конструиране на средната геометрична стойност на две (дължини) от сегменти: трябва да построите окръжност върху сумата от тези два сегмента, както в диаметъра, след което височината се възстановява от точката на връзката им до пресечната точка с кръгът ще даде желаната стойност:

Ориз. 5. Геометричната природа на средната геометрична (рисунка от Wikipedia)

Второто важно свойство на числовите данни е тяхното вариацияхарактеризираща степента на дисперсия на данните. Две различни проби могат да се различават както в средните стойности, така и в вариациите. Въпреки това, както е показано на фиг. 6 и 7, двете проби могат да имат еднакви вариации, но различни средни стойности, или еднакви средни стойности и напълно различни вариации. Данните, съответстващи на полигон B на фиг. 7, се променя много по-малко от данните, върху които полигон A.

Ориз. 6. Две симетрични камбановидни разпределения с еднакъв спред и различни средни стойности

Ориз. 7. Две симетрични камбановидни разпределения с еднакви средни стойности и различно разсейване

Има пет оценки за вариация на данните:

  • обхват,
  • интерквартилен диапазон,
  • дисперсия,
  • стандартно отклонение,
  • коефициентът на вариация.

Люлка

Диапазонът е разликата между най-големите и най-малките елементи на извадката:

Плъзгане = XМакс - XМин

Обхватът на извадка, съдържаща данни за средната годишна доходност на 15 много високорискови взаимни фонда, може да се изчисли с помощта на подреден масив (вижте фигура 4): Span = 18,5 - (–6,1) = 24,6. Това означава, че разликата между най-високата и най-ниската средна годишна възвръщаемост на средства с много високо ниво на риск е 24,6%.

Span измерва цялостната дисперсия на данните. Докато размерът на извадката е много проста оценка на цялостната дисперсия на данните, нейната слабост е, че не взема предвид как данните се разпределят между минималните и максималните елементи. Този ефект се вижда ясно на фиг. 8, която илюстрира проби със същия обхват. Скала B показва, че ако извадката съдържа поне една екстремна стойност, обхватът на извадката се оказва много неточна оценка на дисперсията на данните.

Ориз. 8. Сравнение на три проби със същия диапазон; триъгълникът символизира опората на везната и позицията му съответства на средната стойност на извадката

Интерквартилен диапазон

Интерквартилният или средният диапазон е разликата между третия и първия квартил на извадката:

Интерквартилен диапазон = Q 3 - Q 1

Тази стойност позволява да се оцени разпространението на 50% от елементите и да не се вземе предвид влиянието на екстремни елементи. Интерквартилният диапазон за извадка от средната годишна доходност на 15 много високорискови взаимни фонда може да бъде изчислен с помощта на данните на фиг. 4 (например за функцията QUARTILE.EXC): Интерквартилен диапазон = 9,8 - (–0,7) = 10,5. Интервалът, ограничен от числата 9,8 и –0,7, често се нарича средна половина.

Трябва да се отбележи, че стойностите на Q 1 и Q 3, а оттам и на интерквартилния диапазон, не зависят от наличието на извънредни стойности, тъй като тяхното изчисление не взема предвид стойността, която би била по-малка от Q 1 или повече отколкото Q 3. Количествените агрегати като медиана, първи и трети квартили и интерквартилен диапазон, които не се влияят от извънредни стойности, се наричат ​​стабилни мерки.

Въпреки че обхватът и интерквартилният диапазон дават оценка съответно на общата и средната дисперсия на извадката, нито една от тези оценки не взема предвид как се разпределят данните. Дисперсия и стандартно отклонениеса лишени от този недостатък. Тези показатели осигуряват оценка на степента, до която данните се колебаят около средната стойност. Дисперсия на извадкатае апроксимация на средната аритметична стойност, изчислена от квадратите на разликите между всеки елемент на извадката и средната извадка. За проба X 1, X 2, ... X n дисперсията на извадката (означена със символа S 2 се дава със следната формула:

Като цяло дисперсията на извадката е сумата от квадратите на разликите между елементите в извадката и средната извадка, разделена на стойност, равна на размера на извадката минус едно:

където - средноаритметично, н- размер на извадката, X i - ития примерен елемент х... В Excel преди 2007 г. функцията = VARP () се използва за изчисляване на дисперсията на извадката; от 2010 г. се използва функцията = VARV ().

Най-практичната и широко приета оценка за разпространението на данните е стандартно извадково отклонение... Този индикатор се обозначава със символа S и е равен на корен квадратен от дисперсията на извадката:

В Excel преди 2007 г. функцията = STDEV () се използва за изчисляване на стандартното отклонение на извадката; от 2010 г. се използва функцията = STDEV.V (). За изчисляването на тези функции наборът от данни може да бъде неподреден.

Нито дисперсията на извадката, нито стандартното отклонение на извадката могат да бъдат отрицателни. Единствената ситуация, в която показателите S 2 и S могат да бъдат нула, е, ако всички елементи на извадката са равни един на друг. В този много невероятен случай обхватът и интерквартилният диапазон също са нула.

Числовите данни по своята същност са нестабилни. Всяка променлива може да приеме много различни стойности. Например, различните взаимни фондове имат различни нива на възвръщаемост и загуба. Поради променливостта на числовите данни е много важно да се изследват не само оценките на средната стойност, които имат кумулативен характер, но и оценките на дисперсията, които характеризират дисперсията на данните.

Дисперсията и стандартното отклонение ви позволяват да оцените разпространението на данните около средната стойност, с други думи, да определите колко елемента в извадката са по-малко от средното и колко повече. Дисперсията има някои ценни математически свойства. Стойността му обаче е квадратът на мерната единица - квадратен процент, квадратен долар, квадратен инч и т.н. Следователно, естествената оценка на дисперсията е стандартното отклонение, което се изразява в обичайни мерни единици - процент от дохода, долари или инчове.

Стандартното отклонение ви позволява да оцените размера на флуктуацията на елементите на пробата около средната стойност. В почти всички ситуации повечето от наблюдаваните стойности се намират в интервала плюс или минус едно стандартно отклонение от средната стойност. Следователно, като се знае средноаритметичната стойност на елементите на извадката и стандартното отклонение на извадката, е възможно да се определи интервалът, към който принадлежи по-голямата част от данните.

Стандартното отклонение на възвръщаемостта на 15-те много високорискови взаимни фонда е 6,6 (Фигура 9). Това означава, че доходността на по-голямата част от средствата се различава от средната стойност с не повече от 6,6% (т.е. варира в диапазона от - С= 6,2 - 6,6 = -0,4 до + С= 12,8). Всъщност в този интервал се намира петгодишната средна годишна доходност от 53,3% (8 от 15) средства.

Ориз. 9. Стандартно отклонение на извадката

Обърнете внимание, че когато се добавят квадратните разлики, пробата, по-далеч от средната стойност, придобива повече тегло от по-близката проба. Това свойство е основната причина средното аритметично да се използва най-често за оценка на средната стойност на разпределение.

Коефициентът на вариация

За разлика от предишни оценки на спреда, коефициентът на вариация е относителна оценка. Винаги се измерва като процент, а не по отношение на необработените данни. Коефициентът на вариация, означен с CV, измерва дисперсията на данните спрямо средната стойност. Коефициентът на вариация е равен на стандартното отклонение, разделено на средноаритметичната стойност и умножено по 100%:

където С- стандартно извадково отклонение, - средна извадка.

Коефициентът на вариация ви позволява да сравните две проби, чиито елементи са изразени в различни мерни единици. Например мениджър за доставка на поща възнамерява да обнови автопарка. Когато зареждате опаковки, има два вида ограничения, които трябва да имате предвид: теглото (в паундове) и обема (в кубични фута) на всеки пакет. За проба от 200 чувала приемете, че средното тегло е 26,0 паунда, стандартното отклонение на теглото е 3,9 паунда, средният обем на торбата е 8,8 кубически фута, а стандартното отклонение на обема е 2,2 кубични фута. Как сравнявате разликата в теглото и обема на чантите?

Тъй като мерните единици за тегло и обем се различават една от друга, мениджърът трябва да сравни относителното разпределение на тези стойности. Коефициентът на вариация на теглото е CV W = 3,9 / 26,0 * 100% = 15%, а коефициентът на вариация на обема CV V = 2,2 / 8,8 * 100% = 25%. По този начин относителното разпределение в обема на пакета е много по-голямо от относителното разпределение в теглото им.

Формуляр за разпространение

Третото важно свойство на извадката е формата на нейното разпределение. Това разпределение може да бъде симетрично или асиметрично. За да се опише формата на разпределението, е необходимо да се изчисли неговата средна и медиана. Ако тези два индикатора съвпадат, променливата се счита за симетрично разпределена. Ако средната стойност на променливата е по-голяма от медианата, нейното разпределение има положителна асиметрия (фиг. 10). Ако медианата е по-голяма от средната, разпределението на променливата е отрицателно изкривено. Положителната асиметрия възниква, когато средната стойност се увеличи до необичайно високи стойности. Отрицателното изкривяване възниква, когато средната стойност намалява до необичайно малки стойности. Променливата е симетрично разпределена, ако не приема никакви екстремни стойности в нито една посока, така че високите и ниските стойности на променливата се балансират взаимно.

Ориз. 10. Три вида разпределения

Данните, показани на А-скала, имат отрицателна асиметрия. Тази фигура показва дълга опашка и изкривяване наляво, причинено от необичайно ниски стойности. Тези изключително малки стойности изместват средната стойност наляво и тя става по-малка от медианата. Данните, показани на B скалата, са симетрично разпределени. Лявата и дясната половина на разпределението са техни огледални изображения. Високите и ниските стойности се балансират взаимно, а средната и медианата са равни. Данните по скалата B имат положителна асиметрия. Тази фигура показва дълга опашка и изкривяване вдясно, причинено от необичайно високи стойности. Тези твърде високи стойности изместват средната стойност надясно и тя става по-голяма от медианата.

В Excel описателна статистика може да се получи с помощта на добавката Пакет за анализ... Преминете през менюто ДанниАнализ на данни, в прозореца, който се отваря, изберете реда Описателна статистикаи щракнете Добре... В прозореца Описателна статистикане забравяйте да посочите Интервал на въвеждане(фиг. 11). Ако искате да видите описателна статистика на същия лист като оригиналните данни, изберете бутона за избор Изходен интервали посочете клетката, където трябва да се постави горният ляв ъгъл на изходната статистика (в нашия пример $ C $ 1). Ако искате да изведете данни в нов лист или в нова работна книга, просто трябва да изберете подходящия бутон за избор. Поставете отметка в квадратчето до Обобщена статистика... По желание можете също да изберете Ниво на трудност,k-та най-малка иk-ти най-голям.

Ако е на депозит Даннив района на Анализнямате показана икона Анализ на данни, първо трябва да инсталирате добавката Пакет за анализ(виж например).

Ориз. 11. Описателна статистика за петгодишната средна годишна възвръщаемост на средства с много високи нива на риск, изчислена с помощта на добавката Анализ на данни Excel програми

Excel изчислява различни статистически данни, обсъдени по-горе: средна стойност, медиана, режим, стандартно отклонение, дисперсия, диапазон ( интервал), минимален, максимален и размер на извадката ( проверете). Освен това Excel изчислява някои статистически данни, които са нови за нас: стандартна грешка, ексцес и изкривяване. Стандартна грешкаравно на стандартното отклонение, разделено на квадратния корен от размера на извадката. Асиметрияхарактеризира отклонението от симетрията на разпределението и е функция, която зависи от куба на разликите между елементите на извадката и средната стойност. Куртозата е мярка за относителната концентрация на данни около средната спрямо опашките на разпределението и зависи от разликите между извадката и средната стойност, повишена на четвърта степен.

Изчисляване на описателна статистика за популация

Средната стойност, разпространението и формата на разпределението, обсъдено по-горе, са характеристики, определени от извадката. Ако обаче наборът от данни съдържа числови измерения за цялата съвкупност, можете да изчислите нейните параметри. Тези параметри включват математическото очакване, дисперсията и стандартното отклонение на общата съвкупност.

Очаквана стойносте равно на сбора от всички стойности на общата съвкупност, разделена на размера на генералната съвкупност:

където µ - очаквана стойност, хи- и-то наблюдение на променлива х, н- обемът на общата съвкупност. Excel използва същата функция за изчисляване на математическото очакване като за средноаритметичната стойност: = AVERAGE ().

Дисперсия в популациятаравен на сбора от квадратите на разликите между елементите на генералната съвкупност и мат. очакване, разделено на размера на общата популация:

където σ 2- дисперсия на общата съвкупност. В Excel преди 2007 г. функцията = VARP () се използва за изчисляване на дисперсията на популация, от 2010 г. = VAR.G ().

Стандартно отклонение на населениеторавен на корен квадратен от дисперсията на популацията:

В Excel преди 2007 г. функцията = STDEVP () се използва за изчисляване на стандартното отклонение на населението, от 2010 г. = STDEV.Y (). Имайте предвид, че формулите за дисперсията и стандартното отклонение на съвкупността са различни от формулите за изчисляване на дисперсията на извадката и стандартното отклонение. При изчисляване на примерна статистика S 2и Сзнаменателят на дробта е n - 1, и при изчисляване на параметрите σ 2и σ - обемът на общата съвкупност н.

Основно правило

В повечето ситуации голяма част от наблюденията са концентрирани около медианата, образувайки клъстер. В набори от данни с положителна асиметрия, този клъстер е разположен вляво (т.е. отдолу) от математическото очакване, а в набори от данни с отрицателна асина, този клъстер е разположен вдясно (т.е. отгоре) от математическото очакване. За симетричните данни средната и медианата са еднакви и наблюденията са концентрирани около средната стойност, образувайки разпределение във формата на камбана. Ако разпределението няма изразена асиметрия и данните са концентрирани около определен център на тежестта, може да се приложи правило за оценка на променливостта, което гласи: ако данните имат разпределение във формата на камбана, тогава приблизително 68% от наблюденията са не повече от едно стандартно отклонение от математическото очакване Приблизително 95% от наблюденията са не повече от две стандартни отклонения от математическото очакване, а 99,7% от наблюденията са не повече от три стандартни отклонения от математическото очакване.

По този начин стандартното отклонение, което е оценка на средната вариация около средната стойност, помага да се разбере как се разпределят наблюденията и да се идентифицират отклонения. От практическото правило следва, че за камбановидни разпределения само една стойност на двадесет се различава от математическото очакване с повече от две стандартни отклонения. Следователно стойностите са извън интервала µ ± 2σ, могат да се считат за извънредни. Освен това само три от 1000 наблюдения се различават от математическото очакване с повече от три стандартни отклонения. По този начин стойностите са извън интервала µ ± 3σпочти винаги са извънредни. За разпределения, които са силно изкривени или не са с форма на камбана, може да се приложи емпиричното правило на Biename-Chebyshev.

Преди повече от сто години математиците Биенаме и Чебишев независимо откриха полезното свойство на стандартното отклонение. Те открили, че за всеки набор от данни, независимо от формата на разпределението, процентът на наблюденията, разположени на разстояние, не по-голямо от кстандартни отклонения от математическото очакване, не по-малко (1 – 1/ k 2) * 100%.

Например, ако к= 2, правилото Biename-Chebyshev гласи, че най-малко (1 - (1/2) 2) x 100% = 75% от наблюденията трябва да лежат в интервала µ ± 2σ... Това правило е вярно за всеки кпо-голям от един. Правилото Biename-Chebyshev е много общо и е валидно за дистрибуции от всякакъв вид. Той посочва минималния брой наблюдения, разстоянието от което до математическото очакване не надвишава определената стойност. Въпреки това, ако разпределението е с форма на камбана, практическото правило оценява по-точно концентрацията на данни около очакваната стойност.

Изчисляване на описателна статистика за честотно базирано разпределение

Ако оригиналните данни не са налични, разпределението на честотата става единствен източник на информация. В такива ситуации можете да изчислите приблизителните стойности на количествените показатели за разпределение, като средно аритметично, стандартно отклонение, квартили.

Ако извадковите данни са представени под формата на честотно разпределение, може да се изчисли приблизителна стойност на средноаритметичната стойност, като се приеме, че всички стойности във всеки клас са концентрирани в средната точка на класа:

където - средна извадка, н- броя на наблюденията или размера на извадката, С- броя на класовете в честотното разпределение, m j- средна точка j- отидете на клас, еjе съответната честота jклас.

За да се изчисли стандартното отклонение от честотното разпределение, се приема също, че всички стойности във всеки клас са центрирани в средата на класа.

За да разберем как се определят квартилите на серията въз основа на честотите, нека разгледаме изчислението на долния квартил въз основа на данни за 2013 г. за разпределението на населението на Русия по среден паричен доход на глава от населението (фиг. 12).

Ориз. 12. Делът на населението на Русия със средни парични доходи на глава от населението средно на месец, рубли

За да изчислите първия квартил на серия от интервални вариации, можете да използвате формулата:

където Q1 е стойността на първия квартил, хQ1 е долната граница на интервала, съдържащ първия квартил (интервалът се определя от кумулативната честота, първата надвишава 25%); i е размерът на интервала; Σf е сумата от честотите на цялата проба; вероятно винаги е равно на 100%; SQ1-1 е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил; fQ1 е честотата на интервала, съдържащ долния квартил. Формулата за третия квартил се различава по това, че на всички места вместо Q1 трябва да използвате Q3 и вместо да замените ¾.

В нашия пример (фиг. 12) долният квартил е в диапазона 7000.1 - 10 000, чиято кумулативна честота е 26.4%. Долната граница на този интервал е 7000 рубли, стойността на интервала е 3000 рубли, кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил, е 13,4%, честотата на интервала, съдържащ долния квартил, е 13,0%. Така: Q1 = 7000 + 3000 * (¼ * 100 - 13,4) / 13 = 9677 рубли.

Подводни камъни с описателна статистика

В тази публикация разгледахме как да опишем набор от данни, използвайки различни статистически данни, които оценяват неговата средна стойност, разпространение и разпределение. Следващата стъпка е анализ и интерпретация на данните. Досега изучавахме обективните свойства на данните, а сега се обръщаме към тяхната субективна интерпретация. Две грешки чакат изследователя: неправилно избран обект на анализ и неправилна интерпретация на резултатите.

Анализът на представянето на 15 много високорискови взаимни фонда е доста безпристрастен. Това доведе до напълно обективни изводи: всички взаимни фондове имат различна доходност, разпределението на възвръщаемостта на фондовете варира от –6,1 до 18,5, а средната доходност е 6,08. Обективността на анализа на данните се осигурява от правилния избор на общите количествени показатели за разпределение. Бяха разгледани няколко метода за оценка на средната стойност и разпространението на данните, посочени са техните предимства и недостатъци. Как избирате правилната статистика, за да предоставите обективен и безпристрастен анализ? Ако разпределението на вашите данни е леко изкривено, трябва ли да изберете медианата пред средноаритметичната? Кой индикатор по-точно характеризира разпространението на данните: стандартно отклонение или диапазон? Трябва ли да се посочи положителна асиметрия на разпределението?

От друга страна, интерпретацията на данните е субективен процес. Различните хора стигат до различни заключения, когато тълкуват едни и същи резултати. Всеки има своя гледна точка. Някой смята общите показатели за средната годишна доходност на 15 фонда с много високо ниво на риск за добри и е доста доволен от получените приходи. Други може да смятат, че тези средства имат твърде ниска възвръщаемост. Така субективността трябва да се компенсира с честност, неутралност и яснота на заключенията.

Етични въпроси

Анализът на данните е неразривно свързан с етичните въпроси. Човек трябва да бъде критичен към информацията, разпространявана от вестници, радио, телевизия и интернет. С течение на времето ще се научите да бъдете скептични не само към резултатите, но и към целите, предмета и обективността на изследването. Известният британски политик Бенджамин Дизраели го каза най-добре: „Има три вида лъжи: лъжи, откровени лъжи и статистика“.

Както е отбелязано в бележката, при подбора на резултатите, които да бъдат докладвани, възникват етични проблеми. Трябва да се публикуват както положителни, така и отрицателни резултати. Освен това, когато се прави презентация или писмен доклад, резултатите трябва да бъдат представени по честен, неутрален и обективен начин. Правете разлика между неуспешно и нечестно представяне. За да направите това, е необходимо да се определи какви са били намеренията на говорещия. Понякога говорещият несъзнателно пропуска важна информация, а понякога - нарочно (например, ако използва средноаритметичната стойност, за да оцени средната стойност на очевидно асиметрични данни, за да получи желания резултат). Също така е несправедливо да се пренебрегват резултати, които не отговарят на гледната точка на изследователя.

Използвани материали от книгата Levin and other Statistics for managers. - М .: Уилямс, 2004 .-- с. 178-209

Функцията QUARTILE е запазена за съвместимост с по-ранни версии на Excel

Excel направи изчисляването на средноаритметичната стойност на множество клетки много проста задача - просто използвайте функцията СРЕДНО АРИТМЕТИЧНО(СРЕДНО АРИТМЕТИЧНО). Но какво ще стане, ако някои стойности имат по-голяма тежест от други? Например, в много курсове тестовете се претеглят повече от заданията. За такива случаи е необходимо да се изчисли средно претеглена.

Excel няма функция за изчисляване на среднопретеглената, но има функция, която върши по-голямата част от работата вместо вас: СУМПРОИЗВОД(СУМПРОИЗВОД). И дори ако никога не сте използвали тази функция преди, тогава до края на тази статия ще работите с нея като професионалист. Методът, който използваме, работи във всяка версия на Excel, както и в други електронни таблици като Google Sheets.

Подготовка на масата

Ако ще изчислите среднопретеглена стойност, имате нужда от поне две колони. Първата колона (в нашия пример колона B) съдържа оценките за всяко задание или тест. Втората колона (колона C) съдържа теглата. По-голямото тегло означава по-голямо въздействие на елемента или теста върху крайната оценка.

За да разберете какво е теглото, можете да го мислите като процент от крайната си оценка. Всъщност това не е така, тъй като в този случай теглото трябва да е 100%. Формулата, която ще анализираме в този урок, ще изчисли всичко правилно и не зависи от количеството, в което се добавят теглата.

Въвеждаме формулата

Сега, когато нашата таблица е готова, добавяме формулата към клетката B10(всяка празна клетка ще свърши работа). Както при всяка формула в Excel, започваме със знак за равенство (=).

Първата част от нашата формула е функцията СУМПРОИЗВОД(СУМПРОИЗВОД). Аргументите трябва да бъдат затворени в скоби, така че ги отваряме:

СУМПРОДУКТ (
= СУМПРОДУКТ (

След това добавяме аргументите към функцията. СУМПРОИЗВОД(SUMPRODUCT) може да има множество аргументи, но обикновено се използват два. В нашия пример първият аргумент ще бъде диапазон от клетки B2: B9който съдържа оценки.

СУМПРОИЗВОД (B2: B9
= СУМПРОИЗВОД (B2: B9

Вторият аргумент ще бъде диапазонът от клетки C2: C9която съдържа теглата. Тези аргументи трябва да бъдат разделени с точка и запетая (запетая). Когато всичко е готово, затворете скобите:

СУМПРОИЗВОД (B2: B9; C2: C9)
= СУМПРОИЗВОД (B2: B9, C2: C9)

Сега нека добавим втората част от нашата формула, която ще раздели резултата, изчислен от функцията СУМПРОИЗВОД(SUMPRODUCT) за сумата от теглата. По-късно ще обсъдим защо това е важно.

За да извършим операцията за разделяне, продължаваме вече въведената формула със символа / (наклонена черта) и след това напишете функцията СУМ(SUM):

SUMPRODUCT (B2: B9; C2: C9) / SUM (
= SUMPRODUCT (B2: B9, C2: C9) / SUM (

За функция СУМ(SUM) ще посочим само един аргумент - диапазона от клетки C2: C9... Не забравяйте да затворите скобите, след като въведете аргумента:

СУМ ПРОИЗВОД (B2: B9; C2: C9) / СУМ (C2: C9)
= СУМ ПРОИЗВОД (B2: B9, C2: C9) / СУМ (C2: C9)

Готов! След натискане на клавиша Въведете Excel ще изчисли среднопретеглената стойност. В нашия пример крайният резултат ще бъде 83,6 .

Как работи

Нека да разгледаме всяка част от формулата, като започнем с функцията СУМПРОИЗВОД(SUMPRODUCT), за да разберете как работи. Функция СУМПРОИЗВОД(SUMPRODUCT) изчислява произведението на оценката за всяко задание по теглото му и след това сумира всички получени продукти. С други думи, функцията намира сбора от произведенията, откъдето идва и името й. Така че за Задачи 1умножете 85 по 5 и за Тестумножете 83 по 25.

Ако се чудите защо трябва да умножаваме стойностите в първата част, представете си, че колкото по-голяма тежест има задачата, толкова повече пъти трябва да вземем предвид оценката за нея. Например, Задача 2преброени 5 пъти и Последен изпит- 45 пъти. Ето защо Последен изпитима по-голямо влияние върху крайната оценка.

За сравнение, при изчисляване на обичайното средноаритметично, всяка стойност се брои само веднъж, тоест всички стойности са еднакво претеглени.

Ако можеше да погледнеш под капака на функцията СУМПРОИЗВОД(SUMPRODUCT), видяхме, че това, което тя всъщност мисли е следното:

= (B2 * C2) + (B3 * C3) + (B4 * C4) + (B5 * C5) + (B6 * C6) + (B7 * C7) + (B8 * C8) + (B9 * C9)

За щастие не е нужно да пишем толкова дълга формула, т.к СУМПРОИЗВОД(SUMPRODUCT) прави всичко автоматично.

Самата функция СУМПРОИЗВОД(SUMPRODUCT) ни връща огромен брой - 10450 ... В този момент втората част от формулата се включва: / СУМА (C2: C9)или / СУМА (C2: C9)което връща резултата към нормалния диапазон, давайки отговора 83,6 .

Втората част от формулата е много важна, т.к ви позволява автоматично да коригирате изчисленията. Не забравяйте, че теглото не трябва да е добавено до 100%? Всичко това благодарение на втората част от формулата. Например, ако увеличим една или повече стойности на теглата, втората част на формулата просто ще се раздели на по-голямата стойност, което отново ще доведе до правилния отговор. Или можем да направим теглата много по-малки, например да посочим стойности като 0,5 , 2,5 , 3 или 4,5 и формулата ще продължи да работи правилно. Страхотно, нали?

Най-често срещаният тип средна стойност е средноаритметичната.

Проста средна аритметика

Простата средна аритметична стойност е среден член, при определянето на който общият обем на даден елемент в данните се разпределя равномерно между всички единици, включени в този набор. И така, средната годишна продукция на служител е количеството продукция, което би паднало на всеки служител, ако целият обем продукция беше равномерно разпределен между всички служители на организацията. Средноаритметичната проста стойност се изчислява по формулата:

Проста средна аритметика- Равно на съотношението на сумата от индивидуалните стойности на характеристика към броя на характеристиките в съвкупността

Пример 1 ... Екип от 6 работници получава 3 3,2 3,3 3,5 3,8 3,1 хиляди рубли на месец.

Намерете средна заплата
Решение: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 хиляди рубли.

Претеглена средна аритметична стойност

Ако обемът на набора от данни е голям и представлява серия на разпределение, тогава се изчислява претеглена средна аритметична стойност. Ето как се определя среднопретеглената цена за единица продукция: общите производствени разходи (сумата от продуктите на нейното количество към цената на единица продукция) се разделят на общото количество продукция.

Представяме това под формата на следната формула:

Претеглена средна аритметична стойност- е равно на съотношението (сумата от произведенията на стойността на даден признак към честотата на повторение на даден признак) към (сумата от честотите на всички признаци).Използва се, когато вариантите на изследваната съвкупност се появяват неравен брой пъти.

Пример 2 ... Намерете средната месечна заплата на работник в цеха

Средните заплати могат да се получат чрез разделяне на общите заплати на общия брой работници:

Отговор: 3,35 хиляди рубли.

Средно аритметично за интервални серии

При изчисляване на средноаритметичната стойност за интервална вариационна поредица първо определете средната стойност за всеки интервал като полусумата от горната и долната граница, а след това - средната стойност за цялата серия. В случай на отворени интервали стойността на долния или горния интервал се определя от размера на съседните до тях интервали.

Средните стойности, изчислени от интервални серии, са приблизителни.

Пример 3... Определете средната възраст на вечерните ученици.

Средните стойности, изчислени от интервални серии, са приблизителни. Степента на тяхната апроксимация зависи от степента, до която действителното разпределение на единиците на населението в рамките на интервала се доближава до еднородно.

При изчисляване на средните стойности могат да се използват не само абсолютни, но и относителни стойности (честота):

Средноаритметичната стойност има редица свойства, които по-пълно разкриват същността му и опростяват изчислението:

1. Произведението на средното по сбора на честотите винаги е равно на сбора от произведенията на варианта по честотите, т.е.

2. Средноаритметичната стойност на сбора на вариращите величини е равна на сумата от средноаритметичната стойност на тези величини:

3. Алгебричната сума от отклоненията на отделните стойности на атрибута от средната стойност е равна на нула:

4. Сборът от квадратите на отклоненията на опциите от средното е по-малък от сбора на квадратите на отклоненията от всяка друга произволна стойност, т.е.

Най-подходящ като програма за различни изчисления. По правило Excel идва с MS Office, който е инсталиран на почти всеки компютър. Но малко хора знаят колко мощна е тази програма. След като изучава основите на Excel, той може да се приложи в почти всяка област на дейност. Тази програма ще бъде много полезна за учениците за решаване на задачи по математика, физика, химия, икономика и др. Например в Excel можете бързо и лесно да намерите средната стойност на числата, които искате.

Видео за средно изчисление

Как да намеря средната стойност в Excel?

И така, как обикновено се изчислява средното аритметично? За да направите това, разделете на общия им брой. Това е достатъчно за решаване на много прости проблеми, но във всички останали случаи тази опция няма да работи. Факт е, че в реална ситуация числата винаги се променят, броят на тези числа също. Например, потребителят има таблица, показваща оценките на учениците. И трябва да намерите GPA за всеки ученик. Ясно е, че всеки от тях ще има различни оценки, а броят на предметите в различните специалности и в различните курсове също ще бъде различен. Би било много глупаво (и ирационално) да проследявате и преброявате всичко това ръчно. И не е необходимо да правите това, защото Excel има специална функция, която ще ви помогне да намерите средната стойност на всякакви числа. Дори и да се променят от време на време, програмата автоматично ще преизчисли новите стойности.

Може да се предположи, че потребителят има вече създадена таблица с две колони: първата колона е името на предмета, а втората е оценката по този предмет. И трябва да намерите средния резултат. За да направите това, трябва да използвате съветника за функции, за да напишете формула за изчисляване на средноаритметичната стойност. Това се прави съвсем просто:

  1. Необходимо е да изберете и изберете елементите "Вмъкване - Функция" в лентата с менюта.
  2. Ще се отвори нов прозорец "Съветник за функции", където в полето "Категория" трябва да посочите елемента "Статистически".
  3. След това в полето "Избор на функция" трябва да намерите реда "СРЕДНО" (целият списък е филтриран по азбучен ред, така че не би трябвало да има проблеми с търсенето).
  4. След това ще се отвори друг прозорец, където трябва да посочите диапазона от клетки, за които ще се изчислява средноаритметичната стойност.
  5. След щракване върху бутона "OK", резултатът ще се покаже в избраната клетка.

Ако сега, например, промените някаква стойност за един от елементите (или го изтриете напълно и оставите полето празно), Excel незабавно ще преизчисли формулата и ще даде нов резултат.

Алтернативни начини за изчисляване на средната стойност

Друг начин да намерите средната стойност в Excel е с лентата с формули.

Той е точно под лентата с менюта и точно над първия ред на работния лист на Excel. Това е мястото, където се показват. Например, ако щракнете върху клетка, където средната стойност вече е изчислена, тогава в лентата с формули можете да видите нещо като следното: = СРЕДНО (B1: B6). А малко вляво е бутонът "fx", като щракнете върху който, можете да отворите вече познатия прозорец, за да изберете желаната функция.

Можете също да пишете всякакви формули ръчно. За да направите това, поставете знака "=" във всяка избрана клетка, напишете ръчно формулата (СРЕДНО), отворете скобата, изберете желания диапазон от клетки и затворете скобата. Резултатът ще се покаже незабавно.

По такъв прост начин средната стойност се изчислява в Microsoft Excel. По същия начин можете да изчислите средноаритметичната стойност само за задължителните полета, а не за целия диапазон от клетки. За да направите това, докато избирате диапазон от клетки, просто трябва да задържите клавиша "Ctrl" и да щракнете последователно върху всяко необходимо поле.

В математиката средноаритметичната стойност на числата (или само средната) е сборът от всички числа в даден набор, разделен на техния брой. Това е най-обобщената и разпространена концепция за средната стойност. Както вече разбрахте, за да намерите средната стойност, трябва да сумирате всички числа, които са ви дадени, и да разделите резултата на броя на термините.

Какво е средната аритметика?

Да вземем пример.

Пример 1... Дадени числа: 6, 7, 11. Трябва да намерите средната им стойност.

Решение.

Първо, нека намерим сбора от всички тези числа.

Сега нека разделим получената сума на броя на членовете. Тъй като имаме съответно три члена, ще разделим на три.

Следователно средното от 6, 7 и 11 е 8. Защо 8? Защото сборът от 6, 7 и 11 ще бъде същият като три осмици. Това ясно се вижда на илюстрацията.

Средната стойност донякъде напомня за "подравняването" на поредица от числа. Както виждате, купчините моливи са се превърнали в едно ниво.

Нека разгледаме друг пример, за да затвърдим получените знания.

Пример 2.Дадени числа: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Трябва да намерите тяхното средноаритметично.

Решение.

Намираме сумата.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Разделете на броя на термините (в този случай - 15).

Следователно средната стойност на тази серия от числа е 22.

Сега нека разгледаме отрицателните числа. Нека си припомним как да ги обобщим. Например, имате две числа 1 и -4. Да намерим тяхната сума.

1 + (-4) = 1 – 4 = -3

Имайки това предвид, помислете за друг пример.

Пример 3.Намерете средната стойност на поредица от числа: 3, -7, 5, 13, -2.

Решение.

Намерете сбора от числата.

3 + (-7) + 5 + 13 + (-2) = 12

Тъй като има 5 члена, разделяме получената сума на 5.

Следователно средноаритметичната стойност на числата 3, -7, 5, 13, -2 е 2,4.

В нашето време на технологичен прогрес е много по-удобно да се използват компютърни програми, за да се намери средната стойност. Microsoft Office Excel е един от тях. Намирането на средната стойност в Excel е бързо и лесно. Освен това тази програма е включена в софтуерния пакет на Microsoft Office. Нека разгледаме кратко ръководство за това как да намерите средната аритметика с помощта на тази програма.

За да изчислите средната стойност на поредица от числа, трябва да използвате функцията AVERAGE. Синтаксисът на тази функция е:
= Средно (аргумент1, аргумент2, ... аргумент255)
където аргумент1, аргумент2, ... аргумент255 са или числа, или препратки към клетки (клетките означават диапазони и масиви).

За да стане по-ясно, нека изпробваме натрупаните знания.

  1. Въведете числата 11, 12, 13, 14, 15, 16 в клетки C1 - C6.
  2. Изберете клетка C7, като щракнете върху нея. В тази клетка ще покажем средната стойност.
  3. Щракнете върху раздела Формули.
  4. Изберете Още функции> Статистически, за да отворите падащия списък.
  5. Изберете СРЕДНО. След това трябва да се отвори диалогов прозорец.
  6. Изберете и плъзнете клетки C1-C6 там, за да зададете диапазона в диалоговия прозорец.
  7. Потвърдете действията си с клавиша "OK".
  8. Ако сте направили всичко правилно, в клетка C7 трябва да имате отговор - 13.7. Когато щракнете върху клетка C7, функцията (= Средно (C1: C6)) ще се покаже в лентата с формули.

Много е удобно да използвате тази функция за счетоводство, фактуриране или когато просто трябва да намерите средната стойност на много дълга серия от числа. Поради това често се използва в офиси и големи компании. Това ви позволява да поддържате записите в ред и дава възможност бързо да изчислите нещо (например средния доход на месец). Също така с помощта на Excel можете да намерите средната стойност на функцията.

Средно аритметично

Този термин има други значения, виж средното.

Средно аритметично(в математиката и статистиката) набор от числа е сумата от всички числа, разделена на техния брой. Това е една от най-често срещаните мерки на централната тенденция.

Предложено е (заедно със средната геометрична и средната хармонична) от питагорейците.

Специални случаи на средноаритметичната стойност са средната стойност (на общата съвкупност) и средната извадка (извадки).

Въведение

Означаваме набора от данни х = (х 1 , х 2 , …, х н), тогава средната извадка обикновено се обозначава с хоризонтална лента над променливата (x ¯ (\ displaystyle (\ bar (x))), произнася се „ хс линия ").

Гръцката буква μ се използва за означаване на средноаритметичната стойност на цялото население. За произволна променлива, за която е определена средната стойност, μ е вероятностна средна стойностили математическото очакване на случайна променлива. Ако комплектът хе колекция от случайни числа с вероятностно средно μ, тогава за всяка извадка х иот тази колекция μ = E ( х и) е математическото очакване на тази извадка.

На практика разликата между μ и x ¯ (\ displaystyle (\ bar (x))) е, че μ е типична променлива, защото можете да видите извадката, а не цялата съвкупност. Следователно, ако извадката е представена на случаен принцип (по отношение на теорията на вероятностите), тогава x ¯ (\ displaystyle (\ bar (x))) (но не μ) може да се третира като произволна променлива с разпределение на вероятностите върху извадката (разпределение на вероятностите на средната стойност).

И двете от тези количества се изчисляват по същия начин:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n). (\ displaystyle (\ bar (x)) = (\ frac (1) (n)) \ sum _ (i = 1) ^ (n) x_ (i) = (\ frac (1) (n)) (x_ (1) + \ cdots + x_ (n)).)

Ако хе случайна променлива, тогава математическото очакване хможе да се разглежда като средноаритметично от стойностите при многократни измервания на количество х... Това е проявление на закона за големите числа. Следователно средната извадка се използва за оценка на неизвестното математическо очакване.

В елементарната алгебра е доказано, че средната н+ 1 числа над средното нчисла, ако и само ако новото число е по-голямо от старото средно, по-малко, ако и само ако новото число е по-малко от средното и не се променя, ако и само ако новото число е равно на средното. Колкото повече н, толкова по-малка е разликата между новите и стари средни стойности.

Имайте предвид, че има няколко други "средни" стойности, включително средна мощност, средна по Колмогоров, средна хармонична, средна аритметично-геометрична и различни претеглени средни стойности (напр. претеглена средна аритметична, средна претеглена геометрична стойност, средно претеглена хармонична).

Примери за

  • За три числа ги добавете и разделете на 3:
x 1 + x 2 + x 3 3. (\ displaystyle (\ frac (x_ (1) + x_ (2) + x_ (3)) (3)).)
  • За четири числа ги добавете и разделете на 4:
x 1 + x 2 + x 3 + x 4 4. (\ displaystyle (\ frac (x_ (1) + x_ (2) + x_ (3) + x_ (4)) (4)).)

Или по-просто 5 + 5 = 10, 10: 2. Тъй като сме добавили 2 числа, което означава колко числа събираме, ние разделяме на толкова.

Непрекъсната произволна променлива

За непрекъснато разпределена величина f (x) (\ displaystyle f (x)), средното аритметично за сегмента [a; b] (\ displaystyle) се дефинира от гледна точка на определения интеграл:

F (x) ¯ [a; b] = 1 b - a ∫ abf (x) dx (\ displaystyle (\ overline (f (x))) _ () = (\ frac (1) (ba)) \ int _ (a) ^ (b) f (x) dx)

Някои проблеми при използването на средната стойност

Липса на здравина

Основна статия: Устойчивост в статистиката

Въпреки че средноаритметичната често се използва като средни стойности или централни тенденции, тя не е стабилна статистика, което означава, че средната аритметична стойност е силно повлияна от „големи отклонения“. Трябва да се отбележи, че за разпределения с голям коефициент на изкривяване, средноаритметичната стойност може да не съответства на концепцията за „средна стойност“, а средните стойности от стабилна статистика (например медианата) могат да опишат по-добре централната тенденция.

Класически пример е изчисляването на средния доход. Средноаритметичната може да се тълкува погрешно като медиана, което може да доведе до заключението, че има повече хора с по-високи доходи, отколкото в действителност. „Средният“ доход се тълкува по такъв начин, че доходите на повечето хора са близки до това число. Този „среден“ (в смисъла на средноаритметичната) доход е по-висок от дохода на повечето хора, тъй като висок доход с голямо отклонение от средната стойност силно изкривява средноаритметичната стойност (за разлика от това, средният доход „съпротивлява“ на такива пристрастие). Този „среден“ доход обаче не казва нищо за броя на хората близо до средния доход (и не казва нищо за броя на хората близо до модалния доход). Въпреки това, ако вземете лекомислено понятията „средно“ и „мнозинство от хората“, тогава можете да направите погрешно заключение, че повечето хора имат доходи по-високи, отколкото са в действителност. Например, доклад за „средния“ нетен доход в Медина, Вашингтон, изчислен като средноаритметична стойност на годишните нетни доходи на всички жители, ще даде изненадващо голям брой заради Бил Гейтс. Разгледайте извадката (1, 2, 2, 2, 3, 9). Средноаритметичната стойност е 3,17, но пет от шест стойности са под тази средна стойност.

Сложна лихва

Основна статия: Възвръщаемост на инвестициите

Ако числата умножете, но не сгънете, трябва да използвате средната геометрична, а не средната аритметична. Най-често този инцидент възниква при изчисляване на възвръщаемостта на инвестициите във финанси.

Например, ако акциите паднаха с 10% през първата година и се увеличиха с 30% през втората година, тогава е неправилно да се изчислява „средното“ увеличение за тези две години като средноаритметично (-10% + 30%) / 2 = 10%; правилната средна стойност в този случай се дава от кумулативния годишен темп на прираст, при който годишният прираст е само около 8,16653826392% ≈ 8,2%.

Причината за това е, че процентите имат нова отправна точка всеки път: 30% са 30%. от число, по-малко от цената в началото на първата година:ако акциите са били на $30 в началото и са паднали с 10%, това е $27 в началото на втората година. Ако акциите се покачат с 30%, тя струва $35,1 в края на втората година. Средноаритметичната стойност на този ръст е 10%, но тъй като акциите са само $5,1 за 2 години, средният ръст от 8,2% дава крайния резултат от $35,1:

[30 $ (1 - 0,1) (1 + 0,3) = 30 $ (1 + 0,082) (1 + 0,082) = 35,1 $]. Ако използваме средноаритметичната стойност от 10% по същия начин, няма да получим действителната стойност: [$ 30 (1 + 0,1) (1 + 0,1) = $ 36,3].

Съединение в края на година 2: 90% * 130% = 117% за общо увеличение от 17% и CAGR от 117% ≈ 108,2% (\ displaystyle (\ sqrt (117 \%)) \ приблизително 108,2 \% ), тоест средногодишен ръст от 8,2%.

Упътвания

Основна статия: Статистика на дестинацията

Когато се изчислява средноаритметичната стойност на някаква променлива, която се променя циклично (например фаза или ъгъл), трябва да се обърне специално внимание. Например, средната стойност от 1 ° и 359 ° би била 1 ∘ + 359 ∘ 2 = (\ displaystyle (\ frac (1 ^ (\ circ) +359 ^ (\ circ)) (2)) =) 180 °. Това число е неправилно по две причини.

  • Първо, ъгловите стандарти са определени само за диапазона от 0 ° до 360 ° (или 0 до 2π, когато се измерват в радиани). По този начин една и съща двойка числа може да бъде записана като (1 ° и −1 °) или като (1 ° и 719 °). Средната стойност на всяка двойка ще бъде различна: 1 ∘ + (- 1 ∘) 2 = 0 ∘ (\ displaystyle (\ frac (1 ^ (\ circ) + (- 1 ^ (\ circ))) (2)) = 0 ^ (\ circ)), 1 ∘ + 719 ∘ 2 = 360 ∘ (\ displaystyle (\ frac (1 ^ (\ circ) +719 ^ (\ circ)) (2)) = 360 ^ (\ circ)) .
  • Второ, в този случай 0 ° (еквивалентно на 360 °) би било геометрично по-добрата средна стойност, тъй като числата се отклоняват по-малко от 0 °, отколкото от всяка друга стойност (0 ° има най-малко отклонение). Сравнете:
    • числото 1 ° се отклонява от 0 ° само с 1 °;
    • числото 1 ° се отклонява от изчислената средна стойност от 180 ° със 179 °.

Средната стойност за цикличната променлива, изчислена по горната формула, ще бъде изкуствено изместена от реалната средна стойност към средата на числовия диапазон. Поради това средната стойност се изчислява по различен начин, а именно като средна се избира числото с най-малка дисперсия (централна точка). Освен това, вместо изваждане, се използва модулното разстояние (тоест периферното разстояние). Например, модулното разстояние между 1 ° и 359 ° е 2 °, а не 358 ° (на окръжност между 359 ° и 360 ° == 0 ° - един градус, между 0 ° и 1 ° - също 1 °, общо - 2 °).

Среднопретеглена стойност - какво е това и как да я изчислим?

В процеса на изучаване на математиката учениците се запознават с понятието за средноаритметичната стойност. По-късно в статистиката и някои други науки студентите се сблъскват с изчисляването на други средни стойности. Какви могат да бъдат те и как се различават един от друг?

Средни стойности: значение и разлики

Не винаги точните индикатори дават разбиране на ситуацията. За да се оцени конкретна ситуация, понякога е необходимо да се анализират огромен брой цифри. И тогава средните стойности идват на помощ. Те позволяват да се оцени ситуацията като цяло.

Още от ученическите дни много възрастни помнят съществуването на средноаритметичната стойност. Много е лесно да се изчисли - сумата от поредица от n членове се дели на n. Тоест, ако трябва да изчислите средноаритметичната стойност в последователност от стойности 27, 22, 34 и 37, тогава трябва да решите израза (27 + 22 + 34 + 37) / 4, тъй като 4 стойности се използват при изчисленията. В този случай необходимата стойност ще бъде равна на 30.

Често в рамките на училищния курс се изучава и средната геометрична стойност. Изчисляването на тази стойност се основава на извличане на n-тия корен от произведението на n-членове. Ако вземем едни и същи числа: 27, 22, 34 и 37, тогава резултатът от изчисленията ще бъде 29,4.

Средната хармонична стойност в общообразователното училище обикновено не е предмет на изучаване. Въпреки това се използва доста често. Тази стойност е реципрочна на средното аритметично и се изчислява като частно от n - броя на стойностите и сбора 1 / a 1 + 1 / a 2 + ... + 1 / a n. Ако отново вземем същата серия от числа за изчисление, тогава хармоникът ще бъде 29,6.

Среднопретеглена стойност: характеристики

Въпреки това, всички горепосочени стойности не може да се използват навсякъде. Например в статистиката, когато се изчисляват някои средни стойности, "теглото" на всяко число, използвано в изчисленията, играе важна роля. Резултатите са по-показателни и коректни, защото отчитат повече информация. Тази група от стойности общо се нарича "средно претеглена". Те не преминават в училище, така че си струва да се спрем на тях по-подробно.

На първо място, струва си да се каже какво се разбира под "тегло" на тази или онази стойност. Най-лесният начин да обясните това е с конкретен пример. Телесната температура на всеки пациент се измерва два пъти дневно в болницата. От 100 пациенти в различни отделения на болницата 44 ще са с нормална температура - 36,6 градуса. Други 30 ще имат повишена стойност - 37,2, 14 - 38, 7 - 38,5, 3 - 39, а останалите две - 40. И ако вземем средноаритметичната стойност, тогава тази стойност като цяло за болницата ще бъде повече от 38 градуса! Но почти половината от пациентите имат напълно нормална температура. И тук ще бъде по-правилно да се използва среднопретеглената стойност, а "теглото" на всяка стойност ще бъде броят на хората. В този случай резултатът от изчислението ще бъде 37,25 градуса. Разликата е очевидна.

В случай на среднопретеглени изчисления, „теглото“ може да се приеме като броя на пратките, броя на хората, работещи в даден ден, като цяло всичко, което може да бъде измерено и да повлияе на крайния резултат.

Сортове

Среднопретеглената стойност съответства на средноаритметичната стойност, разгледана в началото на статията. Първата стойност обаче, както вече споменахме, също отчита теглото на всяко число, използвано при изчисленията. Освен това има също геометрични и хармонични претеглени средни стойности.

Има още един интересен вариант, използван в поредицата от числа. Това е претеглена пълзяща средна. На негова база се изчисляват тенденциите. В допълнение към самите стойности и техните тегла, там се използва и периодичност. И при изчисляване на средната стойност в даден момент от време се вземат предвид и стойностите за предишните интервали от време.

Изчисляването на всички тези стойности не е толкова трудно, но на практика обикновено се използва само обичайната средно претеглена стойност.

Методи за изчисление

В ерата на масивна компютъризация не е необходимо ръчно да се изчислява среднопретеглената стойност. Въпреки това ще бъде полезно да знаете формулата за изчисление, за да можете да проверите и, ако е необходимо, да коригирате получените резултати.

Най-лесният начин да разгледате изчислението е с конкретен пример.

Необходимо е да се разбере каква е средната работна заплата в това предприятие, като се вземе предвид броят на работниците, които получават тези или онези доходи.

И така, среднопретеглената стойност се изчислява по следната формула:

x = (a 1 * w 1 + a 2 * w 2 + ... + a n * w n) / (w 1 + w 2 + ... + w n)

Например изчислението ще бъде така:

x = (32 * 20 + 33 * 35 + 34 * 14 + 40 * 6) / (20 + 35 + 14 + 6) = (640 + 1155 + 476 + 240) / 75 = 33,48

Очевидно няма особена трудност при ръчното изчисляване на среднопретеглената стойност. Формулата за изчисляване на тази стойност в едно от най-популярните приложения с формули - Excel - изглежда като функцията СУМПРОИЗВОД (поредица от числа; поредица от тегла) / SUM (серия от тегла).

Как да намеря средната стойност в Excel?

как да намеря средно аритметично в excel?

Владимир09854

Лесна работа. Необходими са само 3 клетки, за да намерите средната стойност в excel. В първото ще напишем едно число, във второто - друго. И в третата клетка ще забием формула, която ще ни даде средната стойност между тези две числа от първата и втората клетка. Ако клетка номер 1 се нарича A1, клетка номер 2 се нарича B1, тогава в клетката с формулата трябва да напишете, както следва:

Тази формула изчислява средноаритметичната стойност на две числа.

За красотата на нашите изчисления можете да изберете клетки с линии под формата на плоча.

В самия Excel има и функция за определяне на средната стойност, но аз използвам стария метод и въвеждам нужната ми формула. По този начин съм сигурен, че Excel ще изчисли точно както ми трябва и няма да измисли някакво свое закръгляване.

M3sergey

Много е лесно, ако данните вече са въведени в клетките. Ако се интересувате само от число, достатъчно е да изберете необходимия диапазон/диапазони и стойността на сбора от тези числа, тяхното средно аритметично и техния брой ще се появи в долния десен ъгъл на лентата на състоянието.

Можете да изберете празна клетка, да кликнете върху триъгълника (падащ списък) "AutoSum" и да изберете "Средно" там, след което да се съгласите с предложения диапазон за изчисление или да изберете свой собствен.

И накрая, можете да използвате формули директно, като щракнете върху Вмъкване на функция до лентата с формули и адреса на клетката. Функцията AVERAGE се намира в категорията "Статистически" и приема като аргументи както числа, така и препратки към клетки и т.н. Там можете да изберете и по-сложни опции, например AVERAGEIF - изчисляване на средната стойност по условие.

Намерете средна стойност в excelе доста проста задача. Тук трябва да разберете дали искате да използвате тази средна стойност в някои формули или не.

Ако трябва да получите само стойността, тогава е достатъчно да изберете необходимия диапазон от числа, след което excel автоматично ще изчисли средната стойност - тя ще се покаже в лентата на състоянието, заглавие "Средно".

В случай, че искате да използвате получения резултат във формули, можете да направите това:

1) Сумирайте клетките с помощта на функцията SUM и ги разделете на броя на числата.

2) По-правилен вариант е да използвате специална функция, наречена СРЕДНО. Аргументите на тази функция могат да бъдат числа, посочени последователно, или диапазон от числа.

Владимир Тихонов

обградете стойностите, които ще участват в изчислението, щракнете върху раздела "Формули", там ще видите "AutoSum" вляво и до него триъгълник, сочещ надолу. щракнете върху този триъгълник и изберете "Средно". Voila, готово) в долната част на лентата ще видите средната стойност :)

Екатерина Муталапова

Да започнем отначало и по ред. Какво означава?

Средната е стойност, която е средноаритметично, т.е. се изчислява чрез добавяне на набор от числа и след това цялата сума от числата се разделя на техния брой. Например, за числата 2, 3, 6, 7, 2 ще има 4 (сумата от числата 20 се разделя на тяхното число 5)

В електронна таблица на Excel за мен лично най-лесният начин беше да използвам формулата = СРЕДНО. За да изчислите средната стойност, трябва да въведете данни в таблицата, да напишете функцията = AVERAGE () под колоната с данни и в скоби да посочите диапазона от числа в клетките, подчертавайки колоната с данни. След това натиснете ENTER или просто щракнете с левия бутон върху която и да е клетка. Резултатът ще се покаже в клетката под колоната. Изглежда неразбираемо, но всъщност е въпрос на минути.

Авантюрист 2000 г

Програмата на Ecxel е разнообразна, така че има няколко опции, които ще ви позволят да намерите средната стойност:

Първи вариант. Просто събирате всички клетки и ги разделяте на техния брой;

Втори вариант. Използвайте специална команда, напишете в необходимата клетка формулата "= СРЕДНО (и след това посочете диапазона от клетки)";

Третият вариант. Ако изберете необходимия диапазон, имайте предвид, че на страницата по-долу се показва и средната стойност в тези клетки.

По този начин има много начини да намерите средната стойност, просто трябва да изберете най-добрия за вас и да го използвате постоянно.

В Excel, като използвате функцията AVERAGE, можете да изчислите средната аритметична проста. За да направите това, трябва да въвеждате редица стойности. Натиснете равно и изберете в Статистическата категория, между които изберете функцията СРЕДНА

Също така, като използвате статистически формули, можете да изчислите претеглената средна аритметична стойност, която се счита за по-точна. За да го изчислим, се нуждаем от стойностите и честотата на индикатора.

Как да намеря средната стойност в Excel?

Ситуацията е следната. Има следната таблица:

Лентите, оцветени в червено, съдържат числовите стойности на оценките за предметите. В колоната "Среден резултат" искате да изчислите тяхната средна стойност.
Проблемът е следният: има общо 60-70 артикула и някои от тях са на друг лист.
Погледнах в друг документ, средната вече беше изчислена, а в клетката има формула като
= "име на лист"! | E12
но това беше направено от някакъв програмист, който беше уволнен.
Моля, кажете ми кой разбира това.

Хектор

В реда с функции вмъквате от предложените функции "СРЕДНО" и избирате от къде трябва да бъдат изчислени (B6: N6) за Иванов например. Не знам точно за съседните листове, но със сигурност се съдържа в стандартната помощ на Windows

Кажете ми как да изчисля средната стойност в Word

Моля, кажете ми как да изчисля средната стойност в Word. А именно средната стойност на оценките, а не броя на хората, получили оценките.

Юлия Павлова

Word може да направи много с макроси. Натиснете ALT + F11 и напишете макро програма ..
В допълнение, Insert-Object ... ще ви позволи да използвате други програми, дори Excel, за да създадете лист с таблица в документ на Word.
Но в този случай трябва да запишете числата си в колоната на таблицата и да въведете средната стойност в долната клетка на същата колона, нали?
За да направите това, поставете поле в долната клетка.
Insert-Field ... -Формула
Съдържание на полето
[= СРЕДНО (ГОРЕ)]
дава средната стойност от сбора на горните лежащи клетки.
Ако полето е избрано и е натиснат десния бутон на мишката, то може да бъде обновено, ако числата са се променили,
прегледайте кода или стойността на полето, променете кода директно в полето.
Ако нещо се обърка, изтрийте цялото поле в клетката и го създайте отново.
СРЕДНО означава средно, НАГОРЕ означава около, тоест ред клетки отгоре.
Аз самият не знаех всичко това, но лесно го намерих в HELP, разбира се, като се замислих малко.