Аритметичка средина

С Википедије, слободне енциклопедије

Аритметичка средина или просек је појам из статистике. Она се рачуна за скуп бројева као количник збира чланова и броја чланова скупа. У математичкој нотацији аритметичка средина је:

[1] Колекција је често скуп резултата експеримента или опсервационе студије, или често скуп резултата из анкете. Термин „аритметичка средина“ је пожељнији у неким контекстима у математици и статистици, јер помаже да се разликује од других просека, као што су геометријска средина[2][3] и хармонска средина.[4][5]

Поред математике и статистике, аритметичка средина се често користи у многим различитим областима као што су економија, антропологија и историја, а у извесној мери се користи у скоро свим академским областима. На пример, доходак по глави становника је аритметички просечан приход становништва једне нације.

Иако се аритметичка средина често користи за извештавање о централним тенденцијама, она није робусна статистика, што значи да на њу у великој мери утичу екстерне вредности (вредности које су много веће или мање од већине вредности). За искривљене расподеле, као што је расподела прихода за коју су приходи неколико људи знатно већи од прихода већине људи, аритметичка средина се можда неће поклапати са нечијим појмом „средине“, а робусна статистика, као што је медијана, може дати бољи опис централне тенденције.

Дефиниција[уреди | уреди извор]

За дати скуп података , аритметичка средина (или средња вредност или просек), означена као ( надвучено), је средња вредност вредности .[6]

Аритметичка средина је најчешће коришћена и лако разумљива мера централне тенденције у скупу података. У статистици, појам просек се односи на било коју од мера централне тенденције. Аритметичка средина скупа посматраних података дефинисана је као једнака збиру нумеричких вредности сваког посматрања, подељеног са укупним бројем посматрања. Симболички, за скуп података који се састоји од вредности , аритметичка средина је дефинисана формулом:

[7]

(за објашњење оператора сумирања, погледајте сумирање.)

На пример, узмите у обзир месечну плату 10 запослених у фирми: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Аритметичка средина је

Ако је скуп података статистичка популација (тј. састоји се од сваког могућег посматрања, а не само од њиховог подскупа), онда се средња вредност те популације назива средња вредност популације и означава грчким словом . Ако је скуп података статистички узорак (подскуп популације), онда се статистика вредност која је резултат овог прорачуна назива средњом вредношћу узорка (која је за скуп података означена као ).

Аритметичка средина се може на сличан начин дефинисати за векторе у више димензија, не само за скаларне вредности; ово се често назива центроид. Уопштеније, пошто је аритметичка средина конвексна комбинација (збир коефицијената је 1), може се дефинисати на конвексном простору, а не само на векторском простору.

Мотивишућа својства[уреди | уреди извор]

Аритметичка средина има неколико својстава која је чине корисним, посебно као мера централне тенденције. Овим су обухваћени:

  • Ако бројеви имају средњу вредност , онда . Пошто је растојање од датог броја до средње вредности, у једном смеру тумачење ове особине значи да су бројеви лево од средње вредности уравнотежени бројевима десно од средње вредности. Средња вредност је једини појединачни број за који се остаци (одступања од процене) збрајају на нулу.
  • Ако се захтева да се користи један број као „типична“ вредност за скуп познатих бројева , онда аритметичка средина бројева то најбоље чини, у смислу минимизирања збира квадрата одступања од типичне вредности: збир од . (Следи да је средња вредност узорка такође најбољи појединачни предиктор у смислу да има најмању средњу квадратну грешку.)[6] Ако се жели аритметичка средина популације бројева, онда је њена процена која је непристрасна, аритметичка средина узорка узетог из популације.

Додатна својства[уреди | уреди извор]

  • =
  • Аритметичка средина било којег броја група бројева једнаке величине заједно је аритметичка средина аритметичке средине сваке групе.

Контраст са медијаном[уреди | уреди извор]

Аритметичка средина се може упоредити са медијаном. Медијана је дефинисана тако да више од половине вредности није веће од медијане, а не више од половине мање од медијане. Ако се елементи у подацима аритметички повећавају, када су постављени неким редом, онда су медијана и аритметички просек једнаки. На пример, размотрите узорак података . Просек је , као и медијана. Међутим, када се узме у обзир узорак који се не може распоредити тако да се аритметички повећава, као што је , медијана и аритметички просек могу значајно да се разликују. У овом случају, аритметички просек је 6,2, док је медијана 4. Генерално, просечна вредност може значајно да варира од већине вредности у узорку, и може бити већа или мања од већине њих.

Примене овог феномена постоје у многим областима. На пример, од 1980-их, медијана прихода у Сједињеним Државама је расла спорије од аритметичког просека прихода.[8]

Генерализације[уреди | уреди извор]

Пондерисана аритметичка средина[уреди | уреди извор]

Пондерисани просек, или пондерисана средња вредност, је просек у коме се неке тачке података више рачунају од других, јер им се придаје већа тежина у прорачуну.[9] На пример, аритметичка средина од и је , или еквивалентно . Насупрот томе, пондерисана средња вредност у којој први број добија, на пример, двоструко већу тежину од другог (можда зато што се претпоставља да се појављује двоструко чешће у општој популацији из које су ови бројеви узорковани) била би израчуната као . Овде су тежине, које се нужно збрајају са вредношћу један, јесу и , при чему је прва дупло већа од друге. Аритметичка средина (понекад се назива „непондерисани просек“ или „једнако пондерисани просек“) може се тумачити као посебан случај пондерисаног просека у коме су све тежине једнаке једна другој (једнаке у горњем примеру, и једнаке са у ситуацији са усредњених бројева).

Континуиране расподеле вероватноће[уреди | уреди извор]

Поређење две лог-нормалне расподеле са једнаком медијаном, али различитом искривљеношц́у, што резултира различитим средњим вредностима и модовима

Ако нумеричко својство, и било који узорак података из њега, може да поприми било коју вредност из непрекидног опсега, уместо, на пример, само целих бројева, онда се вероватноћа да број падне у неки опсег могућих вредности може описати интеграцијом континуиране расподеле вероватноће у овом опсегу, чак и када је наивна вероватноћа за број узорка који узима једну одређену вредност од бесконачно много нула. Аналог пондерисаног просека у овом контексту, у коме постоји бесконачан број могућности за прецизну вредност променљиве у сваком опсегу, назива се средином дистрибуције вероватноће. Расподела вероватноће која се најчешће среће назива се нормална расподела; она има својство да су све мере његове централне тенденције, укључујући не само средњу вредност, већ и горе поменуту медијану и мод (три M-а[10]), једнаке једна другој. Ова једнакост не важи за друге дистрибуције вероватноће, као што је илустровано за лог-нормалну расподелу овде.

Углови[уреди | уреди извор]

Посебна пажња се мора обратити када користите циклични подаци, као што су фазе или углови. Наивно узимање аритметичке средине од 1° и 359° даје резултат од 180°. Ово није тачно из два разлога:

  • Прво, мерења угла су дефинисана само до адитивне константе од 360° (или 2π, ако се мери у радијанима). Тако би се могли лако назвати 1° и −1°, или 361° и 719°, јер сваки од њих даје другачији просек.
  • Друго, у овој ситуацији, 0° (еквивалентно, 360°) је геометријски боља просечна вредност: око ње је мања дисперзија (тачке су истовремено 1° од њега, и 179° од 180°, претпостављени просек).

У општој примени, такав превид ће довести до тога да се просечна вредност вештачки помера ка средини нумеричког опсега. Решење овог проблема је коришћење формулације оптимизације (односно, дефинисање средње вредности као централне тачке: тачка око које има најмање дисперзије) и редефинисање разлике као модуларне удаљености (тј. растојање на кружници: тако да је модуларно растојање између 1° и 359° 2°, а не 358°).

Симболи и кодирање[уреди | уреди извор]

Аритметичка средина се често означава линијом (такође винкулум или макрон), на пример као у ( надвучено).[6]

Неки софтверски пакети (текст процесори, веб претраживачи) увек не приказују правилно симбол x̄. На пример, симбол x̄ у ХТМЛ-у је заправо комбинација два кода – основног слова x плус кода за линију изнад (̄ ор ¯).[11]

У неким текстовима, као што су пдф-ови, симбол x̄ може бити замењен симболом цента (¢) (Уницоде &#162), када се копира у текстуални процесор као што је Мајкрософт Ворд.

Примена[уреди | уреди извор]

Аритметичка средина се највише користи од свих математичких средина у свакодневном животу. Ову средину најчешће користимо када хоћемо да израчунамо просек нечега, тако што све те бројеве саберемо а онда их поделимо бројем колико их има.

Примери[уреди | уреди извор]

Пример 1[уреди | уреди извор]

D = (1, 3, 6, 7, 18)

Скуп D има 5 чланова чији збир је 35, а аритметичка средина је 7.

Пример 2[уреди | уреди извор]

Ако у дневнику у основној школи из математике имамо оцене 5, 5, 3, 2, просек рачунамо овако:

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ Јацобс, Харолд Р. (1994). Матхематицс: А Хуман Ендеавор (Тхирд изд.). W. Х. Фрееман. стр. 547. ИСБН 0-7167-2426-X. 
  2. ^ Матт Фриехауф, Микаела Хертел, Јуан Лиу, анд Стацеy Луонг „Он Цомпасс анд Страигхтедге Цонструцтионс: Меанс” (ПДФ). УНИВЕРСИТY оф WАСХИНГТОН, ДЕПАРТМЕНТ ОФ МАТХЕМАТИЦС. 2013. Приступљено 14. 6. 2018. 
  3. ^ „Еуцлид, Боок VI, Пропоситион 13”. Давид Е. Јоyце, Цларк Университy. 2013. Приступљено 19. 7. 2019. 
  4. ^ „Тхе Авераге оф Ратес анд тхе Авераге Рате” (ПДФ). Архивирано из оригинала (ПДФ) 11. 07. 2022. г. Приступљено 11. 07. 2022. 
  5. ^ „Авераге: Хоw то цалцулате Авераге, Формула, Wеигхтед авераге”. леарнингпундитс.цом. Архивирано из оригинала 29. 12. 2017. г. Приступљено 8. 5. 2018. 
  6. ^ а б в Медхи, Јyотипрасад (1992). Статистицал Метходс: Ан Интродуцторy Теxт. Неw Аге Интернатионал. стр. 53—58. ИСБН 9788122404197. 
  7. ^ Wеисстеин, Ериц W. „Аритхметиц Меан”. матхwорлд.wолфрам.цом (на језику: енглески). Приступљено 2020-08-21. 
  8. ^ Кругман, Паул (4. 6. 2014) [Фалл 1992]. „Тхе Рицх, тхе Ригхт, анд тхе Фацтс: Децонструцтинг тхе Инцоме Дистрибутион Дебате”. Тхе Америцан Проспецт. 
  9. ^ „Меан”. Енцyцлопедиа Британница (на језику: енглески). Приступљено 2020-08-21. 
  10. ^ Тхинкмап Висуал Тхесаурус (2010-06-30). „Тхе Тхрее M'с оф Статистицс: Моде, Медиан, Меан Јуне 30, 2010”. www.висуалтхесаурус.цом. Приступљено 2018-12-03. 
  11. ^ „Нотес он Уницоде фор Стат Сyмболс”. www.персонал.псу.еду. Архивирано из оригинала 31. 03. 2022. г. Приступљено 2018-10-14. 

Литература[уреди | уреди извор]

Сец. 21.7 Wеигхтед Самплес

  • Јамес, Фредерицк (2006). Статистицал Метходс ин Еxпериментал Пхyсицс (2нд изд.). Сингапоре: Wорлд Сциентифиц. ИСБН 981-270-527-9. 


Спољашње везе[уреди | уреди извор]