Логистичка регресија

С Википедије, слободне енциклопедије

У теорији вероватноће и статистици, логистичка расподела је континуирана расподела вероватноће . Његова кумулативна функција расподеле је логистичка функција, која се појављује у логистичкој регресији и напајању неуронским мрежама . Обликом подсећа на нормалну расподелу, али има теже репове (већи куртозис, издуженост). Логистичка расподела је заправо посебан случај Tukey-еве ламбда расподеле .

Спецификација[уреди | уреди извор]

Функција густине вероватноће[уреди | уреди извор]

Када је параметар локације μ = 0 и параметар размере s = 1, онда је функција густине вероватноће логистичке дистрибуције дата са:

Дакле, генерално говорећи, густина је добијена на следећи начин:

Пошто се ова функција може изразити у квадратном облику хиперболичке секанс функције "sech", понекад се назива sech-квадрирана дистрибуција. [1] (Такође можете погледати и: Секанс хиперболични).

Функција кумулативне дистрибуције[уреди | уреди извор]

Логистичка дистрибуција је добила име по функцији кумулативне дистрибуције, која је пример који припада породици логистичких функција. Кумулативна функција дистрибуције логистичке дистрибуције је такође скалирана верзија хиперболичке тангенте.

У овој једначини μ је средња вредност, а s је параметар скалирања који је пропорционалан стандардној девијацији.

Квантилна функција[уреди | уреди извор]

Инверзна кумулативна функција расподеле ( квантилна функција ) логистичке расподеле је генерализација логит ( eng. logit ) функције. Њен дериват представља квантилна функција густине. Они су дефинисани на следећи начин:

Алтернативна параметризација[уреди | уреди извор]

Алтернативна параметризација логистичке дистрибуције може да се изведе изражавањем параметра који скалира, , у односу на стандардне девијације, , користећи замену , где је . Алтернативни облици горе наведених функција су са разлогом прилично јасни и директни.

Апликације[уреди | уреди извор]

Логистичка расподела — и образац у облику слова S кумулативне функције расподеле ( логистичка функција ) и квантилне функције ( логит функција ) — се у великој мери користе у многим различитим областима.

Логистичка регресија[уреди | уреди извор]

Једна од најшире коришћених примена је у логистичкој регресији, која се користи за моделирање категоричких зависних променљивих (нпр. одабир да или не или одабир који има 3 или 4 могућности), као што се стандардна линеарна регресија користи за моделирање континуираних променљивих (нпр. користи се за приходе или становништво). Конкретно, модели логистичке регресије се могу формулисати као модели латентне променљиве са променљивим грешкама које прате логистичку расподелу. Ова фраза је уобичајена у теорији модела дискретног избора, где логистичка дистрибуција игра исту улогу у логистичкој регресији као нормална дистрибуција у пробит ( eng. Probit ) регресији . Логистичка и нормална дистрибуција заиста имају прилично сличан облик. Међутим, логистичка дистрибуција има теже репове, што често повећава робусност анализа заснованих на њој у поређењу са коришћењем нормалне дистрибуције.

Стање[уреди | уреди извор]

PDF ове дистрибуције има идентичан функционални облик као и извод Фермијеве функције . У теорији својстава електрона у полупроводницима и металима, овај дериват служи за одређивање релативне тежине различитих енергија електрона које су везане за њихов допринос у транспорту електрона. Они нивои енергије чије су енергије најближе „средњој вредности“ дистрибуције ( Фермијеви нивои ) доминирају процесима као што је електронска проводљивост, са извесним мрљама изазваним температуром. [2] :34 Међутим, имајте на уму да је одговарајућа расподела вероватноће у Ферми–Дираковој статистици заправо једноставна Бернулијева расподела, са фактором вероватноће која је дата Фермијевом функцијом.

Логистичка расподела настаје као гранична расподела пригушеног насумичног кретања коначне брзине која је описана телеграфским процесом у коме насумична времена између узастопних промена брзине имају независне експоненцијалне расподеле са линеарно растућим параметрима. [3]

Хидрологија[уреди | уреди извор]

У хидрологији се да је расподела дуготрајног протицања реке и падавина (нпр. месечни и годишњи укупни износи који се састоје од збира 30 односно 360 дневних вредности) често сматра скоро нормалном у складу са централном граничном теоремом . [4] Нормална расподела, међутим, захтева нумеричку апроксимацију. Пошто је логистичка расподела, која се може решити аналитички, слична нормалној расподели, може се користити уместо ње. Плава слика илуструје пример прилагођавања логистичке дистрибуције на рангиране октобарске падавине — које су скоро нормално распоређене — и показује појас поузданости од 90% заснован на биномној расподели . Подаци о падавинама су представљени исцртавањем позиција као део анализе кумулативне фреквенције .

Шаховске оцене[уреди | уреди извор]

Шаховска федерација Сједињених Држава и ФИДЕ су промениле своју формулу за израчунавање рејтинга шаха са нормалне дистрибуције на логистичку дистрибуцију; више прочитајте на чланку о Elo систему оцењивања (заснован је на нормалној дистрибуцији).

Повезане дистрибуције[уреди | уреди извор]

  • Логистичка дистрибуција имитира sech дистрибуцију .
  • Ако је онда важи да је .
  • Ако је У(0, 1) онда важи да је .
  • Ако је и одвојено тада .
  • Ако је и онда важи да је (Збир не представља логистичку расподелу). Напоменути да је .
  • Ако је X ~ Logistic(μ, s) онда је exp(X) ~ LogLogistic, иexp(X) + γ ~ shifted log-logistic .
  • Ако је Кс ~ Експоненцијални(1) онда важи да је
  • Ако је X, Y ~ Exponential(1) онда важи да је
  • Металог расподела је генерализација логистичке расподеле, у којој се проширује низ степена у смислу који су замењени логистичким параметрима и . Резултујућа функција металог квантила има веома флексибилан облик, има једноставну затворену форму и може се уклопити у податке са линеарно најмањим квадратима.

Деривације[уреди | уреди извор]

Тренуци вишег реда[уреди | уреди извор]

Централни момент n -тог реда се може изразити у једначинама квантилне функције:

Овај интеграл је врло добро познат [5] и може да се изрази у једначинама Бернулијевих бројева :

Види још[уреди | уреди извор]

  • генерализована логистичка дистрибуција
  • Tukey-ева ламбда дистрибуција
  • лог-логистичка дистрибуција
  • полулогистичка дистрибуција
  • логистичка регресија
  • сигмоидна функција
  1. ^ Johnson, Kotz & Balakrishnan (1995, p.116).
  2. ^ Davies, John H. (1998). The Physics of Low-dimensional Semiconductors: An Introduction. Cambridge University Press. ISBN 9780521484916. 
  3. ^ A. Di Crescenzo, B. Martinucci (2010) "A damped telegraph random process with logistic stationary distribution", J. Appl. Prob., vol. 47, pp. 84–96.
  4. ^ Ritzema, H.P., ур. (1994). Frequency and Regression Analysis. Chapter 6 in: Drainage Principles and Applications, Publication 16, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. стр. 175–224. ISBN 90-70754-33-9. 
  5. ^ OEISA001896

Референце[уреди | уреди извор]

  • Модис, Теодор (1992) Предвиђања: потпис друштва открива прошлост и предвиђа будућност, Симон & Шустер, Њујорк. ISBN 0-671-75917-5.

Шаблон:ProbDistributions