Linearna vs logistična regresija
Pri statistični analizi je pomembno ugotoviti povezave med zadevnimi spremenljivkami v študiji. Včasih je to lahko edini namen same analize. Eno močno orodje, ki se uporablja za ugotavljanje obstoja razmerja in prepoznavanje razmerja, je regresijska analiza.
Najenostavnejša oblika regresijske analize je linearna regresija, kjer je razmerje med spremenljivkami linearno razmerje. V statističnem smislu prikazuje razmerje med pojasnjevalno spremenljivko in spremenljivko odziva. Na primer z uporabo regresije lahko na podlagi podatkov, zbranih iz naključnega vzorca, ugotovimo razmerje med ceno blaga in potrošnjo. Regresijska analiza bo ustvarila regresijsko funkcijo nabora podatkov, ki je matematični model, ki najbolje ustreza razpoložljivim podatkom. To lahko enostavno predstavimo s pomočjo razpršene ploskve. Grafično regresija je enakovredna iskanju najustreznejše krivulje za dani nabor podatkov. Funkcija krivulje je regresijska funkcija. Z uporabo matematičnega modela lahko predvidevamo uporabo blaga za določeno ceno.
Zato se regresijska analiza pogosto uporablja pri napovedovanju in napovedovanju. Uporablja se tudi za ugotavljanje razmerij v eksperimentalnih podatkih, na področjih fizike, kemije in številnih naravoslovnih in tehničnih disciplin. Če je razmerje ali regresijska funkcija linearna funkcija, potem je postopek znan kot linearna regresija. Na razpršeni ploskvi je lahko predstavljena kot ravna črta. Če funkcija ni linearna kombinacija parametrov, potem je regresija nelinearna.
Logistična regresija je primerljiva z multivariatno regresijo in ustvarja model za razlago vpliva več napovedovalcev na spremenljivko odziva. Vendar pa mora biti pri logistični regresiji spremenljivka končnega rezultata kategorična (običajno razdeljena, tj. Par dosegljivih rezultatov, kot sta smrt ali preživetje, čeprav posebne tehnike omogočajo modeliranje bolj kategoriziranih informacij). Neprekinjena spremenljivka izida se lahko pretvori v kategorično spremenljivko, ki se uporablja za logistično regresijo; vendar se strjevanje neprekinjenih spremenljivk na ta način večinoma odsvetuje, ker zmanjšuje natančnost.
Za razliko od linearne regresije v smeri povprečja ni treba napovedovalne spremenljivke v logistični regresiji prisiliti, da so linearno povezane, pogosto porazdeljene ali da imajo enake variance znotraj vsake skupine. Posledično razmerje med spremenljivkama napovedovalca in izida verjetno ne bo linearna funkcija.
Kakšna je razlika med logistično in linearno regresijo?
• Pri linearni regresiji se predpostavlja linearno razmerje med pojasnjevalno spremenljivko in spremenljivko odziva in z analizo se najdejo parametri, ki ustrezajo modelu, da dobimo natančno razmerje.
• Linearna regresija se izvede za kvantitativne spremenljivke, posledična funkcija pa je kvantitativna.
• Pri logistični regresiji so lahko uporabljeni podatki kategorični ali kvantitativni, rezultat pa je vedno kategoričen.