Rozdiel medzi lineárnou regresiou a logistickou regresiou

Obsah:

Anonim

The hlavný rozdiel medzi lineárnou regresiou a logistickou regresiou je to, že lineárna regresia sa používa na predpovedanie spojitej hodnoty, zatiaľ čo logistická regresia sa používa na predikciu diskrétnej hodnoty.

Systémy strojového učenia môžu predpovedať budúce výsledky na základe školenia minulých vstupov. Existujú dva hlavné typy strojového učenia, ktoré sa nazývajú učenie pod dohľadom a učenie bez dozoru. Regresia a klasifikácia spadajú pod učenie pod dohľadom, zatiaľ čo klastrovanie spadá pod učenie bez dozoru. Algoritmy učenia pod dohľadom používajú na trénovanie súboru údajov označené údaje. Lineárna regresia a logistická regresia sú dva typy algoritmov kontrolovaného učenia. Lineárna regresia sa používa vtedy, keď je závislá premenná spojitá a model je lineárny. Logistická regresia sa používa vtedy, keď je závislá premenná diskrétna a model je nelineárny.

Lineárna regresia, logistická regresia, strojové učenie

Čo je to lineárna regresia

Lineárna regresia zisťuje vzťah medzi nezávislými a závislými premennými. Obaja spolu susedia. Nezávislá premenná je premenná, ktorá nie je zmenená inými premennými. Označuje sa x. Môže existovať aj viac nezávislých premenných, ako sú x1, x2, x3 atď. Závislé premenné sa menia podľa nezávislej premennej a sú označené y.

Keď existuje jedna nezávislá premenná, regresná rovnica je nasledovná.

y = b0+ b1x

Predpokladajme napríklad, že x predstavuje zrážky a y predstavuje výnos plodiny.

Obrázok 1: Lineárna regresia

Množina údajov bude vyzerať vyššie. Potom je vybratý riadok, ktorý pokrýva väčšinu dátových bodov. Tento riadok predstavuje predpokladané hodnoty.

Obrázok 2: Vzdialenosť medzi skutočnými dátovými bodmi a predpovedanými hodnotami

Potom sa zistí vzdialenosť od každého údajového bodu k čiare, ako je to znázornené na vyššie uvedenom grafe. Toto je vzdialenosť medzi skutočnou hodnotou a predpokladanou hodnotou. Táto vzdialenosť je známa aj ako chyba alebo zvyšky. Najvhodnejšia čiara by mala mať najmenší súčet druhých mocnín chýb. Keď je zadaná nová hodnota zrážok (x), je možné pomocou tohto riadku nájsť zodpovedajúci výnos plodiny (y).

V reálnom svete môže existovať niekoľko nezávislých premenných (x1, x2, x3…). Toto sa nazýva viacnásobná lineárna regresia. Viacnásobná lineárna regresná rovnica je nasledovná.

Čo je to logistická regresia

Logistickú regresiu je možné použiť na klasifikáciu dvoch tried. Je tiež známy ako binárna klasifikácia. Medzi ďalšie príklady logistickej regresie patrí kontrola, či je e -mail nevyžiadaná pošta, alebo nie je predpovedanie, či si zákazník kúpi produkt, alebo nie, či je možné získať propagáciu alebo nie.

Obrázok 3: Logistická regresia

Predpokladajme, že počet hodín, ktoré študent denne študoval, je nezávislá premenná. V závislosti od toho sa vypočíta pravdepodobnosť absolvovania skúšky. Za prah sa považuje hodnota 0,5. Keď je daný nový počet hodín, je možné pomocou tohto grafu nájsť zodpovedajúcu pravdepodobnosť absolvovania skúšky. Ak je pravdepodobnosť vyššia ako 0,5, považuje sa za 1 alebo úspešnú. Ak je pravdepodobnosť nižšia ako 0,5, potom sa považuje za 0 alebo zlyhá.

Použitím lineárnej regresnej rovnice na sigmoidálnu funkciu získate logistickú regresnú rovnicu.

Funkcia sigmoidu je

Ďalším dôležitým bodom, ktorý je potrebné poznamenať, je, že logistická regresia je použiteľná iba na klasifikáciu 2 tried. Nepoužíva sa na klasifikáciu viac tried.

Rozdiel medzi lineárnou regresiou a logistickou regresiou

Definícia

Lineárna regresia je lineárny prístup, ktorý modeluje vzťah medzi závislou premennou a jednou alebo viacerými nezávislými premennými. Naproti tomu logistická regresia je štatistický model, ktorý predpovedá pravdepodobnosť výsledku, ktorý môže mať iba dve hodnoty.

Použitie

Zatiaľ čo lineárna regresia sa používa na riešenie regresných problémov, logistická regresia sa používa na riešenie klasifikačných problémov (binárna klasifikácia).

Metodika

Lineárna regresia odhaduje závislú premennú, keď dôjde k zmene v nezávislej premennej. Logistická regresia vypočítava možnosť, že dôjde k udalosti. Toto je jeden dôležitý rozdiel medzi lineárnou regresiou a logistickou regresiou.

Výstupná hodnota

Tiež pri lineárnej regresii je výstupná hodnota spojitá. Pri logistickej regresii je výstupná hodnota diskrétna.

Model

Aj keď lineárna regresia používa priamku, logistická regresia používa krivku S alebo sigmoidnú funkciu. To je ďalší dôležitý rozdiel medzi lineárnou regresiou a logistickou regresiou.

Príklady

Predpovedanie HDP krajiny, predpovedanie ceny produktu, predpovedanie predajnej ceny domu, predikcia skóre sú niektoré príklady lineárnej regresie. Predpovedanie toho, či je e -mail spam alebo nie, predpovedanie, či je transakcia kreditnou kartou podvodná alebo nie, predpovedanie, či si zákazník vezme pôžičku alebo nie, sú niektoré príklady logistickej regresie.

Záver

Rozdiel medzi lineárnou regresiou a logistickou regresiou je v tom, že lineárna regresia sa používa na predpovedanie spojitej hodnoty, zatiaľ čo logistická regresia sa používa na predikciu diskrétnej hodnoty. Stručne povedané, na regresiu sa používa lineárna regresia, zatiaľ čo na klasifikáciu sa používa logistická regresia.

Referencia:

1. Lineárna regresná analýza | Lineárna regresia v Pythone | Algoritmy strojového učenia | Simplilearn, 26. marca 2018, k dispozícii tu.2. Logistická regresia | Logistická regresia v Pythone | Algoritmy strojového učenia | Simplilearn, 22. marca 2018, K dispozícii tu.

Obrázok so súhlasom:

1. „Lineárna regresia“ od Sewaqu - vlastná práca, verejná doména) prostredníctvom Commons Wikimedia2. „Zvyšky pre lineárnu regresiu“ od Thomas.haslwanter-vlastná práca (CC BY-SA 3.0) prostredníctvom Commons Wikimedia3. „Logistická krivka“ od Qef (diskusia)-Vytvorené od začiatku pomocou gnuplot (verejná doména) prostredníctvom Commons Wikimedia

Rozdiel medzi lineárnou regresiou a logistickou regresiou