Rozdiel medzi ťažbou údajov a prediktívnou analytikou

Obsah:

Anonim

The hlavný rozdiel medzi dolovaním údajov a prediktívnou analytikou je to, že dolovanie údajov je proces identifikácie skrytých vzorcov údajov pomocou algoritmov a nástrojov na ťažbu, zatiaľ čo prediktívna analytika je proces uplatňovania obchodných znalostí na objavené vzorce na vytváranie predpovedí.

Dolovanie údajov je proces objavovania vzorov vo veľkej množine údajov. Extrahuje nové vzorce a vzťahy medzi dátovými entitami. Výstupom dolovania údajov je vzor, ​​ktorý tvorí distribúciu s rôznou časovou osou. Na druhej strane, prediktívna analytika je proces aplikácie obchodných znalostí na objavené vzorce v súbore údajov s cieľom predpovedať trendy a správanie. Tieto vzorce sa zisťujú pomocou dolovania údajov alebo pomocou inej techniky. Obchodní analytici a odborníci na domény ich analyzujú a interpretujú, aby získali zmysluplné obchodné poznatky.

Dolovanie údajov, prediktívna analýza

Čo je ťažba údajov

Dolovanie údajov sa týka procesu objavovania vzorcov vo veľkom súbore údajov. Zahŕňa extrahovanie informácií zo súboru údajov a ich konverziu do zrozumiteľnej štruktúry na ďalšie použitie. Používa sa v mnohých oblastiach, ako je matematika, kybernetika, marketing atď.

Obrázok 1: Množina údajov

Dolovanie údajov je spojené s niekoľkými úlohami, ako je integrácia údajov, transformácia údajov, vyhodnocovanie vzorov a vizualizácia. Údaje pochádzajú z viacerých zdrojov. Všetky údaje sú integrované a uložené na jednom mieste, ktoré sa nazýva dátový sklad. Po druhé, údaje sú predspracované tak, aby boli vhodné na dolovanie údajov. Potom sú vzorce rozpoznané pomocou algoritmov, ako je klastrovanie, regresia, atď. Nakoniec sú tieto vzory vyhodnotené a vizualizované pomocou grafov.

Okrem toho existuje typ dolovania údajov, ktorý sa nazýva web mining. Toto je proces zhromažďovania informácií prostredníctvom tradičných metód a techník dolovania údajov na webe. Pomáha porozumieť faktorom, ako je efektívnosť webovej stránky a správanie zákazníkov. Dolovanie údajov celkovo poskytuje možnosť odhaliť skryté vzorce v dátach, aby ich bolo možné použiť na vytváranie predpovedí a prijímanie obchodných rozhodnutí.

Čo je prediktívna analýza

Prediktívna analytika analyzuje súčasné a historické skutočnosti a predpovedá budúce alebo neznáme udalosti. Využíva rôzne štatistické techniky, ako je dolovanie údajov, prediktívne modelovanie a strojové učenie.

Obrázok 2: Prediktívny analytický proces

Prediktívny analytický proces zahŕňa nasledujúce činnosti.

  1. Definovanie projektu - Definujte výstupy projektu, rozsah, obchodné ciele a identifikujte súbor údajov, ktorý sa má použiť.
  2. Zhromažďovanie údajov - zhromažďujte údaje z viacerých zdrojov.
  3. Analýza údajov - Proces kontroly, modelovania údajov s cieľom nájsť užitočné informácie.
  4. Štatistická analýza - Overte predpoklady, hypotézy a otestujte ich pomocou štatistických modelov.
  5. Modelovanie - Vytvorte presné prediktívne modely pre rozhodovanie.
  6. Nasadenie-nasaďte analytické výsledky pre každodenný rozhodovací proces, aby ste získali výsledky, správy a výstupy.
  7. Monitorovanie modelu - Správa a monitorovanie výkonu modelu s cieľom zaistiť, aby model poskytoval očakávané výsledky.

Prediktívna analytika sa používa v mnohých oblastiach. Pomáha obchodným organizáciám analyzovať vzorce nachádzajúce sa v historických a transakčných údajoch s cieľom identifikovať riziká a príležitosti. Predpokladajme napríklad kreditné skóre. Kreditná história zákazníka, žiadosť o pôžičku a údaje o zákazníkoch sa analyzujú a spracujú, aby sa mohli rozhodnúť, či tento zákazník zaplatí platbu kreditu včas. Prediktívna analýza sa navyše používa v oblastiach, ako je marketing, financie, poisťovníctvo, maloobchod, telekomunikácie, zdravotníctvo, sociálne siete atď.

Rozdiel medzi ťažbou údajov a prediktívnou analytikou

Definícia

Dolovanie údajov je proces objavovania vzorcov vo veľkom súbore údajov pomocou metód strojového učenia, štatistiky a databázových systémov. Prediktívna analytika je oblasť štatistiky, ktorá sa zaoberá získavaním informácií z údajov a ich používaním na predpovedanie trendov a vzorcov správania. To vysvetľuje základný rozdiel medzi dolovaním údajov a prediktívnou analytikou.

Funkčnosť

Na dolovanie údajov používa algoritmy, ako je regresia a klasifikácia zhromaždených údajov, na objavenie skrytých vzorcov. Prediktívna analytika však aplikuje obchodné znalosti na objavené vzorce, aby získala predpovede platné pre firmy.

Použitie

Existuje ďalší rozdiel medzi dolovaním údajov a prediktívnou analytikou na základe ich použitia. Aj keď dolovanie údajov pomáha lepšie porozumieť zozbieraným údajom, prediktívna analytika pomáha predpovedať budúce alebo neznáme udalosti.

Zapojené profesie

Aj keď dolovanie údajov vykonávajú štatistici a inžinieri, prediktívnu analýzu vykonávajú obchodní analytici a ďalší odborníci na doménu.

Záver

Rozdiel medzi dolovaním údajov a prediktívnou analytikou je v tom, že dolovanie údajov je proces identifikácie skrytých vzorcov údajov pomocou algoritmov a nástrojov na ťažbu, zatiaľ čo prediktívna analýza je proces, ktorý aplikuje obchodné znalosti na objavené vzorce a predpovedá.

Referencia:

1. „Čo je ťažba údajov? - Definícia z WhatIs.com. “ SearchSQLServer, k dispozícii tu.2. „Prediktívna analýza.“ Wikipedia, Wikimedia Foundation, 26. augusta 2018, K dispozícii tu.

Rozdiel medzi ťažbou údajov a prediktívnou analytikou