Ključna razlika med združevanjem v skupine in klasifikacijo je v tem, da je združevanje v skupine nenadzorovano učno tehniko, ki združuje podobne primerke na podlagi značilnosti, medtem ko je klasifikacija nadzorovana učna tehnika, ki primerkom dodeli vnaprej določene oznake na podlagi lastnosti.
Čeprav se zdi, da sta združevanje in razvrščanje podobna postopka, obstaja razlika med njimi glede na njihov pomen. V svetu podatkovnega rudarjenja sta združevanje in klasifikacija dve vrsti učnih metod. Obe metodi označujeta predmete v skupine z eno ali več značilnostmi.
VSEBINA
1. Pregled in ključna razlika
2. Kaj je grozdanje
3. Kaj je razvrščanje
4. Vzporedna primerjava - grozdenje in razvrščanje v tabelarni obliki
5. Povzetek
Kaj je grozdenje?
Grozdenje je metoda združevanja predmetov na tak način, da se predmeti s podobnimi značilnostmi sestavijo, predmeti z različnimi lastnostmi pa se ločijo. Je pogosta tehnika za statistično analizo podatkov za strojno učenje in podatkovno rudarjenje. Analiza in posploševanje raziskovalnih podatkov je tudi področje, ki uporablja združevanje v skupine.
Slika 01: Grozdanje
Grozdanje spada v nenadzorovano rudarjenje podatkov. Ne gre za en sam algoritem, je pa splošna metoda za reševanje naloge. Zato je mogoče z različnimi algoritmi doseči združevanje v skupine. Ustrezni algoritem gruče in nastavitve parametrov so odvisni od posameznih naborov podatkov. To ni samodejna naloga, je pa iterativni postopek odkrivanja. Zato je treba spreminjati obdelavo podatkov in modeliranje parametrov, dokler rezultat ne doseže želenih lastnosti. K-pomeni združevanje v skupine in Hierarhično združevanje sta dva pogosta algoritma združevanja v podatkovno rudarjenje.
Kaj je klasifikacija?
Klasifikacija je postopek kategorizacije, ki uporablja nabor podatkov za usposabljanje za prepoznavanje, razlikovanje in razumevanje predmetov. Klasifikacija je nadzorovana učna tehnika, pri kateri so na voljo sklop vadbe in pravilno opredeljena opazovanja.
Slika 02: Razvrstitev
Algoritem, ki izvaja klasifikacijo, je klasifikator, opazovanja pa so primeri. K-Najbližji sosedski algoritmi in algoritmi dreves odločanja so najbolj znani klasifikacijski algoritmi v podatkovnem rudarjenju.
Kakšna je razlika med združevanjem in razvrščanjem?
Grozdenje je nenadzorovano učenje, medtem ko je klasifikacija nadzorovana učna tehnika. Združuje podobne primerke na podlagi lastnosti, medtem ko klasifikacija dodeljuje vnaprej določene oznake primerkom na podlagi lastnosti. Grozdanje razdeli nabor podatkov na podnabore, da združi primerke s podobnimi funkcijami. Ne uporablja označenih podatkov ali kompleta za usposabljanje. Po drugi strani pa nove podatke kategorizirajte glede na opazovanja vadbenega sklopa. Komplet za vadbo je označen.
Cilj združevanja v skupine je združevanje nabora predmetov, da bi ugotovili, ali obstaja povezava med njimi, medtem ko je namen klasifikacije ugotoviti, kateremu razredu pripada nov predmet iz nabora vnaprej določenih razredov.
Povzetek - Grozdenje proti klasifikaciji
Grozdanje in razvrščanje sta lahko videti podobni, ker oba algoritma za podatkovno rudarjenje delita nabor podatkov na podmnožice, vendar gre za dve različni učni tehniki pri rudarjenju podatkov, da dobimo zanesljive informacije iz zbirke surovih podatkov. Razlika med združevanjem v skupine in klasifikacijo je v tem, da je združevanje v skupine nenadzorovano učno tehniko, ki združuje podobne primerke na podlagi značilnosti, medtem ko je klasifikacija nadzorovana učna tehnika, ki primerkom dodeli vnaprej določene oznake na podlagi lastnosti.
Vljudnost slike:
1. "Grozd-2" avtorja Grozd-2.gif: izpeljano delo hellisp: (javna domena) prek Wikimedia Commons 2. "Magnetizem" Johna Aplesseda - lastno delo. (Javna domena) prek Wikimedia Commons