Mis vahe on kaevandamisandmetel ja andmete tihendamisel?


Vastus 1:

Ma pole päris kindel selles, mis andmeid tihendab.

Andmete kaevandamine on üldisem sõna andmekogumitest saadava kasuliku teabe saamiseks. Andmete tihendamist saab näha Viexi kahest punktist. "Arvuti ja ketta" vaatenurgast vähendab see teie failide suurust. Statistiliste andmete põhjal eelistaksin kasutada andmete mõõtmelisuse vähendamist. Näiteks faktorite meetodid on viis andmekogumi mõõtmelisuse vähendamiseks. Otsite mõnda tegurit, mis teie andmekogumi teabe kokku võtaksid. "vähesed" tähendab vähem tegureid kui andmekogumis olevad algsed muutujad.

Samuti võite näha mudeli ehitamist kompressimismeetodina. Näiteks kui teie peamine huvi on ainult muutuja ennustamine teistest muutujatest, kui leiate, et vajate ainult mõnda muutujat, ei pea te hakkama saama kõigi saadaolevate muutujatega, vaid kõige ennustavamate muutujatega.

Minu vastus on väga ebarahuldav, kuid see võib aidata arutelu alustada.