Mis vahe on andmeteadlasel ja statistikul?


Vastus 1:

Saša Mihhejev

Täpsemalt pole nende kirjutatud kood kunagi mõeldud kasutamiseks peale kellegi kellegi teise

kuid nad kruvivad regulaarselt oma analüüse, rakendades probleemidele tehnikaid, mõistmata nende tehnikate aluseks olevaid eeldusi.

josh_wills: Andmeteadlane (n.): Isik ...

Sõltumatud ja identselt jaotunud juhuslikud muutujad

Mitteparameetriline statistika


Vastus 2:

Andmeteadlased saavad asjadest aru andmete vaatenurgast. Peaks aru saama, mis omadused sellel andmetel on - kas see on hõre? kas sellel on teatud struktuur? kas saame kasutada mõnede muude allikate ortogonaalset teavet? Mida on domeeniteadlastel andmete omaduste kohta öelda? mitme muu sellise teema hulgas. Teine erinevus seisneb selles, et andmeteadlased on peamiselt arvutiteadlased, arendades välja reaalmaailma probleemide algoritmilisi lahendusi, võttes arvesse arvutamispiiranguid, mille sarnasuse võib põhjustada andmete suur suurus - sisaldades ruumi ja aja nõudeid. Selle tagamiseks võib andmeteadlane vajada teadmisi sellistest tehnoloogiatest nagu paralleelne andmetöötlus, mis võib aidata neil neid probleeme lahendada. Sõltuvalt käes oleva ülesande arvutusnõuetest, eriti lennukite arvutusi nõudvates rakendustes, võiks ta soovida osa oma töötlemisest pilves teha - mõne võimsa arvutusmasina, millele saab võrgus juurde pääseda - see toob kaasa liseprobleemina, mida pilves töödelda, pidades samas meeles, et see nõuaks andmete pidevat saatmist võrku, suurendades nõutavat aega. See on vaid jäämäe tipp. On palju muid küsimusi, näiteks neid, mis on seotud töötlemata andmete töötlemisega, mis sõltuvalt rakendusest võivad pärineda mitmesugustest allikatest, alates liikluse jälgimiskaameratest kuni satelliitidele paigaldatud anduriteni, mis jälgivad meie planeedi kliimatingimusi.

Püüan öelda, et kuigi andmeteadlane nõuab tugevaid statistilisi teadmisi, pole see tema arsenalis ainus vahend.


Vastus 3:

Statistik peab selle raske termini kandmiseks teadma rohkem statistikat. Ainuüksi teadmisest, kuidas leida korrelatsioone, arvutada eri tüüpi regressioone ja mõista tõenäosusjaotusi, üksi ei piisa. Kõrgemad teadmised statistika kohta võivad olla meelevaldselt keerulised. Mõlemad peavad mõistma põhistatistikat ja esitama olulised tulemused visuaalsel viisil, mis on huvitav ja informatiivne.

Andmeteadlane peab suutma koostada oma hüpoteesi ja testida seda punktist A kuni Z-ni. Nad peavad välja mõtlema riist- ja tarkvara nõuded ning suutma seda ka kodeerida. Tundub, et map-vähendamine on tõesti tavaline. Vähemalt mõnel juhul peavad nad saama serveri administraatoriteks ja võivad isegi käitada hajutatud süsteeme.


Vastus 4:

Statistik peab selle raske termini kandmiseks teadma rohkem statistikat. Ainuüksi teadmisest, kuidas leida korrelatsioone, arvutada eri tüüpi regressioone ja mõista tõenäosusjaotusi, üksi ei piisa. Kõrgemad teadmised statistika kohta võivad olla meelevaldselt keerulised. Mõlemad peavad mõistma põhistatistikat ja esitama olulised tulemused visuaalsel viisil, mis on huvitav ja informatiivne.

Andmeteadlane peab suutma koostada oma hüpoteesi ja testida seda punktist A kuni Z-ni. Nad peavad välja mõtlema riist- ja tarkvara nõuded ning suutma seda ka kodeerida. Tundub, et map-vähendamine on tõesti tavaline. Vähemalt mõnel juhul peavad nad saama serveri administraatoriteks ja võivad isegi käitada hajutatud süsteeme.