Løgn, forbanna løgn og statistikk

Dette uttrykket er aktuelt i samband med oppstyret rundt Norge.no sin web-statistikk dei siste dagane. Etter å ha rapportert svært låge besøkstal for siste halvår, har det storma rundt Norge.no. Men i denne bloggen er det fenomenet web-statistikk som er interessant å sjå nærmare på.

Web-statistikk er eit vanskeleg felt fordi det har dårleg definerte begrep, problematiske målemetodar og generelt høg grad av usikkerheit. Her er enkelte moment verdt å diskutera:

  • Uklare begrep: Kva er ein unik brukar? Kva med ein (ikkje-unik) brukar? Sideoppslag? Treff? Det siste burde ingen rapportera, det er jo heilt uinteressant og direkte misvisande som målestokk. Analyseverktøya definerer ein unik brukar ulikt (kor langt tidsrom skal gjelda?) og gir difor ulike tal på dette og på andre parametrar ved analyse av same logg.
  • Målemetodar: Grovt sett kan vi dela metodane i server-baserte og klientbaserte målemetodar. Den første er den tradisjonelle analysen av web-loggen; den andre er script-basert og kombinerer Javascript og cookie for måling og verifisering. Det finst også kombinasjonar av desse. Ein annan ting er kva serveren blir sett opp til å logga.
  • Maskinell trafikk: Mykje av trafikken på ein nettstad er ikkje generert av menneske, men av maskiner. Korleis skal det filtrerast ut? På våre eigne prosjekt-nettstader har vi sett at andelen søkerobotar i periodar har vore på meir enn 50 % av all trafikk!

Det er også fleire moment som gjer temaet web-statistikk vanskeleg. Men det største problemet er likevel at dei fleste ikkje ser verdien av web-statistikken. Web-statistikken inneheld gull, og du treng ikkje grava lenge for å finna det. Det er når du skal samanlikna tala med andre, problema oppstår.