Vardagsstatistik med Morgan Ström

I helgen provade jag och fem vänner öl. Vi hade inte setts på ett tag och ville göra något roligt under kvällen. Statistiken var en självklar komponent.

Vi köpte 25 flaskor som mina vänner delade på under kvällens gång (själv är jag glutenintolerant och drack cider). För varje öl skattade de smaken på en skala från 0 (spillolja) till 10 (änglapiss) och skattningarna fördes in i en tabell. Nedan finns en graf över mina kompisars individuella skattningar under kvällens gång.

Alla grafer och analyser har jag gjort i statistikprogrammet R (som är gratis).

Jag sammanfattade mina vänners skattningar med medelvärden och testade om det fanns något samband mellan tidpunkten då ölen dracks och smakupplevelsen. Det fanns det inte (r = 0,08; p = 0,71). På grafen nedan syns medelvärdena förbundna med en streckad linje. Den blå regressionslinjen visar att sambandet var nästintill obefintligt. Ölen blir alltså varken godare eller äckligare ju mer man har druckit…

Eftersom jag hällde upp varje öl utan att mina vänner såg flaskan visste de aldrig vilken öl de drack. Vi gjorde så för att varken ölmärke eller utseende på flaskan skulle påverka smakupplevelsen. I grafen nedan kan man se att sambandet mellan smak och literpris var svagt (rho = 0,32) och icke-signifikant (p = 0,12). Dyr öl måste alltså inte nödvändigtvis vara god öl!

Om man bortser från Chimay som var skitdyr men inte så god – en så kallad outlier som du ser längst till höger i grafen ovan – så var sambandet mellan pris och smak dock signifikant.

Statistiska verktyg har länge varit förbehållna forskare och professionella användare på grund av de höga priserna för mjukvara som SPSS, SAS och Minitab. R är gratis. Alla som vill kan göra liknande analyser och grafer som jag gjort ovan, och det behöver varken vara särskilt svårt eller dyrt. Det enda som krävs är lite statistikkunskaper och en rejäl skopa nörderi! Undrar du vilka ölsorter som mina vänner tyckte var godast? Här finns topplistan!

Vill du göra dessa analyser och grafer själv?
1. Ladda ner R, mitt csv-ark och denna R-kod.
2. Starta R
3. Installera nödvändiga paket med följande kod:install.packages(c(“ggplot2”, “reshape”, “chron”, “psych”))
4. Använd setwd() så att din workspace är i samma mapp som ol.csv. Jag skrev så här: setwd(“C:/Users/morgstro/Downloads/”)
5. Kopiera in koden och tryck enter. Alla beräkningar m.m kommer att skrivas i konsolen. 6. Skriv sedan indgraf, tidgraf, prisgraf eller prisgraf2 (bonusmaterial) och tryck på enter för att visa graferna.

Text: Morgan Ström, PTP-psykolog på Pearson Assessment. Där jobbar han med att utveckla instrument för mätning av psykologiska faktorer, som kognitiv förmåga och personlighet. Bild: flickr.com/dancunningham