Došlo je do osip tweets i blogu nedavno govori o problemima s korištenjem prosjeka u PPC marketing. Primjerice, ona u kojoj Julie Bacchini tvrdi da su "prosjeci sranje":
Iako je istina da ponekad prosjeci mogu biti vrlo pogrešni, problem s gore navedenim skupom podataka je velika varijacija populacije i standardna devijacija u uzorku.
$config[code] not foundU ovom postu želim razgovarati o matematici koja je ovdje uključena i postaviti slučaj za vrijednost prosjeka, kao i odgovoriti na neke kritike o izvještavanju o prosjecima koje sam u posljednje vrijeme vidio u PPC zajednici.
Varijanca, standardno odstupanje i koeficijent varijance
Varijacija uzorka je mjera disperzije - koliko će se vrijednosti u skupu podataka vjerojatno razlikovati od prosječne vrijednosti vašeg skupa podataka. Izračunava se uzimajući prosjek kvadrata razlika za svaku točku podataka od prosjeka. Kvadratiranje razlika osigurava da se negativna i pozitivna odstupanja ne poništavaju.
Dakle, za klijenta 1, samo izračunajte razliku između 0,5 posto i prosječne promjene od 3,6 posto, zatim kvadratirajte taj broj. Učinite to za svakog klijenta, a zatim uzmite prosjek varijance: to je varijacija vašeg uzorka.
Uzorak standardnog odstupanja je samo kvadratni korijen varijance.
Jednostavno rečeno, u prosjeku, vrijednosti u ovom skupu podataka obično padaju za 5,029 posto od ukupnog prosjeka od 3,6 posto (tj. Brojevi su vrlo raspršeni), što znači da ne možete mnogo zaključiti iz ove distribucije.
Pojednostavljeni način procjene jesu li vaša standardna odstupanja "previsoka" (pod pretpostavkom da tražite normalnu distribuciju) je izračunati koeficijent varijacije (ili relativnu standardnu devijaciju) koji je jednostavno standardna devijacija podijeljena s prosjekom.
Što to znači i zašto nam je stalo? Radi se o vrijednosti izvještavanja o prosjecima. Kada WordStream proučava podatke o klijentu, mi ne izračunavamo samo prosjeke iz malih skupova podataka i donosimo velike zaključke - brinemo o distribuciji podataka. Ako su brojevi posvuda, bacamo ih i pokušavamo segmentirati uzorak na drugačiji način (prema industriji, trošiti, itd.) Kako bismo pronašli smisleniji uzorak iz kojeg možemo pouzdanije donositi zaključke.
Čak i smisleni prosjeci po definiciji uključuju vrijednosti iznad i ispod prosjeka
Još jedna kritika anti-prosječnog logora je ideja da prosjek ne govori za cjelokupno stanovništvo. To je, naravno, točno, po definiciji.
Da, prosjeci sadrže podatke koji padaju iznad i ispod prosječne vrijednosti. Ali to nije veliki argument za potpuno odbacivanje prosjeka.
Pod pretpostavkom normalne distribucije, očekuje se da će otprilike 68% vaših podataka padati za +/- 1 standardne devijacije od Vašeg prosjeka, 95% unutar +/- 2 standardne devijacije, i 99,7% unutar +/- 3 standardne devijacije, kako je ilustrirano ovdje.
Kao što možete vidjeti, outlieri svakako postoje, iako ako imate čvrstu standardnu distribuciju u vašem setu podataka, oni nisu tako česti kao što mislite. Dakle, ako ste oprezni glede matematike, prosjeci i dalje mogu biti vrlo korisne informacije za veliku većinu oglašivača.
U PPC marketingu, Math pobjeđuje
Nemojmo bacati prosjek s vodom za kupanje. Uostalom, gotovo svi podaci o izvedbi u AdWordsu (CTR, CPC, prosječna pozicija, konverzijske stope itd.) Prikazani su kao prosječne vrijednosti.
Umjesto da ignoriramo prosjeke, upotrijebimo moć matematike da utvrdimo je li prosjek koji gledate značajan ili ne.
Ponovno je izdana uz dopuštenje. Izvorno ovdje.
Prosječna fotografija putem usluge Shutterstock
Više u: Sadržaj kanala izdavača