Když používáte Tabulky Google k práci se dvěma soubory dat, možná budete chtít tyto dva porovnat tak, že určíte, do jaké míry jeden ovlivňuje druhý.
Korelace mohou nabídnout pohled na to, zda existuje prediktivní vztah mezi rovinami x a y, ale nemusí nutně naznačovat kauzalitu. Zde je návod, jak můžete pomocí Tabulek Google identifikovat korelace ve vašich datech.
Co je korelace a k čemu ji můžete použít?
Když jsou dvě proměnné korelovány, jedna může určit, jak proměnná ovlivňuje druhou. Je však důležité si uvědomit, že korelace v tomto případě neznamená spoléhání se; jen ukazuje, jak blízko a rychle se dvě proměnné porovnávají nebo spolu souvisí.
Statistické metriky pomáhají pochopit základní trendy v analýze dat. Korelace patří mezi nejčastěji používané statistické metriky a určuje, jak blízko jsou dvě proměnné související nebo závislé.
Porozumění korelačnímu koeficientu v Tabulkách Google
V Tabulkách Google se korelační koeficient vypočítává pomocí funkce CORREL. Korelační koeficient slouží jako měřítko toho, jak úzce jsou soubory dat propojeny. Může být použit k získání Pearsonova koeficientu korelace produktu a momentu (r), pokud máte dvě proměnné sady dat. Pokud se chcete o tomto koeficientu dozvědět více, můžete si přečíst více v této příručce od
Statistiky ve společnosti Leard.Dalo by se narazit na jednu ze tří korelačních metrik. Každé měření definuje vztahy mezi proměnnými odlišně. Jeho hodnota je mezi -1 a +1:
- -1 označuje dokonalou negativní korelaci: Pokud má korelace korelační koeficient rovný nebo nižší než -0,9, je označena jako silně negativní. Je to známka toho, že data jsou v korelaci. Proměnná x však stále roste, zatímco proměnná y stále klesá.
- 0 znamená žádné spojení: Proměnné se považují za nekorelující, pokud je korelační koeficient větší než 0,01, ale menší než 0,1, protože mezi každou proměnnou není rozeznatelný vztah. Jsou na sobě nezávislé.
- +1 označuje dokonalou pozitivní korelaci: Když koeficient korelace spadne mezi 0,9 a 1, je považován za vysoce pozitivní. Znamená to, že došlo ke zvýšení počtu dvou proměnných souborů.
Nejvyšší hodnotou koeficientu mohl být korelační koeficient 1. Když je hodnota korelace 1, znamená to, že pokud byste měli data vykreslit do grafu, byla by zcela zarovnaná, aby vytvořila přímku.
Pokud jste stále trochu ztraceni, nebojte se. Vysvětlíme syntaxi funkce CORREL a poté se ponoříme do několika příkladů z reálného světa, které vám pomohou lépe porozumět. Pochopení linií, které nejlépe padnou a jak vytvořit trendové linie v Tabulkách Google vám s tím pomůže.
Syntaxe funkce CORREL v Tabulkách Google
=CORREL(data_y; data_x)
Pojďme si to rozebrat na jednotlivé části a lépe porozumět tomu, co každá fráze znamená:
- =CORREL: Toto je funkce Google Sheet, která určuje r (Pearsonův korelační koeficient produktu a momentu datové sady).
- data_y: Toto se týká skupiny buněk obsahujících závislá data nebo rozsahu hodnot pro tyto buňky.
- údaje x: Toto je buď odkaz na pole buněk s nezávislými daty nebo rozsah hodnot pro tyto buňky.
Pokud byste měli datové body vykreslit do grafu, data_y by byla osa Y a data_x osa X. Všimnete si, že existují dva různé způsoby, jak zadat rozsah dat. Možnosti jsou buď rozsah referenčních buněk, nebo přímé zadávání dat ve funkci.
Ve většině případů je výhodnější použití rozsahu referenčních buněk. Je to proto, že tabulka s největší pravděpodobností již obsahuje vaše data. Použitím rozsahu referenčních buněk se můžete vyhnout nadměrnému zadávání, které může vést k chybě uživatele.
Příklady funkcí CORREL v Tabulkách Google
Pojďme se podívat na několik příkladů, abychom pochopili, jak používat funkci CORREL v Tabulkách Google.
Příklad 1: Silná pozitivní korelace
Pro tento první příklad předstírejme, že pracujeme v realitním průmyslu. V tabulce níže máme části hektarů půdy, které prodáváte, a počet prodaných jednotek těchto různých pozemků ve vaší tabulce Google.
- Pokud postupujete v tabulce, začněte zadáním dat proměnných do tabulky, jak je uvedeno níže:
- Klepněte na buňku C2
- Typ =CORREL(
- Poté přejdete k typu data_y, což je v našem případě odkazovaný rozsah buněk A2:A6, potom zadejte čárku.
- Pokračujte typem data_x, který je v našem případě označen jako B2:B6.
- Zakončete uzavírací závorkou, jak je znázorněno níže:
- Nakonec stiskněte Vstupte vrátit korelační koeficient dvou částí dat v buňce C2.
Pomocí výše uvedeného příkladu jste získali korelační koeficient 0,90, což je silná pozitivní korelace, protože jeho hodnota spadá mezi 0,9 a 1. Znamená to tedy, že jak se mění y, mění se i x v podstatě srovnatelným způsobem.
Níže je znázornění našeho příkladu ukázkových dat na XY bodovém grafu. Jak můžete vidět, čára nejlepší shody je blízko datovým bodům v grafu, což podporuje myšlenku, že údaje jsou silně korelovány.
Můžete se dozvědět více o vytváření XY bodových grafů v Tabulkách Google v našem dalším článku.
Příklad 2: Slabá negativní korelace
Tentokrát v naší tabulce použijeme obecnější příklad „proměnných x a y“. Účelně jsme zahrnuli čísla, abychom demonstrovali negativní korelaci, kterou funkce CORREL demonstruje níže:
Mezi proměnnými y a x není silný vztah, takže výsledkem je méně významný korelační koeficient než v předchozím příkladu. Výsledek, kterého jsme dosáhli, je -0,47. To však neznamená, že neexistuje žádná korelace. Podívejme se znovu na linii, která nejlépe vyhovuje, abychom to pochopili.
Jak můžete vidět z bodového grafu, datové body jsou dále od linie, která nejlépe odpovídá. Je zde tedy menší korelace než v prvním příkladu, ale ne žádná. Také si všimnete, že linie, která nejlépe sedí, se zmenšuje. To ukazuje negativní korelaci, jedna hodnota klesá, zatímco druhá roste.
Příklad 3: Žádné spojení
Zde máme sadu zcela náhodných čísel. Pojďme se rychle dotknout, jak znovu používat funkci CORREL:
- Zadejte buňku C2 vzorec CORREL
- Naše argumenty jsou A2:A10 a B2:B10
- Stiskněte Enter
Hodnota vrácená na C2 je 0,02. Pokud korelační koeficient spadá mezi 0,01 a 0,1, je určeno, že dané proměnné nekorelují, protože mezi nimi není rozeznatelná souvislost. Vztahy mezi proměnnými jsou zcela nezávislé.
Níže je znázorněno totéž na bodovém grafu. Linie nejlepší shody je téměř plochá, což naznačuje malou korelaci mezi dvěma soubory dat.
Snadno korelujte svá data v Tabulkách Google
Korelace může být náročné téma, pokud jste s ní na střední škole příliš nepracovali. Tato příručka pokryla všechny základy, ale budete muset nadále používat funkci CORREL v Tabulkách Google, abyste ji měli stále v paměti.
Jedná se o výkonnou funkci, protože pomáhá vyhnout se vytváření rozptylových grafů a dokáže rychle najít trendy ve vašich datech. Přesto se nebojte přidat grafy, které pomohou ostatním uživatelům lépe porozumět datům ve vašich tabulkách.