Zde je návod, jak pomocí integrovaných nástrojů Excelu usnadnit statistickou analýzu.
V regresní analýze hrají zásadní roli reziduální grafy. Řeknou vám, jak přesně vaše regresní přímka představuje vztah mezi dvěma proměnnými. Následující průvodce vysvětluje, jak vypočítat a vykreslit rezidua Excelu pomocí dvou metod.
Než se však dostaneme k dobrým věcem, pojďme stručně pochopit rezidua a jejich význam v regresní analýze.
Co jsou zbytky a proč jsou důležité?
Reziduum je rozdíl mezi pozorovanou (skutečnou) hodnotou a predikovanou hodnotou. Jednodušeji řečeno, zbytek je chyba. Pokud je například pozorovaná hodnota 10 a váš model dal hodnotu 8, pak by zbytková hodnota byla 2.
Na druhé straně reziduální graf je bodový graf, ve kterém je nezávislá proměnná (stáří) vynesena na horizontální ose a rezidua (chyby) jsou vyneseny na vertikální ose.
Dobře, víte, co jsou zbytky, ale proč jsou důležité? Abyste tomu porozuměli, zvažte následující případ:
Chceme porozumět vztahu mezi věkem a mírou úspor. Za tímto účelem nakreslíme regresní přímku. Nejsme si však jisti, zda regresní přímka přesně reprezentuje vztah mezi těmito dvěma proměnnými. Tam přicházejí zbytky. Ke kontrole přesnosti regresní přímky používáme reziduální graf.
Nyní, když víte, co jsou rezidua, pojďme se naučit, jak vytvořit reziduální graf v Excelu:
Jak vytvořit reziduální graf pomocí rovnice trendové čáry
První metoda vykreslování reziduí v aplikaci Excel používá k výpočtu předpokládaných hodnot pro naše data rovnici spojnice trendu. Jakmile to máme, můžeme vypočítat rezidua odečtením předpokládaných hodnot od pozorovaných hodnot. Nakonec vytvoříme bodový graf s prediktory na horizontální ose a rezidui na vertikální ose.
I když tato metoda vyžaduje více kroků než druhá metoda, je to skvělý způsob, jak porozumět konceptu. Jakmile budete mít slušné porozumění, můžete použít druhou metodu, která vyžaduje méně času a úsilí.
Pojďme vás procesem provést krok po kroku:
Krok 1: Zadejte data
Začneme zadáním hodnot pro prediktor (pod X sloupec) a pozorované hodnoty (pod Y sloupec):
Krok 2: Vytvořte bodový graf dat
Nyní vytvoříme bodový graf dat podle následujících kroků:
Pokud nejste obeznámeni s rozptylovými grafy, zde je obsáhlý článek o vytvoření bodového grafu v Excelu a prezentace vašich dat. Můžete se také naučit použijte bodový graf v Excelu k předpovědi chování dat.
- Vyberte data (pod X a Y sloupce).
- Přejít na Excel stuha a klikněte Vložit.
- V Grafy klikněte na šipku pod Bodový diagram volba.
- Vyberte první bodový graf (Rozptylujte pouze pomocí značek).
- Získáte bodový graf podobný následujícímu grafu:
Krok 3: Přidejte spojnici trendu a zobrazte rovnici spojnice trendu na Scatterplotu
Chcete-li do bodového grafu přidat spojnici trendu, postupujte takto:
- Klikněte na bodový graf.
- Přejít na Excel stuha a klikněte Rozložení.
- V Pozadí klikněte na šipku pod Trendová čára ikona.
- Vybrat Lineární trendová linie volba.
Nyní uvidíte čáru (trendline) protínající tečky na vašem bodovém grafu. Chcete-li zobrazit rovnici spojnice trendu na bodovém grafu, postupujte takto:
- Jděte znovu do Trendová čára a klikněte na šipku pod ní.
- Klikněte Více možností trendové linie.
- A Formát trendové linie objeví se dialogové okno.
- Zkontrolovat Zobrazit rovnici na grafu možnost ve spodní části Formát trendové linie dialogové okno. Rovnice spojnice trendu se zobrazí v grafu.
Krok 4: Vypočítejte předpokládané hodnoty
Chcete-li vypočítat předpokládané hodnoty, vytvořte další sloupec (Z) vedle svých dat a postupujte podle následujících kroků:
- Zadejte vzorec spojnice trendu zobrazený v grafu a vložte jej do sloupce Z (buňka C2). Změň X ve vzorci s hodnotami ve sloupci X.
- Takže pro první předpokládanou hodnotu by vzorec byl dán takto:
=1,5115*A2+23,133
- Nahradit A2 s A3 ve vzorci spojnice trendu pro druhou predikovanou hodnotu.
- Pro třetí předpokládanou hodnotu nahraďte A3 s A4a tak dále, dokud nezískáte všechny predikované hodnoty pro jejich odpovídající prediktory.
Krok 5: Najděte zbytkové hodnoty
Nyní, když máme předpovězené hodnoty, můžeme najít zbytkové hodnoty odečtením předpovězených hodnot od pozorovaných (skutečných) hodnot ve sloupci Y. Vzorec pro první zůstatkovou hodnotu by byl =B2-C2. Za druhé by byl vzorec =B3-C3, a tak dále.
Krok 6: Vytvořte graf zbytků
K vytvoření reziduálního grafu potřebujeme prediktor a reziduální hodnoty. Nyní, když máme oba, postupujte takto:
- Vyberte sloupce Y a Z.
- Klikněte pravým tlačítkem a vyberte Skrýt.
- Nyní vyberte X a Zbytky sloupců.
- Přejít na Vložit na pásu karet aplikace Excel.
- Klikněte na šipku pod Rozptyl ikona.
- Vybrat Rozptýlit pouze pomocí značek volba.
- Získáte svůj zbytkový graf, jak je znázorněno níže.
U druhé metody stačí dát Excelu data a ten udělá veškerou práci. Zbytkový graf můžete vytvořit pouze několika kliknutími. K tomu však budete muset načíst analytický nástroj Excelu. Začněme:
- Přejít na Soubor tab a klikněte Možnosti.
- The Možnosti aplikace Excel objeví se dialogové okno.
- Přejít na Spravovat pole (dole), vyberte Doplňky aplikace Excela klikněte Jít.
- An Doplňky objeví se dialogové okno.
- Zkontrolovat Analytické nástroje pole a klikněte OK.
- Nyní přejděte k Excel stuha a klikněte Data.
- Najdete Analýza dat ikona v Analýza sekce.
Krok 2: Zadejte data
- Vyberte sloupce A a Da klikněte pravým tlačítkem myši. Klikněte Odkrýt.
- Nyní zkopírujte X a Y sloupců.
Po odkrytí sloupců si všimnete, že se graf změnil. Abychom jej změnili zpět na původní zbytkový spiknutí, musíme jej skrýt Y a Z sloupce (výběrem Y a Z sloupce, klepněte pravým tlačítkem myši a vyberte Skrýt).
- Otevřete nový list aplikace Excel a vložte jej X a Y sloupců.
- Klepněte na nově zobrazenou položku Analýza dat možnost v Analýza sekce Data tab.
- A Analýza dat objeví se dialogové okno.
- Najděte a vyberte Regrese pod Analytické nástroje.
- Klikněte OK. The Regrese objeví se dialogové okno.
- Zadejte hodnoty do Y sloupec (prediktory, B2:B11) v Vstupní rozsah Y pole.
- Zadejte rozsah buněk do X sloupec (nezávislé proměnné, A2:A11) v Vstup X Rozsah pole.
Krok 3: Vytvořte graf zbytků
V Regrese dialogové okno pod Možnosti výstupu, šek Nová vrstva listua klikněte OK.
Excel automaticky vytvoří reziduální graf spolu s následujícími výstupy, které můžete použít ke kontrole spolehlivosti vašeho regresního modelu:
- Regresní statistika
- Tabulka ANOVA
- Tabulka koeficientů
- Zbytkový výstup
Analytický nástroj Excelu nabízí řadu cenných statistických funkcí, které můžete použít k analýze svých datových sad. Po vytvoření zbytkového grafu pomocí analytického nástroje Excelu se můžete při prohlížení všech komplikovaných tabulek začít škrábat na hlavě. Ale jakmile se naučíte provádět základní analýzu dat v Excelu, čísla nevypadají tak děsivě.