Sådan beregnes summen af kvadrater til fejl (sse)
Summen af kvadratiske fejl eller SSE er en foreløbig statistisk beregning, der fører til andre dataværdier. Når du har et sæt dataværdier, er det nyttigt at kunne finde, hvor tæt relateret disse værdier er. Du skal få dine data organiseret i et bord, og derefter udføre nogle ret simple beregninger. Når du har fundet SSE for et datasæt, kan du derefter fortsætte med at finde varians og standardafvigelse.
Trin
Metode 1 af 3:
Beregning af SSE med hånden1. Opret en tre kolonne bord. Den klareste måde at beregne summen af kvadratfejl på er at begynde med en tre kolonnebord. Mærke de tre kolonner som
,
, og
.

2. Udfyld dataene. Den første kolonne vil holde værdierne for dine målinger. Udfyld
kolonne med værdierne af dine målinger. Disse kan være resultaterne af nogle eksperiment, en statistisk undersøgelse eller bare data til rådighed for et matematisk problem.

3. Beregn den gennemsnitlige. Før du kan beregne fejlen for hver måling, skal du beregne gennemsnittet af det fulde datasæt.

4. Beregn de enkelte fejlmålinger. I den anden kolonne i dit bord skal du udfylde fejlmålinger for hver dataværdi. Fejlen er forskellen mellem måling og middelværdien.

5. Beregn firkanterne af fejlene. I den tredje kolonne i tabellen finder du pladsen af hver af de resulterende værdier i midterkolonnen. Disse repræsenterer kvadraterne af afvigelsen fra middelværdien for hver målt værdi af data.

6. Tilføj firkanterne af fejl sammen. Det sidste trin er at finde summen af værdierne i den tredje kolonne. Det ønskede resultat er SSE eller summen af kvadratfejl.
Metode 2 af 3:
Oprettelse af et Excel-regneark til at beregne SSE1. Mærk kolonnerne i regnearket. Du vil oprette et tre kolonnebord i Excel, med de samme tre overskrifter som ovenfor.
- I celle A1, skriv i overskriften "Værdi."
- I celle B1 skal du indtaste overskriften "afvigelse."
- I celle C1 skal du indtaste overskriften "afvigelse kvadreret."

2. Indtast dine data. I den første kolonne skal du indtaste værdierne for dine målinger. Hvis sættet er lille, kan du blot skrive dem i hånden. Hvis du har et stort datasæt, skal du muligvis kopiere og indsætte dataene i kolonnen.

3. Find gennemsnittet af datapunkterne. Excel har en funktion, der beregner middelværdien for dig. I nogle ledige celle under dit datatabell (det betyder virkelig ikke, hvilken celle du vælger), indtast følgende:

4. Indtast funktionen for fejlmålingerne. I den første tomme celle i kolonnen "Deviation" skal du indtaste en funktion for at beregne forskellen mellem hvert datapunkt og middelværdien. For at gøre dette skal du bruge det celle navn, hvor gennemsnittet ligger. Lad os antage, at du har brugt celle A104.

5. Indtast funktionen for fejlkvesterne. I den tredje kolonne kan du lede Excel til at beregne den firkant, du har brug for.

6. Kopier funktionerne for at fylde hele bordet. Når du har indtastet funktionerne i den øverste celle i henholdsvis hver kolonne, B2 og C2, skal du udfylde det fulde bord. Du kunne retype funktionen i hver linje af bordet, men det ville tage alt for længe. Brug musen, fremhæv cellerne B2 og C2 sammen, og uden at slippe af museknappen skal du trække ned til nederste celle i hver kolonne.

7. Find SSE. Kolonne C i din tabel indeholder alle de firkantede fejlværdier. Det sidste trin er at have Excel beregne summen af disse værdier.
Metode 3 af 3:
Vedrører SSE til andre statistiske data1. Beregn variansen fra SSE. At finde SSE for et datasæt er generelt en byggesten til at finde andre, mere nyttige værdier. Den første af disse er varians. Variansen er en måling, der angiver, hvor meget de målte data varierer fra middelværdien. Det er faktisk gennemsnittet af de kvadrerede forskelle fra middelværdien.For prøveproblemet fra patienternes temperaturer kan vi antage, at 10 patienter kun repræsenterer et stikprøve sæt. Derfor vil variansen blive beregnet som: 


- Fordi SSE er summen af de kvadrerede fejl, kan du finde gennemsnittet (som er variationen), bare ved at dividere med antallet af værdier. Men hvis du beregner variansen af et prøvesæt, snarere end en fuld befolkning, vil du dividere med (n-1) i stedet for n. Dermed:
- Variation = SSE / N, hvis du beregner variansen af en fuld befolkning.
- Variance = SSE / (N-1), hvis du beregner variationen af et prøve sæt data.

2. Beregn standardafvigelse fra SSE. Standardafvigelsen er en almindeligt anvendt værdi, der angiver, hvor meget værdierne for ethvert datasæt afviger fra middelværdien. Standardafvigelsen er kvadratroden af variansen. Husk at variansen er gennemsnittet af firkantet fejlmålinger.

3. Brug SSE til at måle kovariansen. Denne artikel har fokuseret på datasæt, der kun måler en enkelt værdi ad gangen. Men i mange undersøgelser kan du sammenligne to separate værdier. Du vil gerne vide, hvordan disse to værdier vedrører hinanden, ikke kun til gennemsnittet af datasættet. Denne værdi er kovariansen.
Tips
Del på sociale netværk :