Sådan beregnes summen af ​​kvadrater til fejl (sse)

Summen af ​​kvadratiske fejl eller SSE er en foreløbig statistisk beregning, der fører til andre dataværdier. Når du har et sæt dataværdier, er det nyttigt at kunne finde, hvor tæt relateret disse værdier er. Du skal få dine data organiseret i et bord, og derefter udføre nogle ret simple beregninger. Når du har fundet SSE for et datasæt, kan du derefter fortsætte med at finde varians og standardafvigelse.

Trin

Metode 1 af 3:
Beregning af SSE med hånden
  1. Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 1
1. Opret en tre kolonne bord. Den klareste måde at beregne summen af ​​kvadratfejl på er at begynde med en tre kolonnebord. Mærke de tre kolonner som Værdi{ displayStyle { Text {værdi}}}{ Text {Value}}, Afvigelse{ displayStyle { Text {Deviation}}}{ Text {Deviation}}, og Afvigelse2{ DisplayStyle { Text {Deviation}} ^ {2}}{ Text {Deviation}} ^ {2}.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 2
    2. Udfyld dataene. Den første kolonne vil holde værdierne for dine målinger. Udfyld Værdi{ displayStyle { Text {værdi}}}{ Text {Value}} kolonne med værdierne af dine målinger. Disse kan være resultaterne af nogle eksperiment, en statistisk undersøgelse eller bare data til rådighed for et matematisk problem.
  • I dette tilfælde antag du, at du arbejder med nogle medicinske data, og du har en liste over kroppens temperaturer på ti patienter. Den forventede normale kropstemperatur er 98.6 grader. Temperaturerne på ti patienter måles og giver værdierne 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2, og 99.1. Skriv disse værdier i den første kolonne.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 3
    3. Beregn den gennemsnitlige. Før du kan beregne fejlen for hver måling, skal du beregne gennemsnittet af det fulde datasæt.
  • Husk, at gennemsnittet af ethvert datasæt er summen af ​​værdierne, divideret med antallet af værdier i sættet. Dette kan repræsenteres symbolsk, med variablen μ{ displayStyle mu} MU repræsenterer middelværdien, som:
  • μ=ΣxN{ displayStyle mu = { frac { sigma x} {n}}} mu = { frac { sigma x} {n}}
  • For disse data beregnes gennemsnittet som:
  • μ=99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.110{ displaystyle mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}} = { frac {99,0 + 98,6 + 98,5 + 101.1 + 98,3 + 98,6 + 97,9 + 98,4 + 99,2 + 99,1} {10}}
  • μ=988.710{ displayStyle mu = { frac {988.7} {10}}} mu = { frac {988.7} {10}}
  • μ=98.87{ displaystyle mu = 98.87} = 98,87
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 4
    4. Beregn de enkelte fejlmålinger. I den anden kolonne i dit bord skal du udfylde fejlmålinger for hver dataværdi. Fejlen er forskellen mellem måling og middelværdien.
  • For det givne datasæt, trækker den gennemsnitlige 98.87, fra hver målt værdi og udfyld den anden kolonne med resultaterne. Disse ti beregninger er som følger:
  • 99.0-98.87=0.13{ displayStyle 99.0-98.87 = 0.13}99.0-98.87 = 0.13
  • 98.6-98.87=-0.27{ displayStyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 98.5-98.87=-0.37{ displayStyle 98.5-98.87 = -0.37}98.5-98.87 = -0.37
  • 101.1-98.87=2.23{ displayStyle 101.1-98.87 = 2.23}101.1-98.87 = 2.23
  • 98.3-98.87=-0.57{ displayStyle 98.3-98.87 = -0.57}98.3-98.87 = -0.57
  • 98.6-98.87=-0.27{ displayStyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 97.9-98.87=-0.97{ displayStyle 97.9-98.87 = -0.97}97.9-98.87 = -0.97
  • 98.4-98.87=-0.47{ displayStyle 98.4-98.87 = -0.47}98.4-98.87 = -0.47
  • 99.2-98.87=0.33{ displayStyle 99.2-98.87 = 0.33}99.2-98.87 = 0.33
  • 99.1-98.87=0.23{ displayStyle 99.1-98.87 = 0.23}99.1-98.87 = 0.23
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 5
    5. Beregn firkanterne af fejlene. I den tredje kolonne i tabellen finder du pladsen af ​​hver af de resulterende værdier i midterkolonnen. Disse repræsenterer kvadraterne af afvigelsen fra middelværdien for hver målt værdi af data.
  • For hver værdi i midterkolonnen skal du bruge din regnemaskine og finde pladsen. Optag resultaterne i den tredje kolonne som følger:
  • 0.132=0.0169{ displayStyle 0.13 ^ {2} = 0.0169}0,13 ^ {2} = 0,0169
  • (-0.27)2=0.0729{ displayStyle (-0.27) ^ {2} = 0.0729}(-0,27) ^ {2} = 0,0729
  • (-0.37)2=0.1369{ displayStyle (-0.37) ^ {2} = 0.1369}(-0,37) ^ {2} = 0,1369
  • 2.232=4.9729{ displayStyle 2.23 ^ {2} = 4.9729}2.23 ^ {2} = 4.9729
  • (-0.57)2=0.3249{ displayStyle (-0.57) ^ {2} = 0.3249}(-0.57) ^ {2} = 0.3249
  • (-0.27)2=0.0729{ displayStyle (-0.27) ^ {2} = 0.0729}(-0,27) ^ {2} = 0,0729
  • (-0.97)2=0.9409{ displayStyle (-0.97) ^ {2} = 0.9409}(-0,97) ^ {2} = 0,9409
  • (-0.47)2=0.2209{ displayStyle (-0.47) ^ {2} = 0.2209}(-0,47) ^ {2} = 0,2209
  • 0.332=0.1089{ displayStyle 0.33 ^ {2} = 0.1089}0,33 ^ {2} = 0,1089
  • 0.232=0.0529{ displayStyle 0.23 ^ {2} = 0.0529}0,23 ^ {2} = 0,0529
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 6
    6. Tilføj firkanterne af fejl sammen. Det sidste trin er at finde summen af ​​værdierne i den tredje kolonne. Det ønskede resultat er SSE eller summen af ​​kvadratfejl.
  • For dette datasæt beregnes SSE ved at tilføje de ti værdier i den tredje kolonne:
  • SSE=6.921{ displayStyle SSE = 6.921}SSE = 6.921
  • Metode 2 af 3:
    Oprettelse af et Excel-regneark til at beregne SSE
    1. Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 7
    1. Mærk kolonnerne i regnearket. Du vil oprette et tre kolonnebord i Excel, med de samme tre overskrifter som ovenfor.
    • I celle A1, skriv i overskriften "Værdi."
    • I celle B1 skal du indtaste overskriften "afvigelse."
    • I celle C1 skal du indtaste overskriften "afvigelse kvadreret."
  • Billedet med titlen Berør summen af ​​firkanter for fejl (SSE) Trin 8
    2. Indtast dine data. I den første kolonne skal du indtaste værdierne for dine målinger. Hvis sættet er lille, kan du blot skrive dem i hånden. Hvis du har et stort datasæt, skal du muligvis kopiere og indsætte dataene i kolonnen.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 9
    3. Find gennemsnittet af datapunkterne. Excel har en funktion, der beregner middelværdien for dig. I nogle ledige celle under dit datatabell (det betyder virkelig ikke, hvilken celle du vælger), indtast følgende:
  • = Gennemsnit (A2: ___)
  • Skriv ikke ikke et tomt rum. Udfyld det blank med celle navnet på dit sidste datapunkt. For eksempel, hvis du har 100 point af data, vil du bruge funktionen:
  • = Gennemsnit (A2: A101)
  • Denne funktion omfatter data fra A2 til A101, fordi den øverste række indeholder overskrifterne i kolonnerne.
  • Når du trykker på Enter, eller når du klikker væk til en anden celle på bordet, vil gennemsnittet af dine dataværdier automatisk fylde den celle, du lige har programmeret.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 10
    4. Indtast funktionen for fejlmålingerne. I den første tomme celle i kolonnen "Deviation" skal du indtaste en funktion for at beregne forskellen mellem hvert datapunkt og middelværdien. For at gøre dette skal du bruge det celle navn, hvor gennemsnittet ligger. Lad os antage, at du har brugt celle A104.
  • Funktionen til fejlberegningen, som du indtaster i celle B2, vil være:
  • = A2- $ A $ 104.Dollarkeltegnene er nødvendige for at sikre, at du låser i celle A104 for hver beregning.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 11
    5. Indtast funktionen for fejlkvesterne. I den tredje kolonne kan du lede Excel til at beregne den firkant, du har brug for.
  • I Cell C2 skal du indtaste funktionen
  • = B2 ^ 2
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 12
    6. Kopier funktionerne for at fylde hele bordet. Når du har indtastet funktionerne i den øverste celle i henholdsvis hver kolonne, B2 og C2, skal du udfylde det fulde bord. Du kunne retype funktionen i hver linje af bordet, men det ville tage alt for længe. Brug musen, fremhæv cellerne B2 og C2 sammen, og uden at slippe af museknappen skal du trække ned til nederste celle i hver kolonne.
  • Hvis vi antager, at du har 100 datapunkter i dit bord, vil du trække musen ned til cellerne B101 og C101.
  • Når du derefter slipper museknappen, kopieres formlerne i alle cellerne i tabellen. Tabellen skal automatisk befolkes med de beregnede værdier.
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 13
    7. Find SSE. Kolonne C i din tabel indeholder alle de firkantede fejlværdier. Det sidste trin er at have Excel beregne summen af ​​disse værdier.
  • I en celle under bordet, sandsynligvis C102 for dette eksempel, indtast funktionen:
  • = Sum (C2: C101)
  • Når du klikker på Enter eller klikker på en anden anden celle i tabellen, skal du have SSE-værdien for dine data.
  • Metode 3 af 3:
    Vedrører SSE til andre statistiske data
    1. Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 14
    1. Beregn variansen fra SSE. At finde SSE for et datasæt er generelt en byggesten til at finde andre, mere nyttige værdier. Den første af disse er varians. Variansen er en måling, der angiver, hvor meget de målte data varierer fra middelværdien. Det er faktisk gennemsnittet af de kvadrerede forskelle fra middelværdien.
    • Fordi SSE er summen af ​​de kvadrerede fejl, kan du finde gennemsnittet (som er variationen), bare ved at dividere med antallet af værdier. Men hvis du beregner variansen af ​​et prøvesæt, snarere end en fuld befolkning, vil du dividere med (n-1) i stedet for n. Dermed:
    • Variation = SSE / N, hvis du beregner variansen af ​​en fuld befolkning.
    • Variance = SSE / (N-1), hvis du beregner variationen af ​​et prøve sæt data.
  • For prøveproblemet fra patienternes temperaturer kan vi antage, at 10 patienter kun repræsenterer et stikprøve sæt. Derfor vil variansen blive beregnet som:
  • Variance=SSE(N-1){ displayStyle { Text {VARIANCE}} = { FRIC { Text {SSE}} {(n-1)}}}{ TEXT {VARIANCE}} = { FRAC {{ TEXT {SSE}}} {(N-1)}}
  • Variance=6.9219{ displayStyle { Text {VARIANCE}} = { FRAC {6.921} {9}}}{ TEXT {VARIANCE}} = { FRAC {6.921} {9}}
  • Variance=0.769{ displayStyle { Text {VARIANCE}} = 0.769}{ TEXT {VARIANCE}} = 0.769
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 15
    2. Beregn standardafvigelse fra SSE. Standardafvigelsen er en almindeligt anvendt værdi, der angiver, hvor meget værdierne for ethvert datasæt afviger fra middelværdien. Standardafvigelsen er kvadratroden af ​​variansen. Husk at variansen er gennemsnittet af firkantet fejlmålinger.
  • Derfor, efter at du har beregnet SSE, kan du finde standardafvigelsen som følger:
  • Standardafvigelse=SSEN-1{ displayStyle { Text {standard afvigelse}} = { sqrt { frac { text {sse}} {n-1}}}}{ Text {Standard Deviation}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}
  • For dataprøven af ​​temperaturmålingerne kan du finde standardafvigelsen som følger:
  • Standardafvigelse=SSEN-1{ displayStyle { Text {standard afvigelse}} = { sqrt { frac { text {sse}} {n-1}}}}{ Text {Standard Deviation}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}
  • Standardafvigelse=6.9219{ DisplayStyle { Text {Standard Deviation}} = { sqrt { frac { Text {6.921}} {9}}}}{ Text {Standard Deviation}} = { sqrt {{ frac {{ Text {6.921}}} {9}}}}
  • Standardafvigelse=.769{ DisplayStyle { Text {Standard Deviation}} = { sqrt {.769}}}{ Text {Standard Deviation}} = { sqrt {.769}}
  • Standardafvigelse=0.877{ DisplayStyle { Text {Standard Deviation}} = 0.877}{ Text {Standard Deviation}} = 0.877
  • Billedet med titlen Beregn summen af ​​firkanter for fejl (SSE) Trin 16
    3. Brug SSE til at måle kovariansen. Denne artikel har fokuseret på datasæt, der kun måler en enkelt værdi ad gangen. Men i mange undersøgelser kan du sammenligne to separate værdier. Du vil gerne vide, hvordan disse to værdier vedrører hinanden, ikke kun til gennemsnittet af datasættet. Denne værdi er kovariansen.
  • Beregningerne for kovariansen er for involveret i detaljer her, bortset fra at bemærke, at du vil bruge SSE for hver datatype og derefter sammenligne dem. For en mere detaljeret beskrivelse af kovariansen og de involverede beregninger, se Beregne kovariance.
  • Som et eksempel på brugen af ​​kovariansen vil du måske sammenligne patienternes alder i en medicinsk undersøgelse til effektiviteten af ​​et lægemiddel ved at sænke feber temperaturer. Så ville du have et datasæt i alderen og et andet datasæt af temperaturer. Du vil finde SSE for hvert datasæt, og derefter finder du variationen, standardafvigelser og kovarians.
  • Tips

    Del på sociale netværk :
    Lignende