GENERELLA BEGREPP |
Analysenhet | De enheter såsom oss jämför. mot modell länder, individer, kalenderår, aktier, kommuner, osv. |
Variabel | Egenskap hos analysenheterna såsom varierar. En typisk demografisk undersökning får fungera som ett exempel mot modell längd, ålder alternativt partillhörighet hos individer, alternativt befolkning, grad från demokrati alternativt klimat hos länder. |
Variabelvärde | Det faktiska värde ett analysenhet besitter vid ett variabel. |
Kausalitet | Orsaksförhållande. inom en kausalt samband förväntas den en variabeln äga påverkat den andra. |
Centralmått | Ett värde vilket sammanfattar tendensen inom en datamaterial. |
Fördelning | Hur värdena fördelar sig ovan samtliga tänkbara värden.
förmå titta ut vid samtliga tänkbara sätt. |
Normalfördelning | En bestämd fördelning, var dem flesta värdena återfinns inom mitten, samt tidigare ute inom kanterna. |
Spridning | Hur värdena existerar spridda kring centralmåttet. |
Korrelation | Grad från samvariation mellan numeriskt värde variabler. |
Kovarians | Grad från samvariation mellan numeriskt värde variabler, fast uttryckt inom den skal likt variablerna existerar mätta inom, dvs svårare för att jämföra än korrelation. |
URVAL samt INFERENS |
Population | Den team oss önskar dra slutsatser ifall, mot modell väljare inom Sverige. |
Urval | Den sektion från populationen (som förmå väljas ut vid olika sätt) liksom oss faktiskt studera.
Engelska: sample. |
Slumpmässigt urval | När oss slumpmässigt drar enheter ur populationen mot urvalet. allmänt sett detta urvalssätt liksom ger bäst möjligheter mot generalisering. |
Kvoturval | När oss sätter ihop urvalet till för att fyllning vissa kvoter, liksom matchar populationen. |
Självselekterat urval | När analysenheterna själva får anmäla sig mot urvalet.
Ger många dåliga möjligheter för att generalisera mot populationen, eftersom dem liksom anmäler sig ofta ej existerar representativa. |
Inferens | Att generalisera slutsatser angående urvalet mot populationen vilket helhet. |
Centrala gränsvärdessatsen | Teori liksom säger för att då oss tar flera urval ur enstaka population kommer medelvärdet inom urvalen forma ett normalfördelning centrerat vid detta sanna medelvärdet inom populationen.
Ligger mot bas till signifikansberäkningar. I statistiska sammanhang är en variabel en egenskap som kan anta olika värden hos de undersökta enheternaEngelska: huvud limit theorem. |
Konfidensintervall | Intervall från värden såsom uttrycker graden från osäkerhet. mot modell kring vad detta sanna medelvärdet existerar inom enstaka population, alternativt vilket detta sanna sambandet mellan numeriskt värde variabler är. |
VARIABELTYPER (SKALNIVÅ) |
Nominalskala | Kategorisering utan rangording.
Variabeln "frukt" kunna äga värdena "apelsin," "päron" alternativt "äpple" dock dem förmå ej rangordnas. |
Ordinalskala | Kategorisering tillsammans rangordning, dock utan ekvidistans (dvs detta existerar olika avstånd mellan dem olika skalstegen). mot modell kunna variabeln "Inställning mot förslag" äga värdena "Mycket bra," "Ganska bra," "Varken god alternativt dåligt," "Ganska dåligt" alternativt "Mycket dåligt." många god existerar förbättrad än ganska god, samt ganska utmärkt existerar förbättrad än varken utmärkt alternativt uselt, dock oss vet ej för att hoppen däremellan existerar lika stora. |
Intervallskala | Kategorisering tillsammans med rangordning samt ekvidistans.
mot modell längd inom centimeter. varenda steg uppåt vid skalan existerar lika långt. |
CENTRALMÅTT |
Typvärde | Det enskilt vanligaste värdet. Lämpligt på grund av nominalskalor. |
Median | Det värde man får angående man arrangerar varenda värden inom storleksordning, samt tar detta liksom existerar vid mitten (eller mittemellan dem numeriskt värde vilket existerar inom mitten).
Lämpligt till ordinalskalor, dock går även för att nyttja vid intervallskalor. |
Medelvärde | Det värde man får ifall man summerar varenda enskilda värden samt dividerar tillsammans med antalet enheter. kunna bara användas vid intervallskalor. Formel: $\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$ |
SPRIDNINGSMÅTT |
Varians | en mått vid avvikelsen ifrån medelvärdet, såsom används inom flera andra beräkningar. Analysenhet Formel: $V = \frac{\sum_{i=1}^n (x_i - \bar{x})^2)}{n-1}$ Formeln betyder för att man tar varenda enskild observations avvikelse ifrån medelvärdet, kvadrerar den, samt sedan summerar man samtliga dem kvadrerade avvikelserna, delar tillsammans med n-1, samt tar sedan roten ur detta.
|
Standardavvikelse | Ett mått vid den typiska avvikelsen ifrån medelvärdet.
Beräknas likt roten från variansen. Formel: $s = \sqrt{V}$ |
VARIABELSPRÅKET |
Beroende variabel | Den variabel oss önskar förklara. Kallas ibland utfallsvariabel, alternativt vid engelska dependent variabel alternativt outcome variable. |
Oberoende variabel | Den variabel oss tror redogör den beroende variabeln.
Kallas ibland prediktor, alternativt vid engelska independent varaible, determinant alternativt predictor. |
Kontrollvariabel | Ytterligare variabel likt förs in inom analysen, oftast på grund av för att utesluta spuriositet. |
Bakomliggande variabel | Variabel likt kommer före den oberoende variabeln inom den tänkta orsakskedjan.
kunna ofta existera god för att granska för. |
Mellanliggande variabel | Variabel vilket kommer mellan den oberoende variabeln samt den beroende variabeln inom den tänkta orsakskedjan. bör inte kontrolleras på grund av angående man önskar utesluta spuriositet. |
Interaktionsvariabel | Variabel liksom styr vilken inverkan den oberoende variabeln äger. Där utgörs enheterna av personer, som kan ha egenskaper så som ålder, kön, inkomst, civilstånd och så vidare Kallas ibland till modererande variabel. |
Dummyvariabel | Variabel såsom visar ifall ett analysenhet besitter ett egenskap (1), alternativt ej (0). |
TYPER från SAMBAND |
Nollsamband | Brist vid korrelation mellan numeriskt värde variabler. |
Positivt samband | Samband var mer från den en variabeln hänger ihop tillsammans mer från den andra, samt var mindre från den en variabeln hänger ihop tillsammans mindre från den andra. |
Negativt samband | Samband var mer från den en variabeln hänger ihop tillsammans mindre från den andra, samt var mindre från den en variabeln hänger ihop tillsammans mer från den andra. |
Kausalt samband | Samband var den oberoende variabeln orsakar den beroende. |
Spuriöst samband | Samband mellan numeriskt värde variabler såsom orsakats från för att enstaka tredjeplats variabel orsakat både oberoende samt beroende. |
Undertryckt samband | Egentligen befintlig samband mellan numeriskt värde variabler, vilket döljs från för att enstaka tredjeplats variabel hänger ihop tillsammans mindre värden vid den en variabeln samt högre vid den andra, alternativt tvärtom. |
Ickelinjärt samband | Samband liksom förändras beroende vid variabelns värde.
mot modell sambandet mellan ålder samt valdeltagande. Sannolikheten för att omrösta ökar då man blir äldre, dock bara mot ett viss gräns: riktigt gamla röstar inom mindre utsträckning än dem inom medelåldern. |
ANALYSTEKNIKER |
Univariat analys | Analys från enstaka variabel.
mot modell kalkyl från medelvärde. |
Bivariat analys | Analys från samband mellan numeriskt värde variabler. |
Korrelationsanalys | Analys vilket visar sambandets riktning samt styrka mellan numeriskt värde variabler. detta finns flera olika korrelationsmått, dock detta vanligaste existerar Pearson's R. |
Regressionsanalys | Analys var linje passas mot ett mängd punkter.
Ger data ifall linjens lutning, sambandets styrka, osäkerhet inom skattningen från sträcka, m.m. |
Multipel regressionsanalys | Regressionsanalys tillsammans fler än enstaka oberoende variabel. |
Logistisk regressionsanalys | Typ från regressionsanalys anpassat till fall var den beroende variabeln bara äger värdet 0 alternativt 1. |
Faktoranalys | Analys var man försöker hitta gemensamma nämnare mellan olika variabler.
Dvs minska datan på grund av för att titta angående detta finns någon latent variabel, likt oss ej observerat, såsom är kapabel förklara variationen inom flera variabler. |
DESIGNTYPER |
Experimentell design | När oss besitter övervakning ovan den oberoende variabeln, samt slumpar analysenheter in inom experimentgrupp (som utsätts till enstaka behandling) samt kontrollgrupp (som ej utsätts till behandling alternativt utsätts på grund av enstaka ytterligare behandling). De enheter som vi jämför Ger goda möjligheter för att uttala sig angående kausalitet. |
Pseudoexperimentell design | När oss utnyttjar naturlig variation till för att hitta specialfall var detta blivit ungefär likt slumpmässig tilldelning mot någon "behandling." |
Regression discontinuity design | När detta finns någon vass gräns såsom styr tilldelning mot någon bestämd variabel, samt oss antar för att analysenheter noggrann ovan samt beneath gränsen existerar ungefär lika, samt för att slumpen avgör vilka såsom hamnar ovan samt under. |
Matchning | När analysenheter matchas ihop tillsammans sina "statistiska tvillingar," dvs enheter likt äger identisk värden vid samtliga relevanta variabler förutom den oberoende. |
Tvärsnittsdesign | När oss jämför flera analysenheter nära en situation.
Engelska: Crosssectional analysis. |
Longitudinell design | När oss jämför analysenheter tillsammans sig själva ovan tid. |
Paneldesign | När oss jämför flera enheter tillsammans med varandra, samt ovan tidsperiod. Kallas även Time Series-Cross Section. |
BEGREPP INOM REGRESSIONSANALYS |
Regressionslinje | Den linje vilket passar bäst mot punktmängden. |
b-koefficient | Lutning vid regressionslinjen.
Hur många den beroende variabeln förväntas öka då den oberoende variabeln ökar tillsammans med en steg. |
Konstant/intercept | Det förväntade värdet vid den beroende variabeln då varenda oberoende variabler inom analysen besitter värdet 0. |
$R^2$ | Ett mått vid hur många från variationen inom den beroende variabeln likt kunna förklaras från dem oberoende variablerna.
Går mellan 0 samt 1. 0.5 kunna tolkas likt "50% från variationen inom den beroende variabeln förklaras från dem oberoende variablerna." |
Standardfel | Ett mått vid osäkerheten inom skattningen från b-koefficienten. dold variabel Engelska: Standard error. |
t-värde | B-koefficienten delat tillsammans standardfelet. Används till för att beräkna signifikansvärdet. |
p-värde | Signifikansvärdet. Visar hur osannolikt detta existerar för att man skulle erhålla ett b-koefficient såsom existerar minimalt därför massiv, självklart för att nollhypotesen stämmer.
existerar egentligen bara intressant då man utvärderar en urval, alternativt äger ett slumpmässig tilldelning inom en experiment.

dock trots detta används detta ofta liksom beslutsregel på grund av för att att fatta beslut eller bestämma något då samband existerar starka nog för att tolkas. Den vanliga beslutsregeln existerar för att p-värden beneath 0.05 räknas såsom signifikanta. Räknas fram genom för att jämföra t-värdet tillsammans med enstaka t-fördelning, likt beror vid hur flera analysenheter man besitter tillsammans inom analysen. |
n-tal | Hur flera analysenheter likt ingick inom analysen. |
Ostandardiserad regressionskoefficient | Den vanliga b-koefficienten, såsom då existerar uttryckt inom den beroende variabelns grupp.
ifall tex beroende variabel existerar BNP per capita visar koefficienten hur många BNP per capita förväntas öka ifall den oberoende variabeln ökar tillsammans en skalsteg. |
Standardiserad regressionskoefficient | b-koefficienten, fast standardiserad sålunda för att variansen inom både oberoende samt beroende variabel existerar 1. En dold variabel kan representera något som ses som antingen redundant eller en konstant som inte behöver observeras Möjliggör jämförelse mellan koefficienter mätta tillsammans med olika skalor, vilket annars existerar svårt. |
DIAGRAM |
Histogram | Visar fördelningen från enstaka variabel. Heter identisk vid engelska. |
Spridningsdiagram | Visar sambandet mellan numeriskt värde variabler genom för att rita ut analysenheterna likt punkter utifrån numeriskt värde axlar.
Engelska: Scatterplot. |