Flere lineære regressionssteder, metode og anvendelser



den multiple lineær regression er et beregningsværktøj, der undersøger årsagssammenhænge forhold mellem objekter af undersøgelse og test komplekse hypoteser.

Det bruges i matematik og statistik. Denne type af lineær regression kræver afhængig (med andre ord, de resultater) og uafhængige variable (dvs. forårsager) følger en hierarkisk orden, og andre faktorer, der ligger i forskellige områder af undersøgelsen.

Normalt er den lineære regression en, der er repræsenteret af en lineær funktion, der beregnes ud fra to afhængige variabler. Dette har som det vigtigste tilfælde, hvor fænomenet studerede, har en retlinie af regression.

I et givet datasæt (x1, y1) (xn, yn) og værdier svarende til et par af tilfældige variabler i direkte korrelation med hinanden, kan den lige regression tage, at starte, i form af en ligning, som y = a · x + b .

Teoretiske beregningssteder i den multiple lineære regression

Enhver beregning ved hjælp af flere lineære regressioner vil meget afhænge af objektet, der studeres, og studieområdet, såsom økonomi, da variablerne gør de anvendte formler, har kompleksiteter, der varierer alt efter tilfældet.

Det betyder, at jo mere indviklet spørgsmål, bør tages flere faktorer i betragtning, flere data skal indsamles, og derfor større vil mængden af ​​elementer der skal indgå i beregningen, hvilket vil gøre den formel er større.

Men den almindelige i alle disse formler, der er en lodret akse (ordinaten eller Y-akse) og en vandret akse (abscissen eller X-aksen) og derefter beregnes grafisk repræsenteret ved en kartesisk system,.

Derefter foretages fortolkningen af ​​dataene (se næste afsnit) og konklusioner eller forudsigelser foretages. Under alle omstændigheder kan præstatistiske lokaler bruges til at veje variablerne, som fx følgende:

1- Svag eksogenitet

Det betyder, at variablen skal antages med en fast værdi, der næppe kan udgøre ændringer i modellen på grund af årsager udenfor sig selv.

2- Lineær karakter

Det indebærer, at værdierne af variablerne såvel som af andre parametre og forudsigelseskoefficienter skal vises som en lineær kombination af elementer, der kan repræsenteres i grafen, i det kartesiske system.

3- Homocedasticity

Dette skal være konstant. Her menes det, at uanset de prædiktive variabler skal der være den samme variance af fejlene for hver anden responsvariabel.

4- uafhængighed

Dette gælder kun fejlene i svarvariablerne, som skal vises isoleret og ikke som en gruppe af fejl, der repræsenterer et defineret mønster.

5- Fravær af multikollinearitet

Det bruges til uafhængige variabler. Det sker, når du forsøger at studere noget, men meget lidt information er tilgængelig, så der kan være mange svar, og derfor kan værdierne have mange fortolkninger, som i sidste ende ikke løser det problem, der stilles.

Der er andre forudsætninger end der tages hensyn til, men dem, der præsenteres ovenfor, gør det klart, at multipel lineær regression kræver en masse information ikke kun at have en mere stringent, omfattende og gratis undersøgelse af bias, men at løsningen på spørgsmålet Forslaget er konkret.

Det vil sige, at det skal gå til punkt med noget meget specifikt, specifikt, der ikke gør sig til at være vagt, og at det i mindre grad muliggør fejl.

Husk at multiple lineær regression ikke er ufejlbarlig og kan være tilbøjelig til fejl og unøjagtigheder i beregningen. Dette skyldes ikke så meget, hvem der udfører undersøgelsen, men fordi et bestemt fænomen i naturen ikke er helt forudsigeligt eller nødvendigvis er produktet af en bestemt årsag.

Det sker ofte, at ethvert objekt kan ændre sig pludseligt, eller at en begivenhed stammer fra handling (eller manglende handling) af mange elementer, der interagerer med hinanden.

Fortolkninger af grafikken

Når dataene er blevet beregnet i overensstemmelse med de modeller, der er udformet i tidligere faser af undersøgelsen, giver formlerne værdier, som kan repræsenteres i en graf.

I denne rækkefølge vil det kartesiske system vise mange punkter, der svarer til de beregnede variabler. Nogle vil være mere i koordinaternes akse, mens andre vil være mere i aksen af ​​abscisserne. Nogle vil være mere grupperet, mens andre bliver mere isolerede.

For at bemærke den kompleksitet, der er involveret i tolkningen af ​​dataene i graferne, kan vi f.eks. Observere Ascombe-kvartetten. I dette kvartet håndteres fire forskellige sæt data, og hver enkelt af dem er i en separat graf, der fortjener en separat analyse.

Lineariteten forbliver, men punkterne i det kartesiske system skal undersøges meget omhyggeligt, før man ved, hvordan puslespilene kommer sammen. Derefter kan de relevante konklusioner trækkes.

Selvfølgelig er der flere midler til, at disse stykker passer sammen, selvom de følger forskellige metoder, som er beskrevet i specialiserede beregningsmanualer..

Multipel lineær regression, som allerede nævnt, afhænger af mange variabler som genstanden for undersøgelsen og det område, hvor det anvendes, således at procedurerne i økonomi er ikke det samme som i medicin eller datalogi. Alt i alt, ja, et skøn er lavet, en hypotese, der så kontrolleres i slutningen.

Udvidelser af multiple lineære regression

Der er flere typer lineær regression, såsom simple og generelle, men der er også flere facetter af multipel regression, der tilpasser sig forskellige objekter af undersøgelse og dermed til videnskabens behov..

Disse håndterer normalt et stort antal variabler, så du kan ofte se modeller som multivariate eller multilevel. Hver enkelt bruger postulater og formler af forskellig kompleksitet, så fortolkningen af ​​deres resultater har tendens til at være af større betydning..

Estimeringsmetoder

Der er en lang række procedurer til at estimere de data, der opnås ved den multiple lineære regression.

Endnu en gang vil alt her afhænge af den anvendte model soliditet, beregningsformlerne, antallet af variabler, de teoretiske postulater, der blev taget i betragtning, studieområdet, de algoritmer, der er programmeret i de specialiserede computerprogrammer, og , par excellence, kompleksiteten af ​​objektet, fænomenet eller begivenheden, der analyseres.

Hver estimeringsmetode bruger helt forskellige formler. Ingen er perfekt, men den har unikke dyder, der skal bruges i overensstemmelse med den statistiske undersøgelse, der udføres.

Der er alle slags: instrumentelle variabler, generaliserede mindste kvadrater, Bayesian lineær regression, blandede modeller, Tyjonov regularisering, kvantile regression, Theil-Sen estimator og en lang liste over værktøjer, som dataene kan studeres med større præcision. 

Praktiske anvendelser

Multiple lineær regression anvendes i forskellige fagområder, og i mange tilfælde er det nødvendigt med hjælp fra computerprogrammer for at få mere nøjagtige data.

På denne måde reduceres de fejlmarginer, der måtte opstå ved manuelle beregninger (i betragtning af tilstedeværelsen af ​​mange uafhængige og afhængige variabler, er det ikke overraskende, at denne type lineær regression giver sig til fejl, da der er mange data og faktorer forarbejdede).

I analysen af ​​markedstendenser undersøges det for eksempel, om data som priserne på en vare er steget og faldet, men først og fremmest hvornår og hvorfor.

Når analyseres, når der er vigtige variationer i tallene i en given tidsperiode, især hvis ændringerne er uventede. Hvorfor ser du efter de præcise eller sandsynlige faktorer, hvormed produktet gik op, ned eller holdt sin detailpris?.

Ligeledes er sundhedsvidenskaberne (medicin, bioanalyse, apotek, epidemiologi) omfattet af flere lineære regressioner, hvor de studerer sundhedsindikatorer som dødelighed, sygelighed og fødselsrate..

I disse tilfælde kan vi starte fra en undersøgelse, der begynder med observationen, men efterfølgende er der lavet en model for at afgøre, om variationen af ​​nogle af indikatorerne skyldes en bestemt årsag, hvornår og hvorfor.

Økonomi bruger også flere lineære regressioner til at undersøge fordele og ulemper ved at foretage visse investeringer. Her er det altid nødvendigt at vide, hvornår de finansielle transaktioner foretages, med hvem og hvad var de forventede fordele.

Risikoeniveauerne vil være højere eller lavere i overensstemmelse med de forskellige faktorer, der tages i betragtning ved vurderingen af ​​kvaliteten af ​​disse investeringer, idet der også tages hensyn til omfanget af monetære udvekslinger.

Det er dog i økonomien, hvor dette beregningsværktøj er mest udnyttet. Derfor anvendes flere lineære regressioner i denne videnskab med det formål at forudsige forbrugsudgifter, investeringsudgifter, indkøb, eksport, import, aktiver, efterspørgsel efter arbejdskraft, jobtilbud og mange andre elementer..

Alle er relateret til makroøkonomi og mikroøkonomi, idet den er den første, hvor dataanalysevariabler er mere rigelige, fordi de ligger globalt..

referencer

  1. Baldor, Aurelio (1967). Plane- og rumgeometri, med en introduktion til trigonometri. Caracas: Editorial Cultura Venezolana, S.A..
  2. Universitetshospitalet Ramón y Cajal (2017). Multipel lineær regressionsmodel. Madrid, Spanien: HRC, Madrid-regionen. Hentet fra www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Flere regression i adfærdsmæssig forskning: Forklaring og forudsigelse, 2. udgave. New York: Holt, Rinehart & Winston.
  4. Rojo Abuín, J.M. (2007). Multipel lineær regression Madrid, Spanien: Center for Mennesker og Samfundsvidenskab. Genoprettet fra humaniora.cchs.csic.es.
  5. Autonome Universitet i Madrid (2008). Multipel lineær regression Madrid, Spanien: UAM. Gendannet fra web.uam.es.
  6. University of A Coruña (2017). Flere lineære regressionsmodeller; Korrelation. La Coruña, Spanien: UDC, Institut for Matematik. Gendannet fra dm.udc.es.
  7. Uriel, E. (2017). Multipel lineær regression: estimation og egenskaber. Valencia, Spanien: Universitetet i Valencia. Genoprettet fra www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel og Suriñach Caral, Jordi (2002). Multipel lineær regressionsmodel: specifikation, estimering og kontrast. Catalonien: UOC Editorial.