Model Regresi Polinomial

Secara sederhana, model regresi dalam statistik matematika dibangun berdasarkan data yang diketahui, yang merupakan pasangan angka. Jumlah pasangan demikian sudah ditentukan sebelumnya. Jika Anda membayangkan bahwa angka pertama dalam pasangan adalah nilai koordinat xdan yang kedua y, maka himpunan pasangan angka tersebut dapat direpresentasikan pada bidang dalam sistem koordinat Cartesian sebagai himpunan poin. Pasangan angka ini tidak diambil secara acak. Dalam praktiknya, sebagai aturan, angka kedua tergantung pada yang pertama. Membangun regresi berarti mengambil garis tersebut (lebih tepatnya, fungsi) yang sedekat mungkin (mendekati) banyak poin di atas.




Untuk apa semua ini? Pertama-tama, ini diperlukan untuk persiapan apa yang disebut perkiraan. Seringkali perlu mencari tahu yhanya mengetahui xjika berbeda dari X tersebut, atas dasar mana regresi dibangun. Saya akan memberikan contoh sederhana. Ada statistik tentang ketergantungan pertumbuhan seseorang pada usianya berdasarkan pada 100 orang berbeda yang dipelajari. Dengan demikian, kami memiliki 100 pasang angka {umur; pertumbuhan}. Pada saat yang sama, "pertumbuhan" adalah kuantitas yang tergantung, dan "usia" adalah independen. Dengan membangun model regresi dengan benar, kita dapat "memprediksi" pertumbuhan dengan kepastian apa pun berdasarkan nilai usia.

Dalam praktiknya, tergantung pada situasinya, linier, parabola, kekuasaan, dan jenis fungsi lainnya digunakan dalam pembuatan model regresi. Dalam perjalanan statistik matematika, model regresi linier paling sering dipertimbangkan. Kadang-kadang mereka menyentuh kasus yang lebih rumit - model parabola. Membuat generalisasi, mudah ditebak bahwa model linier dan parabola adalah kasus-kasus tertentu dari model yang lebih kompleks - polinomial. Membangun model regresi berarti menemukan parameter fungsi yang akan muncul di dalamnya. Untuk regresi linier - dua parameter: koefisien dan istilah bebas.


Regresi polinomial dapat digunakan dalam statistik matematika untuk memodelkan komponen tren deret waktu. Rangkaian waktu sebenarnya adalah serangkaian angka yang bergantung pada waktu. Misalnya, suhu harian rata-rata selama setahun terakhir, atau pendapatan bulanan perusahaan. Urutan polinomial yang disimulasikan dievaluasi dengan metode khusus, misalnya, dengan kriteria seri. Tujuan membangun model regresi polinomial di bidang deret waktu masih sama - perkiraan.


Untuk mulai dengan, kami mempertimbangkan masalah regresi polinom secara umum. Semua penalaran didasarkan pada generalisasi penalaran dalam masalah regresi linier dan parabola. Setelah pertimbangan ini, saya akan beralih ke kasus khusus - pertimbangan model ini untuk deret waktu.


Biarkan dua seri pengamatan diberikan xi(variabel independen) dan yi(variabel dependen) i= overline1,n. Persamaan polinomial memiliki bentuk

y= jumlah limitj=0kbjxj,     (1)


dimana bj- parameter dari polinomial ini, j= overline0,k. Di antara mereka b0- anggota gratis. Mari kita cari parameter kuadrat terkecil (OLS) bjdiberikan regresi.

Dengan analogi dengan regresi linier, OLS juga didasarkan pada meminimalkan ekspresi berikut:

S= jumlah limiti=1n kiri( hatyiβˆ’yi kanan)2 to min     (2)



Di sini  hatyi- Nilai teoritis yang merupakan nilai polinomial (1) pada titik xi. Mengganti (1) dalam (2), kita dapatkan

S= jumlah limiti=1n kiri( sumj=0kbjxijβˆ’yi kanan)2 hingga mnt



Berdasarkan kondisi yang diperlukan untuk fungsi ekstrem (k+1)variabel S=S(b0,b1, dots,bk)kami menyamakan turunan parsialnya menjadi nol, mis.

Sbpβ€²=2 jumlah limiti=1nxip kiri( jumlah limitj=0kbjxijβˆ’yi kanan)=0,   p= overline0,k.


Membagi sisi kiri dan kanan masing-masing persamaan dengan 2, kami mengungkapkan jumlah kedua:

 jumlah limiti=1nxip kiri(b0+b1xi+b2xi2+ titik+bkxik kanan)βˆ’ jumlah limiti=1nxipyi=0,   p= overline0,k.


Membuka kurung, kami transfer di masing-masing pEkspresi th, istilah terakhir dengan yike kanan dan membagi kedua belah pihak dengan n. Hasilnya, kami dapat (k+1)ekspresi membentuk sistem persamaan normal linier untuk bp. Ini memiliki bentuk berikut:

\ left \ {\ begin {array} {l} b_0 + b_1 \ overline x + b_2 \ overline {x ^ 2} + \ dots + b_k \ overline {x ^ k} = \ overline y \\ b_0 \ overline x + b_1 \ overline {x ^ 2} + b_2 \ overline {x ^ 3} + \ dots + b_k \ overline {x ^ {k + 1}} = \ overline {xy} \\ b_0 \ overline {x ^ 2} + b_1 \ overline {x ^ 3} + b_2 \ overline {x ^ 4} + \ dots + b_k \ overline {x ^ {k + 2}} = \ overline {x ^ 2y} \\ \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \\ b_0 \ overline {x ^ k} + b_1 \ overline {x ^ {k + 1}} + b_2 \ overline {x ^ {k + 2}} + \ dots + b_k \ overline {x ^ {2k}} = \ overline {x ^ ky} \ end {array} \ benar. \ \ \ \ \ (3)


Anda dapat menulis ulang sistem (3) dalam bentuk matriks: AB=Cdimana


A = \ kiri (\ begin {array} {ccccc} 1 & \ overline x & \ overline {x ^ 2} & \ ldots & \ overline {x ^ k} \\ \ overline x & \ overline {x ^ 2 } & \ overline {x ^ 3} & \ ldots & \ overline {x ^ {k + 1}} \\ \ overline {x ^ 2} & \ overline {x ^ 3} & \ overline {x ^ 4} & & \ ldots & \ overline {x ^ {k + 2}} \\ \ vdots & \ vdots & \ vdots & \ ddots & \ vdots \\ \ overline {x ^ k} & \ overline {x ^ {k + 1} } & \ overline {x ^ {k + 2}} & \ ldots & \ overline {x ^ {2k}} \ end {array} \ kanan), \ \ B = \ kiri (\ begin {array} {c} b_0 \\ b_1 \\ b_2 \\ vdots \\ b_k \ end {array} \ kanan), \ \ C = \ kiri (\ begin {array} {c} \ overline y \\ overline {xy} \\ \ overline {x ^ 2thn} \\ vdots \ overline {x ^ ky} \ end {array} \ kanan).


Sekarang kita beralih ke penerapan fakta-fakta di atas dalam kasus deret waktu. Biarkan deret waktu diberikan xtdimana t= overline1,n. Diperlukan untuk membangun tren urutan polinomial k, yang mendekati deret waktu yang diberikan seakurat mungkin. Sebagai variabel independen xkami akan mengambil tberdasarkan definisi deret waktu. Xs ini adalah serangkaian bilangan asli yang menunjukkan periode waktu. Sebagai a ynilai seri waktu diambil xt. Dapat dilihat bahwa nilai-nilai elemen aijmatriks sistem Aindependen dari xt. Karena dalam kasus umum, jelas,

aij= overlinexi+jβˆ’2= frac1n jumlah limitr=1nxri+jβˆ’2,


kemudian dalam hal deret waktu

aij= frac1n jumlah limitr=1nri+jβˆ’2,


dimana i,j= overline1,(k+1).

Item cjvektor matriks istilah gratis Cumumnya diperoleh sebagai

cj= overlinexjβˆ’1y= frac1n jumlah limitr=1nxrjβˆ’1yr.


Dan dalam hal deret waktu

cj= frac1n jumlah limitr=1nrjβˆ’1xr,


dimana j= overline1,(k+1).

Dengan demikian, setelah menyelesaikan sistem (3), kita dapat menemukan parameter yang diinginkan dari tren polinomial b0, dots,bk.


Untuk mengisi matriks sistem dan menyelesaikannya, salah satu metode numerik dapat digunakan saat memodelkan tren pada komputer. Dalam hal ini, hasil perhitungan akan cukup akurat.


Akibatnya, komponen tren akan berbentuk:

Tt= jumlah limiti=0kbiti,   t=0,1,2, dots.


Perlu dicatat juga bahwa komponen tren yang disimulasikan Tt, ditentukan tidak hanya untuk periode saat ini [1;n], tetapi juga untuk periode mendatang t>n.

Saya segera mencatat bahwa model regresi polinomial hanya komponen tren dari deret waktu. Model deret waktu lengkap juga menyiratkan komponen lain, yang berada di luar cakupan artikel ini.


Dalam praktiknya, saya pribadi belum melihat deret waktu dengan urutan tren polinomial lebih dari 2. Ini menjelaskan prevalensi model regresi linier dan prabolik sebagai kasus polinomial tertentu.

Source: https://habr.com/ru/post/id414245/


All Articles