Secara sederhana, model regresi dalam statistik matematika dibangun berdasarkan data yang diketahui, yang merupakan pasangan angka. Jumlah pasangan demikian sudah ditentukan sebelumnya. Jika Anda membayangkan bahwa angka pertama dalam pasangan adalah nilai koordinat dan yang kedua , maka himpunan pasangan angka tersebut dapat direpresentasikan pada bidang dalam sistem koordinat Cartesian sebagai himpunan poin. Pasangan angka ini tidak diambil secara acak. Dalam praktiknya, sebagai aturan, angka kedua tergantung pada yang pertama. Membangun regresi berarti mengambil garis tersebut (lebih tepatnya, fungsi) yang sedekat mungkin (mendekati) banyak poin di atas.

Untuk apa semua ini? Pertama-tama, ini diperlukan untuk persiapan apa yang disebut perkiraan. Seringkali perlu mencari tahu
hanya mengetahui
jika berbeda dari X tersebut, atas dasar mana regresi dibangun. Saya akan memberikan contoh sederhana. Ada statistik tentang ketergantungan pertumbuhan seseorang pada usianya berdasarkan pada 100 orang berbeda yang dipelajari. Dengan demikian, kami memiliki 100 pasang angka {umur; pertumbuhan}. Pada saat yang sama, "pertumbuhan" adalah kuantitas yang tergantung, dan "usia" adalah independen. Dengan membangun model regresi dengan benar, kita dapat "memprediksi" pertumbuhan dengan kepastian apa pun berdasarkan nilai usia.
Dalam praktiknya, tergantung pada situasinya, linier, parabola, kekuasaan, dan jenis fungsi lainnya digunakan dalam pembuatan model regresi. Dalam perjalanan statistik matematika, model regresi linier paling sering dipertimbangkan. Kadang-kadang mereka menyentuh kasus yang lebih rumit - model parabola. Membuat generalisasi, mudah ditebak bahwa model linier dan parabola adalah kasus-kasus tertentu dari model yang lebih kompleks - polinomial. Membangun model regresi berarti menemukan parameter fungsi yang akan muncul di dalamnya. Untuk regresi linier - dua parameter: koefisien dan istilah bebas.
Regresi polinomial dapat digunakan dalam statistik matematika untuk memodelkan komponen tren deret waktu. Rangkaian waktu sebenarnya adalah serangkaian angka yang bergantung pada waktu. Misalnya, suhu harian rata-rata selama setahun terakhir, atau pendapatan bulanan perusahaan. Urutan polinomial yang disimulasikan dievaluasi dengan metode khusus, misalnya, dengan kriteria seri. Tujuan membangun model regresi polinomial di bidang deret waktu masih sama - perkiraan.
Untuk mulai dengan, kami mempertimbangkan masalah regresi polinom secara umum. Semua penalaran didasarkan pada generalisasi penalaran dalam masalah regresi linier dan parabola. Setelah pertimbangan ini, saya akan beralih ke kasus khusus - pertimbangan model ini untuk deret waktu.
Biarkan dua seri pengamatan diberikan (variabel independen) dan (variabel dependen) . Persamaan polinomial memiliki bentuk
dimana
- parameter dari polinomial ini,
. Di antara mereka
- anggota gratis. Mari kita cari parameter kuadrat terkecil (OLS)
diberikan regresi.
Dengan analogi dengan regresi linier, OLS juga didasarkan pada meminimalkan ekspresi berikut:
Di sini - Nilai teoritis yang merupakan nilai polinomial (1) pada titik . Mengganti (1) dalam (2), kita dapatkan
Berdasarkan kondisi yang diperlukan untuk fungsi ekstrem variabel kami menyamakan turunan parsialnya menjadi nol, mis.
Membagi sisi kiri dan kanan masing-masing persamaan dengan 2, kami mengungkapkan jumlah kedua:
Membuka kurung, kami transfer di masing-masing
Ekspresi th, istilah terakhir dengan
ke kanan dan membagi kedua belah pihak dengan
. Hasilnya, kami dapat
ekspresi membentuk sistem persamaan normal linier untuk
. Ini memiliki bentuk berikut:
\ left \ {\ begin {array} {l} b_0 + b_1 \ overline x + b_2 \ overline {x ^ 2} + \ dots + b_k \ overline {x ^ k} = \ overline y \\ b_0 \ overline x + b_1 \ overline {x ^ 2} + b_2 \ overline {x ^ 3} + \ dots + b_k \ overline {x ^ {k + 1}} = \ overline {xy} \\ b_0 \ overline {x ^ 2} + b_1 \ overline {x ^ 3} + b_2 \ overline {x ^ 4} + \ dots + b_k \ overline {x ^ {k + 2}} = \ overline {x ^ 2y} \\ \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \ ldots \\ b_0 \ overline {x ^ k} + b_1 \ overline {x ^ {k + 1}} + b_2 \ overline {x ^ {k + 2}} + \ dots + b_k \ overline {x ^ {2k}} = \ overline {x ^ ky} \ end {array} \ benar. \ \ \ \ \ (3)
Anda dapat menulis ulang sistem (3) dalam bentuk matriks: dimana
A = \ kiri (\ begin {array} {ccccc} 1 & \ overline x & \ overline {x ^ 2} & \ ldots & \ overline {x ^ k} \\ \ overline x & \ overline {x ^ 2 } & \ overline {x ^ 3} & \ ldots & \ overline {x ^ {k + 1}} \\ \ overline {x ^ 2} & \ overline {x ^ 3} & \ overline {x ^ 4} & & \ ldots & \ overline {x ^ {k + 2}} \\ \ vdots & \ vdots & \ vdots & \ ddots & \ vdots \\ \ overline {x ^ k} & \ overline {x ^ {k + 1} } & \ overline {x ^ {k + 2}} & \ ldots & \ overline {x ^ {2k}} \ end {array} \ kanan), \ \ B = \ kiri (\ begin {array} {c} b_0 \\ b_1 \\ b_2 \\ vdots \\ b_k \ end {array} \ kanan), \ \ C = \ kiri (\ begin {array} {c} \ overline y \\ overline {xy} \\ \ overline {x ^ 2thn} \\ vdots \ overline {x ^ ky} \ end {array} \ kanan).
Sekarang kita beralih ke penerapan fakta-fakta di atas dalam kasus deret waktu. Biarkan deret waktu diberikan dimana . Diperlukan untuk membangun tren urutan polinomial , yang mendekati deret waktu yang diberikan seakurat mungkin. Sebagai variabel independen kami akan mengambil berdasarkan definisi deret waktu. Xs ini adalah serangkaian bilangan asli yang menunjukkan periode waktu. Sebagai a nilai seri waktu diambil . Dapat dilihat bahwa nilai-nilai elemen matriks sistem independen dari . Karena dalam kasus umum, jelas,
kemudian dalam hal deret waktu
dimana
Item vektor matriks istilah gratis umumnya diperoleh sebagai
Dan dalam hal deret waktu
dimana
Dengan demikian, setelah menyelesaikan sistem (3), kita dapat menemukan parameter yang diinginkan dari tren polinomial
Untuk mengisi matriks sistem dan menyelesaikannya, salah satu metode numerik dapat digunakan saat memodelkan tren pada komputer. Dalam hal ini, hasil perhitungan akan cukup akurat.
Akibatnya, komponen tren akan berbentuk:
Perlu dicatat juga bahwa komponen tren yang disimulasikan
, ditentukan tidak hanya untuk periode saat ini
, tetapi juga untuk periode mendatang
.
Saya segera mencatat bahwa model regresi polinomial hanya komponen tren dari deret waktu. Model deret waktu lengkap juga menyiratkan komponen lain, yang berada di luar cakupan artikel ini.
Dalam praktiknya, saya pribadi belum melihat deret waktu dengan urutan tren polinomial lebih dari 2. Ini menjelaskan prevalensi model regresi linier dan prabolik sebagai kasus polinomial tertentu.