Regularisasi (matematika) Fungsi hijau dan biru keduanya mengalami kerugian nol pada titik-titik data yang ada. Model yang telah dilatih dapat diarahkan untuk lebih memilih fungsi hijau yang mungkin dapat menggeneralisasi lebih baik ke lebih banyak titik yang diambil dari distribusi yang tidak diketahui dengan menyesuaikan , bobot dari data regularisasi.
Meskipun prosedur regularisasi dapat dibagi dalam banyak cara. Regularisasi dapat dibagi sebagai berikut.
Regularisasi eksplisit adalah regularisasi yang dilakukan ketika seseorang secara eksplisit menambahkan suatu suku dalam masalah optimasi. Suku-suku ini dapat berupa prior, penalti, atau kendala. Regularisasi eksplisit umumnya digunakan pada masalah optimasi yang tidak terdefinisi dengan baik (ill-posed optimization problems). Suku regularisasi, atau penalti, memberikan biaya pada fungsi optimisasi untuk membuat solusi optimal menjadi unik.
Dalam regularisasi eksplisit, terlepas dari masalah atau modelnya, selalu ada dua suku: suku data, yang terkait dengan kemungkinan pengukuran (likelihood), dan suku regularisasi, yang terkait dengan prior. Dengan menggabungkan keduanya menggunakan statistik Bayesian, kita dapat menghitung posterior yang mencakup kedua sumber informasi tersebut, sehingga menstabilkan proses estimasi. Dengan menyeimbangkan kedua tujuan ini, kita memilih untuk lebih berorientasi pada data atau untuk menegakkan regularisasi (untuk mencegah overfitting). Ada cabang penelitian khusus yang membahas berbagai kemungkinan regularisasi. Dalam praktiknya, seseorang biasanya mencoba regularisasi tertentu dan kemudian mencari tahu densitas probabilitas yang sesuai dengan regularisasi tersebut untuk membenarkan pemilihan tersebut. Ini juga bisa dimotivasi secara fisik melalui akal sehat atau intuisi.
Dalam pemelajaran mesin, istilah data terkait dengan data pelatihan, sementara regularisasi adalah pilihan model atau modifikasi pada algoritma. Tujuan utamanya selalu untuk mengurangi kesalahan generalisasi, yaitu skor kesalahan dengan model terlatih pada set evaluasi, bukan data pelatihan.[3]
Salah satu penggunaan regularisasi yang paling awal adalah regularisasi Tikhonov (regresi ridge), yang terkait dengan metode kuadrat terkecil.