Prinsip
Himpunan observasi dimodelkan sebagai sampel acak dari distribusi peluang gabungan yang tidak diketahui, dinyatakan sebagai kumpulan parameter. Tujuan estimasi maksimum likelihood adalah untuk menentukan parameter, sehingga data hasil observasi memiliki peluang gabungan tertinggi. Disini, parameter yang menentukan distribusi gabungan dinyatakan dalam bentuk vektor
sehingga distribusi tersebut termasuk suatu keluarga parametrik
, dengan
adalah ruang parameter, yakni subhimpunan berdimensi terhingga dari ruang Euklides. Mengevaluasi kepadatan gabungan pada sampel data hasil observasi
memberikan suatu fungsi bernilai real,
yang dinamakan fungsi likelihood. Untuk variabel acak bebas, fungsi
akan menjadi hasil kali dari fungsi-fungsi kepadatan univariat: 
Tujuan estimasi maksimum likelihood adalah mencari nilai dari parameter model yang memaksimalkan fungsi likelihood di ruang parameter.[5] Dalam artian, 
Secara intuitif, estimasi maksimum likelihood memilih nilai parameter yang menjadikan data hasil observasi mungkin terjadi. Nilai istimewa
yang memaksimalkan fungsi likelihood
dinamakan estimasi maksimum likelihood. Lebih lanjut, jika fungsi
yang didefinisikan sebagai fungsi terukurkan, maka fungsi itu adalah estimator maksimum likelihood. Suatu fungsi umumnya didefinisikan di ruang sampel, dalam artian mengambil suatu sampel yang diketahui sebagai argumennya. Adapun suatu syarat cukup tapi tak perlu mengenai keberadaannya, yakni bahwa fungsi likelihood adalah kontinu di suatu ruang parameter kompak
.[6] Apabila ruang parameter
terbuka, fungsi likelihood dapat menaik tanpa benar-benar mencapai suatu nilai supremum.
Pada prakteknya, estimasi maksimum likelihood seringkali mudah dikerjakan bersamaan dengan logaritma natural dari fungsi likelihood, yang dinamakan log-likelihood:
Karena fungsi logaritma bersifat monotonik, nilai maksimum dari fungsi
muncul pada nilai yang sama dari
, sebagaimana halnya dengan nilai maksimum dari
.[7] Apabila fungsi
terdiferensialkan di ruang parameter
, syarat yang perlu terjadinya maksimum (atau minimum) adalah
Semua persamaan tersebut dinamakan persamaan likelihood. Untuk pemodelannya, persamaan-persamaan tersebut secara eksplisit dapat diselesaikan untuk
. Akan tetapi, secara umum solusi bentuk tertutup untuk permasalahan maksimisasi masih belum diketahui, ataupun belum tersedia. Estimasi maksimum likelihood hanya dapat ditemukan melalui optimisasi numerik. Permasalahan lainnya adalah bahwa dalam sampel terhingga, terdapat banyak akar untuk persamaan likelihood.[8] Menentukan akar
dari persamaan-persamaan likelihood yang tentunya suatu maksimum (lokal) tergantung pada apakah matriks dari turunan parsial orde kedua dan parsial campuran
adalah semidefinit negatif di
, karena matriks ini mengindikasi kecekungan lokal. Matriks ini dinamakan matriks Hessian. Biasanya, distribusi peluang yang paling umum, terutama dalam keluarga eksponensial, adalah fungsi cekung secara logaritmik.[9][10]