Aturan 5 langkah untuk proses analisis pada proteom atau genom pada awalnya diusulkan oleh Kuo-Chen Chou pada 2011 - yang mana banyak ilmuwan menyebutnya sebagai "Aturan 5 langkah Chou".[1][2][3][4] Aturan ini telah banyak digunakan untuk analisis proteom dan genom, serta memprediksi modifikasi pasca-translasi (Post-Translational Modification) pada protein, RNA, dan DNA.[5]
Menurut aturan ini, untuk mengembangkan metode prediksi yang lebih berguna - atau prediktor untuk analisis genom atau proteom, ada lima pedoman yang harus diikuti:
Membuat atau memilih dataset benchmark yang valid untuk melatih dan menguji prediktor.
Merumuskan sampel urutan biologis dengan rumus matematika yang efektif - yang benar-benar dapat mencerminkan hubungan intrinsik individu tersebut dengan target yang akan diprediksi.
Memperkenalkan atau mengembangkan algoritma (atau mesin) yang kuat untuk dapat mengoperasikan prediksi.
Melakukan uji validasi silang yang benar agar dapat secara obyektif mengevaluasi tingkat akurasi prediksi.
Membuat server web untuk prediktor yang dapat diakses oleh publik.
Sejak saat itu, aturan 5 langkah ini telah banyak digunakan oleh ilmuwan dalam mengembangkan berbagai prediktor untuk analisis proteom atau genom, terutama oleh para ilmuwan yang merumuskan urutan biologis dengan PseAAC atau PseKNC untuk mengembangkan berbagai prediktor - yang kemudian digunakan untuk analisis proteome atau genom.
Berbagai makalah yang disajikan untuk mengembangkan metode analisis urutan baru atau prediktor statistik dengan mengamati pedoman aturan 5-langkah Chou memiliki beberapa keunggulan sebagai berikut:
Sangat jelas dalam pengembangan logika
Sepenuhnya transparan dalam pengoperasiannya
Hasil yang dilaporkan dapat dengan mudah diulangi oleh simpatisan lain
Potensi tinggi dalam merangsang metode analisis urutan lainnya
Nyaman digunakan oleh sebagian besar ilmuwan eksperimental
Selain itu, aturan 5 langkah Chou telah semakin diperluas ke bagian ilmiah lainnya, misalnya ilmu material untuk mengembangkan metode yang kuat untuk mendeteksi bahan perovskit dengan suhu Curie yang lebih tinggi juga.[6]
↑Hussain W, Khan YD, Rasool N, Khan SA, Chou KC (Feb 2019). "SPrenylC-PseAAC: A sequence-based model developed via Chou's 5-steps rule and general PseAAC for identifying S-prenylation sites in proteins". J. Theor. Biol. 468: 1–11. doi:10.1016/j.jtbi.2019.02.007. PMID30768975.
↑Hussain W, Khan YD, Rasool N, Khan SA, Chou KC (Mar 2019). "SPalmitoylC-PseAAC: A sequence-based model developed via Chou's 5-steps rule and general PseAAC for identifying S-palmitoylation sites in proteins". Anal. Biochem. 568: 14–23. doi:10.1016/j.ab.2018.12.019. PMID30593778.
↑Le NQK, Yapp EKY, Ho QT, Nagasundaram N, Ou YY, Yeh HY (Feb 2019). "iEnhancer-5Step: Identifying enhancers using hidden information of DNA sequences via Chou's 5-step rule and word embedding". Anal. Biochem. 57: 53–61. doi:10.1016/j.ab.2019.02.017. PMID30822398.
↑Ning Q, Ma Z, Zhao X (Mar 2019). "dForml(KNN)-PseAAC: Detecting Formylation sites from protein sequences using K-nearest neighbor algorithm via Chou's 5-step rule and Pseudo components". J. Theor. Biol. doi:10.1016/j.jtbi.2019.03.011. PMID30880183.
↑Kabir M, Ahmad S, Iqbal M, Hayat M (Feb 2019). "iNR-2L: A two-level sequence-based predictor developed via Chou's 5-steps rule and general PseAAC for identifying nuclear receptors and their families". Genomics. doi:10.1016/j.ygeno.2019.02.006. PMID30779939.
↑Zhan, X., Chen, M., Lu, W. (2018). Accelerated search for perovskite materials with higher Curie temperature based on the machine learning methods. Computational Materials Science 151, 41-48. http://dx.doi.org/10.1016/j.commatsci.2018.04.031