Sinyal biologis
Augmentasi data sintetis sangat penting untuk klasifikasi pemelajaran mesin, khususnya untuk data biologis yang cenderung berdimensi tinggi dan sulit diperoleh. Analisis dalam aplikasi kontrol robotik dan augmentasi pada subjek disabilitas dan non-disabilitas masih banyak bergantung pada pendekatan spesifik per individu. Kelangkaan data sangat terasa dalam permasalahan pemrosesan sinyal, seperti pada sinyal elektromiografi pada penderita penyakit Parkinson, yang sumbernya memang sulit untuk didapatkan. Zanini, dkk. mencatat bahwa penggunaan jaringan adversarial generatif (khususnya, DCGAN), memungkinkan proses style transfer untuk menghasilkan sinyal elektromiografi sintetis yang merepresentasikan karakteristik sinyal dari para penderita Penyakit Parkinson.[11]
Pendekatan-pendekatan ini juga penting dalam elektroensefalografi (rekaman gelombang otak). Wang, dkk. mengeksplorasi ide penggunaan jaringan saraf konvolusional dalam (deep CNN) untuk pengenalan emosi berbasis EEG. Hasil penelitian mereka meunjukkan bahwa penggunaan augmentasi data berhasil meningkatkan akurasi dalam mengenali emosi.[12]
Salah satu pendekatan umum adalah menghasilkan sinyal sintetis adalah dengan mengatur ulang komponen dari data asli. Lotte [13] mengusulkan sebuah metode “Artificial Trial Generation Based on Analogy” yang memiliki tiga contoh data
yang lalu digunakan untuk menghasilkan data buatan
yang
adalah
bagi
. Sebuah transformasi kemudian dilakukan pada
untuk menjadikannya lebih mirip pada
. Lalu, transformasi yang sama kemudian diterapkan pada
yang menghasilkan
. Pendekatan ini terbukti meningkatkan kinerja pengklasifikasi Analisis Diskriminan Linear (Linear Discriminant Analysis atau LDA) pada tiga dataset yang berbeda.
Penelitian terkini menunjukkan bahwa teknik sederhana sekalipun dapat memberikan dampak signifikan. Misalnya, Freer [14] mengamati bahwa penambahan derau pada data yang telah berhasil dikumpulkan untuk menghasilkan titik-titik data tambahan dapat meningkatkan kemampuan pemelajaran beberapa model yang sebelumnya berkinerja buruk. Tsinganos, dkk.[15] meneliti pendekatan magnitudo warping, dekomposisi wavelet, dan model EMG permukaan sintetis (pendekatan generatif) untuk pengenalan gerakan tangan. Hasilnya menunjukkan peningkatan kinerja klasifikasi hingga +16% ketika data tambahan diperkenalkan selama pelatihan.
Baru-baru ini, penelitian augmentasi data mulai berfokus pada bidang pemelajaran mendalam, khususnya pada kemampuan model generatif untuk menciptakan data buatan yang kemudian dimasukkan ke dalam pelatihan model klasifikasi. Pada tahun 2018, Luo, dkk.[16] menemukan bahwa data sinyal EEG yang berguna dapat dihasilkan oleh Conditional Wasserstein Generative Adversarial Networks (GANs). Ketika data sintetis ini ditambahkan ke dalam set pelatihan dalam kerangka train-test klasik, performa klasifikasi mengalami peningkatan yang signifikan.
Sinyal mekanis
Prediksi sinyal mekanis berbasis augmentasi data membuka jalan bagi teknologi generasi baru, seperti pengelolaan energi baru, bidang komunikasi 5G, dan rekayasa kontrol robotika.[17] Pada tahun 2022, Yang, dkk.,[17] mengintegrasikan constraints (kendala), optimisasi, dan kontrol ke dalam kerangka jaringan deep learning yang didukung oleh augmentasi data dan pemangkasan data (data pruning) dengan mempertimbangkan korelasi data ruang-waktu (spatio-temporal data correlation). Pendekatan ini berhasil meningkatkan interpretabilitas, keamanan, dan kemampuan pengendalian deep learning dalam proyek industri nyata melalui penggunaan persamaan pemrograman matematis eksplisit dan solusi analitis.