19 November 2011

Kuliah hikmah (bagian 1)


Aku gak yakin kuliah kali ini bisa aku ikuti, pagi ini kepalaku emang pusing, rasanya seperti ada gempa. Tapi aku kuatkan niat untuk datang ke kampus. Hari ini kuliah Database Multimedia oleh pak Arry Arman. Topik yang akan dibahas adalah Audio Database.
Kampus ITB
Seperti biasa, jika pak Arman yang mengajar, sepertinya sesuatu yang sulit dicerna akan lancar masuk ke otak ini. Tapi kali ini beda, kepalaku pusing dari tadi malam, begadang, namanya juga kuliah (alesan). Pada materi sebelumnya yaitu Document Database, penjelasan yang beliau berikan memang langsung dapat dipahami. Beliau menjelaskan dengan gaya bahasa yang 'merakyat', beliau hampir tidak pernah menggunakan istilah2 tenologi yang keren. Mungkin memang begitu karakter mengajar pak Arman yang paling saya salut, jempol deh pak, hehe....
Kali ini aku ingin bertaruh, apakah aku bisa mengikuti kuliah beliau. Dengan kondisi kepala yang gak 'support' buat konsentrasi penuh, ditambah mata ngantuk akibat begadang, rasanya akan sulit untuk menerima materi dari beliau. Belum lagi materi tersebut lebih rumit dari materi sebelumnya, yaitu Audio Database.
Beliau menjelaskan tujuan membuat audio database agar data berupa audio dapat di ekstrak isinya sehingga kita bisa mengetahui apa informasi yang ada pada audio tersebut. Beliau menganalogikan sebuah rekaman telepon yang direkam  sebagai barang bukti untuk sebuah kasus korupsi yang sempat booming di media masa. Jika terdapat 100 jam rekaman audio yang isinya percakapan yang diduga ada informasi yang dapat dijadikan barang bukti, maka kita akan membutuhkn waktu 100 jam juga untuk mendengarkan seluruh isi rekaman tersebut. Nah lhooo... Anda bisa bayangkan untuk mengetahui apa saja yang dibicarakan dalam rekaman tersebut membutuhkan waktu yang cukup lama. Tidak adakah cara untuk mengetahui isi percakapan tersebut dalam waktu yang lebih cepat?
Jawabannya ada! Dengan teknologi saat ini, data berupa rekaman percakapan dapat di analisa dan diketahui apa isi pembicaraan yang ada pada data rekaman tersebut, bahkan dalam hitungan menit. Konsep yang beliau jelaskan adalah melakukan scanning terhadap rekaman tersebut dan mengenali dialog yang ada pada rekaman tersebut dan mengubahnya dalam bentuk teks. Teks yang dihasilkan akan disimpan ke dalam bentuk tabel yang memiliki berbagai informasi mengenai data audionya. Sehingga ketika kita ingin mencari kata "saya" pada rekaman tersebut, maka database akan memberikan informasi kapan kata tersebut diucapkan pada rekaman. Selain itu juga dapat mengetahui siapa saja yang berdialog dalam rekaman tersebut. Inilah yang dinamakan Audio Database.
Seperti database pada umumnya, database audio tetap berupa teks yang nantinya dapat dicari dan ditelusuri. Namun yang membedakannya adalah data yang diinputkan berdasarkan hasil scanning dari data rekaman suara berupa percakapan. Dari sini baru ketahuan permasalahan yang muncul, yaitu bagaimana caranya mengubah data rekaman suara menjadi teks yang isinya sesuai dengan isi rekaman suara tersebut.
Teknologi yang bisa menjawabnya adalah speech recognition dan speaker recognition. Speech Recognition adalah teknologi untuk mengenal apa yang diucapkan pada suatu rekaman suara. Sedangkan Speaker Recognition adalah teknologi untuk mengenal siapa yang mengucapkan kata tersebut pada suatu rekaman data.
Hmm...ternyata sampai disini otakku masih bisa berkompromi untuk menangkap materi-materi yang beliau sampaikan. Memang gak terlalu banyak sih, tapi menurutku ini sudah cukup banyak. Tapi anehnya aku tidak menangkap tanda-tanda bahwa kuliah kali ini akan berakhir, justru aku melihat ada satu materi lagi yang ingin dituntaskan oleh beliau. Apa itu? Perasaan aku makin gak enak aja nih, kayaknya materi selanjutnya berhubungan dengan rumus-rumus, atau metode speech recognition dan speaker recognition. Membayangkan hal itu sepertinya otakku kembali mumet. Tanda-tanda mau 'stand-by' sudah mulai terasa di ubun-ubun.
Bagaimana tidak? Beberapa minggu lalu aku sempat mengikuti seminar dan workshop tentang Speech Recognition di Lab Multimedia Labtek V ITB. Walaupun datangnya rada telat, tetapi aku sempat melihat 2 dari 3 pemateri pada hari itu. Alhasil kepalaku malah tambah pusing melihat metode-metode yang mereka presentasikan.
Wuuuhh...jangan-jangan kali ini aku harus berhadapan lagi dengan metode-metode yang sama yang akan dijelaskan beliau sesaat lagi, tapi kali ini dalam kondisi kepala pusing. Hmm...

No comments: