Aku gak yakin kuliah
kali ini bisa aku ikuti, pagi ini kepalaku emang pusing, rasanya seperti ada
gempa. Tapi aku kuatkan niat untuk datang ke kampus. Hari ini kuliah Database
Multimedia oleh pak Arry Arman. Topik yang akan dibahas adalah Audio Database.
Kampus ITB |
Seperti biasa, jika
pak Arman yang mengajar, sepertinya sesuatu yang sulit dicerna akan lancar
masuk ke otak ini. Tapi kali ini beda, kepalaku pusing dari tadi malam,
begadang, namanya juga kuliah (alesan). Pada materi sebelumnya yaitu Document
Database, penjelasan yang beliau berikan memang langsung dapat dipahami. Beliau
menjelaskan dengan gaya bahasa yang 'merakyat', beliau hampir tidak pernah
menggunakan istilah2 tenologi yang keren. Mungkin memang begitu karakter
mengajar pak Arman yang paling saya salut, jempol deh pak, hehe....
Kali ini aku ingin
bertaruh, apakah aku bisa mengikuti kuliah beliau. Dengan kondisi kepala yang
gak 'support' buat konsentrasi penuh, ditambah mata ngantuk akibat begadang,
rasanya akan sulit untuk menerima materi dari beliau. Belum lagi materi
tersebut lebih rumit dari materi sebelumnya, yaitu Audio Database.
Beliau menjelaskan
tujuan membuat audio database agar data berupa audio dapat di ekstrak isinya
sehingga kita bisa mengetahui apa informasi yang ada pada audio tersebut.
Beliau menganalogikan sebuah rekaman telepon yang direkam sebagai barang bukti untuk sebuah kasus
korupsi yang sempat booming di media masa. Jika terdapat 100 jam rekaman audio
yang isinya percakapan yang diduga ada informasi yang dapat dijadikan barang
bukti, maka kita akan membutuhkn waktu 100 jam juga untuk mendengarkan seluruh
isi rekaman tersebut. Nah lhooo... Anda bisa bayangkan untuk mengetahui apa
saja yang dibicarakan dalam rekaman tersebut membutuhkan waktu yang cukup lama.
Tidak adakah cara untuk mengetahui isi percakapan tersebut dalam waktu yang
lebih cepat?
Jawabannya ada!
Dengan teknologi saat ini, data berupa rekaman percakapan dapat di analisa dan
diketahui apa isi pembicaraan yang ada pada data rekaman tersebut, bahkan dalam
hitungan menit. Konsep yang beliau jelaskan adalah melakukan scanning terhadap rekaman
tersebut dan mengenali dialog yang ada pada rekaman tersebut dan mengubahnya
dalam bentuk teks. Teks yang dihasilkan akan disimpan ke dalam bentuk tabel
yang memiliki berbagai informasi mengenai data audionya. Sehingga ketika kita
ingin mencari kata "saya" pada rekaman tersebut, maka database akan
memberikan informasi kapan kata tersebut diucapkan pada rekaman. Selain itu
juga dapat mengetahui siapa saja yang berdialog dalam rekaman tersebut. Inilah
yang dinamakan Audio Database.
Seperti database
pada umumnya, database audio tetap berupa teks yang nantinya dapat dicari dan
ditelusuri. Namun yang membedakannya adalah data yang diinputkan berdasarkan
hasil scanning dari data rekaman suara berupa percakapan. Dari sini baru
ketahuan permasalahan yang muncul, yaitu bagaimana caranya mengubah data
rekaman suara menjadi teks yang isinya sesuai dengan isi rekaman suara
tersebut.
Teknologi yang bisa
menjawabnya adalah speech recognition dan speaker recognition. Speech
Recognition adalah teknologi untuk mengenal apa yang diucapkan pada suatu
rekaman suara. Sedangkan Speaker Recognition adalah teknologi untuk mengenal
siapa yang mengucapkan kata tersebut pada suatu rekaman data.
Hmm...ternyata
sampai disini otakku masih bisa berkompromi untuk menangkap materi-materi yang
beliau sampaikan. Memang gak terlalu banyak sih, tapi menurutku ini sudah cukup
banyak. Tapi anehnya aku tidak menangkap tanda-tanda bahwa kuliah kali ini akan
berakhir, justru aku melihat ada satu materi lagi yang ingin dituntaskan oleh
beliau. Apa itu? Perasaan aku makin gak enak aja nih, kayaknya materi
selanjutnya berhubungan dengan rumus-rumus, atau metode speech recognition dan
speaker recognition. Membayangkan hal itu sepertinya otakku kembali mumet.
Tanda-tanda mau 'stand-by' sudah mulai terasa di ubun-ubun.
Bagaimana tidak?
Beberapa minggu lalu aku sempat mengikuti seminar dan workshop tentang Speech
Recognition di Lab Multimedia Labtek V ITB. Walaupun datangnya rada telat,
tetapi aku sempat melihat 2 dari 3 pemateri pada hari itu. Alhasil kepalaku
malah tambah pusing melihat metode-metode yang mereka presentasikan.
Wuuuhh...jangan-jangan
kali ini aku harus berhadapan lagi dengan metode-metode yang sama yang akan
dijelaskan beliau sesaat lagi, tapi kali ini dalam kondisi kepala pusing.
Hmm...
No comments:
Post a Comment