Teknologi
yang terkait antar muka telematika
1. Head-up Display
Systems
Head-up
display, atau disingkat HUD, adalah setiap tampilan yang transparan menyajikan
data tanpa memerlukan pengguna untuk melihat diri dari sudut pandang atau yang
biasa.
1.1 Sejarah HUD
HUD pertama kali diperkenalkan pada tahun 1950-an, dengan adanya
teknologi reflektif gunsight pada perang dunia ke dua. Saat itu, suatu tembakan
dihasilkan dari sumber listrik yang diproyeksikan ke sebuah kaca. Pemasangan
proyektor itu biasanya dilakukan pada bagian atas panel instrumen di tengah
daerah pandang pilot, antara kaca depan dan pilot sendiri.
Dengan menggunakan reflektif gunshight pada pertempuran udara,
pilot harus “mengkalibrasi” pandangannya secara manual. Hal ini dilakukan
dengan memasukkan lebar sayap target pada sebuah penyetelan roda yang diikuti
dengan penyesuaian mata, sehingga target yang bergerak dapat disesuaikan dengan
bingkai yang diarahkan kepadanya. HUD terbagi menjadi 3 generasi yang
mencerminkan teknologi yang digunakan untuk menghasilkan gambar, yaitu:
a) Generasi
Pertama
Gunakan CRT untuk menghasilkan sebuah gambar
pada layar fosfor, memiliki kelemahan dari degradasi dari waktu ke waktu dari
lapisan layar fosfor. Mayoritas HUD beroperasi saat ini adalah dari jenis ini.
b) Generasi
Kedua
Gunakan sumber cahaya padat, misalnya LED,
yang dimodulasi oleh sebuah layar LCD untuk menampilkan gambar. Ini
menghilangkan memudar dengan waktu dan juga tegangan tinggi yang dibutuhkan
untuk sistem generasi pertama. Sistem ini pada pesawat komersial.
c) Generasi
Ketiga
Menggunakan waveguides optik untuk
menghasilkan gambar secara langsung dalam Combiner daripada menggunakan sistem
proyeksi.
Penggunaan HUD dapat dibagi menjadi 2 jenis. Jenis pertama adalah
HUD yang terikat pada badan pesawat atau kendaraan chasis. Sistem penentuan
gambar yang ingin disajikan semata-mata tergantung pada orientasi kendaraan.
Jenis yang kedua adalah HMD, helm dipasang yang menampilkan HUD dimana elemen
akan ditampilkan tergantung pada orientasi dari kepala pengguna.
1.2 Teknologi HUD
a) CRT (Cathode
Ray Tube)
Hal yang sama untuk semua HUD adalah sumber
dari gambar yang ditampilkan, CRT, yang dikemudikan oleh generator.
b) Refractive
HUD
Dari CRT, sinar diproduksi secara paralel
dengan sebuah lensa collimating. Sinar paralel tersebut diproyeksikan ke kaca
semitrasnparan (kaca gabungan) dan memantul ke mata pilot. Salah satu
keuntungan dari reaktif HUD adalah kemampuan pilot untuk menggerakkan kepalanya
dan sekaligus melihat gambar yang ditampilkan pada kaca gabungan.
c) Reflective
HUD
Kerugian dari HUD reflektif adalah akibatnya
pada besarnya tingkat kompleksitas yang terlibat dalam meproduksi penggabungan
lekungan dari segi materi dan rekayasa.
d) System
Architecture
HUD komputer mengumpulkan informasi dari
sumber – sumber seperti IRS (Inertial Reference System), ADC (Air Data
Computer), radio altimeter, gyros, radio navigasi dan kontrol kokpit.
Diterjemahkan ke dalam koordinat x dan y, komputer HUD selanjutnya akan
menyediakan informasi yang dibutuhkan untuk hal apa yang akan ditampilkan pada
HUD ke generator simbol.
e) Display
Cutter
Salah satu perhatian penting dengan simbologi
HUD adalah kecenderungan perancang untuk memasukkan data terlalu banyak,
sehingga menghasilkan kekacauan tampilan. Kekacauan tampilan ini jauh dari
eksklusif untuk HUD, tetapi hal ini sangat kritis pada saat melihat ke arah tampilan.
1.3 Faktor Perancangan HUD
Ada beberapa faktor yang harus dipertimbangkan ketika merancang
sebuah HUD, yaitu :
a) Bidang
penglihatan – Karena mata seseorang berada di dua titik berbeda, mereka melihat
dua gambar yang berbeda. Untuk mencegah mata seseorang dari keharusan untuk
mengubah fokus antara dunia luar dan layar HUD, layar adalah “Collimated”
(difokuskan pada tak terhingga). Dalam tampilan mobil umumnya terfokus di
sekitar jarak ke bemper.
b) Eyebox –
menampilkan hanya dapat dilihat sementara mata pemirsa dalam 3dimensi suatu
daerah yang disebut Kepala Motion Kotak atau “Eyebox”. HUD Eyeboxes modern
biasanya sekitar 5 dengan 3 dari 6 inci. Hal ini memungkinkan pemirsa beberapa
kebebasan gerakan kepala.
c) Terang /
kontras – harus menampilkan pencahayaan yang diatur dalam dan kontras untuk
memperhitungkan pencahayaan sekitarnya, yang dapat sangat bervariasi (misalnya,
dari cahaya terang awan malam tak berbulan pendekatan minimal bidang menyala).
d) Menampilkan
akurasi – HUD komponen pesawat harus sangat tepat sesuai dengan pesawat tiga
sumbu – sebuah proses yang disebut boresighting – sehingga data yang
ditampilkan sesuai dengan kenyataan biasanya dengan akurasi ± 7,0 milliradians.
e) Instalasi –
instalasi dari komponen HUD harus kompatibel dengan avionik lain, menampilkan,
dll
2. Tangible User
Interface
Tangible
User Interface (TUI) adalah sebuah antarmuka pengguna di mana seseorang
berinteraksi dengan informasi digital melalui lingkungan fisik. Sebuah TUI
adalah salah satu teknologi dimana pengguna berinteraksi dengan sistem digital
melalui manipulasi obyek fisik terkait dan langsung mewakili kualitas sistem
tersebut. Ide dari TUI adalah untuk memiliki hubungan langsung antara sistem
dan cara mengontrol melalui manipulasi fisik dengan memiliki makna yang
mendasar atau hubungan langsung yang menghubungkan manipulasi fisik ke perilaku
yang mereka picu pada sistem.
Karakteristik
TUI :
a) Representasi
fisik komputasi digabungkan dengan informasi digital yang mendasari.
b) Representasi
fisik mewujudkan mekanisme kontrol interaktif.
c) Representasi
fisik perseptual digabungkan dengan representasi digital secara aktif
dimediasi.
d) Keadaan
fisik tangibles mencakup aspek kunci dari negara digital sistem
Salah satu
pionir dalam user interface yang nyata adalah Hiroshi Ishii, seorang profesor
di MIT Media Laboratory yang mengepalai Tangible Media Group. Visi tertentu Nya
bagi Tangible UIS adalah Bits Tangible, yiatu memberikan bentuk fisik ke
informasi digital, membuat bit-bit nya dapat di maniplulasi secara langsung dan
terlihat jelas. Tangible bits mengejar kesamaan antara dua dunia yang sangat
berbeda yaitu dari bit dan atom. Jadi secara harfiah nya tangible user
interface (TUI) adalah sebuah system digital yang membuat sebuah benda menjadi
nyata, dapat di sentuh di raba dan memiliki bentuk.
2.1 Penerapan Tangible User Interface
1. Mouse
Salah satu penerapan TUI yang
paling sederhana adalah pada mouse. Menyeret mouse melalui permukaan datar dan
gerakan pointer pada layar yang sesuai merupakan cara berinteraksi dengan
sistem digital melalui manipulasi objek fisik.
2. Siftables
Merupakan perangkat kecil dari
proyek awal di MT Media Lab yang memiliki bentuk menyerupai batu bata kecil
yang mempunyai interface. Shiftable memiliki jumlah lebih dari satu dan mampu
berkomunikasi serta berinteraksi satu sama lain tergantung pada posisinya.
Shiftable yang terpisah tahu kapan shiftable lain berada di dekat mereka dan
bereaksi sesuai dengan permainan user.
3. Reactable
Reactable adalah alat musik yang
dirancang dengan keadaan teknologi seni untuk memungkinkan musisi (dan lainnya)
untuk bereksperimen dengan suara dan menciptakan musik yang unik. Instrumen ini
didasarkan pada meja bundar tembus dan bercahaya di mana satu set pucks dapat
ditempatkan. Dengan menempatkan mereka di permukaan (atau membawa mereka
pergi), dengan memutar mereka dan menghubungkan mereka satu sama lain, pemain
dapat menggabungkan unsur-unsur yang berbeda seperti synthesizer, efek, loop
sampel atau elemen kontrol dalam rangka menciptakan komposisi yang unik dan
fleksibel.
Begitu setiap keping ditempatkan
di permukaan, keping itu diterangi dan mulai berinteraksi dengan keping lain,
menurut posisi dan kedekatannya. Interaksi ini terlihat pada permukaan meja
yang bertindak sebagai layar, memberikan umpan balik instan tentang apa yang
sedang terjadi di Reactable, mengubah musik ke dalam sesuatu yang terlihat dan
nyata.
4. Microsoft
Surface
Merupakan sebuah teknologi dengan
layar multi sentuh yang memungkinkan pengguna untuk berinteraksi dengan built
in system pada waktu yang sama. Yang menjadi perhatian adalah hal tersebut
bereaksi tidak hanya ketika disentuh, tetapi teknologi ini juga dapat mengenali
objek yang ditempatkan diatasnya dan dapat mengatur sendiri perilaku yang
terkait dengan benda-benda serta bagaimana kita dapat memanipulasinya.
5. Marble
Answering Machine
Contoh lain dari Tangiable User
Interface adalah Marble Answering Machine (Mesin Penjawab Marmer) oleh Durrell
Uskup (1992). Marmer merupakan suatu pesan yang ditinggalkan di mesin penjawab.
Menjatuhkan marmer ke piring pemutar,lalu memutar ulang pesan yang terkait.
6. Sistem
Topobo
Blok di Topobo seperti blok LEGO
yang bisa diambil bersama-sama, tetapi juga dapat bergerak sendiri menggunakan
komponen bermotor. Seseorang dapat mendorong, menarik, dan memutar blok-blok,
dan blok-blok bisa menghafal gerakangerakan ini dan menggulang kembali
gerakan-gerakan tersebut. Pelaksanaan lain memungkinkan pengguna untuk sketsa
gambar di atas meja sistem dengan pena yang nyata nyata. Sistem ini akan
mengintegrasikan kamera video dengan sistem pengenalan isyarat.
3. Computer Vision
Computer
Vision adalah ilmu dan teknologi mesin yang melihat, di mana mesin mampu
mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas
tertentu. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di
balik sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat
mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera,
atau data multi-dimensi dari scanner medis. Sedangkan sebagai disiplin
teknologi, computer vision berusaha untuk menerapkan teori dan model untuk
pembangunan sistem computer vision.
Computer
Vision didefinisikan sebagai salah satu cabang ilmu pengetahuan yang
mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Cabang ilmu
ini bersama Artificial Intelligence akan mampu menghasilkan Visual Intelligence
System. Perbedaannya adalah Computer Vision lebih mempelajari bagaimana
komputer dapat mengenali obyek yang diamati. Namunkomputer grafik lebih ke arah
pemanipulasian gambar (visual) secara digital. Bentuk sederhana dari grafik
komputer adalah grafik komputer 2D yang kemudian berkembang menjadi grafik
komputer 3D, pemrosesan citra, dan pengenalan pola. Grafik komputer sering
dikenal dengan istilah visualisasi data.
Computer
Vision adalah kombinasi antara :
a) Pengolahan
Citra (Image Processing), bidang yang berhubungan dengan proses transformasi
citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra
yang lebih baik.
b) Pengenalan
Pola (Pattern Recognition), bidang ini berhubungan dengan proses identifikasi
obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk
mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.
3.1 Fungsi atau Proses Pada Computer Vision
Untuk menunjang tugas Computer Vision, terdapat beberapa fungsi
pendukung ke dalam sistem ini, yaitu :
1. Proses
penangkapan citra (Image Acquisition)
· Image Acqusition pada manusia
dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu
format yang kemudian dapat dimanipulasi oleh otak.
· Senada dengan proses di atas,
computer vision membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.
·
Umumnya mata pada computer vision
adalah sebuah kamera video.
·
Kamera menerjemahkan sebuah scene
atau image.
· Keluaran dari kamera adalah
berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan
dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan
tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman
(brightness) pada scene.
· Kamera mengamati sebuah kejadian
pada satu jalur dalam satu waktu, memindainya dan membaginyamenjadi ratusan
garis horizontal yang sama.
· Tiap‐tiap garis membuat sebuah
sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang
garis sinyal tersebut.
· Kemudian sinyal listrik ini
diubah menjadi bilangan biner yang akan digunakan oleh komputer untuk
pemrosesan.
· Karena komputer tidak bekerja
dengan sinyal analog, maka sebuah analog‐to‐digital
converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh
komputer.
· ADC ini akan mengubah sinyal
analog yang direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam
sebuah aliran (stream) sejumlah bilangan biner.
·
Bilangan biner ini kemudian
disimpan di dalam memori dan akan menjadi data raw yang akan diproses.
2. Proses
pengolahan citra (Image Processing)
· Tahapan berikutnya computer
vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari
data binary tersebut.
· Image processing membantu
peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah
lebih jauh secara lebih efisien.
·
Image processing akan
meningkatkan perbandingan sinyal terhadap noise (signal‐to‐noise ratio = s/n).
· Sinyal‐sinyal tersebut adalah
informasi yang akan merepresentasikan objek yang ada dalam image.
· Sedangkan noise adalah segala
bentuk interferensi, kekurangpengaburan, yang terjadi pada sebuah objek.
3. Analisa data
citra (Image Analysis)
· Image analysis akan
mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui
suatu proses investigasi.
· Sebuah program komputer akan
mulai melihat melalui bilangan biner yang merepresentasikan informasi visual
untuk mengidentifikasi fitur‐fitur spesifik dan karekteristiknya.
· Lebih khusus lagi program image
analysis digunakan untuk mencari tepi dan batas‐batasan objek dalam image.
· Sebuah tepian (edge) terbentuk
antara objek dan latar belakangnya atau antara dua objek yang spesifik.
· Tepi ini akan terdeteksi sebagai
akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu
batasnya.
4. Proses
pemahaman data citra (Image Understanding)
· Ini adalah langkah terakhir dalam
proses computer vision, yang mana sprsifik objek dan hubungannya
diidentifikasi.
· Pada bagian ini akan melibatkan
kajian tentang teknik-teknik artificial intelligent.
· Understanding berkaitan dengan
template matching yang ada dalam sebuah scene.
·
Metode ini menggunakan program
pencarian (search program) dan teknik penyesuaian pola (pattern matching
techniques).
3.2 Penerapan Computer Vision
1. Bidang
Pengolahan Citra Medis
Hal ini dicirikan dengan ekstraksi informasi
dari data gambar untuk tujuan membuat diagnosis medis pasien. Hal ini juga
dapat pengukuran dimensi organ, aliran darah, dan lain-lain area aplikasi ini
juga mendukung penelitian medis dengan memberikan informasi baru, misalnya,
tentang struktur otak, atau tentang kualitas perawatan medis.
2. Bidang
Industri
Kadang-kadang disebut visi mesin, dimana
informasi ini diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu
contohnya adalah kendali mutu dimana rincian atau produk akhir yang secara
otomatis diperiksa untuk menemukan cacat. Mesin visi juga banyak digunakan
dalam proses pertanian untuk menghilangkan bahan makanan yang tidak diinginkan
dari bahan massal, proses yang disebut sortir optik.
3. Bidang
Fisika
Fisika merupakan bidang lain yang terkait
erat dengan Computer vision. Sistem Computer vision bergantung pada sensor
gambar yang mendeteksi radiasi elektromagnetik yang biasanya dalam bentuk baik
cahaya tampak atau inframerah. Sensor dirancang dengan menggunakan fisika
solid-state. Proses di mana cahaya merambat dan mencerminkan off permukaan
dijelaskan menggunakan optik. Sensor gambar canggih bahkan meminta mekanika
kuantum untuk memberikan pemahaman lengkap dari proses pembentukan gambar. Selain
itu, berbagai masalah pengukuran fisika dapat diatasi dengan menggunakan
Computer vision, untuk gerakan misalnya dalam cairan.
4. Bidang
Neurobiologi
Khususnya studi tentang sistem biological
vision Selama abad terakhir, telah terjadi studi ekstensif dari mata, neuron,
dan struktur otak dikhususkan untuk pengolahan rangsangan visual pada manusia
dan berbagai hewan. Hal ini menimbulkan gambaran kasar, namun rumit, tentang
bagaimana “sebenarnya” sistem visi beroperasi dalam menyelesaikan tugas-tugas
visi tertentu yang terkait.
5. Bidang
Matematika Murni
Sebagai contoh, banyak metode dalam visi
komputer didasarkan pada statistik, optimasi atau geometri. Akhirnya, bagian
penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer,
bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat
lunak dan perangkat keras, atau bagaimana metode ini dapat dimodifikasi untuk
mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja.
6. Bidang
Pemrosesan Sinyal
Banyak metode untuk pemrosesan sinyal
satu-variabel, biasanya sinyal temporal, dapat diperpanjang dengan cara alami
untuk pengolahan sinyal dua variabel atau sinyal multi-variabel dalam visi
komputer. Namun, karena sifat spesifik gambar ada banyak metode dikembangkan
dalam visi komputer yang tidak memiliki mitra dalam pengolahan sinyal
satu-variabel.
7. Bidang
Pertahanan Dan Keamanan (Militer)
Contoh jelas adalah deteksi tentara musuh
atau kendaraan dan bimbingan rudal. Lebih sistem canggih untuk panduan mengirim
rudal rudal ke daerah daripada target yang spesifik, dan pemilihan target yang
dibuat ketika rudal mencapai daerah berdasarkan data citra diperoleh secara
lokal. Dalam hal ini, pengolahan otomatis data yang digunakan untuk mengurangi
kompleksitas dan informasi sekering dari sensor ganda untuk meningkatkan
keandalan.
8. Bidang
Didalam Kendaraan Otonom
Meliputi submersibles , berbasis kendaraan
darat (robot kecil dengan roda, mobil atau truk), kendaraan udara, dan
kendaraan udara tak berawak (UAV). Tingkat berkisar otonomi dari sepenuhnya
otonom (berawak) kendaraan untuk kendaraan di mana sistem visi berbasis
komputer mendukung driver atau pilot dalam berbagai situasi. Hal ini juga dapat
digunakan untuk mendeteksi peristiwa-peristiwa tugas tertentu yang spesifik,
misalnya, sebuah UAV mencari kebakaran
hutan. kendaraan otonom menggunakan visi komputer, misalnya, NASA Mars
Exploration Rover dan ESA exomars Rover.
9. Bidang Kecerdasan
Buatan
Keterkaitan dengan perencanaan otonom atau
musyawarah untuk sistem robotical untuk menavigasi melalui lingkungan.
Pemahaman yang rinci tentang lingkungan ini diperlukan untuk menavigasi melalui
mereka. Informasi tentang lingkungan dapat diberikan oleh sistem visi komputer,
bertindak sebagai sensor visi dan memberikan informasi tingkat tinggi tentang
lingkungan dan robot. Buatan kecerdasan dan visi lain berbagi topik komputer
seperti pengenalan pola dan teknik pembelajaran. Akibatnya, visi komputer
kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau ilmu
bidang komputer secara umum.
10. Bidang
Industri Perfilman
Semua efek-efek di dunia akting , animasi,
dan penyotingan adegan film semua di fs rekam dengan perangkat elektronik yang
dihubungkan dengan komputer. Animasinya juga di kembangkan mempergunakan
animasi yang dibuat dengan aplikasi komputer. Sebagai contoh film-film
Hollywood berjudul TITANIC itu sebenarnya tambahan animasi untuk menggambarkan
kapal raksasa ya.
4. Browsing Audio
Data
Sebuah
metode browsing jaringan disediakan untuk browsing video / audio data yang
ditembak oleh sebuah IP kamera. Jaringan video / audio metode browsing sesuai
mencakup langkah-langkah dari:
· Menjalankan sebuah program
aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam
kamera IP,
· Transmisi untuk mendaftarkan kode
identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi,
·
Mendapatkan kamera IP pribadi
alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera
IP melalui kamera IP pribadi alamat dan alamat server pribadi dan,
· Kopel ke layanan server melalui
alamat server pribadi sehingga untuk mendapatkan video / audio data yang
ditembak oleh kamera IP, di mana server layanan menangkap video / audio data
yang ditembak oleh kamera IP melalui Internet.
Pada
perkembangan sejarahnya Audio mengalami 4 fase, yaitu :
1. Fase
pertama, dikenal juga dengan Tehnik Audio – Mono ini umumnya dikenal sekitar
periode tahun 20’an hingga sekitar akhir tahun 50’an dengan diketemukannya Alat
Gramaphone oleh Thomas Alfa Edison dengan metode Plat Baja,
2. Fase kedua,
sekitar awal tahun 50’an dengan diketemukan Perekaman Analog dengan piringan
plat hitam maka orang mulai mengenal perekaman Mono stereo dengan metode
pemisahan suara ( Vokal dan Alat Musik ) menjadi L / R ( Music ;Left – output,
Voice ; Right – output )
3. Fase ketiga,
ditemukan tehnik Mixing Stereo menjadi L /R , ini populer sekali dan
dikembangkan terus hingga sekitar tahun 60’an akhir – awal 70’an
4. Fase
keempat, Proses perekaman Umumnya saat ini didalam produksi audio umumnya
dilakukan dari Analog Ke Digital begitupun sebaliknya . Data Analog mempunyai
pengertian adalah data sinyal gelombang suara yang dikeluarkan dari Sumber
Aslinya hasil perekaman, misal : Perekaman Vokal ke komputer. Data Analog
sendiri mempunyai pengertian adalah Informasi gelombang suara yang terus
menerus berubah tidak beraturan secara Alami, Data Analog mengalami perubahan
keras (Amplitudo) dan tinggi rendah suara yang berfluktuasi, namun belum
mempunyai Skala & satuan yang pasti, sedangkan Data Digital adalah hasil
manipulasi Informasi gelombang suara secara terus menerus berubah tidak
beraturan secara alami menjadi satuan skala yang pasti.
5. Speech Recognition
Speech
recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan
komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini
memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang
diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut
dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.
Pengenalan
ucapan (speech recognition) dalam perkembangan teknologinya merupakan bagian
dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya).
Pengenalan suara sendiri terbagi menjadi dua kategori, yaitu:
· Piranti pengenalan kata (word recognition)
yang mampu merespon ucapan-ucapan secara individu atau perintah-perintah yang
menggunakan teknik yang dikenal sebagai speaker verification. Pertama kali
sistem akan membangkitkan suatu template untuk mengenali suara user.
· Piranti pengenalan kalimat
(speech recognition) yang mampu mengenali hubungan antar kata terucap di dalam
kalimat atau frase. Teknik - teknik statistik
dipakai dalam hal pola perekaman suara yang akan dicocokkan dengan kata-kata
terucap.
5.1 Prinsip Dasar Speech Recognition
Semua metode dasar proses pengenalan suara terdiri dari dua fase
operasi, yaitu :
·
Proses training. Pada proses ini
sistem belajar dari referensi pola yang berupa perbedaan pola sinyal suara
misal frase, kata, fonem yang akan mengisi vocabulari dari sistem. Setiap
referensi di pelajari dari kata yang dikatakan yang kemudian disimpan dalam
template dan telah mengalami metode untuk meratarata dan karakteristik statistik
dan parameter statistik.
·
Proses recognition. Pada proses
ini sistem akan diberikan inputan yang belum diketahui dan akan di identifikasi
berdasarkan pola template yang telah didapatkan pada proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa
modul utama, yaitu :
· Signal processign frontend
digunakan untuk mengkonversi sinyal suara kedalam bentuk sequence feature vector yang akan digunakan pada saat
klasifikasi.
· Accoustic modelling digunakan
untuk memodelkan secara statistik hasil training yang telah dilakukan kedalam
sebuah template.
· Language modelling digunakan
untuk memodelkan bentuk kata baik berupa kata, fonem, ataupun kalimat.
6. Speech Synthesis
Speech
synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi
ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin
dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan pengucapan
bahasa.TTS (text to speech) dimaksudkan untuk membaca teks elektronik dalam
bentuk buku, dan juga untuk menyuarakan teks dengan menggunakan pemaduan suara.
Sistem ini dapat digunakan sebagai sistem komunikasi, pada sistem informasi
referral, dapat diterapkan untuk membantu orangorang yang kehilangan kemampuan
melihat dan membaca. Ada beberapa masalah yang terdapat pada pemaduan suara,
yaitu :
1. User sangat
sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak
dapat memberikan toleransi atas ketidaksempurnaan pemadu suara.
2. Output dalam
bentuk suara tidak dapat diulang atau dicari dengan mudah.
3. Meningkatkan
keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan
meningkatkan biaya pengeluaran.
Speech
Synthesis atau sintesis pidato adalah kemampuan sebuah komputer untuk
menghasilkan suara yang menyerupai suara manusia. Meskipun mereka tidak bisa
meniru spektrum penuh irama manusia dan intonasi. Sebuah sistem komputer yang
digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat
diimplementasikan dalam perangkat lunak atau hardware. Speech Synthesis adalah
termasuk sebuah teks-to-speech (TTS), yaitu sistem mengkonversi teks ke dalam
pidato bahasa normal.
Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga.
Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga.
Referensi:
http://www.scribd.com/doc/206037173/Teknologi-Yang-Terkait-Antar-Muka-Telematika
Tidak ada komentar:
Posting Komentar