Site icon poles.id

Google Luncurkan Gemini 3.5 Live Translate, Jangkau 70+ Bahasa

poles.id – Google baru saja mengumumkan peluncuran inovasi terbaru mereka, yaitu Gemini 3.5 Live Translate. Ini adalah model audio terbaru yang dirancang untuk menerjemahkan bicara secara langsung dari satu bahasa ke bahasa lain, dengan kemampuan untuk mendeteksi lebih dari 70 bahasa secara otomatis. Model ini menghasilkan terjemahan yang mempertahankan intonasi, tempo, dan nada suara pembicara, menjadikannya langkah maju yang signifikan dalam teknologi terjemahan.

Gemini 3.5 Live Translate: Inovasi Teknologi Terjemahan

Gemini 3.5 Live Translate berfungsi sebagai model audio tunggal yang menangani output suara dengan cara mengolah ucapan secara langsung. Ini berarti saat suara masuk, model ini dapat menerjemahkannya tanpa perlu menunggu hingga kalimat selesai. Fitur ini memberikan keunggulan dalam situasi komunikasi multibahasa, di mana waktu reaksi yang cepat sangat penting. Model ini menggunakan pemrosesan aliran kontinu, berbeda dari sistem berbasis giliran yang mengharuskan pembicara berhenti sebelum terjemahan dilakukan.

Proses terjemahan dilakukan secara real-time, menjaga kualitas dan keselarasan dengan pembicara. Hal ini memberi kesempatan untuk menghasilkan terjemahan yang lebih mendekati percakapan alami, meskipun output terjemahan bisa tertinggal beberapa detik dari ucapan asli.

Fitur Utama dan Aplikasi yang Tersedia

Dengan Gemini 3.5 Live Translate, Google menawarkan platform yang sangat berguna untuk berbagai kebutuhan, mulai dari panggilan bisnis, rapat, hingga sesi pembelajaran. Model ini memungkinkan pengguna untuk melakukan komunikasi secara efisien dalam situasi yang bising sekalipun, berkat ketahanan terhadap gangguan suara.

Model ini akan tersedia melalui berbagai platform, termasuk Gemini Live API dan Google AI Studio untuk pengembangan, serta Google Meet dan aplikasi Google Translate. Dalam konteks ini, Google Meet akan menerima pembaruan luar biasa di mana dukungan untuk lebih dari 70 bahasa dapat meningkatkan pengalaman komunikasi antarpeserta dalam rapat virtual.

Penerapan di Berbagai Sektor

Penggunaan Gemini 3.5 Live Translate tidak terbatas pada rapat atau aplikasi bisnis. Beberapa platform pengembang seperti Agora, Fishjam, dan LiveKit telah mulai menggunakan Live API untuk integrasi media real-time yang lebih baik. Hal ini memungkinkan mereka untuk fokus pada pengalaman pengguna, sementara Gemini menangani kompleksitas pengolahan audio.

Salah satu kasus penggunaan menarik datang dari Grab, yang sedang menguji model ini untuk memfasilitasi komunikasi antara pengemudi dan penumpang. Dengan lebih dari 10 juta panggilan suara dilakukan setiap bulan oleh pengguna Grab, efektivitas dan akurasi terjemahan dapat menjadi penentu utama dalam meningkatkan kepuasan pelanggan.

Perubahan di Google Meet dan Aplikasi Terjemahan

Sebagaimana diumumkan oleh Google, pembaruan di Google Meet akan membawa kemampuan terjemahan ke tingkat yang lebih tinggi. Sebelumnya, Google Meet hanya mampu mendukung lima bahasa, namun dengan peluncuran Gemini 3.5 Live Translate, jumlah bahasa yang didukung dapat meningkat menjadi lebih dari 70. Ini memungkinkan lebih dari 2000 kombinasi bahasa dalam satu pertemuan, memberikan fleksibilitas dan aksesibilitas yang jauh lebih baik bagi pengguna.

Pada aplikasi Google Translate, fitur Live Translate memungkinkan komunikasi lebih langsung ketika terhubung dengan headphone. Fitur mendengarkan baru di Android memungkinkan pengguna memegang ponsel di telinga, mirip seperti panggilan telepon biasa, di mana audio terjemahan dialirkan langsung melalui earphone, menjaga privasi selama percakapan.

Kesimpulan

Peluncuran Gemini 3.5 Live Translate merupakan langkah signifikan dalam perkembangan teknologi terjemahan, menghadirkan solusi yang inovatif untuk komunikasi multibahasa. Dengan kemampuan untuk mendukung lebih dari 70 bahasa dan menerjemahkan ucapan secara langsung, model ini membuka peluang baru dalam berbagai sektor, dari bisnis hingga pendidikan. Keuntungan dari pengolahan audio yang cepat dan akurat berpotensi meningkatkan interaksi sosial dan profesional di dunia yang semakin terhubung.

Exit mobile version