Wed. Sep 25th, 2024

Microsoft Perkenalkan Teknologi AI Ubah Foto Jadi Video Berbicara Secara Langsung

matthewgenovesesongstudies.com, Jakarta – Microsoft Research Asia telah meluncurkan alat AI eksperimental baru yang disebut VASA-1. AI ini dapat mengubah gambar orang tersebut serta file audio yang ada sehingga orang di dalam foto tersebut mengucapkan gambar tersebut secara real time.

Menurut Engadget pada Senin (22/4/2024), VASA-1 memiliki kemampuan menghasilkan ekspresi wajah dan gerakan kepala dari foto yang diunggah. Tak hanya itu, kecerdasan buatan ini bisa mencocokkan gerakan bibir Anda dengan suara atau lagu yang diunggah beserta foto yang ingin Anda jadikan video.

Peneliti Microsoft menguji VASA-1 dengan mengunggah banyak contoh keluaran yang dihasilkan AI ini ke situs web proyek mereka. Alhasil, video AI ini terlihat benar-benar nyata, sehingga bisa membuat orang lain mengira bahwa video AI tersebut adalah video nyata.

Meski gerakan mulut dan kepala pada video yang dihasilkan AI belum sesuai dengan rekaman audio, VASA-1 akan terus berkembang, dan kemungkinan video yang dihasilkan AI akan jauh lebih mirip dengan video aslinya.

Namun fitur kecerdasan buatan pada VASA-1 dapat dimanfaatkan oleh pihak yang tidak bertanggung jawab untuk membuat video palsu dengan mudah dan cepat.

Terkait hal ini, peneliti Microsoft sudah mengetahui hal ini. Oleh karena itu, mereka memutuskan untuk tidak mempublikasikan demo online, API, produk, detail implementasi tambahan, atau proposal apa pun sampai mereka yakin bahwa teknologi tersebut dapat digunakan sesuai dengan peraturan yang ada.

Microsoft mengatakan VASA-1 dapat digunakan untuk meningkatkan pemerataan pendidikan serta meningkatkan aksesibilitas bagi mereka yang mengalami kesulitan komunikasi dengan menyediakan akses dalam bentuk avatar yang dapat berinteraksi dengan Anda.

Namun, mereka tidak mengatakan apakah mereka berencana menerapkan aturan khusus untuk mencegah penjahat menggunakan AI untuk tujuan jahat, seperti membuat konten AI yang menyamar sebagai tokoh masyarakat atau menyebarkan hoaks.

Menurut postingan yang menyertai pengumuman tersebut, VASA-1 dilatih pada kumpulan data VoxCeleb2, yang berisi lebih dari 1 juta ucapan tentang 6.112 selebriti yang diambil dari video YouTube.

Di sisi lain, penggunaan kecerdasan buatan yang tidak bertanggung jawab dapat menyebabkan penyebaran penipuan dan bahkan mengancam perekonomian global.

Forum Ekonomi Dunia (WEF) menyatakan bahwa ancaman terbesar terhadap perekonomian global tahun ini adalah informasi palsu atau penipuan yang diciptakan oleh kecerdasan buatan (AI). Menurut mereka, hal tersebut dapat mengancam, melemahkan demokrasi dan mempolarisasi masyarakat.

Laporan tersebut, berdasarkan survei terhadap hampir 1.500 pakar, pemimpin bisnis dan pembuat kebijakan, dirilis menjelang pertemuan tahunan kelompok elit CEO dan pemimpin dunia di Davos, Swiss.

Survei tersebut menyoroti pesatnya kemajuan teknologi, yang juga menyebabkan munculnya tantangan baru, dan misinformasi serta misinformasi telah diidentifikasi sebagai masalah paling serius dalam dua tahun ke depan.

Para peneliti memperingatkan bahwa munculnya chatbot AI generatif seperti ChatGPT berarti bahwa pengembangan konten sintetis kompleks yang digunakan untuk mengontrol sekelompok orang tidak lagi terbatas.

Kepala manajemen risiko Marsh, Caroline Clint, mengatakan AI dapat digunakan oleh individu yang tidak bertanggung jawab untuk menciptakan penipuan dan dapat memengaruhi perilaku masyarakat.

“Masyarakat bisa menjadi semakin terpolarisasi karena semakin sulitnya pengecekan fakta. “Informasi palsu juga dapat digunakan untuk menimbulkan pertanyaan tentang legitimasi pemerintahan terpilih, yang berarti proses demokrasi dapat terdilusi, dan ini akan menyebabkan polarisasi masyarakat lebih lanjut,” kata Clint, seperti dikutip voanews.com, Sabtu. (20.4.2024) .

Di sisi lain, terdapat penelitian yang menunjukkan bahwa organisasi media masih belum memiliki kebijakan terkait gambar yang dihasilkan AI.

Penelitian yang dipimpin oleh RMIT University ini juga melibatkan Washington State University dan Center for Media Studies QUT. Mereka mewawancarai 20 editor foto dari 16 organisasi media publik dan komersial di Eropa, Australia, dan Amerika Serikat tentang persepsi mereka terhadap kecerdasan buatan generatif dalam teknologi jurnalisme visual.

Dari 16 organisasi, lima organisasi melarang staf menggunakan kecerdasan buatan untuk membuat gambar, tiga organisasi hanya melarang gambar fotorealistik, dan satu organisasi mengizinkan penggunaan gambar yang dihasilkan AI.

“Editor foto ingin transparan kepada audiensnya saat menggunakan teknologi AI generatif, namun organisasi media tidak dapat mengontrol perilaku manusia atau cara platform lain menampilkan informasi,” kata peneliti utama dan dosen senior RMIT Ty Jay Thomson.

“Lebih banyak organisasi media harus transparan mengenai kebijakan mereka sehingga khalayak dapat percaya bahwa konten mereka dibuat atau diedit sesuai dengan apa yang dikatakan organisasi tersebut,” tambah Thomson.

Ia juga menambahkan bahwa jika media ingin membuat kebijakan AI, mereka harus mempertimbangkan semua bentuk komunikasi, termasuk gambar dan video, dan memberikan pedoman yang lebih spesifik. Oleh karena itu, penggunaan kecerdasan buatan generatif di redaksi dapat mencegah misinformasi dan disinformasi.

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *