Mon. Sep 16th, 2024

OpenAI dan Google Latih Model AI Pakai Transkrip Video YouTube, Melanggar Hak Cipta?

matthewgenovesesongstudies.com, Jakarta – OpenAI dan Google melatih model AI mereka pada teks yang ditranskripsi dari video YouTube. Pendekatan ini berisiko melanggar hak cipta pembuat konten.

Beberapa hari yang lalu, CEO YouTube Neil Mohan mengatakan dalam sebuah wawancara dengan Bloomberg Originals bahwa dugaan penggunaan video YouTube untuk melatih Sora, generator teks-ke-video baru OpenAI, melanggar kebijakan platform.

Menurut The New York Times, OpenAI menggunakan alat pengenalan ucapan Whisper untuk menyalin lebih dari 1 juta jam video YouTube, yang kemudian digunakan untuk melatih GPT-4.

Sebelumnya dilaporkan bahwa OpenAI menggunakan video YouTube dan podcast untuk melatih dua sistem AI. Greg Brockman, presiden OpenAI, dikatakan menjadi anggota tim.

Juru bicara Google Matt Bryant mengatakan kepada New York Times: “Menurut aturan Google, pengambilan atau pengunduhan konten YouTube tanpa izin tidak diperbolehkan.”

Bryant mengklaim perusahaannya tidak mengetahui adanya penggunaan semacam itu oleh OpenAI.

Namun laporan menunjukkan bahwa seseorang di Google mengetahui hal ini tetapi tidak mengambil tindakan terhadap OpenAI karena Google menggunakan video YouTube untuk melatih model kecerdasan buatannya sendiri.

Saya

Google mengatakan kepada The New York Times bahwa mereka hanya akan melakukan ini untuk video dari pembuat konten yang menyetujuinya.

Laporan tersebut juga mengklaim bahwa Google telah memberikan waktu hingga Juni 2023 kepada tim untuk mengubah kebijakan privasinya guna mencakup penggunaan konten publik yang lebih luas, termasuk Google Dokumen dan Google Spreadsheet, guna melatih model dan produk AI-nya.

Google mengatakan perubahan tersebut dilakukan untuk kejelasan dan akan dirilis pada Juli 2023.

Bryant mengatakan kepada New York Times bahwa data tersebut hanya dapat digunakan dengan izin dari pengguna yang berpartisipasi dalam pengujian fitur eksperimental Google.

Perusahaan tidak melakukan pelatihan jenis materi tambahan berdasarkan perubahan bahasa. Perubahan ini menambahkan chatbot Bard AI sebagai contoh penggunaan data ini.

Sebelumnya, OpenAI mengumumkan bahwa mereka melakukan pratinjau skala kecil terhadap alat baru yang disebut Voice Engine, sebuah teknologi kloning suara yang dapat mensimulasikan speaker (manusia) mana pun dengan menganalisis sampel audio berdurasi 15 detik.

Perusahaan AI Chatbit, ChatGPT, mengatakan bahwa mereka dapat menghasilkan “ucapan yang terdengar alami” dengan “suara yang kaya secara emosional dan autentik”.

Mengutip Engadget, Minggu (31 Maret 2024), teknologi tersebut didasarkan pada API text-to-speech OpenAI yang sudah ada dan digunakan sejak tahun 2022.

OpenAI saat ini menggunakan versi perangkat untuk mendukung API text-to-speech dan suara default yang tersedia di fitur baca dengan lantang.

Blog resmi perusahaan memiliki banyak contoh suara kloning yang sangat mirip dengan aslinya. Jika Anda penasaran, cobalah menyimak dan membayangkan banyak kemungkinan yang bisa jadi baik atau buruk.

OpenAI mengatakan pihaknya melihat teknologi ini berguna untuk alat bantu membaca, terjemahan bahasa, dan membantu kondisi bicara yang tiba-tiba atau degeneratif.

Perusahaan meluncurkan program percontohan di Brown University untuk membantu pasien gangguan bicara dengan membuat model mesin bicara dari rekaman proyek sekolah.

Terlepas dari potensi manfaatnya, para penjahat mau tidak mau akan menyalahgunakan teknologi ini untuk melakukan tindakan jahat, dan hal ini sudah menjadi masalah.

Perlu dicatat bahwa mesin ucapan ini belum siap untuk debut, karena ada masalah privasi serius yang perlu diatasi sebelum dirilis secara penuh.

OpenAI menyadari bahwa teknologi ini menimbulkan risiko serius, yang khususnya relevan pada tahun pemilu.

Perusahaan mengatakan akan mempertimbangkan masukan dari “mitra AS dan internasional di pemerintahan, media, hiburan, pendidikan, masyarakat sipil dan banyak lagi” untuk memastikan peluncuran produk tersebut memiliki risiko minimal.

Semua penguji pratinjau menyetujui kebijakan penggunaan OpenAI, yang melarang peniruan identitas orang lain tanpa izin atau hak hukum mereka.

Selain itu, siapa pun yang menggunakan teknologi tersebut harus mengungkapkan kepada penonton bahwa suara tersebut dihasilkan oleh kecerdasan buatan.

OpenAI menggunakan langkah-langkah keamanan seperti memberikan tanda air untuk melacak sumber audio apa pun dan “memantau secara aktif” bagaimana sistem digunakan.

Saat produk resmi diluncurkan, akan ada “daftar ucapan terlarang” yang akan mengidentifikasi dan memblokir pembicara buatan AI yang terlalu mirip dengan orang terkenal.

OpenAI masih bungkam mengenai kapan akan dirilis. TechCrunch telah menemukan beberapa data harga potensial yang tampaknya dapat melemahkan pesaing seperti ElevenLabs.

Mesin ucapan berharga $15 per juta karakter (sekitar 162.500 kata). saya

Tampaknya ini cara yang ramah anggaran untuk menyelesaikan buku audio Anda. Materi pemasaran juga menyebutkan bahwa versi “HD” akan memiliki harga dua kali lipat, namun perusahaan belum merinci cara kerjanya.

OpenAI membuat kemajuan besar minggu ini. Mereka baru saja mengumumkan kemitraan lain dengan teman baiknya Microsoft untuk membangun superkomputer berbasis AI yang disebut “Stargate”.

Proyek ini dikatakan menelan biaya $100 miliar, menurut The Information.

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *