Jakarta Selatan – Awal tahun ini, Google mengumumkan MusicLM, alat ‘AI eksperimental’ yang dapat menghasilkan musik berkualitas tinggi dari tulisan dan nadanya. Sekarang, alat ini tersedia untuk publik mencoba.
Google menjelaskan bahwa pada tingkat penggunaan publik, alat ini bekerja dengan mengetikkan sebuah permintaan seperti “jazz bernuansa soulful untuk pesta makan malam”. Model MusicLM akan membuat dua versi lagu yang diminta untuk orang yang memasukkan permintaan tersebut. Kamu kemudian bisa memilih mana yang lebih kamu sukai, yang menurut Google akan “membantu meningkatkan model AI”.
Model ini dilatih dengan lima juta klip audio, yang totalnya mencapai 280.000 jam musik pada 24 kHz. Saat diumumkan pada bulan Januari lalu, Google merilis sejumlah contoh kemampuan ‘Generasi Audio’ alat ini dari ‘Caption Kaya’, hasilnya bisa didengarkan di sini.
Google mengklaim bahwa, “baik kamu seorang musisi profesional atau baru memulai, MusicLM adalah alat eksperimental yang dapat membantumu mengekspresikan kreativitasmu”.
Perusahaan tersebut juga memublikasikan ‘cara kerja di balik layar’ pada hari kemarin dengan MusicLM digunakan oleh seorang seniman suara, seorang seniman residensi Google Arts & Culture, dan seorang peneliti Google.
Pada bulan Januari lalu, Google juga menerbitkan sebuah kertas kerja yang menjelaskan tentang penelitian yang dilakukan untuk mengembangkan alat tersebut.
Menurut para peneliti Google, “pekerjaan di masa depan dapat difokuskan pada pembuatan lirik, serta perbaikan kondisi teks dan kualitas vokal. Aspek lain adalah pemodelan struktur lagu tingkat tinggi seperti pengenalan, bait, dan paduan suara”.
Kertas kerja tersebut menyarankan bahwa MusicLM, “memperluas kumpulan alat yang membantu manusia dengan tugas-tugas kreatif dalam musik”, dan menambahkan bahwa “ada beberapa risiko yang terkait dengan model ini dan penggunaannya”.
Menurut para peneliti, di antara risiko-risiko tersebut adalah “sampel yang dihasilkan akan mencerminkan bias yang ada dalam data pelatihan, yang menimbulkan pertanyaan tentang kesesuaian untuk pembuatan musik bagi budaya yang kurang direpresentasikan dalam data pelatihan, sambil pada saat yang sama juga menimbulkan kekhawatiran tentang penyelewengan budaya”.
Risiko lain yang diungkapkan dalam kertas kerja tersebut adalah “potensi penyelewengan konten kreatif”. Para peneliti menjelaskan: “Sesuai dengan praktik pengembangan model yang bertanggung jawab, kami melakukan studi yang menyeluruh tentang hafalan, mengadaptasi, dan memperluas metodologi yang digunakan dalam konteks LLM berbasis teks, fokus pada tahap pemodelan semantik”.
“KAMI SANGAT MENDEKATKAN KEBUTUHAN UNTUK LEBIH BANYAK PEKERJAAN DI MASA DEPAN DALAM PENANGANAN RISIKO TERKAIT PEMBUATAN MUSIK – KAMI TIDAK MEMILIKI RENCANA UNTUK MELEPASKAN MODEL PADA TITIK INI.”
Mereka mengatakan bahwa mereka “menemukan hanya sebagian kecil contoh yang dihafal dengan benar, sementara untuk 1% contoh, kami dapat mengidentifikasi kecocokan yang mendekati”.
Dan kemudian menambahkan: “Kami sangat menekankan perlunya lebih banyak pekerjaan di masa depan dalam menangani risiko-risiko terkait pembuatan musik – kami tidak memiliki rencana untuk melepaskan model pada titik ini.”
Para peneliti menjelaskan: “Sesuai dengan praktik pengembangan model yang bertanggung jawab, kami melakukan studi menyeluruh tentang memorisasi, mengadaptasi dan memperluas metodologi yang digunakan dalam konteks LLM berbasis teks, berfokus pada tahap pemodelan semantik.”
“KAMI MENEGASKAN PERLU ADANYA LEBIH BANYAK PEKERJAAN DI MASA DEPAN UNTUK MENGATASI RISIKO YANG TERKAIT DENGAN GENERASI MUSIK – KAMI TIDAK MEMILIKI RENCANA UNTUK MERILIS MODEL PADA TITIK INI.”
PENELITIAN GOOGLE MUSICLM
Mereka mengatakan bahwa mereka “menemukan bahwa hanya sebagian kecil contoh yang dihafal secara tepat, sementara untuk 1% dari contoh-contoh itu kami dapat mengidentifikasi kecocokan yang lebih dekat”.
Dan kemudian menambahkan: “Kami menegaskan perlu adanya lebih banyak pekerjaan di masa depan untuk mengatasi risiko yang terkait dengan generasi musik – kami tidak memiliki rencana untuk merilis model pada titik ini.”
“Tujuh tahun setelah perjalanan kami sebagai perusahaan AI-first, kami berada pada titik infleksi yang menggembirakan.”
SUNDAR PICHAI, GOOGLE DAN ALPHABET
Rilis publik tak terduga Google MusicLM minggu ini tiba pada hari yang sama dengan CEO Google dan Alphabet, Sundar Pichai, mengumumkan dorongan besar-besaran ke AI dengan berbagai pembaruan yang didukung AI untuk berbagai produk Google.
“Tujuh tahun setelah perjalanan kami sebagai perusahaan AI-first, kami berada pada titik infleksi yang menggembirakan,” kata Pichai dalam pidato utamanya di acara Google I/O 2023 pada hari Rabu (10 Mei).
Mereka bilang, “Kita punya kesempatan untuk membuat AI lebih membantu bagi orang, bisnis, komunitas, untuk semua orang.”
Sebagai bagian dari dorongan AI baru Google, perusahaan ini sedang memperluas alat AI percakapan dan pesaing Chat GPT-nya, Bard, ke lebih dari 180 negara setelah diluncurkan pertama kali di Inggris dan AS.
Baru-baru ini, Google juga memindahkan Bard ke model bahasa canggih terbarunya, PaLM 2. Google mengatakan bahwa ini adalah “model bahasa besar yang jauh lebih mampu, yang memiliki keterampilan matematika dan penalaran serta kemampuan pemrograman yang lebih maju”.
Peluncuran publik MusicLM tiba pada saat kekhawatiran meningkat seputar penggunaan AI generatif dalam musik.
Salah satu alasan utama kekhawatiran industri seputar penggunaan AI generatif, yang dilatih pada musik lain, adalah risiko pelanggaran hak cipta.
Bulan lalu, produksi musik yang dihasilkan oleh AI yang meniru vokal artis superstar mendominasi berita setelah sebuah lagu yang disebut heart on my sleeve, yang menampilkan vokal AI yang meniru suara Drake dan The Weeknd, menjadi viral.
Lagu tersebut, diunggah oleh seorang artis bernama ghostwriter, kemudian dihapus dari YouTube, Spotify, dan platform lainnya. Di YouTube, konfirmasi tentang apa yang memicu penghapusan lagu dari platform tersebut muncul di halaman milik ghostwriter yang sekarang sudah tidak aktif.
Di dalamnya tertulis: “Video ini tidak lagi tersedia karena klaim hak cipta oleh Universal Music Group.”
Berbicara pada panggilan pendapatan Q1 Universal Music Group bulan lalu, Sir Lucian Grainge, CEO & Chairman Universal Music Group, mencatat bahwa: “Berbeda dengan pendahulunya, sebagian besar AI generatif terbaru [yaitu ‘fake Drake’] dilatih pada materi berhak cipta, yang jelas melanggar hak artis dan label serta akan membuat platform sepenuhnya tidak sejalan dengan kemitraan dengan kami dan artis kami serta kemitraan yang mendorong kesuksesan.”
Dalam pidatonya di panggilan yang sama, Sir Lucian Grainge juga mengkritik “oversupply konten” yang saat ini menyebabkan sekitar 100.000 lagu per hari didistribusikan ke layanan streaming musik.
“Tidak banyak orang yang menyadari bahwa AI telah menjadi kontributor utama dari oversupply konten ini,” kata Grainge.
“Sebagian besar konten AI ini di DSP berasal dari generasi AI sebelumnya, teknologi yang tidak dilatih pada IP berhak cipta dan menghasilkan keluaran berkualitas sangat rendah dengan daya tarik konsumen yang hampir tidak ada.”
Munculnya platform AI yang memungkinkan pengguna membuat volume lagu yang besar dengan hanya dengan satu kali sentuhan juga mengungkapkan potensi penggunaan AI generatif untuk penipuan streaming.
Bulan ini, aplikasi pembuat musik yang ditenagai AI, Boomy, yang penggunanya telah menciptakan 14,4 juta lagu hingga saat ini, mengatakan bahwa Spotify telah menonaktifkan kemampuannya untuk mengunggah lagu ke DSP, dan beberapa lagu yang sudah diunggah telah dihapus.
Seorang juru bicara Spotify kemudian mengkonfirmasi kepada MBW bahwa “tertentu katalog rilisan” dari Boomy dihapus karena platform streaming mendeteksi streaming buatan dari lagu-lagu tersebut. (Tidak ada saran bahwa Boomy sendiri terlibat dalam streaming buatan).
Boomy mengatakan pada Sabtu (6 Mei) bahwa “pengiriman terkurasi ke Spotify dari rilisan baru oleh artis Boomy telah diaktifkan kembali,” perusahaan menulis di server Discord mereka pada Sabtu (6 Mei).
Sementara Spotify mengonfirmasi telah membuat beberapa lagu tidak tersedia, ternyata mitra distribusi Boomy sendiri – DashGo yang dimiliki oleh Downtown – yang telah menghentikan unggahan ke Spotify.
Hanya sebagian kecil lagu Boomy yang tampaknya telah “digarisbawahi” sehingga tidak dapat diputar. Per tanggal 8 Mei, tidak ada lagu Boomy yang telah digarisbawahi pada playlist mereka di Spotify. (MBW)