Buku Yang Digunakan Untuk Melatih AI
Buku Yang Digunakan Untuk Melatih AI – beberapa perusahaan teknologi terbesar menggunakan hampir 200.000 buku untuk melatih sistem AI. Masalah? Tidak ada yang memberi tahu penulisnya.
Buku Yang Digunakan Untuk Melatih AI
rryalsrussell – Sistem ini disebut Books, dan menurut penyelidikan The Atlantic, basis datanya didasarkan pada kumpulan e-book yang diproduksi secara ilegal yang mencakup setiap genre mulai dari fiksi erotis hingga puisi prosa. Buku membantu sistem AI generatif belajar mengkomunikasikan informasi.
Beberapa teks pelatihan AI dapat diperoleh dari artikel yang diterbitkan di Internet, namun AI berkualitas tinggi memerlukan teks berkualitas tinggi untuk menyerap bahasa tersebut, menurut The Atlantic, di mana buku-buku itu akan diperkenalkan. Books3 telah menjadi subjek beberapa tuntutan hukum terhadap Meta dan perusahaan lain yang menggunakan sistem tersebut untuk melatih AI.
Sekarang penulis dapat melihat apakah buku mereka digunakan untuk melatih sistem AI ini, berkat database yang ditambang oleh Books3 yang dirilis minggu lalu di Atlantik. Dan banyak yang tidak senang.
“Saya benar-benar patah hati dan patah hati. Saya marah dan merasa sangat tidak berdaya pada saat yang sama,” tulis Mary H. K. Choi di media sosial setelah mengetahui bahwa karyanya telah digunakan. “Aku marah dan ingin bertarung, tapi aku juga sangat lelah.”
Choi, yang novel debutnya “Kontak Darurat” diterbitkan di database, menjelaskan perasaannya melalui email. Buku tersebut, yang berpusat pada seorang wanita muda Korea-Amerika yang menjalani hubungan baru, “sangat pribadi”, dan Choi awalnya diberi tahu bahwa kisahnya “terlalu tenang dan khusus”. Buku tersebut kemudian menjadi buku terlaris New York Times dan mendapat pembaca di seluruh dunia.
“Buku ini berisi pilihan tak terbatas, permutasi tak terbatas, dan bahkan kesalahan penulis saat itu. Gagasan bahwa seluruh kehidupannya bisa .diperas ke dalam pusaran besar untuk dimasukkan ke dalam generatif algoritmik raksasa ke dalam mesin sosis yang memotong dengan sangat cepat,” katanya. “Tidak hanya secara finansial bagi penulisnya, namun hal ini juga memerlukan banyak hal untuk menjalin hubungan dekat dengan penjual buku, pustakawan, dan pembaca.”
Baca juga : Bagaimana Penerbit Dapat Menavigasi Revolusi AI
Penulis novel Pachinko dan Free Food for Millionaires, Min Jin Lee yang diterbitkan di jejaring sosial, memiliki sentimen serupa. , menyebut penggunaan buku-bukunya sebagai “pencurian”.
“Saya menghabiskan tiga dekade hidup saya untuk menulis buku-buku saya,” katanya. “Model bahasa Ali yang besar tidak ‘menelan’ atau ‘mengikis’ ‘data.’ Semua perusahaan mencuri karya, waktu, dan kreativitas saya. Mereka mencuri cerita saya.” Mereka mencuri sebagian dari diriku.”
Nora Roberts, seorang penulis roman yang produktif, memiliki 206 buku di database Books3, menurut The Atlantic. Jumlah ini adalah yang tertinggi dibandingkan penulis mana pun yang masih hidup, nomor dua setelah William Shakespeare. Dia menyebut database dan penggunaannya oleh perusahaan teknologi sebagai “segala jenis kebohongan.”
“Kami adalah manusia, kami adalah penulis, dan kami dieksploitasi oleh orang-orang yang ingin menggunakan karya kami, sekali lagi tanpa izin atau kompensasi . untuk menulis buku, manuskrip, esai” “karena murah dan mudah,” kata Roberts.
Eksploitasi penulis ini tidak mengganggu penulis Nik Sharma, yang buku masaknya Season ditemukan di database.
“Saya Ngeri, tapi tak heran saya dimanfaatkan,” ujarnya di media sosial. “Rupanya saya bahkan tidak meminta izin atau membayar kompensasi karena menggunakan pekerjaan saya untuk melatih AI.”
AI tidak bisa dihindari, kata Sharma kemudian melalui email — karena itu dia tidak terlalu terkejut. Menurutnya, yang paling sulit adalah tidak ada yang dihubungi terkait penggunaan maupun pembayaran. Lagipula, pendidikan di Amerika tidaklah gratis, katanya; guru dibayar dan buku pelajaran dibeli.
“Saat ini AI adalah hal yang paling liar dan kebijakan pemerintah masih dalam tahap awal,” kata Sharma. “Dan sebagai hasilnya, perusahaan teknologi mengambil setiap peluang. Saya senang ini hanya satu buku masak dan bukan yang lain.”
Meta, yang menggunakan database Books3, tidak menanggapi permintaan komentar, menurut The Atlantic. Juru bicara Bloomberg mencatat dalam pernyataannya bahwa perusahaan tersebut “menggunakan sejumlah sumber data yang berbeda,” termasuk Books3, untuk melatih model BloombergGPT aslinya, sebuah model kecerdasan buatan untuk industri keuangan. kepada juru bicaranya bahwa Bloomberg “tidak akan menyertakan kumpulan data Books3 dalam sumber data yang digunakan untuk melatih BloombergGPT versi komersial di masa mendatang.”
Tidak semua penulis kecewa karena AI menggunakan karya mereka. James Chappel, yang database buku akademisnya menggunakan Gereja Katolik modern, mengatakan di media sosial bahwa dia “tidak peduli sama sekali”. “Saya ingin buku saya dibaca!” dia menulis “Saya ingin hal ini mengajarkan!”
Baca juga : Forensik Keamanan Siber Seni Menjadi Detektif Digital
Chappel tidak menanggapi permintaan komentar lebih lanjut.
AI di tangan perusahaan besar telah menjadi perhatian utama banyak penulis. Writers Guild of America melakukan pemogokan pada musim panas ini untuk menuntut pembatasan penggunaan kecerdasan buatan dalam penulisan film dan acara TV. Secara khusus, ChatGPT telah digunakan untuk segala hal mulai dari tugas menulis hingga dokumen hukum.
Penulis tidak sendirian dalam permasalahan ini. Karena popularitas sistem AI teks-ke-gambar, seniman visual mengalami situasi yang sama tahun lalu ketika mereka mengetahui bahwa karya mereka digunakan tanpa izin untuk mempraktikkan AI. Kedua kasus tersebut menyoroti kekhawatiran tentang semakin luasnya jangkauan kecerdasan buatan dalam semua bentuk seni, di mana karya terkadang bisa bersifat sangat pribadi atau intim.
Perdebatan yang dimulai oleh Books3 muncul ketika Presiden AS Joe Biden mengumumkan rencana untuk memperkenalkan peraturan tentang kecerdasan buatan. . pada musim gugur ini, dengan mengatakan bahwa negara ini memimpin “jalan menuju inovasi AI yang bertanggung jawab”.
Namun, bagi para penulis, perjuangan yang sedang berlangsung seputar AI dan karya mereka bisa sangat melelahkan. Bagi Choi, merupakan hal yang “tidak nyata” saat mengetahui bahwa bukunya digunakan selama pemogokan WGA, ketika kecerdasan buatan menjadi topik perdebatan yang hangat. “Saya terkejut,” katanya melalui email. “Rasanya seperti kemenangan atau hasil imbang di satu arena bisa hancur di arena lain.”
Namun, Choi mengatakan bahwa dia mengetahui bukunya di antara ribuan buku lainnya. “Penghinaan tidak berarti apa-apa,” meskipun hal itu penting baginya. “Saya pikir di saat-saat paling menyedihkan, segala sesuatu tampaknya benar-benar tidak bisa dihindari,” katanya.
Choi tidak sendirian. dalam rasa keniscayaan ini. Roberts meminta para penulis dan penonton untuk bersatu mengatasi masalah ini.
“Kita yang membuat cerita harus bersatu untuk melawan penyalahgunaan bakat dan kerja keras kita,” katanya. “Kita harus melindungi pekerjaan kita dan pekerjaan satu sama lain. Saya berharap pembaca dan pemirsa mendukung kami dalam masalah penting ini.”