Artikel ini perlu dikembangkan dari artikel terkait di Wikipedia bahasa Inggris. (Juni 2025)
klik [tampil] untuk melihat petunjuk sebelum menerjemahkan.
|
Artikel ini memerlukan pemutakhiran informasi. (Mei 2025) |
| Kecerdasan buatan generatif |
|---|
Kecerdasan buatan generatif (bahasa Inggris: Generative Artificial Intelligence,[1] disingkat GenAI) adalah cabang dari kecerdasan buatan (AI) yang berfokus pada kemampuan sistem untuk menghasilkan atau membuat data baru yang memiliki karakteristik atau distribusi serupa dengan data yang telah diberikan kepadanya. Ini berbeda dengan pendekatan tradisional AI yang mungkin lebih fokus pada tugas-tugas tertentu seperti klasifikasi atau prediksi.

Salah satu teknik yang umum digunakan dalam Generative AI adalah menggunakan model generatif seperti Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), atau model berbasis aliran seperti Transformer.[2] Model-model ini dilatih untuk memahami dan merepresentasikan distribusi dari data pelatihan mereka dan kemudian menghasilkan data baru yang serupa dengan distribusi tersebut.
Contoh penggunaan Generative AI termasuk pembuatan gambar, teks, suara, atau bahkan video yang terlihat atau terdengar autentik. Misalnya, GANs dapat digunakan untuk membuat gambar wajah yang tampak seolah-olah mereka adalah orang yang sebenarnya, atau untuk menghasilkan gambar seni yang unik. Di sisi lain, VAEs dapat digunakan untuk menghasilkan teks atau gambar yang baru berdasarkan distribusi data latihan mereka, yang kemudian dapat digunakan dalam berbagai aplikasi kreatif atau praktis.[3][4][5]
Perkembangan
suntingAkar kemunculan media yang dihasilkan secara algoritmis dapat ditelusuri pada pengembangan rantai Markov, sebuah metode pemodelan bahasa alami yang telah digunakan sejak awal abad ke-20. Konsep ini diperkenalkan oleh matematikawan Rusia Andrey Markov pada tahun 1906, melalui analisis pola huruf vokal dan konsonan pada karya Eugene Onegin.[6] Setelah sebuah model Markov dilatih menggunakan korpus teks, model tersebut mampu menghasilkan teks baru secara probabilistik berdasarkan pola dalam data latih tersebut.[7]
Pada awal 1970-an, para seniman mulai memanfaatkan komputer untuk memperluas teknik generatif melampaui model Markov. Harold Cohen menciptakan AARON, sebuah program komputer perintis yang dirancang untuk menghasilkan karya seni lukis secara mandiri, dan hasilnya dipamerkan di berbagai galeri.[8]
Memasuki era 1980-1990-an, istilah seperti generative AI planning atau generative planning digunakan untuk menamai sistem perencanaan berbasis kecerdasan buatan yang menghasilkan rangkaian tindakan untuk mencapai suatu tujuan tertentu.[9] Sistem ini memanfaatkan pendekatan AI simbolik, termasuk penelusuran ruang keadaan dan pemenuhan kendala. Pada awal 1990-an, teknologi tersebut dianggap telah berkembang cukup matang, dan dimanfaatkan untuk berbagai kebutuhan seperti penyusunan rencana tindakan darurat militer, perencanaan proses manufaktur, hingga pembuatan rencana keputusan dalam prototipe wahana antariksa otonom.[10]
(2014-2019)
suntingDalam pembelajaran mesin, terdapat dua jenis pendekatan utama, yaitu model diskriminatif dan model generatif. Sejak akhir 2000-an, kemajuan dalam teknologi deep learning mendorong peningkatan besar dalam pengenalan citra, pengenalan suara, pemrosesan bahasa alami, dan berbagai tugas lainnya. Namun, pada fase ini jaringan saraf lebih banyak dikembangkan sebagai model diskriminatif karena membangun model generatif yang akurat masih menjadi tantangan.[11]
Perkembangan signifikan terjadi pada tahun 2014, ketika munculnya Variational Autoencoder (VAE) dan Generative Adversarial Network (GAN) membuka jalan bagi jaringan saraf dalam yang dapat mempelajari representasi generatif untuk data kompleks seperti gambar. Model-model ini tidak hanya mampu mengklasifikasi citra, tetapi juga menghasilkan konten visual baru, contohnya proyek DeepDream yang menampilkan kemampuan jaringan saraf memodifikasi dan menciptakan gambar.[12]
Kemajuan berikutnya hadir pada tahun 2017 melalui arsitektur Transformer, yang menawarkan peningkatan besar dibandingkan model Long Short-Term Memory (LSTM) dalam hal pemahaman konteks sekuens, khususnya untuk teks. Inovasi ini kemudian menjadi landasan bagi munculnya Generative Pre-trained Transformer (GPT-1) pada tahun 2018, yang menandai era baru dalam kecerdasan buatan generatif berbasis bahasa.[13]
(2020โ)
suntingPada Maret 2020, muncul 15.ai, sebuah aplikasi web yang dikembangkan oleh peneliti anonim dari MIT yang memungkinkan pembuatan suara karakter secara meyakinkan meskipun hanya menggunakan sedikit data pelatihan.[14] Layanan ini dipandang sebagai salah satu contoh awal yang mempopulerkan teknologi kloning suara berbasis AI (audio deepfake) dalam budaya digital dan kemudian memengaruhi perkembangan teknologi suara berbasis kecerdasan buatan.[15]
Pada 2021, hadirnya model DALL-E berbasis arsitektur Transformer memberikan lompatan baru dalam pembuatan gambar oleh AI.[16] Kemudian pada 2022, akses terhadap teknologi pembuatan karya visual berbasis perintah bahasa alami semakin terbuka luas melalui peluncuran Midjourney dan Stable Diffusion.[17] Model-model ini mampu menghasilkan gambar fotorealistis, karya seni, serta desain secara otomatis dari deskripsi teks sehingga cepat diadopsi oleh berbagai kalangan, mulai dari seniman hingga masyarakat umum.
Perilisan publik ChatGPT pada November 2022, meningkatkan penggunaan AI generatif untuk tugas berbasis teks secara luas. [18]Kemampuan sistem ini dalam membangun percakapan alami, menghasilkan konten kreatif, memberikan bantuan pemrograman, hingga menganalisis informasi memicu diskusi global mengenai dampaknya terhadap dunia kerja, pendidikan, serta kreativitas manusia.[19]
Pada Maret 2023, GPT-4 dirilis dan dinilai sebagai peningkatan signifikan dalam kemampuan AI generatif. Sebuah tim dari Microsoft Research bahkan menilai bahwa model tersebut dapat dianggap sebagai tahapan awal menuju kecerdasan umum buatan (AGI), meskipun penilaian tersebut mendapat sanggahan dari para akademisi lain yang berpendapat bahwa teknologi yang ada masih jauh dari kecerdasan setara manusia.[20] Pada tahun yang sama, Meta memperkenalkan ImageBind, sebuah proyek riset model multimodal yang dapat mengolah enam jenis data berbeda: teks, gambar, video, termal, data 3D, audio, dan gerakan.[21]
Pada Desember 2023, Google memperkenalkan Gemini, model AI multimodal yang tersedia dalam beberapa versi: Ultra, Pro, Flash, dan Nano.[22] Gemini Pro kemudian diintegrasikan dengan chatbot Bard, sebelum seluruh layanan Bard dan Duet AI digabungkan di bawah merek Gemini pada Februari 2024, termasuk peluncuran aplikasi seluler.
Di periode yang sama, Anthropic memperkenalkan keluarga model bahasa besar Claude yang menunjukkan performa kompetitif pada berbagai tolok ukur kecerdasan buatan.[23]
Secara global, penerapan dan persepsi publik mengenai AI generatif tidak merata. Negara-negara Asia Pasifik menunjukkan tingkat optimisme dan adopsi yang lebih tinggi dibanding wilayah Barat. Survei pada 2024 menunjukkan bahwa mayoritas responden di wilayah tersebut menilai AI berdampak positif, dan Tiongkok menonjol sebagai pemimpin dalam pemanfaatan teknologi AI generatif, termasuk dalam pengajuan paten dan penggunaan harian di kalangan generasi muda.[24]
Pada pertengahan 2025, meskipun penggunaan di tingkat konsumen terus bertumbuh, sejumlah perusahaan mulai menghentikan proyek percontohan AI generatif karena kendala integrasi, kualitas data, dan hasil yang tidak sesuai ekspektasi. Kondisi tersebut dipandang sebagai indikasi bahwa industri sedang memasuki fase jurang kekecewaan (trough of disillusionment) dalam siklus hype teknologi menurut Gartner.[25]
Aplikasi
suntingJenis model kecerdasan buatan generatif yang menonjol antara lain Pentransformasi praterlatih generatif (GPT), generative adversarial networks (GAN), dan variational autoencoders (VAE). Sistem AI generatif disebut multimodal apabila mampu memproses berbagai jenis masukan atau menghasilkan berbagai jenis keluaran.[26] Sebagai contoh, GPT-4o dapat memproses sekaligus menghasilkan teks, gambar, dan audio.[27]
AI generatif telah digunakan di berbagai sektor industri dan secara signifikan mengubah dinamika penciptaan, analisis, serta penyampaian konten. Dalam bidang kesehatan, misalnya, AI generatif mempercepat penemuan obat dengan menciptakan struktur molekul yang memiliki karakteristik target tertentu serta menghasilkan citra radiologi untuk melatih model diagnosis.[28] Kemampuan ini tidak hanya memungkinkan pengembangan yang lebih cepat dan lebih hemat biaya, tetapi juga meningkatkan kualitas pengambilan keputusan medis. Dalam sektor keuangan, layanan AI generatif membantu pembuatan kumpulan data dan otomatisasi laporan menggunakan bahasa alami. Teknologi ini mengotomatisasi pembuatan konten, menghasilkan data keuangan sintetis, dan menyesuaikan komunikasi dengan pelanggan, serta mendukung pengoperasian chatbot dan agen virtual. Secara keseluruhan, teknologi-teknologi ini meningkatkan efisiensi, menekan biaya operasional, dan mendukung pengambilan keputusan berbasis data di lembaga keuangan.[29]
Industri media memanfaatkan AI generatif untuk berbagai aktivitas kreatif, seperti komposisi musik, penulisan naskah, penyuntingan video, dan seni digital. Sektor pendidikan juga terdampak, karena alat-alat ini memungkinkan pembelajaran yang dipersonalisasi melalui pembuatan kuis, bahan belajar, dan penulisan esai. Baik pendidik maupun peserta didik memperoleh manfaat dari platform berbasis AI yang menyesuaikan diri dengan beragam pola belajar.[30] Namun, dalam konteks pendidikan di Kolombia, penggunaan program AI generatif milik Meta oleh siswa dilaporkan menyebabkan penurunan nilai akademik.[31]
Teks dan kode perangkat lunak
suntingModel bahasa besar (large language models atau LLM) dilatih menggunakan teks yang telah ditokenisasi dari berbagai korpus teks. Sistem-sistem ini mencakup ChatGPT, Gemini, Claude, LLaMA, dan BLOOM. LLM memiliki kemampuan pemrosesan bahasa alami, penerjemahan mesin, serta pembangkitan bahasa alami.[32]
LLM dapat digunakan sebagai foundation model untuk berbagai tugas lain.[33] Model ini juga dapat dilatih menggunakan kode komputer, sehingga memungkinkan pembuatan kode sumber untuk program komputer baru berdasarkan perintah (prompt), sebuah praktik yang dikenal sebagai vibe coding.[34] Contohnya meliputi OpenAI Codex, Tabnine, GitHub Copilot, Microsoft Copilot, dan fork Visual Studio Code bernama Cursor.[35]
Beberapa asisten AI membantu kandidat melakukan kecurangan dalam wawancara pemrograman daring dengan menyediakan kode, perbaikan, dan penjelasan. Antarmuka tersembunyi yang digunakan meminimalkan pergerakan mata, sehingga mengurangi kemungkinan kecurangan terdeteksi oleh pewawancara.[36]
Audio
suntingTahun 2016, WaveNet yang dikembangkan oleh DeepMind menunjukkan bahwa jaringan saraf dalam mampu menghasilkan gelombang suara mentah (raw waveforms).[37] Kemampuan WaveNet dalam memodelkan gelombang suara mentah membuatnya dapat merepresentasikan berbagai jenis audio, termasuk musik; sebagai contoh, model ini mampu menghasilkan suara manusia yang relatif realistis dengan melatihnya menggunakan rekaman ujaran asli.[38] Pada tahun-tahun berikutnya, fokus penelitian bergeser dari sintesis konkatenatif ke sintesis ujaran berbasis pembelajaran mendalam,[39] dengan model seperti Tacotron 2 pada tahun 2018 yang menunjukkan bahwa jaringan saraf dapat mengonversi teks menjadi ujaran alami melalui pelatihan menggunakan puluhan jam data suara.[40]
Pada tahun 2020, sebuah situs web text-to-speech gratis bernama 15.ai menunjukkan bahwa jaringan saraf dalam mampu menghasilkan ujaran yang ekspresif secara emosional hanya dengan 15 detik data suara, jumlah yang jauh lebih sedikit dibandingkan puluhan jam data yang sebelumnya diperlukan.[41]
Platform lain yang memanfaatkan AI generatif untuk menghasilkan ujaran meliputi Amazon Polly, Voicebox milik Meta, dan ElevenLabs.[42] Sistem yang dapat menghasilkan musik berdasarkan deskripsi teks (text-to-music) mencakup MusicGen dari Meta dan MusicLM dari Google.[43] Selain itu, audio deepfake telah digunakan untuk menghasilkan trek vokal yang meniru suara penyanyi lain.[44]
Gambar
suntingAI generatif dapat dimanfaatkan untuk menghasilkan karya visual, termasuk seni digital dan ilustrasi.[45] Sistem-sistem ini umumnya dilatih menggunakan kumpulan data gambar yang disertai keterangan takarir (caption). Contoh model teks-ke-gambar (text-to-image) antara lain Stable Diffusion, DALLยทE, Midjourney, Imagen, Adobe Firefly, dan Flux. Selain menghasilkan gambar baru, teknologi ini juga digunakan untuk neural style transfer, yaitu penerapan gaya visual tertentu ke dalam gambar lain secara otomatis.[46]
Video
suntingAI generatif juga digunakan untuk menghasilkan video dengan tingkat realisme yang tinggi. Beberapa contoh platform yang mengembangkan teknologi ini meliputi Sora dari OpenAI[47], Runway[48], Make-A-Video dari Meta Platforms, serta LTX Video, sebuah proyek sumber terbuka yang dikembangkan oleh Lightricks.[49]
Robotika
suntingDalam bidang robotika, AI generatif dapat menciptakan lintasan gerak baru dengan mempelajari pola pergerakan sistem robot.[87] Model multimodal yang menggabungkan visi-bahasa-aksi, seperti RT-2 dari Google, mampu melakukan penalaran sederhana berdasarkan perintah pengguna dan masukan visual, misalnya mengambil objek tertentu sesuai deskripsi teks yang diberikan.[50]
Pemodelan 3D
suntingDalam pemodelan tiga dimensi, kecerdasan buatan diterapkan pada computer-aided design (CAD) untuk mengotomatisasi proses pembuatan model 3D melalui pendekatan teks-ke-3D, gambar-ke-3D, maupun video-ke-3D.[51] Selain itu, pustaka CAD berbasis AI dapat dikembangkan dengan memanfaatkan linked open data berupa skema dan diagram teknis.[52] Asisten CAD berbasis AI saat ini digunakan sebagai alat bantu untuk menyederhanakan alur kerja dan meningkatkan efisiensi dalam perancangan.[53]
Referensi
sunting- ^ Newsom, Gavin; Weber, Shirley N. (September 6, 2023). "Executive Order N-12-23" (PDF). Executive Department, State of California. Diarsipkan dari asli (PDF) tanggal 2024-02-21. Diakses tanggal September 7, 2023.
- ^ Pinaya, Walter H. L.; Graham, Mark S.; Kerfoot, Eric; Tudosiu, Petru-Daniel; Dafflon, Jessica; Fernandez, Virginia; Sanchez, Pedro; Wolleb, Julia et al. (2023). "Generative AI for Medical Imaging: extending the MONAI Framework". arฮงiv:2307.15208 [eess.IV].
- ^ Brynjolfsson, Erik; Li, Danielle; Raymond, Lindsey R. (April 2023), Generative AI at Work (Working Paper), Working Paper Series, doi:10.3386/w31161, diarsipkan dari asli tanggal 2024-03-28, diakses tanggal 2024-01-21
- ^ "Don't fear an AI-induced jobs apocalypse just yet". The Economist. 2023-03-06. Diarsipkan dari asli tanggal 2023-11-17. Diakses tanggal 2023-03-14.
- ^ Coyle, Jake (2023-09-27). "In Hollywood writers' battle against AI, humans win (for now)". AP News. Associated Press. Diarsipkan dari asli tanggal 2024-04-03. Diakses tanggal 2024-01-26.
- ^ Prof. Charles Grinstead; Prof. Laurie Snell (19970101). Introduction to Probability. American Mathematical Society.
- ^ Bremaud, Pierre (2013-03-09). Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues (dalam bahasa Inggris). Springer Science & Business Media. ISBNย 978-1-4757-3124-8.
- ^ Rosenbaum, Sara (2024-02-21). "When Medicaid Unwinding Meets AI: In the Matter of DeLoitte Consulting".
- ^ "(PDF) Computer Aided Process Planning: The State-of-the-Art Survey,"". ResearchGate (dalam bahasa Inggris). Diakses tanggal 2025-11-22.
- ^ Pell, Barney; Bernard, Douglas E.; Chien, Steve A.; Gat, Erann; Muscettola, Nicola; Nayak, P. Pandurang; Wagner, Michael D.; Williams, Brian C. (1998-03). "An Autonomous Spacecraft Agent Prototype". Autonomous Robots. 5 (1): 29โ52. doi:10.1023/a:1008860925034. ISSNย 0929-5593.
- ^ Jebara, Tony (2004). Generative Versus Discriminative Learning. Boston, MA: Springer US. hlm.ย 17โ60. ISBNย 978-1-4613-4756-9.
- ^ He, Ran; Cao, Jie; Tan, Tieniu (2025-05). "Generative artificial intelligence: a historical perspective". National Science Review. 12 (5): nwaf050. doi:10.1093/nsr/nwaf050. ISSNย 2053-714X. PMCย 11970245. PMIDย 40191253.
- ^ Islam, Saidul; Elmekki, Hanae; Elsebai, Ahmed; Bentahar, Jamal; Drawel, Nagat; Rjoub, Gaith; Pedrycz, Witold (2024-05-01). "A comprehensive survey on applications of transformers for deep learning tasks". Expert Systems with Applications. 241: 122666. doi:10.1016/j.eswa.2023.122666. ISSNย 0957-4174.
- ^ Chandraseta, Rionaldi (2021-01-21). "Generate Your Favourite Characters' Voice Lines using Machine Learning". Towards Data Science (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ Sola. "15.ai Creator reveals journey from MIT Project to internet phenomenon โ Technology โ The Guardian Nigeria News โ Nigeria and World News". guardian.ng (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ Coldewey, Devin (2021-01-05). "OpenAI's DALL-E creates plausible images of literally anything you ask it to". TechCrunch (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ "Stable Diffusion Public Release". Stability AI (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ Lock, Samantha (2022-12-05). "What is AI chatbot phenomenon ChatGPT and could it replace humans?". The Guardian (dalam bahasa Inggris (Britania)). ISSNย 0261-3077. Diakses tanggal 2025-11-22.
- ^ Contributors, Ars (2023-08-23). "How ChatGPT turned generative AI into an "anything tool"". Ars Technica (dalam bahasa Inggris). Diakses tanggal 2025-11-22.
- ^ Bubeck, Sรฉbastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Peter; Lee, Yin Tat; Li, Yuanzhi (2023-04-13), Sparks of Artificial General Intelligence: Early experiments with GPT-4, doi:10.48550/arXiv.2303.12712, diakses tanggal 2025-11-22
- ^ Vincent, James (2023-05-09). "Meta open-sources multisensory AI model that combines six types of data". The Verge (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ Kruppa, Miles (2023-12-06). "Google Announces AI System Gemini After Turmoil at Rival OpenAI". The Wall Street Journal (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ Nuรฑez, Michael (2024-03-04). "Anthropic unveils Claude 3, surpassing GPT-4 and Gemini Ultra in benchmark tests". VentureBeat (dalam bahasa American English). Diakses tanggal 2025-11-22.
- ^ "Asia Pacific open to digital and reform transformation | Ipsos". www.ipsos.com (dalam bahasa Inggris). 2024-11-11. Diakses tanggal 2025-11-22.
- ^ "Gartner Says Generative AI for Procurement Has Entered the Trough of Disillusionment". Gartner (dalam bahasa Inggris). Diakses tanggal 2025-11-22.
- ^ Islam, Arham (2023-03-21). "A History of Generative AI: From GAN to GPT-4". MarkTechPost (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Mittal, Aayush Mittal (2024-05-22). "OpenAI's GPT-4o: The Multimodal AI Model Transforming Human-Machine Interaction". Unite.AI (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Vemula, Divya; Jayasurya, Perka; Sushmitha, Varthiya; Kumar, Yethirajula Naveen; Bhandari, Vasundhra (2023-02-01). "CADD, AI and ML in drug discovery: A comprehensive review". European Journal of Pharmaceutical Sciences. 181: 106324. doi:10.1016/j.ejps.2022.106324. ISSNย 0928-0987.
- ^ "Generative AI in Banking: Practical Use Cases and Future Potential". www.trinetix.com (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ Element451 (2024-11-26). "Top Benefits Of AI In Education For Teachers and Students". Element451 Higher Ed CRM (dalam bahasa Inggris). Diakses tanggal 2025-12-13. Pemeliharaan CS1: Nama numerik: authors list (link)
- ^ Salamanca, Laura Rodrรญguez (2025-07-30). "Meta brought AI to rural Colombia. Now students are failing exams". Rest of World (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Kaushal, Ayush; Mahowald, Kyle (2022). "What do tokens know about their characters and how do they know it?". Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA, USA: Association for Computational Linguistics. doi:10.18653/v1/2022.naacl-main.179.
- ^ Bommasani, Rishi; Hudson, Drew A.; Adeli, Ehsan; Altman, Russ; Arora, Simran; Arx, Sydney von; Bernstein, Michael S.; Bohg, Jeannette; Bosselut, Antoine (2022-07-12), On the Opportunities and Risks of Foundation Models, doi:10.48550/arXiv.2108.07258, diakses tanggal 2025-12-13
- ^ Chen, Mark; Tworek, Jerry; Jun, Heewoo; Yuan, Qiming; Pinto, Henrique Ponde de Oliveira; Kaplan, Jared; Edwards, Harri; Burda, Yuri; Joseph, Nicholas (2021-07-14), Evaluating Large Language Models Trained on Code, doi:10.48550/arXiv.2107.03374, diakses tanggal 2025-12-13
- ^ "Investing in Cursor". Andreessen Horowitz (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ Elias, Jennifer (2025-03-09). "Meet the 21-year-old helping coders use AI to cheat in Google and other tech job interviews". CNBC (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ Oord, Aaron van den; Dieleman, Sander; Zen, Heiga; Simonyan, Karen; Vinyals, Oriol; Graves, Alex; Kalchbrenner, Nal; Senior, Andrew; Kavukcuoglu, Koray (2016-09-19), WaveNet: A Generative Model for Raw Audio, doi:10.48550/arXiv.1609.03499, diakses tanggal 2025-12-13
- ^ Meyer, David. "Google's DeepMind Claims Massive Progress in Synthesized Speech". Fortune (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ Triantafyllopoulos, Andreas; Schuller, Bjรถrn W.; ฤฐymen, Gรถkรงe; Sezgin, Metin; He, Xiangheng; Yang, Zijiang; Tzirakis, Panagiotis; Liu, Shuo; Mertes, Silvan (2023-10). "An Overview of Affective Speech Synthesis and Conversion in the Deep Learning Era". Proceedings of the IEEE. 111 (10): 1355โ1381. doi:10.1109/JPROC.2023.3250266. ISSNย 1558-2256.
- ^ "Audio samples from "Semi-Supervised Training for Improving Data Efficiency in End-to-End Speech Synthesis"". google.github.io. Diakses tanggal 2025-12-13.
- ^ Chandraseta, Rionaldi (2021-01-21). "Generate Your Favourite Characters' Voice Lines using Machine Learning". Towards Data Science (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Desai, Saahil (2023-07-17). "A Voicebot Just Left Me Speechless". The Atlantic (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ Agostinelli, Andrea; Denk, Timo I.; Borsos, Zalรกn; Engel, Jesse; Verzetti, Mauro; Caillon, Antoine; Huang, Qingqing; Jansen, Aren; Roberts, Adam (2023-01-26), MusicLM: Generating Music From Text, doi:10.48550/arXiv.2301.11325, diakses tanggal 2025-12-13
- ^ Lamar, Andre. "Jay-Z's Delaware producer sparks debate over AI rights". The News Journal (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Epstein, Ziv; Hertzmann, Aaron; Herman, Laura; Mahari, Robert; Frank, Morgan R.; Groh, Matthew; Schroeder, Hope; Smith, Amy; Akten, Memo (2023-06-07), Art and the science of generative AI: A deeper dive, doi:10.48550/arXiv.2306.04141, diakses tanggal 2025-12-13
- ^ Ramesh, Aditya; Pavlov, Mikhail; Goh, Gabriel; Gray, Scott; Voss, Chelsea; Radford, Alec; Chen, Mark; Sutskever, Ilya (2021-07-01). "Zero-Shot Text-to-Image Generation". Proceedings of the 38th International Conference on Machine Learning (dalam bahasa Inggris). PMLR: 8821โ8831.
- ^ "OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos (Published 2024)" (dalam bahasa Inggris). 2024-02-15. Diakses tanggal 2025-12-13.
- ^ "Instant Videos Could Represent the Next Leap in A.I. Technology (Published 2023)" (dalam bahasa Inggris). 2023-04-04. Diakses tanggal 2025-12-13.
- ^ Nuรฑez, Michael (2025-05-06). "Lightricks just made AI video generation 30x faster โ and you won't need a $10,000 GPU". VentureBeat (dalam bahasa American English). Diakses tanggal 2025-12-13.
- ^ Brohan, Anthony; Brown, Noah; Carbajal, Justice; Chebotar, Yevgen; Chen, Xi; Choromanski, Krzysztof; Ding, Tianli; Driess, Danny; Dubey, Avinava (2023-07-28), RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control, doi:10.48550/arXiv.2307.15818, diakses tanggal 2025-12-13
- ^ Rinko, Sam (2024-06-25). "9 Best AI 3D Generators You Need To Try". eWEEK (dalam bahasa Inggris). Diakses tanggal 2025-12-13.
- ^ "Slash CAD model build times with new AI-driven part creation methodology | GlobalSpec". insights.globalspec.com. Diakses tanggal 2025-12-14.
- ^ Kevin (2023-03-22). "The Role of Artificial Intelligence (AI) in the CAD Industry". Scan2CAD (dalam bahasa American English). Diakses tanggal 2025-12-14.