OpenAI baru-baru ini mengungkapkan model pembuat video terbarunya yang disebut Sora. Model ini tidak hanya mampu melakukan berbagai keajaiban sinematik, tetapi juga memiliki kemampuan untuk menghasilkan dunia-digital dalam video game.
Publikasi paper teknis yang berjudul “Video generation models as world simulators” oleh sejumlah peneliti OpenAI menjelaskan secara rinci arsitektur Sora, termasuk kemampuannya dalam menghasilkan video hingga resolusi dan rasio aspek yang tinggi, serta melakukan berbagai tugas editing gambar dan video.
Namun, yang paling menarik dari Sora adalah kemampuannya untuk “mensimulasikan dunia digital”, seperti yang dijelaskan oleh para penulis OpenAI.
Kemampuan Simulasi Dunia Digital Sora
Sora mampu memperlihatkan kecanggihan dalam mensimulasikan dunia digital, seperti yang ditunjukkan dalam eksperimen yang dilakukan oleh OpenAI dengan memberikan prompt yang berisi kata “Minecraft”.
Sora mampu merender HUD dan gameplay yang mirip dengan Minecraft dengan dinamika permainan yang meyakinkan, termasuk fisika, sambil secara bersamaan mengontrol karakter pemain. Hal ini tercapai karena Sora berperan lebih sebagai “mesin fisika berbasis data” daripada sekadar alat kreatif biasa.
Model ini tidak hanya menghasilkan foto atau video tunggal, tetapi juga melakukan perhitungan fisika untuk setiap objek dalam lingkungan yang diberikan, lalu merender foto atau video (atau dunia 3D interaktif) berdasarkan perhitungan tersebut.
Batasan dan Tantangan Sora dalam Domain Game
Meskipun memiliki kemampuan simulasi yang luar biasa, Sora masih memiliki keterbatasan dalam domain video game. Model ini belum dapat secara akurat mengaproksimasi fisika interaksi dasar seperti pecahan kaca.
Bahkan dengan interaksi yang dapat dimodelkan, Sora seringkali tidak konsisten, seperti gagal merender gigitan pada burger saat seseorang sedang makan. Namun demikian, dengan membaca paper yang benar, terlihat bahwa Sora bisa membuka jalan bagi game yang dihasilkan secara prosedural lebih realistis, bahkan mungkin fotorealistis, hanya dari deskripsi teks saja.
Hal ini menimbulkan kegembiraan sekaligus kekhawatiran (mengingat implikasi deepfake), yang mungkin menjadi alasan OpenAI memilih untuk membatasi akses terhadap Sora melalui program akses yang sangat terbatas untuk saat ini.
Implikasi dan Potensi Pengembangan Lebih Lanjut
Kemampuan Sora dalam simulasi dunia digital menunjukkan potensi besar dalam pengembangan simulasi fisik dan digital yang sangat canggih di masa depan. Dengan terus mengembangkan model-model video seperti Sora, kita dapat membayangkan pengembangan simulator yang sangat mampu untuk dunia fisik dan digital, termasuk objek, hewan, dan manusia yang berada di dalamnya.
Namun, di sisi lain, kita juga harus waspada terhadap implikasi yang mungkin timbul, terutama dalam konteks penggunaan teknologi deepfake. Penggunaan yang tidak bijaksana dari kemampuan ini dapat menyebabkan konsekuensi yang tidak diinginkan dalam masyarakat. Oleh karena itu, penting untuk mempertimbangkan etika dan regulasi yang ketat dalam pengembangan dan penerapan teknologi seperti Sora.
Dengan demikian, Sora dari OpenAI tidak hanya merupakan terobosan dalam penghasilan video dan simulasi dunia digital, tetapi juga memunculkan pertanyaan-pertanyaan penting tentang etika dan implikasi penggunaannya di masa depan.