Era Baru AI Agentik: Dari Chatbot ke Dunia Fisik
Tahun 2026 menandai pergeseran fundamental dalam lanskap kecerdasan buatan: dari model yang sekadar “mengetahui” menuju agen yang benar-benar “bertindak”. Foundation models—model transformer berskala besar yang dilatih dengan dataset masif dan di-fine-tune untuk berbagai tugas hilir—telah berkembang jauh melampaui chatbot, asisten kode, dan aplikasi digital lainnya. Kini, model-model tersebut berfungsi sebagai mesin kognitif untuk agen AI di dunia fisik, tempat mereka merencanakan, menggunakan perkakas digital, dan menjalankan tugas multilangkah di lingkungan yang terintegrasi secara digital—mulai dari gudang dan pabrik hingga sistem transportasi dan rumah sakit.
Amazon menjadi salah satu pionir transisi menuju era “AI fisik” ini melalui debut Project Eluna, sebuah model AI agentik yang dirancang untuk mentransformasi cara operasional pusat pemenuhan (fulfillment center) mereka bekerja. Agar bermanfaat di lingkungan fisik berisiko tinggi, sebuah agen memerlukan lebih dari sekadar kefasihan berbahasa alami—ia harus memahami hukum-hukum fisika dan kendala operasional secara mendalam.
Mengapa Halusinasi AI di Dunia Fisik Lebih Berbahaya
Tantangan utama yang harus diatasi adalah masalah halusinasi. Di lingkungan virtual, halusinasi AI mengambil bentuk informasi fabrikasi—sitasi palsu, ketidaktepatan faktual, dan kecacatan logika yang disajikan dengan tingkat keyakinan tinggi. Di sistem fisik, halusinasi dapat menyebabkan pelanggaran terhadap realitas dengan konsekuensi yang jauh lebih serius dan nyata.
Sebagai contoh, jika sebuah agen mengusulkan jalur robotik yang mengabaikan momentum dan massa benda yang sedang dipindahkan, hasilnya bisa membahayakan keselamatan manusia atau menyebabkan kerusakan fatal pada produk dan peralatan. Inilah mengapa pendekatan grounding—yaitu integrasi informasi eksternal yang mencakup dataset khusus domain, prinsip-prinsip fisika, dan simulasi numerik—menjadi sangat krusial untuk mengontekstualisasikan penalaran sebuah model.
Seluruh pendekatan grounding ini dapat digunakan secara terpisah maupun dikombinasikan, tergantung pada aplikasi spesifiknya. Implementasi praktis dari pendekatan-pendekatan ini tidak hanya akan mempercepat penggunaan agen AI yang aman dan produktif, tetapi juga memungkinkan ekspansi lebih lanjut ke domain-domain baru yang sebelumnya terlalu berisiko.
Empat Pilar Grounding AI Agentik
Project Eluna merupakan model AI agentik yang beroperasi di cloud dan membantu operator yang mengelola operasional pusat pemenuhan melalui dasbor digital. Sistem ini dirancang untuk bertindak dengan tingkat otonomi tertentu—menalar situasi operasional yang kompleks dan merekomendasikan tindakan kepada manajer operasi. Eluna menarik data historis dan real-time, seperti status konveyor belt atau robot, untuk mengantisipasi hambatan dan menjaga operasional tetap berjalan lancar.
Empat pendekatan grounding dikembangkan untuk memastikan agen AI seperti Eluna tetap konsisten secara fisik dan andal secara operasional:
Pilar 1: Pembelajaran Dalam Dipandu Fisika
Foundation models tradisional dapat mempelajari pola statistik dalam data, tetapi sering kali gagal mematuhi batasan keras alam semesta fisik, seperti hukum konservasi massa, energi, atau momentum. Dalam pendekatan physics-guided deep learning (PGDL), pengetahuan fisika pertama atau first-principle diintegrasikan ke dalam model foundation sejak tahap pretraining. Prinsip-prinsip ini mencakup simetri seperti bias induktif berupa rotasi dan transformasi lainnya, serta persamaan diferensial yang dapat digunakan untuk mengontrol gerakan dan navigasi robot.
Pendekatan ini tidak hanya memastikan prediksi model mematuhi hukum fisika yang berlaku, tetapi juga memungkinkan model untuk belajar dari dataset yang jauh lebih kecil. Jika model sudah memahami prinsip fundamental dinamika sejak awal, ia membutuhkan lebih sedikit data latih untuk mencapai tingkat akurasi yang memuaskan. Efisiensi data ini sangat berharga dalam skenario dunia nyata di mana pengumpulan data fisik berskala besar bisa sangat mahal dan memakan waktu.
Pilar 2: Penalaran Sadar Ketidakpastian
Large language model (LLM) sering menunjukkan kepercayaan berlebih dalam prediksi yang tidak pasti, yang dapat berujung pada penyampaian misinformasi dengan tingkat keyakinan tinggi. Agar dapat dipercaya dalam setting mission-critical, agen AI harus memiliki kemampuan untuk mengenali kapan ia tidak mengetahui sesuatu dan bertindak sesuai batasan pengetahuannya.
Framework UQ4CT yang dikembangkan untuk tujuan ini mampu menghasilkan estimasi ketidakpastian terkalibrasi atas ruang fungsi yang memetakan prompt input ke output. Framework ini menggunakan pendekatan mixture of experts, di mana model dibagi menjadi sub-jaringan yang lebih kecil dengan keahlian spesifik masing-masing. Agen yang di-grounding menggunakan ketidakpastian terkalibrasi dapat menghentikan proses atau meminta intervensi manusia ketika ketidakpastian internalnya melampaui ambang batas keamanan. Hasilnya, framework ini mempertahankan akurasi tinggi di lima benchmark sekaligus menunjukkan reduksi lebih dari 25 persen pada expected calibration error (ECE)—ukuran seberapa baik estimasi probabilitas model sesuai dengan probabilitas observasi sesungguhnya.
Pilar 3: Menjembatani Kesenjangan Teks-ke-Numerik
Meskipun foundation models merupakan ahli dalam bahasa alami, hukum dunia fisik ditulis dalam bahasa matematika dan data berdimensi tinggi—jenis data yang digunakan secara ekstensif dalam bidang robotika, manajemen rantai pasok, dan keuangan. Agen yang andal harus mampu menerjemahkan niat manusia yang diekspresikan melalui bahasa menjadi eksekusi numerik yang presisi tanpa kehilangan akurasi.
Framework adapting-while-learning (AWL) mengandalkan dua mekanisme kunci untuk tujuan ini. Mekanisme pertama adalah world-knowledge distillation, di mana agen AI berinteraksi dengan simulator dunia fisik untuk mengumpulkan informasi tentang apa saja yang mungkin terjadi secara fisik. Pengetahuan ini diinternalisasi melalui supervised fine-tuning. Mekanisme kedua adalah dynamic tool adaptation, di mana model foundation memanggil simulator numerik khusus ketika ia mengenali bahwa pelatihan aslinya tidak memadai untuk kompleksitas tugas yang sedang dihadapi. Model yang di-post-train dengan AWL mencapai akurasi jawaban 29 persen lebih tinggi dan penggunaan alat simulator 12 persen lebih baik dibanding model asli, bahkan melampaui model mutakhir seperti GPT-4o dan Claude-3.5 pada dataset sains fisik.
Pilar 4: Grounding Berbantuan Verifier
Verifier adalah perangkat lunak eksternal dari LLM yang digunakan untuk memastikan bahwa model bekerja dalam batas-batas logika dan realitas. Agen AI cuaca bernama Zephyrus menggunakan verifier untuk menyempurnakan penalaran foundation model dalam sains cuaca. Zephyrus bekerja dalam loop interaktif reflektif—agen menulis kode untuk mengkueri dataset cuaca eksternal, mengamati hasil fisik, dan merevisi penalarannya jika output ditandai secara ilmiah tidak masuk akal oleh verifier.
Verifier lain bernama Hilbert dirancang khusus untuk penalaran matematis. Hilbert memecah masalah matematis kompleks menjadi sub-tujuan dan menggunakan umpan balik dari verifier formal terpisah untuk memvalidasinya secara rekursif. Proses ini memastikan output agen terbukti benar secara matematis. Hasilnya sangat impresif: peningkatan kinerja sebesar 422 persen dibanding prover LLM publik terbaik yang tersedia saat ini.
Panduan ke Depan
Keempat pilar grounding ini meletakkan fondasi yang kokoh untuk membumikan LLM dalam realitas. Beberapa arah penelitian menjanjikan ke depan mencakup fine-tuning foundation models untuk berinteraksi dengan simulasi numerik multifidelitas yang lebih kompleks, penggunaan ketidakpastian bukan hanya sebagai pendeteksi halusinasi tetapi juga sebagai sinyal reward intrinsik, serta penyematan hukum fisika dan kendala domain sebagai verifier formal selama perencanaan proses. Pada akhirnya, agen yang memadukan pembelajaran terpandu fisika dengan ketidakpastian terkalibrasi dan verifikasi formal akan jauh lebih kokoh dibanding agen yang hanya mengandalkan satu pilar semata. Seiring agen AI memperluas jangkauan ke domain fisik yang semakin kompleks, penalaran yang setia dan grounding yang efektif akan menjadi prinsip utama untuk memastikan AI agentik beroperasi secara aman, andal, dan berskala besar.




