(SeaPRwire) – Setiap tiga bulan, peserta dalam ramalan Metaculus cuba meramalkan masa depan untuk hadiah berjumlah kira-kira $5,000. Metaculus, sebuah platform ramalan, mengemukakan soalan-soalan penting geopolitik seperti “Adakah Thailand akan mengalami rampasan kuasa tentera sebelum September 2025?” dan “Adakah Israel akan menyerang tentera Iran lagi sebelum September 2025?”
Peramal menganggarkan kebarangkalian kejadian berlaku—ramalan yang lebih bermaklumat daripada sekadar “ya” atau “tidak”—beberapa minggu hingga beberapa bulan lebih awal, selalunya dengan ketepatan yang menakjubkan. Pengguna Metaculus dengan tepat meramalkan tarikh pencerobohan Rusia ke atas Ukraine dua minggu lebih awal dan meramalkan 90 peratus kemungkinan Roe v. Wade dibatalkan hampir dua bulan sebelum ia berlaku.
Namun, salah satu daripada 10 peserta terbaik dalam pertandingan, yang pemenangnya diumumkan pada hari Rabu, mengejutkan para peramal: sebuah AI. “Ia sebenarnya agak menakjubkan,” kata Toby Shevlane, Ketua Pegawai Eksekutif Mantic, syarikat pemula yang berpangkalan di UK yang baru diumumkan yang membangunkan AI tersebut. Apabila pertandingan dibuka pada bulan Jun, peserta meramalkan bahawa skor bot teratas akan menjadi 40% daripada purata prestasi manusia teratas. Sebaliknya, Mantic mencapai lebih 80%.
“Ramalan—ia ada di mana-mana, bukan?” kata Nathan Manzotti, yang telah bekerja dalam AI dan analitik data untuk Department of Defence dan General Services Administration, bersama-sama dengan kira-kira setengah dozen agensi kerajaan AS. “Pilih mana-mana agensi kerajaan, dan mereka pasti mempunyai beberapa bentuk ramalan yang sedang berjalan.”
Peramal membantu institusi menjangka masa depan, jelas Anthony Vassalo, pengarah bersama Inisiatif Ramalan di RAND, sebuah badan pemikir kerajaan AS. Ia juga membantu mereka mengubahnya. Meramalkan peristiwa geopolitik beberapa minggu atau bulan lebih awal membantu “menghentikan kejutan” dan “membantu pembuat keputusan dalam membuat keputusan,” kata Vassalo. Peramal mengemas kini ramalan mereka berdasarkan dasar yang digubal oleh penggubal undang-undang, jadi mereka boleh meramalkan bagaimana campur tangan dasar hipotetikal mungkin mengubah hasil masa depan. Jika pembuat keputusan berada di landasan yang tidak diingini, peramal boleh membantu mereka “mengubah senario yang mereka hadapi,” kata Vassalo.
Tetapi meramalkan soalan geopolitik yang luas adalah sangat sukar. Ramalan daripada peramal terkemuka boleh mengambil masa berhari-hari untuk satu soalan. Bagi organisasi seperti RAND, menjejaki pelbagai topik merentasi banyak zon geopolitik, “ia akan mengambil masa berbulan-bulan untuk peramal manusia membuat ramalan awal mengenai semua soalan tersebut, apatah lagi mengemas kini mereka secara berkala,” kata Vassalo.
Pembelajaran mesin telah lama berguna dalam domain dengan data yang banyak dan berstruktur rapi, seperti ramalan cuaca atau perdagangan dana kuantitatif. Apabila meramalkan geopolitik atau kemajuan teknologi, “anda akan mempunyai banyak faktor yang kompleks dan saling bergantung yang mana pertimbangan manusia boleh menjadi lebih mudah diakses dan berpatutan” dalam meramal, kata Deger Turan, Ketua Pegawai Eksekutif Metaculus.
Model bahasa besar berfungsi dengan maklumat yang sama tidak kemas seperti peramal manusia, dan mampu mensimulasikan pertimbangan manusia ini. Mereka juga bertambah baik dengan cara yang sama seperti manusia: dengan membuat ramalan mengenai banyak soalan, melihat bagaimana ia berlaku, dan mengemas kini kaedah ramalan mereka berdasarkan hasil—pada skala yang jauh lebih besar daripada kemampuan manusia.
“Wawasan utama kami sebenarnya ialah meramalkan masa depan cenderung menjadi masalah yang boleh disahkan, kerana itulah cara manusia belajar, bukan?” kata Ben Turtel, Ketua Pegawai Eksekutif LightningRod, yang membangunkan AI untuk ramalan yang telah ditempatkan secara kompetitif dalam pertandingan AI Metaculus. Syarikat itu melatih model terkini mengenai soalan ramalan.
Latihan yang diterima oleh AI semakin terlihat dalam ranking. Pada bulan Jun, bot teratas, yang dibina oleh Metaculus di atas model penaakulan o1 OpenAI, menduduki tempat dalam piala. Kali ini, Mantic berada di tempat kelapan daripada 549 peserta—kali pertama bot menduduki 10 tempat teratas dalam siri pertandingan itu.
Keputusan itu harus diambil dengan berhati-hati, menurut Ben Wilson, seorang jurutera di Metaculus yang menjalankan perbandingan AI dan manusia mengenai cabaran ramalan. Peraduan itu mengandungi sampel yang agak kecil iaitu 60 soalan. Selain itu, kebanyakan 600 peserta adalah amatur, sesetengahnya hanya meramalkan beberapa soalan dalam pertandingan, menyebabkan mereka mempunyai skor yang rendah.
Akhir sekali, mesin mempunyai kelebihan yang tidak adil. Peserta memenangi mata bukan sahaja untuk ketepatan, tetapi juga “liputan”—berapa awal mereka membuat ramalan, berapa banyak soalan yang mereka ramalkan, dan berapa kerap mereka mengemas kini anggaran mereka. Sebuah AI yang kurang tepat daripada pesaing manusia masih boleh berprestasi baik dalam ranking dengan sentiasa mengemas kini anggarannya sebagai tindak balas kepada berita yang muncul, dengan cara yang tidak mungkin dilakukan oleh manusia.
Bagi Vassalo, kelebihan tidak adil AI menyelesaikan masalah terbesarnya yang masih ada: mendapatkan ramalan berkualiti tinggi merentasi semua soalan yang dia perlukan ramalan. “Saya sebenarnya tidak perlu ia mencapai tahap superforecaster,” katanya, menggunakan gelaran yang diberikan kepada peramal teratas. “Saya perlukan ia sebaik keramaian.”
Ini lebih sukar daripada kedengarannya: ramalan Komuniti Metaculus, agregat ramalan semua pengguna mengenai setiap soalan, adalah salah satu pelaku paling konsisten di platform. Jika ia adalah seorang individu, ia akan menduduki tempat keempat di laman web—begitulah kebijaksanaan orang ramai. Dalam Piala Suku Tahunan, Mantic ketinggalan lima tempat di belakang Ramalan Komuniti.
Peramal AI yang boleh dipercayai boleh menjejaki ratusan soalan secara serentak, membolehkan Vassalo mengerahkan peramal manusia terkemuka hanya untuk soalan-soalan yang dianggap oleh AI layak untuk penelitian lanjut.
“Satu perkara mengenai ramalan, atau analitik prediktif, adalah ia sokongan keputusan,” kata Manzotti. “Banyak kepimpinan akan membuang data jika mereka mempunyai firasat ke arah yang berbeza.” Itu adalah masalah yang tidak boleh diselesaikan oleh AI.
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.