Ingin ejen AI bekerja dengan lebih baik? Tingkatkan cara mereka mengambil maklumat, kata Databricks

(SeaPRwire) –   Halo dan selamat datang ke Eye on AI. Dalam edisi ini… meraih pasukan dan teknologi dari startup cip AI Groq… membeli Manus AI…AI menjadi lebih baik dalam meningkatkan AI…tetapi kita mungkin tidak cukup tahu tentang otak untuk mencapai AGI.

Selamat Tahun Baru! Banyak yang telah berlaku dalam AI sejak kita mengakhiri tahun ini tepat sebelum Krismas Eve. Kita akan cuba membuat anda terkini dalam bahagian Berita Eye on AI di bawah.

Sementara itu, seperti yang saya catatkan sebelum ini, 2025 sepatutnya menjadi tahun agen AI, tetapi kebanyakan syarikat menghadapi masalah untuk melaksanakannya. Apabila tahun itu hampir berakhir, kebanyakan syarikat terperangkap dalam fasa percubaan (pilot) untuk mencuba agen AI. Saya fikir itu akan berubah tahun ini, dan satu sebabnya ialah vendor teknologi sedang menyedari bahawa hanya menawarkan model AI dengan keupayaan agen tidak mencukupi. Mereka perlu membantu pelanggan mereka merekayasa keseluruhan aliran kerja sekitar agen AI—sama ada secara langsung, melalui jurutera yang ditempatkan ke hadapan yang bertindak sebagai perunding dan “sherpa kejayaan pelanggan”; atau melalui penyelesaian perisian yang memudahkan pelanggan melakukan kerja ini sendiri.

Langkah utama untuk memastikan aliran kerja ini betul adalah memastikan agen AI mempunyai akses kepada maklumat yang tepat. Sejak 2023, cara standard untuk melakukan ini adalah dengan sejenis proses RAG, atau generasi yang diperkuatkan pengambilan. Pada dasarnya, idea itu ialah sistem AI mempunyai akses kepada sejenis enjin carian yang membenarkannya mengambil dokumen atau data yang paling relevan dari sama ada sumber dalaman korporat atau internet awam dan kemudian model AI berdasarkan responsnya atau mengambil tindakan berdasarkan data itu, bukan bergantung pada apa-apa yang dipelajarinya semasa proses latihannya. Terdapat banyak alat carian yang berbeza yang boleh digunakan untuk sistem RAG—dan banyak syarikat menggunakan pendekatan hibrid yang menggabungkan pangkalan data vektor, khususnya untuk dokumen tidak berstruktur, serta carian kata kunci yang lebih tradisional atau bahkan carian Boolean yang lama.

Tetapi RAG bukanlah penawar ajaib dan proses AI RAG yang mudah masih boleh mengalami kadar ralat yang agak tinggi. Satu masalah ialah model AI sering menghadapi masalah untuk menterjemahkan prompt pengguna kepada kriteria carian yang baik. Satu lagi ialah walaupun carian dijalankan dengan baik, seringkali model gagal menapis dan menyaring data dengan betul dari carian awal. Ini kadangkala kerana terdapat terlalu banyak format data yang berbeza yang diambil, dan kadangkala kerana manusia yang memberi prompt kepada model AI tidak menulis arahan yang baik. Dalam beberapa kes, model AI itu sendiri tidak cukup boleh dipercayai dan mereka mengabaikan beberapa arahan.

Tetapi, kebanyakan masa, agen AI gagal bukan kerana agen “tidak dapat membuat alasan tentang data tetapi agen tidak mendapat data yang tepat pada mulanya,” , pengarah penyelidikan di Databricks memberitahu saya. Bendersky adalah veteran lama di , di mana dia bekerja pada kedua-dua Google Search dan untuk Google .

Databricks memperkenalkan ‘arkitektur’ pengambilan baru yang mengalahkan RAG

Hari ini, (dikenali dengan perisian analisis datanya) memperkenalkan arkitektur baru untuk agen AI yang diperkuatkan pengambilan yang dipanggil Instructed Retriever yang dikatakan menyelesaikan kebanyakan kelemahan RAG.

Sistem menterjemahkan prompt pengguna dan sebarang spesifikasi khusus yang model harus sentiasa pertimbangkan (seperti kemasukan dokumen atau sama ada produk mempunyai ulasan pelanggan yang baik) menjadi rancangan carian berbilang langkah untuk kedua-dua data berstruktur dan tidak berstruktur—dan, yang penting, metadata—untuk mendapatkan maklumat yang tepat kepada model AI.

Banyak daripada ini berkaitan dengan menterjemahkan bahasa semula jadi prompt pengguna dan spesifikasi carian kepada bahasa pertanyaan carian khusus. “Keajaiban terletak pada bagaimana anda menterjemahkan bahasa semula jadi, dan kadangkala ia sangat sukar, dan mencipta model yang sangat baik untuk melakukan terjemahan pertanyaan,” , CTO Databricks untuk rangkaian neural, berkata. (Tang adalah salah seorang pengasas MosaicML, yang Databricks pada 2023.)

Dalam satu set ujian penanda aras yang Databricks reka bentuk yang dikatakan mencerminkan kes penggunaan korporat dunia nyata yang melibatkan mengikuti arahan, carian khusus domain, penjanaan laporan, penjanaan senarai, dan carian PDF dengan susunan kompleks, arkitektur Instructed Retriever syarikat menghasilkan ketepatan 70% lebih baik daripada kaedah RAG yang mudah dan, apabila digunakan dalam proses agen berbilang langkah, memberikan peningkatan 30% berbanding proses yang sama yang dibina pada RAG, sementara memerlukan 8% kurang langkah secara purata untuk mencapai keputusan.

Meningkatkan keputusan walaupun dengan arahan yang tidak ditentukan dengan baik

Syarikat juga mencipta ujian baru untuk melihat bagaimana model boleh menangani pertanyaan yang mungkin tidak ditentukan dengan baik. Ia berdasarkan sebahagiannya pada set data penanda aras sedia ada dari Universiti Stanford yang dipanggil (Semi-structured Retrieval Benchmark). Dalam kes ini, Databricks melihat subset pertanyaan ini yang berkaitan dengan carian produk , dipanggil StaRK-Amazon, dan kemudian menambah set data ini dengan contoh tambahan. Mereka ingin melihat pertanyaan carian yang mempunyai syarat tersirat. Contohnya, pertanyaan, “find a jacket from FooBrand that is best rated for cold weather,” mempunyai beberapa kekangan tersirat. Ia mesti jaket. Ia mesti dari FoodBrand. Ia mesti jaket FooBrand yang mempunyai rating tertinggi untuk cuaca sejuk. Mereka juga melihat pertanyaan di mana pengguna mahu mengecualikan produk tertentu atau mahu agen AI hanya mencari produk dengan ulasan baru-baru ini.

Idea arkitektur Instructed Retriever adalah bahawa ia menukar syarat tersirat ini menjadi parameter carian yang eksplisit. Bendersky berkata terobosan di sini adalah bahawa Instructed Retriever tahu bagaimana menukar pertanyaan bahasa semula jadi menjadi satu yang akan memanfaatkan metadata.

Databricks menguji arkitektur Instructed Retriever menggunakan model AI GPT-5 Nano dan GPT-5.2 dari OpenAI, serta Claude-4.5 Sonnet dari Anthropic, dan kemudian juga model kecil yang diperhalusi dengan 4 bilion parameter yang mereka cipta khusus untuk menangani pertanyaan seperti ini, yang dipanggil InstructedRetriever-4B. Mereka menilai semua ini berbanding dengan arkitektur RAG tradisional. Di sini mereka mendapat skor antara 35% hingga 50% lebih baik dari segi ketepatan keputusan. Dan Instructed Retriever-4B mendapat skor yang hampir sama dengan model frontier yang lebih besar dari OpenAI dan Anthropic, sementara lebih murah untuk digunakan.

Seperti biasa dengan AI, mempunyai data anda di tempat yang tepat dan diformat dengan cara yang tepat adalah langkah pertama yang penting untuk kejayaan. Bendersky berkata Instructed Retriever harus berfungsi dengan baik selagi set data perusahaan mempunyai indeks carian yang merangkumi metadata. (Databricks juga menawarkan produk untuk membantu mengambil set data yang benar-benar tidak berstruktur dan menghasilkan metadata ini.)

Syarikat berkata bahawa Instructed Retriever tersedia hari ini kepada pelanggan ujian beta yang menggunakan produk Knowledge Assistantnya dalam platform pembinaan agen AI Agent Bricksnya dan harus berada dalam keluaran luas tidak lama lagi.

Ini hanyalah satu contoh jenis inovasi yang kita hampir pasti akan melihat lebih banyak tahun ini dari semua vendor agen AI. Mereka mungkin menjadikan 2026 sebagai tahun sebenar agen AI.

Dengan itu, berikut adalah lebih banyak berita AI.

Jeremy Kahn

@jeremyakahn

Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.

Sektor: Top Story, Berita Harian

SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.