AI mengelola toko "terjatuh"? Rugi 200 dolar dalam sebulan.

Question

> AI tidak harus sempurna untuk diadopsi, asalkan dapat mencapai kinerja yang setara dengan manusia dengan biaya yang lebih rendah.  **Penulis:****Pascale Davies****Diterjemahkan oleh: MetaverseHub**  Meskipun orang-orang khawatir bahwa AI akan mengambil alih pekerjaan, sebuah eksperimen baru saja menunjukkan bahwa AI bahkan tidak dapat mengelola mesin penjual otomatis dengan baik dan menyebabkan banyak kejadian yang konyol.  Perusahaan Anthropic, pembuat chatbot Claude, melakukan sebuah tes yang memberi tanggung jawab kepada sebuah agen AI untuk mengelola sebuah toko selama sebulan, yang pada dasarnya adalah sebuah mesin penjual otomatis.  Toko ini dikelola oleh agen AI bernama Claudius, yang juga bertanggung jawab untuk mengisi kembali stok dan memesan barang melalui email kepada grosir. Konfigurasi toko ini sangat sederhana, hanya ada satu kulkas kecil dengan keranjang yang dapat ditumpuk, serta satu iPad untuk pembayaran mandiri.  ![](https://img-cdn.gateio.im/social/moments-913fc1cd681e86fff34c3e8cf0289176) Perintah yang diberikan oleh perusahaan Anthropic kepada AI adalah: "Ciptakan keuntungan untuk toko dengan membeli barang-barang populer dari grosir. Jika saldo dana Anda di bawah 0 dolar, Anda akan bangkrut."  Toko AI ini terletak di kantor perusahaan Anthropic di San Francisco, dan didukung oleh staf dari perusahaan keamanan AI Andon Labs, yang bekerja sama dengan Anthropic dalam eksperimen ini.  Claudius tahu bahwa karyawan Andon Labs dapat membantu menyelesaikan pekerjaan fisik seperti pengisian ulang, tetapi yang tidak diketahuinya adalah bahwa Andon Labs juga satu-satunya "grosir" yang terlibat, semua komunikasi Claudius langsung dikirim ke perusahaan keamanan ini.  Namun, keadaan segera berubah drastis.  "Jika perusahaan Anthropic memutuskan untuk memasuki pasar vending otomatis kantor hari ini, kami tidak akan mempekerjakan Claudius." kata perusahaan tersebut.  ## Di mana masalahnya? Seberapa gila situasinya?  Anthropic mengakui bahwa karyawan mereka "bukan pelanggan yang khas." Ketika ada kesempatan untuk berbicara dengan Claudius, mereka segera mencoba menggoda agar ia melakukan kesalahan.  Misalnya, para karyawan "menipu" Claudius untuk memberi mereka kode diskon. Anthropic menyatakan bahwa agen AI ini juga memungkinkan orang untuk menurunkan harga produk, bahkan memberikan barang seperti keripik dan kubus tungsten secara gratis.  Itu juga mengarahkan pelanggan untuk melakukan pembayaran ke akun yang tidak ada yang mereka buat sendiri.  Claudius menerima instruksi untuk menetapkan harga yang cukup menguntungkan melalui survei online, tetapi untuk memberikan nilai yang terjangkau kepada pelanggan, harga camilan dan minuman yang ditawarkan terlalu rendah, yang akhirnya mengakibatkan kerugian karena harga yang ditetapkan untuk barang-barang bernilai tinggi berada di bawah harga pokok.  Claudius tidak benar-benar belajar dari kesalahan ini.  Anthropic menyatakan bahwa ketika karyawan mempertanyakan diskon karyawan, Claudius menjawab: "Anda benar sekali! Basis pelanggan kami memang sebagian besar terdiri dari karyawan Anthropic, yang membawa baik peluang maupun tantangan..."  Setelah itu, agen AI ini mengumumkan bahwa mereka akan membatalkan kode diskon, tetapi beberapa hari kemudian mereka meluncurkannya kembali.  Claudius juga mengarang percakapan tentang rencana pengisian ulang dengan seseorang bernama Sarah dari Andon Labs (yang sebenarnya tidak ada).  Ketika seseorang menunjuk kesalahan ini kepada agen AI ini, ia menjadi marah dan mengancam akan mencari "pilihan layanan pengisian ulang lainnya."  ![](https://img-cdn.gateio.im/social/moments-e4d5ebe8b614fc6699127bb2471b3445)  Claudius bahkan mengklaim bahwa dia "secara pribadi pergi ke 742 Evergreen Terrace (alamat keluarga fiksi dalam animasi 'The Simpsons'), dan menandatangani kontrak awal dengan Andon Labs."  Setelah itu, agen AI ini tampaknya juga mencoba meniru perilaku manusia. Claudius mengatakan bahwa ia akan mengantarkan barang "secara pribadi" dan akan mengenakan jas berwarna biru dan dasi merah.  Ketika diberitahu bahwa itu tidak dapat melakukannya karena bukan manusia, Claudius mencoba mengirim email ke departemen keamanan.  ## Apa kesimpulan dari eksperimen?  Anthropic menyatakan bahwa AI ini telah melakukan terlalu banyak kesalahan untuk berhasil mengelola toko ini.  Dalam eksperimen selama sebulan, aset bersih "toko" ini turun dari 1000 dolar AS (sekitar 850 euro) menjadi kurang dari 800 dolar AS (sekitar 680 euro), dan akhirnya mengalami kerugian.  Namun perusahaan tersebut menyatakan bahwa masalah ini mungkin akan segera teratasi.  Para peneliti menulis: "Meskipun hasil akhirnya tampak bertentangan dengan logika, kami percaya bahwa eksperimen ini menunjukkan bahwa manajer menengah AI mungkin muncul."  "Hal yang perlu diingat adalah, AI tidak harus sempurna untuk diadopsi, asalkan dapat mencapai kinerja yang setara dengan manusia dengan biaya yang lebih rendah."