Tarayıcı AI'nin bir sonraki savaş alanı haline geldiğinde, kim elenecek?

Yapay zekanın geleceği, web sayfalarında otonom olarak gezinebilen aracılarda yatmaktadır. Teknoloji şirketleri, web görevlerini otomatikleştirmek ve üretkenliği artırmak için tarayıcı proxy'lerinin geliştirilmesine yatırım yapıyor. Bu makale, Web3 yerel senaryolarının sunduğu kullanım durumlarını, mevcut zorlukları ve fırsatları araştırıyor. Bu makale Mario Chow ve Figo, @IOSG tarafından yazılmıştır ve BlockBeats tarafından derlenmiş, derlenmiş ve katkıda bulunulmuştur. OpenAI Sam Altman: Google Chrome'u satın almakla ilgileniyorum!) Katılımcı pazarlardaki en büyük tarayıcı savaşı) (Arka plan eklendi: Perplexity, Chrome tarayıcıyı satın almak için 34,5 milyar dolar teklif ediyor, AI arama motoru köleleri devlerle savaşıyor) Son 12 ayda, web tarayıcıları ve otomasyon arasındaki ilişki önemli ölçüde değişti. Neredeyse tüm büyük teknoloji şirketleri, kendi tarayıcı proxy (browser agent) oluşturmak için çabalıyor. 2024'ün sonundan itibaren bu eğilim daha belirgin hale geliyor: OpenAI, Ocak ayında Ajan modunu başlattı, Anthropic, Claude modeli için "bilgisayar kullanımı"nı yayınladı, Google DeepMind, Project Mariner'ı başlattı, Opera, proxy tarayıcısı Neon'u duyurdu ve Perplexity AI, Comet tarayıcısını başlattı. Sinyal açık: Yapay zekanın geleceği, web sayfalarında özerk olarak gezinebilen aracılarda yatıyor. Bu eğilim yalnızca tarayıcılara daha akıllı sohbet robotları eklemekle ilgili değil, aynı zamanda makinelerin dijital ortamla etkileşim kurma biçiminde temel bir değişimdir. Tarayıcı aracıları, web sayfalarını "gören" ve harekete geçen yapay zeka sistemleridir: bağlantılara tıklamak, formları doldurmak, sayfaları kaydırmak, metin girmek: tıpkı insan kullanıcılar gibi. Bu model, hala manuel olan veya geleneksel komut dosyası oluşturma için çok karmaşık olan görevleri otomatikleştirerek muazzam üretkenlik ve ekonomik değerin kilidini açmayı vaat ediyor. ▲ GIF demosu: AI tarayıcı aracısı iş başında: talimatları izleyin, hedef veri kümesi sayfasına gidin, otomatik olarak ekran görüntüleri alın ve gerekli verileri çıkarın. AI tarayıcı savaşını kim kazanacak? Hemen hemen tüm büyük teknoloji şirketleri ( ve ) kendi tarayıcı AI ajanlarını geliştiren bazı girişimler. İşte en temsili projelerden birkaçı: OpenAI – Ajan Modu OpenAI'nin Ajan modu ( daha önce Operatör olarak biliniyordu, Ocak 2025'te piyasaya sürüldü ) kendi tarayıcısına sahip bir AI ajanıdır. Operatörler, web formlarını doldurmak, yiyecek siparişi vermek, toplantılar planlamak gibi çeşitli tekrarlayan çevrimiçi görevleri yerine getirebilir: hepsi insanlar tarafından yaygın olarak kullanılan standart bir web arayüzü aracılığıyla. ▲ Yapay zeka ajanları, toplantıları profesyonel asistanlar gibi planlar: takvimleri kontrol edin, uygun zaman aralıklarını bulun, etkinlikler oluşturun, onaylar gönderin ve sizin için .ics belgeler oluşturun. Anthropic – Claude'un "Bilgisayar Kullanımı" 2024'ün sonunda Anthropic, Claude 3.5 için yeni bir "Bilgisayar Kullanımı ( Bilgisayar )Use" özelliğini tanıttı ve ona bilgisayarları ve tarayıcıları bir insan gibi çalıştırma yeteneği verdi. Claude ekrana bakabilir, imleci hareket ettirebilir, düğmelere tıklayabilir ve metin girebilir. Bu, geliştiricilerin Claude'un web sitelerinde ve uygulamalarda otomatik olarak gezinmesine izin vermesine olanak tanıyan, genel beta sürümüne giren türünün ilk büyük model proxy aracıdır. Anthropic, bunu web sayfalarındaki çok adımlı iş akışlarını otomatikleştirmek birincil amacı olan deneysel bir özellik olarak konumlandırıyor. Şaşkınlık – Comet AI girişimi Perplexity ( en iyi Soru-Cevap motoruyla tanınır ) Chrome'a yapay zeka destekli bir alternatif olarak 2025'in ortalarında Comet tarayıcısını piyasaya sürdü. Özünde Comet, geleneksel arama bağlantıları yerine anında Soru-Cevap ve özetler sağlayan (omnibox) URL çubuğuna yerleştirilmiş, sohbete dayalı bir yapay zeka arama motorudur. Buna ek olarak, Comet, siteler arasında rutin görevleri otomatikleştiren kenar çubuğunda yerleşik bir aracı olan yerleşik Comet Assistant'a sahiptir. Örneğin, açtığınız iletileri özetleyebilir, bir toplantı planlayabilir, tarayıcı sayfalandırmasını yönetebilir veya sizin adınıza web bilgilerine göz atabilir ve tarayabilir. Temsilcilerin bir kenar çubuğu arayüzü aracılığıyla mevcut web içeriğinden haberdar olmalarını sağlayan Comet, gezinmeyi yapay zeka asistanlarıyla sorunsuz bir şekilde harmanlamayı amaçlıyor. Tarayıcı proxy'lerinin gerçek dünyadaki uygulama senaryoları Bir önceki makalede, (OpenAI, Anthropic, Perplexity vb. gibi ) büyük teknoloji şirketlerinin farklı ürün formları aracılığıyla nasıl (browser tarayıcı proxy'lerine sahip olduğunu inceledik agents) İşlevsellik enjekte edin. Değerlerini daha sezgisel bir şekilde anlamak için, bu yeteneklerin gerçek dünya senaryolarında günlük yaşama ve kurumsal iş akışlarına nasıl uygulanabileceğine daha yakından bakabiliriz. Günlük Web Otomasyonu # E-ticaret ve Kişisel Alışveriş Çok pratik bir senaryo, alışveriş ve rezervasyon görevlerini bir acenteye devretmektir. Temsilciler, çevrimiçi alışveriş sepetinizi otomatik olarak doldurabilir ve sabit listelere göre sipariş verebilir veya birden fazla perakendecide en düşük fiyatları bulabilir ve ödeme işlemini sizin adınıza tamamlayabilir. Seyahat için, yapay zekadan aşağıdaki gibi görevleri gerçekleştirmesini isteyebilirsiniz: "Bana gelecek ay Tokyo'ya bir uçuş rezervasyonu yapın ( 800 ) doların altında bir ücret alın ve ücretsiz Wi-Fi'si olan bir otel rezervasyonu yapın." Acente tüm süreci ele alır: uçuş aramak, seçenekleri karşılaştırmak, yolcu bilgilerini doldurmak, otel rezervasyonlarını tamamlamak, tümü havayolu ve otel web siteleri aracılığıyla. Bu otomasyon seviyesi, mevcut seyahat robotlarının çok ötesine geçiyor: sadece tavsiye etmekle kalmıyor, aynı zamanda doğrudan satın alma işlemlerini de gerçekleştiriyor. # Ofis verimliliğini artırın: Proxy'ler, insanların tarayıcılarında yaptıkları tekrarlayan iş eylemlerinin çoğunu otomatikleştirebilir. Örneğin, e-postaları düzenleyin ve yapılacaklar listelerini çıkarın veya birden çok takvimdeki boşlukları kontrol edin ve toplantıları otomatik olarak planlayın. Perplexity'nin Comet asistanı, gelen kutunuzun içeriğini zaten özetleyebilir veya web arayüzü aracılığıyla sizin için bir gündem ekleyebilir. Temsilciler ayrıca düzenli raporlar oluşturmak, elektronik tabloları güncellemek veya sizin tarafınızdan yetkilendirildikten sonra form göndermek için SaaS aracında oturum açabilir. İş ilanı vermek için farklı iş panolarına otomatik olarak giriş yapabilen bir İK temsilcisi hayal edin; Veya CRM sistemi için müşteri adayı profilini güncelleyebilen bir satış temsilcisi. Bu sıradan görevler çalışanların çok fazla zamanını tüketirdi, ancak yapay zeka bunu web formlarını ve sayfa eylemlerini otomatikleştirerek yapabilir. Tek bir göreve ek olarak, aracılar birden çok ağ sisteminde eksiksiz iş akışlarını bağlayabilir. Bu adımların tümünün, tarayıcı aracısının gücü olan farklı web arayüzlerinde gerçekleştirilmesi gerekir. Temsilciler, sorun giderme için çeşitli panolarda oturum açabilir ve hatta yeni çalışanları işe alma ( birden çok SaaS sitesinde hesap ) oluşturma gibi süreçleri düzenleyebilir. Esasen, şu anda birden çok siteye tıklamayı gerektiren herhangi bir çok adımlı işlem bir aracı tarafından gerçekleştirilebilir. Günümüzün zorlukları ve sınırlamaları Potansiyele rağmen, günümüzün tarayıcı proxy'leri hala mükemmel olmaktan uzaktır. Mevcut uygulamalar, uzun süredir devam eden bazı teknik ve altyapı zorluklarını ortaya koymaktadır: Mimari uyumsuzluk Modern...

AGENT-3.41%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)