[關鍵字]:Perplexity AI、AI 搜尋引擎、雲端運算、網路爬蟲、Cloudflare
[內文]:
近年來,人工智慧(AI)的發展日新月異,各種AI工具如雨後春筍般湧現。其中,Perplexity AI作為一款AI搜尋引擎,憑藉其獨特的優勢,正逐漸受到廣大用戶的青睞。它不僅整合了大型語言模型與即時網路搜索,更提供準確且附有來源引用的答案,尤其適合需要可靠信息的專業人士和學生使用。
Perplexity AI 擁有三大使用模式:Search(搜索)、Research(研究)和Labs(實驗室),滿足不同層次的需求。同時,它還提供四大資料來源,包括Academic(學術)、Finance(金融)、Web(網路)和Social(社交媒體),讓使用者可以針對不同需求調整 Focus 模式,確保來源具針對性。使用者甚至可以上傳 PDF、Word、PPT 等文件,讓 Perplexity AI 針對相關內容作分析,減少資訊噪音影響。
然而,就在 Perplexity AI 迅速發展的同時,也面臨了一些挑戰。雲端防護服務商 Cloudflare 指出,Perplexity AI 曾被發現以偽裝瀏覽器的未宣告爬蟲繞過 robots.txt 與 WAF 限制,抓取原本禁止擷取的內容。Cloudflare 認為,此舉不僅違背了網路共識,也衝擊了網站對合法爬蟲的基本信任機制。
針對 Cloudflare 的指控,Perplexity AI 則強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。他們認為 Cloudflare 將 AI 助理誤認為惡意 bot,會阻礙資訊自由流通。
這場爭論的核心,牽涉到 AI 搜尋引擎的資料抓取方式,以及網路爬蟲的合規性問題。Cloudflare 提出的「合規爬蟲五大原則」,包括透明、克制、明確目的、分工清楚和遵守規則,為網路爬蟲的行為劃定了明確的界限。
個人心得:
作為一個長期關注 AI 發展的科技愛好者,我認為這起事件提醒我們,在享受 AI 技術帶來的便利時,也要關注其可能帶來的倫理和法律問題。如何平衡創新與合規,如何在資訊爆炸的時代維護網路秩序,是我們必須共同面對的挑戰。
事件癥結點:
事件的癥結點,在於如何界定 AI 搜尋引擎的爬蟲行為是否合規。傳統的網路爬蟲會主動、大規模地抓取網頁內容,而 AI 助理則是在用戶請求時,臨時抓取並回應。兩者在資料抓取的方式和目的上存在差異,導致了對其合規性的不同看法。
參考資料與本文對照:
本文主要參考了 Yahoo Tech 的相關報導,報導中詳細介紹了 Perplexity AI 的功能、模式和應用場景,並提及了 Cloudflare 對其爬蟲行為的指控。
- Yahoo Tech 的文章提供了 Perplexity AI 的基本介紹,以及其在學術研究、商業分析等方面的應用案例,這為我們了解 Perplexity AI 的功能提供了基礎。
- 文章中引述了 Cloudflare 對 Perplexity AI 的指控,以及 Perplexity AI 的回應,這幫助我們了解了事件的來龍去脈,並分析了其中的爭議點。
- Cloudflare 提出的「合規爬蟲五大原則」,為我們提供了判斷網路爬蟲行為是否合規的依據。
參考閱讀
Perplexity AI 全攻略|三大模式使用懶人包、白領與學生實用指南,Yahoo Tech • 2 小時前
PerplexityAI全攻略|三大模式使用懶人包、白領與學生實用指南,Yahoo Tech
只認識ChatGPT就落伍了!上班族都改用PerplexityLabs:工作效率翻倍,準時下班不是夢!,Yahoo特別企劃
Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」,數位時代 via Yahoo奇摩新聞
Perplexity被抓包「偷偷爬站」!Cloudflare:刻意繞過封鎖、偽裝成 Google Chrome,T客邦
蘋果加碼AI投資!庫克證實將擴大支出與收購大型人工智慧企業,鉅亨網