[無偏見報導]Perplexity AI 爬蟲爭議：合規性挑戰，資訊自由與網路秩序的平衡。

[關鍵字]：Perplexity AI、AI 搜尋引擎、雲端運算、網路爬蟲、Cloudflare

[內文]：

近年來，人工智慧（AI）的發展日新月異，各種AI工具如雨後春筍般湧現。其中，Perplexity AI作為一款AI搜尋引擎，憑藉其獨特的優勢，正逐漸受到廣大用戶的青睞。它不僅整合了大型語言模型與即時網路搜索，更提供準確且附有來源引用的答案，尤其適合需要可靠信息的專業人士和學生使用。

Perplexity AI 擁有三大使用模式：Search（搜索）、Research（研究）和Labs（實驗室），滿足不同層次的需求。同時，它還提供四大資料來源，包括Academic（學術）、Finance（金融）、Web（網路）和Social（社交媒體），讓使用者可以針對不同需求調整 Focus 模式，確保來源具針對性。使用者甚至可以上傳 PDF、Word、PPT 等文件，讓 Perplexity AI 針對相關內容作分析，減少資訊噪音影響。

然而，就在 Perplexity AI 迅速發展的同時，也面臨了一些挑戰。雲端防護服務商 Cloudflare 指出，Perplexity AI 曾被發現以偽裝瀏覽器的未宣告爬蟲繞過 robots.txt 與 WAF 限制，抓取原本禁止擷取的內容。Cloudflare 認為，此舉不僅違背了網路共識，也衝擊了網站對合法爬蟲的基本信任機制。

針對 Cloudflare 的指控，Perplexity AI 則強調其「user-driven agent」只在用戶發出請求時才抓取內容，且僅用於當下回答，不會長期保存或訓練模型。他們認為 Cloudflare 將 AI 助理誤認為惡意 bot，會阻礙資訊自由流通。

這場爭論的核心，牽涉到 AI 搜尋引擎的資料抓取方式，以及網路爬蟲的合規性問題。Cloudflare 提出的「合規爬蟲五大原則」，包括透明、克制、明確目的、分工清楚和遵守規則，為網路爬蟲的行為劃定了明確的界限。

個人心得：

作為一個長期關注 AI 發展的科技愛好者，我認為這起事件提醒我們，在享受 AI 技術帶來的便利時，也要關注其可能帶來的倫理和法律問題。如何平衡創新與合規，如何在資訊爆炸的時代維護網路秩序，是我們必須共同面對的挑戰。

事件癥結點：

事件的癥結點，在於如何界定 AI 搜尋引擎的爬蟲行為是否合規。傳統的網路爬蟲會主動、大規模地抓取網頁內容，而 AI 助理則是在用戶請求時，臨時抓取並回應。兩者在資料抓取的方式和目的上存在差異，導致了對其合規性的不同看法。

參考資料與本文對照：

本文主要參考了 Yahoo Tech 的相關報導，報導中詳細介紹了 Perplexity AI 的功能、模式和應用場景，並提及了 Cloudflare 對其爬蟲行為的指控。

Yahoo Tech 的文章提供了 Perplexity AI 的基本介紹，以及其在學術研究、商業分析等方面的應用案例，這為我們了解 Perplexity AI 的功能提供了基礎。
文章中引述了 Cloudflare 對 Perplexity AI 的指控，以及 Perplexity AI 的回應，這幫助我們了解了事件的來龍去脈，並分析了其中的爭議點。
Cloudflare 提出的「合規爬蟲五大原則」，為我們提供了判斷網路爬蟲行為是否合規的依據。