資料倉儲(Data lake/storage) 和 資料庫 (a database) 的主要差異

資料庫 (a database)

資料庫的核心是資料的容器,通常是用於目的在軟體之間的資料交換和使用電子方式存儲資料,
資料庫中的資料通常彼此通常具有關係和對應,儲存資料的類型也較為固定與局限,
其中的數據必須存儲在列、行和表中。

資料庫中的數據通常會不斷的調整,包含新增、更新、刪除和修改,適合實作單一目的性的功能。
以通常而言,數據庫的圖形用戶並不是必需的,使用者需要對 SQL 等查詢語言有紮實的理解才能瀏覽數據。

Example
  • PostgreSQL
  • MongoDB
  • Redis
  • Elasticsearch

資料倉儲(Data lake/storage)

資料倉儲是一個包含大量原始數據的大型存儲系統,可接受各種格式的檔案進行儲存。
相較於資料庫,資料倉儲具有更靈活的能力。

數據湖旨在存儲任何類型的文件,例如圖片、視頻和文件,
特別是當我們需要在一個地方存儲大量數據時,我們希望構建一個數據湖。
數據湖中存儲的數據通常獨立於數據湖的其他對象。

對於實際構建數據倉庫的公司來說,數據湖是一個長期存儲所有數據的地方,直到下載或是轉存到資料庫才會啟動後續程序。
中小型組織可能幾乎沒有理由自建或自行管理一個資料倉儲系統。

Example
  • Hadoop
  • Azure
  • Amazon S3

Reference

youtube – Database vs Data Warehouse vs Data Lake | What is the Difference?
Data Storage Explained: Data Lake vs Warehouse vs Database

Add a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *