SaaS多租戶應用程序與數(shù)據(jù)庫數(shù)據(jù)隔離方案設計與選擇
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
![]() 軟件即服務 (Software as a service,SaaS) 是一種通過互聯(lián)網(wǎng)按需交付軟件應用程序的方法,通常采用訂閱方式。借助 SaaS,云服務提供商 (CSP) 可以托管和管理應用程序軟件和底層基礎設施,保證系統(tǒng)的可靠性。用戶可以通過手機或電腦上的網(wǎng)絡連接到應用程序。 通俗地講,就是將用戶的服務器相關硬件、操作系統(tǒng)、應用程序搬到云上,讓軟件提供商來維護。SaaS的優(yōu)勢多用于ToB的業(yè)務,將客戶本地部署的系統(tǒng)遷移到云上,方方便客戶的同時,軟件提供商也創(chuàng)新了盈利模式。 SaaS對客戶來說有什么優(yōu)勢呢?
客戶本地數(shù)據(jù)遷移到云上或者直接訂閱使用云上產品,不可避免需要關注數(shù)據(jù)的安全隔離。使用單租戶模式還是實現(xiàn)多租戶數(shù)據(jù)共存與訪問,企業(yè)在系統(tǒng)設計之初必須規(guī)劃多租戶的架構解決方案。 我們了解下租戶概念:
相信大家也有個疑問,在多租戶場景中,為什么要進行用戶數(shù)據(jù)隔離?操作數(shù)據(jù)時加條件篩選不也可以嗎?如下查詢:
如果開發(fā)者在某個地方漏掉 tenant_id 條件,可能出現(xiàn)以下問題:
通過數(shù)據(jù)隔離,上述問題就可以完全避免。盡管在操作數(shù)據(jù)時加條件在一定程度上可以實現(xiàn)多租戶數(shù)據(jù)的隔離,但它存在明顯的安全問題。在實際場景中,數(shù)據(jù)隔離通常是通過物理或邏輯上的手段綜合實現(xiàn)的,具體包括分庫分表、分區(qū)、租戶標識符控制等方式。 多租戶場景之所以要數(shù)據(jù)隔離,完全是出于數(shù)據(jù)安全與隱私保護。數(shù)據(jù)隔離可以降低數(shù)據(jù)泄露潛在風險、增強用戶對企業(yè)系統(tǒng)的信任、符合隱私法規(guī)(如GDPR、CCPA等)。 多租戶的架構中,最常見的方案主要有四種:
接下來,我簡單介紹這幾種方案的優(yōu)劣情況和使用場景。
優(yōu)點:
缺點:
場景:
優(yōu)點:
缺點:
場景:
優(yōu)點:
缺點:
場景:
優(yōu)點:
缺點:
場景:
在設計有效的多租戶數(shù)據(jù)庫時,必須仔細平衡數(shù)據(jù)隔離、可擴展性、性能和安全性。對于成功運行的多租戶系統(tǒng),每一個要素都至關重要。隨著租戶數(shù)量的增加,數(shù)據(jù)庫需要具有可擴展性,以便處理增加的負載。為了保證數(shù)據(jù)庫能夠快速有效地訪問數(shù)據(jù),性能至關重要。對于這些應用程序,需要考慮實時數(shù)據(jù)訪問。 租戶數(shù)據(jù)庫的設計方案,需要結合自身的業(yè)務選型。在數(shù)據(jù)庫方面,實現(xiàn)數(shù)據(jù)隔離主要有數(shù)據(jù)庫、schema、行級這三種。當然也有分區(qū)模式和混合模式。 這三個方案會面臨的問題,我簡單總結如下: 通常SaaS場景下的單個租戶數(shù)據(jù)量不會太大,一般從幾十MB至幾十GB。新方案初期難確定容量大小,當服務器性能無法滿足時,再新增服務器分配新租戶來使用。因此設計數(shù)據(jù)庫的時候,需要一個專門存儲租戶信息的數(shù)據(jù)庫,該數(shù)據(jù)庫用于管理租戶、同時也記錄該租戶數(shù)據(jù)所在的數(shù)據(jù)庫連接信息。 如果明確租戶增長不會太大,且業(yè)務功能的使用也不同(較多表可能存在數(shù)據(jù)傾斜),數(shù)據(jù)量都是幾十GB的,推薦使用數(shù)據(jù)庫隔離模式。我們可以將幾十個數(shù)據(jù)庫放在同一個實例中,有效利用計算資源。數(shù)據(jù)庫隔離模式也適合schema隔離模式,當然需要考慮上面提到面臨的問題。 當租戶數(shù)量達成千上萬的時候,或者未來租戶數(shù)能達到這個量級,數(shù)據(jù)庫隔離模式就不必再考慮了,schema隔離模式確實可以考慮。能使用schema模式的常見關系型數(shù)據(jù)庫,如Oracle、SQL Server、PostgreSQL,但如果使用 PostgreSQL 的多schema隔離模式,autovacuum 可能會頻繁執(zhí)行,將是比較大的性能問題! 當上萬的租戶、或者數(shù)據(jù)量少的租戶,推薦使用行級隔離。行級隔離的基本原理是,當用戶操作數(shù)據(jù)庫表時,系統(tǒng)判斷是否是某個租戶的數(shù)據(jù),必須在連接會話中獲取能識別租戶的信息,如租戶賬號、租戶ID等。獲取到的信息需要與表中的行數(shù)據(jù)進行篩選匹配,如匹配表中字段tenant_id中的值,這樣操作的數(shù)據(jù)只能是該連接的租戶數(shù)據(jù)。 行級隔離不是簡單地加where條件篩選指定的租戶,因為無法不免有漏掉條件的可能。使用行級別安全(Row Level Security,RLS),即使不加租戶相關條件,租戶也只能操作自己的數(shù)據(jù),達到租戶之間的數(shù)據(jù)安全隔離。目前Oracle、SQL Server、PostgreSQL 等都支持行級別安全。 使用RLS也可能存在數(shù)據(jù)傾斜,導致數(shù)量差異大的租戶操作SQL的執(zhí)行計劃不準確,該如何處理呢?前面提到過混合場景和分區(qū)方案就是其中的解決方案。數(shù)據(jù)庫少的租戶可使用RLS方案,數(shù)據(jù)量大的租戶可以使用數(shù)據(jù)庫或schema方案。另外還可以使用分區(qū)方案,分區(qū)方案只是輔助RLS解決數(shù)據(jù)傾斜問題,不作為正式的租戶隔離方案。對于數(shù)據(jù)量大的租戶,可以將表進行分區(qū),一個或多個分區(qū)存儲大租戶的數(shù)據(jù),另一個分區(qū)存儲數(shù)據(jù)量少的租戶。 我這里介紹兩種案例:
SQL Server有真正的行級隔離方案,但這里我介紹的是另一種非正式的隔離方案,可以說也是一種通用方案,在其他數(shù)據(jù)庫都可以實現(xiàn)。 該方案在視圖中添加where條件,識別當前上下文環(huán)境的登錄用戶ID,到表中進行篩選。以下是一個完整的簡單示例。
應用程序只操作視圖,每張視圖背后都對應一張表。由于視圖已經(jīng)隔離了用戶數(shù)據(jù),任何用戶都不可能操作其他用戶的數(shù)據(jù)。如果表結構發(fā)生變化,可以通過存儲過程sp_refreshview刷新視圖定義。這是我以前公司用的一種租戶隔離方案,類似RLS。當前你也可以使用SQL Server 官方真正的“行級別安全性(RLS)”設計租戶隔離。
另一個實際的案例就是PostgreSQL的“行級安全策略(RLS)”。每張表都存在字段tenant_id,存儲租戶id,租戶id的管理可以從平臺數(shù)據(jù)庫中獲取。
我們定義策略參數(shù)app.tenant_id,當租戶連接數(shù)據(jù)庫時,需要設置app.tenant_id的值。當訪問表的時候,rls策略將獲取上下文信息app.tenant_id的參數(shù)值,相當于將“tenant_id=?” 拼接到where條件中,與前面的“SQL Server 使用視圖進行行級隔離”有相似之處。 數(shù)據(jù)庫級別與schema級別的數(shù)據(jù)隔離比較好理解,對租戶來說隔離性好,但不適合大量租戶的情況。一個企業(yè)的租戶數(shù)據(jù)量差異比較大,這就需要考慮產品是否真的符合租戶的業(yè)務場景。也就是說,企業(yè)內部需要對發(fā)布多個版本或多個產品滿足不同的客戶需求,在多租戶的數(shù)據(jù)庫設計方面也評估使用不同的數(shù)據(jù)隔離方案。 我們除了在數(shù)據(jù)庫選型、租戶架構選型之外,也要考慮云資源成本??蛻臬@取成本、 客戶生命周期價值、月度經(jīng)常性收入、 客戶流失率 是SaaS提供商特別關注的一些關鍵績效和業(yè)務指標。這些指標對于業(yè)務優(yōu)化和增長至關重要,并且它們提供了SaaS公司財務狀況的全面概覽。針對租戶資源的成本占比、租戶均值成本等,評估租戶開銷是否超出了計劃。 閱讀原文:https://mp.weixin.qq.com/s/Ba_KqWY5a_SAKN4RvPqH5Q 該文章在 2025/1/25 9:13:25 編輯過 |
關鍵字查詢
相關文章
正在查詢... |