近年來,數據安全事件頻發,業務數據不可見、不可視,導致業務數據被第三方利用、泄露的風險長期存在且無解。同時,隨著監管力度的加大,數據安全處罰事件逐年變多,2023年更是呈現出爆發式增長的趨勢。
在這樣的背景下,數據安全建設顯得尤為重要。但目前市場中諸多數據安全相關的產品與方案同質化嚴重,依然延續老方法和舊邏輯,如人工打標、手動分類,這無異於拿著「舊藥方」治「頑疾」,市場上真正能有效解決數據安全難題的「良方」仍顯稀缺。
壓住數據安全的「三大頑疾」
在數據安全頂層規劃方面,全球及國內頂尖權威機構,諸如Gartner與信通院,已確立了系統的方法論。這些機構一致強調,數據安全本質上是一個流程驅動的領域,它呼喚跨角色、跨部門的緊密協作,並深度融入業務營運之中。
然而,當前的數據安全在落地實施方面卻面臨三大核心難題:
這三個長期懸而未決的挑戰,正是許多組織在初步實施數據安全方案後未能取得預期成效的關鍵所在。
傳統單純依靠人工的數據分類分級方式不僅效率極低,還容易因個體主觀判斷有差異,導致實際套用中準確率低,無法長期持續套用;為提質增效,市面上出現了許多針對數據安全的解決方案,如運用NLP小模型對數據進行理解,輔助人工進行分類分級。
但傳統NLP小模型需要大量客戶側數據來做訓練,且對於業務數據的理解能力很差,盡管能夠一定程度上提升效率,最終依然需要大量人工進行校驗和判斷。
更為關鍵的是,無論是純人工還是小模型+人工的解決方案,都僅局限於對資料庫中結構化數據的處理,即便完成分類,其套用場景也極為有限,主要支持少數合規需求,如數據脫敏和數據目錄報送等。然而,真正的數據風險往往潛藏於數據的實際使用和流動過程中,對流動數據的辨識和對數據安全使用風險的監測,是傳統方案所無法解決的「頑疾」。
以例項說明:即便透過靜態分類,在資料庫中已辨識出10G的敏感數據,但對於這些數據當前正被哪些應用程式和API呼叫及使用,傳統方法卻無能為力,使得這部份資訊的可見性和控制力幾乎為零。
安全GPT:用大模型「重塑」數據安全建設
面對傳統小模型所無法解決的數據理解和辨識問題,大模型技術提供了全新的思路。
大模型本身屬於自然語言模型,非常擅長對文本數據理解能力,在數據辨識以及風險推理上具備天然優勢。但大模型的訓練和微調需要結合大量的行業數據、數據安全風險案例等,更需要大量的技術研發投入和AI套用能力的沈澱,所以盡管大模型技術在各行業百花齊放,然而套用在數據安全領域的大模型卻沒有出現。
2023年5月18日,網路安全領域的頭部廠商深信服率先推出業界首款安全大模型——安全GPT,在今年9月最新釋出的4.0版本中,深信服憑借多年沈澱的行業數據和數據安全風險案例,推出了數據安全大模型,不僅實作動靜態數據分類分級,更率先實作了流動數據的辨識和數據風險自動研判分析,全面推動了數據安全的新變革,重塑數據安全管理與監測的解決方案。
深信服安全GPT 4.0 數據安全大模型可自動化完成資料庫靜態數據以及API等流動數據分類分級工作,與傳統小模型相比,分類分級的準確率從60%提升到了90%,效率提升了40倍,人工只需設定分類標準,打標過程全部模型自動化完成。
不僅如此,數據大模型還實作了動靜態數據的整體分類與流動可視,可以分鐘級完成任意數據的使用調查,幫助企業快速定位數據以及掌握數據使用情況,並可針對性預防和調整核心數據的使用,確保核心數據的安全。
除了數據的自動分類分級,深信服安全GPT數據安全大模型還能實作自動監測異常行為和數據風險自動研判分析。安全GPT強大的分析研判能力得益於研發團隊收集了內部大量的數據安全風險相關的分析案例,為安全GPT做了大量的訓練和微調,從而實作上下文關聯,有效區分正常的業務行為和真正的數據安全風險,並輸出詳細的研判分析過程,極大降低研判分析難度。
在數據泄露、數據濫用、違規數據出境和超範圍處理數據四種典型的攻擊場景,安全GPT數據安全大模型檢出率高達90%,準確率達70%,為有效啟用數據潛能和釋放數據價值帶來堅實保障。
AI賦能,深信服為新質生產力護航
作為最早探索人工智慧與安全融合的廠商,深信服早在2016年就投入到機器學習、深度學習在網路安全領域中的套用,隨著2022年AI大模型的崛起,深信服也躬身入局,采用「大模型+數據+安全和演算法專家」的思路,憑借在大模型等AI技術領域的積累、安全領域數據的積累、場景化的落地等綜合能力,全力打造安全GPT,並在政府、醫衛等多個行業獲得廣泛套用。
如今,深信服又將大模型套用在數據安全領域,帶來安全GPT數據安全大模型,有望徹底重塑企業與組織的數據安全建設,並帶來全新的使用體驗,真正為發展新質生產力保駕護航。
其一,深信服安全GPT采用新思路、新技術,率先響應了組織與企業在動態數據分類分級、流轉可視和風險檢測方面的需求,真正幫助組織與企業實作數據在生產域、套用域、流通域的安全保障,完成AI時代數據安全新技術與新需求的完美對接。
其二,深信服安全GPT徹底重塑數據安全產品與方案的使用體驗,推動數據安全「人機共智」時代的到來。過去,依靠人工進行數據分類分級、數據與模版匹配、數據使用調查、數據可視,效率不足且準確率低;如今,在安全GPT的加持下,基於大模型強大的自然語言理解和語意分析能力,企業能以數十倍的效率完成動靜態數據的分類分級,並且能夠高效進行數據調查與可視、風險智慧分析研判。
其三,深信服安全GPT讓組織與企業真正看到和感受到安全大模型在數據安全領域的核心價值,這對於組織與企業後續全面擁抱人工智慧與安全融合的趨勢有著重要意義。
截至目前,深信服安全GPT已在超400家企事業單位真實環境測試和套用,覆蓋政府、能源、金融等各行業。
綜合觀察,【「數據要素X」三年行動計劃(2024-2026)】已然全面啟動,千行百業紛紛AI技術為抓手,以求充分釋放數據要素的潛能,而數據安全則成為必不可少的條件。深信服憑借前瞻性的布局、創新的技術、全新的思路打造出安全GPT,並將安全GPT成功套用到數據安全領域,解決數據安全過去依賴人工的困境,為千行百業的使用者們實作「安全領先一步」。