SAS 在 SAS Innovate 2024 發表 Data Maker
SAS 在 SAS Innovate 2024 發表 Data Maker
SAS 在今年的年度大會 SAS Innovate 2024 上發表了 Data Maker,這是一個專為企業設計的工具,用於生成數據以訓練專門的 AI 模型。為了進一步加強這項技術,SAS 最近收購了英國合成數據公司 Haze 的核心軟件資產。這一收購將使企業客戶能夠安全且高效地生成難以大量搜集的數據。
數據在 AI 發展中的重要性
數據是推動 AI 發展的重要資源,然而,由於涉及隱私等因素,企業往往無法獲得大量真實數據來訓練 AI 模型。特別是在醫療保健和金融等受到嚴格隱私規管的行業,這一問題尤為突出。
合成數據的崛起
隨著數據需求的增加,業界開始開發合成數據技術。這種技術僅使用少量數據來模擬真實數據的統計模式,同時又不帶有可識別的個人資訊,從而生成大量類似的數據來訓練 AI 模型。近年來,生成式 AI 的進步使得這種模擬更加準確。
合成數據帶來的競爭優勢
1. 尋找創新機會:運用合成數據集可以發現新的創新機會。
2. 加快產品上市時間:合成數據可以加速產品的開發和上市。
3. 可信的 AI 系統:合成數據有助於建立更可信的 AI 系統。
4. 提升數據隱私和安全:合成數據不包含個人資訊,有助於保護隱私。
5. 降低成本:使用合成數據可以降低數據收集和處理的成本。
SAS 收購 Haze 的影響
SAS 收購英國公司 Haze 的軟件資產後,將會將其整合到 SAS Viya 平台的 Data Maker 中,進一步加強該方案的合成數據能力。預計在 2025 年初,這一整合將會發表初步預覽。
Data Maker 的進一步發展
SAS 在今年初已經發表了 Data Maker,該工具不僅能夠生成大量數據,還能通過品質評分來監控數據的質量。
未來展望
SAS 技術總監 Bryan Harris 引用數據分析員的預測,指出到 2026 年,將有 75% 的企業會使用生成式 AI 來建立合成客戶數據,而 2023 年這一比例還不到 5%。引入合成數據將使企業能夠解決數據問題,利用以往因可用性、存取限制或數據質量等問題而無法觸及的數據資源。
結語
隨著合成數據技術的進步,企業將能夠更有效地訓練 AI 模型,並在保護隱私的前提下推動創新。SAS 的這一收購和技術整合將進一步推動這一趨勢的發展。