构建安全可信的数据治理生态
2023年5月,包括“ChatGPT之父”山姆·奥特曼(Sam Altman)在内350位AI领域权威人士签署了一封联名公开信,信中写道:“应将缓解AI导致的灭绝风险,与其他社会规模风险(如大流行病和核战争)等同重视,作为全球优先事项。”
“人工智能凸显了数据的重要性,再创造一个全球性的治理框架,建立互信是最重要的因素。”新加坡资讯通信媒体发展局局长柳俊泓在论坛发言中指出,对数据和AI的信任,是在数字时代平衡保护和创新的基础。
论坛期间,不少专家在讨论中提到了一个词——可信AI,该词的核心就是AI大模型的安全问题。“我们必须认识到数据安全是永远的命题,一定要‘安全可信’。”中国工程院院士沈昌祥在论坛上表示,要用主动免疫可信计算筑牢人工智能安全防线。
在他看来,数据安全治理需要做到全程管控,实现六个“不”:首先让进攻者“进不去”,进去后“拿不到”数据,即使进攻者拿到数据也白拿,因为数据被加密“看不懂”,并且系统带有自动免疫功能,让进攻者“改不了”数据。同时,需要保证设备“瘫不了”,能在发现故障后及时采取措施确保稳定运行,最后是确保攻击行为可追溯“赖不掉”。
“达到这六个‘不’的效果,才能使得数据安全治理达到有效的目标。”沈昌祥介绍,经过30多年的发展,我国已经构建了比较完整的新型产业空间。他表示,目前,中国已经具备可信计算功能的国产CPU,嵌入式可信芯片及可信根,具备可信计算3.0技术的设备。
除了可信计算,一系列前沿技术也为构建安全可信的数据治理生态提供支持。香港科技大学首席副校长、英国皇家工程院院士郭毅可认为,在增强数据安全上,区块链和量子密码学等技术有较大应用前景。
“区块链有透明和不可更改的技术特性。”郭毅可说,将区块链技术应用在数据安全治理领域,能在确保数据完整性的同时,进一步降低数据授权风险和数据篡改风险。他还提到,可以通过数据匿名化技术、用户同意和隐私设计规则,以及实施数据分类、访问控制和加密等方法,保护知识产权和防止未经授权的数据披露。
在郭毅可看来,加密技术能保护数据在静止和传输过程中的安全。此外,还可以利用差分隐私、数据屏蔽等匿名化技术来删除个人身份信息,以确保数据的机密性,同时保留其对AI模型训练的有用性。
“用魔法(即AI技术)打败魔法”,这是刘前伟提出的AI时代数据安全治理的一大出路。在论坛上关于AI数据安全治理相关技术路径的讨论中,隐私计算、联邦学习等被反复提及。
除了问题,AIGC也为数据治理提供了新的、更有效的手段。欧洲科学院院士、清华大学人工智能研究院常务副院长孙茂松提到,现在数据里面有很多隐私问题,但可以用生成式人工智能(AIGC)生成符合真实情况的数据,同时规避掉用户真实的隐私数据。“所以,实际上生成式人工智能对我们数据治理也有非常重要的正面推动作用。”