“隐语”是开源的可信隐私计算框架,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制。
开源项目:
https://github.com/secretflow
https://gitee.com/secretflow
本文根据厦门大学信息学院教授 罗晔,在1月20日北京「隐语开源社区嘉年华」的演讲分享整理。
非常感谢隐语小伙伴的邀请,很开心今天在活动现场见到了一些老朋友,也见到一些新朋友。我今天的报告主要围绕隐语和学研生态的共建初探。
自我介绍
我是罗晔,2004年在清华大学相继取得了本科和硕士学位之后,又在佐治亚理工学院取得了电子工程和数学的双博士学位。随后,我在莱斯大学的数学系执教三年。2017年,我回国加入了厦门大学信息学院。目前,我的研究主要集中在密码学应用、隐私计算和机器学习等领域。
关于学研生态共建
2023年7月,当时隐语团队联系到我,希望能够在这方面展开合作。我们认为这对于高校的人才培养具有重要意义,因此给予了积极响应。基于厦门大学信息学院的网络空间安全专业的学科建设,去年8月,我们再次与隐语团队进行了深入讨论,从开源技术、人才培养和跨学科课题等多个角度进行了广泛探讨。
在过去的半年时间里,我们依托网络空间安全专业的教学计划,与隐语展开紧密合作。例如,在大二上学期,学生在完成专业分流后,首先接触的是“网络安全导论”和“密码学”课程,我都有幸参与其中。到了大三,我主导了“密码系统设计与实践”课程。考虑到隐语平台结合了机器学习和密态计算,我还将机器学习纳入合作课题。最后,在毕业设计这块,目前也正在指导学生基于隐语课题完成毕业设计项目。
课程一:网安导论
《网络安全导论》是计算机系网络安全专业的特色课程之一,由专业内十余位资深教师联合执教,每周2节课,为学生深入介绍网络安全各细分领域的基本概念与专业知识。在课程的最后两周,我们特地安排了企业讲座,以实现学术与实践的紧密结合。今年是邀请了隐语团队专家,分享开源课程。另外,也邀请奇安信专家做网安攻防方面的介绍。
课程的另一亮点在于,我们通过隐语社区推出的两节开源基础课程,以线上的模式向学生们普及开源相关的重要知识。这一措施源于:虽然开源概念对技术发展至关重要,但高校的正规课程中往往缺乏对其的专项介绍;对开源感兴趣的同学大多是通过参与项目或个人探索来了解这一领域。
鉴于此,我们借助隐语优秀的开源实践特质,为学生们推广这一开源基础课程,旨在提供全面的开源知识介绍,并不仅限于网络安全专业的学生,我们计划将其推广至整个计算机科学与技术领域,希望能惠及更广泛的学生群体。
课程二:现代密码学
《现代密码学》是由我亲自授课的核心专业课程,总共包含64学时,主要在大二年级学生中进行教授。课程时长设置为64学时,而非传统的32学时,是因为我们在课程中融入了密码分析学的内容,以期打造一个更加全面和深入的学习体验。
在课程接近尾声时,我们向学生们推荐了隐语线上mooc的资源。在整个学期中,我们所强调的是密码学的基础理论。而隐私计算则代表了密码学在当下的前沿应用。通过在基础理论教学结束后引入隐语慕课,我们希望学生拓宽视野,了解密码学在实际中可以解决的一些热点问题。
此外,我们数学系也设有密码学的课程,并且我们与该课程的教师保持着紧密的交流合作。目前,我们正在共同编写一本教材,探讨在其实践部分融入与隐语相关的实际操作内容,以便学生通过动手实践进一步深化对密码学知识的理解和应用。
课程三:密码系统设计与实践
此外,我们设了一个暑期课程来进行密码学相关内容的实践,整个课程被划分为两个主要部分:
第一部分专注于传统密码学,覆盖了网络安全协议等基本内容;第二部分则专门讲解隐私计算。在为期4-5周的紧凑课程中,学生们能够对隐私计算领域形成一个全面的认识。我们特别介绍了隐语框架,鼓励学生通过实践活动,增强对隐私计算以及其在现代工业界应用的兴趣。
在课程的项目实践环节,我们安排学生进行分组项目。其中的“项目二”是基于隐私计算的实践,我直接采用了去年星河杯隐私设计大赛中的MPC(多方计算)组的任务和数据集。学生在较短的时间内就能提出优秀的解决方案,这一成果在很大程度上得益于隐语框架的完善性,使得学生能够迅速掌握并应用所学知识。
与此同时,我们也正在进行一个项目,即结合隐语OSCP任务指导本科生完成毕设。我们注意到,一般OSCP项目对于本科毕业生而言规模偏小,无法完全达到本科毕设对工作量和创新性的要求。因此,在设计任务时,我们进行了多轮迭代,最终确定了三个任务。这三个任务分为两大类,由三位学生分别承担,确保项目符合本科毕业生的学习和创新需求。
项目任务详解与学生贡献:
项目一:在 SPU(Secure Processing Unit)框架中使用 PyTorch 实施深度学习计算。这是一个相对较为庞大和复杂的任务,我们将其分配给了一名学生。
项目二:个性化联邦学习。这个项目涉及隐语平台上个性化联邦学习的研究和开发工作。由于任务涵盖了理论研究与实际操作两个方面,由两名学生共同承担。
另外,在隐语 MOOC 二期课程中,3位同学整理了约1.3万字的学习笔记。其中安同学目前已经在实践中验证了隐语平台基于横向联邦学习框架的 HuggingFace 预训练模型加载。
下面列出目前为止我们的学生们具体实现的 OSCP 的任务,李明波同学作为社区之星,他完成了其中一半多的任务,剩下的 OSCP 任务由另外几位硕士生和本科生完成。
课程探索与项目落地
我们做了一些相应研究,有些是基于隐语框架,有些是自己开发。基于SPU的模型推理技术研究,基于联邦学习的模拟训练技术研究,及利用Kuscia隐语调度框架的隐私计算系统研究。
在这方面,我们有两名学生利用业余时间,成功在Kuscia计算平台上部署了基于传统前后端技术的应用,例如使用NGC网关、MySQL数据库和相关后端技术,从而迅速实现了对隐语框架的整合。我们的学生通过实践证明了只需要不算大的工作量就可以将隐语框架适配集成到落地产品中。
这是我们进行的一项隐私计算项目,其成果展示了隐语框架的出色实施效果。
总结与展望
涉及到结合学生培养与社区发展这一主题,我认为这是极其有价值的。通过这样的合作,企业能够更深入地了解学生,而学生也对此显示出浓厚兴趣。例如,在我们的毕业设计项目中,报名的学生众多,但由于名额有限,最终只有三名学生能够参与进来。在实践课程中,学生们也展现出极大的热情。目前,我们尚未涉足的领域包括学科竞赛和大型项目合作,我们希望未来能在这些方面开展更多合作。例如,在学生竞赛方面,我们可以联合社区导师和学校教师共同指导;在大型项目方面,双方可以共同探讨项目内容,以此推动学术研究和实践建设的共同发展。
🏠 隐语社区:
https://github.com/secretflow
https://gitee.com/secretflow
https://www.secretflow.org.cn(官网)
👇欢迎关注:
公众号:隐语的小剧场
B站:隐语secretflow
邮箱:secretflow-contact@service.alipay.com
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。