Projects:PrivateComputing
From IIIS-Systems
项目名称
保护隐私的分布式计算
项目介绍
随着互联网和云计算的普及,大数据挖掘已成了一个热点话题,但海量数据的收集和使用势必会牵涉到各种各样的隐私问题,如何在保护用户隐私的情况下进行分布式大数据挖掘是一个亟待解决的问题。
本项目实现了一个基于Differential Privacy的大规模分布式计算框架,支持多种主流的数据挖掘算法。
参与人员
李艺
项目图示
项目特点
1. 服务端基于Spark Streaming实现,稳定性好
2. 支持多种主流数据挖掘算法,如分类、聚类、规则挖掘等
3. 提供简洁的编程接口,用户可轻易将常用的算法移植过来
4. 服务端压力与用户数线性相关,系统可扩展性强
5. 本项目同时支持在线计算