您现在的位置:新闻首页>汽车

华控清交徐葳:隐私计算推动大数据行业的破局与新生

2022-09-29编辑:admin(来源:原创/投稿/转载)


  “当两个百万富翁在街上相遇,他们都想知道谁更富有,但又不愿意透露自己拥有的真正财富。如何在没有可信第三方的情况下,可以知道谁更有钱?”80年代,中国科学院院士、国内唯一图灵奖获得者姚期智提出了著名的“百万富翁”设想,并通过“混淆电路”这一理论,证明了“多方安全计算(MPC)”在理论上的可行性。然而,由于算力等因素的制约,MPC在提出之初并未实现落地应用。

  近年来,随着数字化转型的深入,数据融合应用趋势不断加快,以MPC为代表的隐私计算技术,开始了广泛的产业落地。当下,隐私计算已吸引了互联网巨头、网络安全、大数据公司、初创型企业等纷纷入局。

  在美国谷歌任职期间,华控清交联合创始人徐葳在导师大卫·帕特森(2017年图灵奖得主、RISC-V奠基人)的介绍下,与姚期智院士会面,于2013年回国加入了姚期智院士创办的清华大学交叉信息研究院,从助理教授做起。“我一直都说,是姚期智先生把我从国外捡回来的。”徐葳笑言。

  2018年6月,通过转化姚期智院士和徐葳教授的科研成果,华控清交正式成立。四年后,华控清交B轮融资近7亿元,估值达45亿元,投资方囊括联想创投、国科投资、中关村科学城、华兴资本、OPPO集团、大湾区共同家园发展基金、复星创富等知名机构,是名副其实的隐私计算行业领军者。

  “当下,大数据的产业应用面临诸多挑战。特别是由于数据流动存在的严重壁垒,大多数企业无法打造数据闭环,导致大数据应用局限在金融、广告等少数领域。隐私计算的价值正在于打破壁垒,推动数据在产业链上下游的流通,在未来三到五年促进大数据产业实现新发展。”

  一方面,数据收集和提取的合法性存在争议,大数据对拓宽信息获取渠道的需求,引发了隐私保护和数据利用之间的冲突。另一方面,由于数据确权难度大,缺乏外部数据协同,企业无法进行全局性的数据展现,内外部数据没有形成闭环,导致数据的价值挖掘较为困难。

  “在现实世界中,企业和机构往往各自只掌握一部分数据,而片面的数据往往没有太多分析价值。更为挑战的是,往往有数据的机构没有数据应用的场景,而有场景的机构缺少数据。这导致只有少数能够形成数据闭环的企业,能在大数据应用中获得实际的收益。”徐葳指出。

  要打破这一困境,就必须让数据在企业和机构之间真正流通起来。但出于数据权属、数据泄露及自身商业利益等诸多因素考虑,手握数据的企业或组织对于开放内部数据,尤其是核心数据保持极其谨慎的态度,导致数据隐私保护和数据高效流动之间的矛盾日益凸显。

  “为什么大家不愿意进行明文数据流通,因为有太多的顾虑。企业不知道数据会被拿去做什么用途,甚至自身也不太清楚数据里究竟有什么内容,担心一旦共享给别人,数据用途就不可控,会被挖掘出超出预料的信息。为了打消这种担忧,就需要建立起数据流通的信任机制,保证个人信息、商业机密或独有数据资源等隐私信息在数据处理、流转过程中用途是可控的。”隐私计算的价值正在于,通过让数据“可用不可见”,最终实现数据“用途可控”的目标,从而消解数据隐私保护和数据高效流动之间的矛盾,打破数据在行业、企业间的流动壁垒,让数据孤岛问题得到根本解决。

  “隐私计算的目的其实不是保密,数据保密只是手段,最终目的是为了限定数据的使用方式和用途,消除大家对数据泄露的担忧。我们希望能做到,数据在参与计算后,各方拿到的只有计算结果,不仅数据是看不见的,中间结果也看不到,这样评估到底用途如何不可控就更简单。”

  目前,大数据在广告和金融方面的应用最为广泛和成熟。前者表现为大数据广告精准营销,后者则是大数据征信。徐葳认为,随着隐私计算的发展,越来越多的企业或组织与产业链上下游业务伙伴,在数据流通和交易领域进行深度合作,将更好地释放数据更大的价值,把大数据应用拓展到除广告、金融外的更多领域。

  “隐私计算从来不是一个独立的行业,而是大数据产业的一环。通过隐私计算实现多方数据的融合,让数据可管可控。我预计,明年就能看到令人眼前一亮的多方数据融合应用,未来3-5年将会迎来这类应用的爆发。”

  在具体行业中,徐葳较为看好隐私计算在医疗健康、新能源、制造业等领域的应用,通过产业链上下游的各方数据协同计算,提升生产效率,推进产业创新。

  “比如,制造业是较为封闭的行业。由于数据很敏感,平台之间无法相互打通。在这种形势下,制造业并非不愿意数字化转型,而是看不到数据流通带来的收益。但如果利用隐私计算这类技术破除壁垒,打通产业链上下游,实现制造业、物流业、电商行业深度融合,带来更多的商机、更多的资源配置,那么自然而然地会吸引制造业融入数字化转型的潮流中。我觉得这是未来,同时也是为何技术能改变世界的原因。”

  自成立以来,华控清交一直以推动建设数据流通基础设施为己任,参加了《多方安全计算金融应用技术规范》等30多个行业标准的制定,发起和参加了包括北京国际大数据交易所在内的多个政府数据共享开放平台和数据要素市场基础设施的建设和实施。

  徐葳表示,隐私计算要实现更大范围的落地,通过数据流通的基础设施建设,以规模经济效益来降低边际成本,是一条可行的技术路线。

  “隐私计算技术其实很贵,因为从理论上计算、通讯、管理都复杂,所以相比直接的明文数据流通肯定要贵得多。因此要使隐私计算成为数据流通中的主流渠道,我们目前看到的可行路线,是借助规模经济效益均摊隐私计算的成本到大量数据上。当系统规模非常大,就能降低边际成本,或者说单位交易的成本。因此实现隐私计算的通用化、低成本和规模化,特别是建设大型数据流通基础设施,是当前最可行的路。”近日,华控清交的大规模集群系统的可扩展性实现突破,将一万亿数据纯密文逻辑回归训练耗时降低到小时级,为大规模的隐私计算提供技术支撑。为降低单个节点能耗,单节点性能通过自主研发的半同态DSA(特定领域的芯片架构)和芯片,实现了每秒达到数十万行的隐匿查询速度,相当于上千个CPU核的计算力。

  除了参与北京国际大数据交易所以及湖南大数据交易所的建立外,华控清交也与龙头企业合作构建行业基础设施。此前,由光大银行和华控清交联合建设的行业内首个隐私计算金融基础设施已落地。徐葳透露,公司还在电力、通讯、制药等行业进行探索。

  “未来,我们希望把不同基础标准的平台都能够互联互通,慢慢形成一张数据流通的大网。这样,数据闭环就不仅仅存在于大型的互联网公司。你想要什么样的数据来助力业务发展,都能从这个互联互通基础设施上通过一定方法来获取。届时,大家就真的可以把积累的算法、思想、专业知识,真正地投入到实践之中,带来社会生产方面的实际收益,大数据的行业也将随之迎来新生。”

本文地址:http://www.zibocpa.cn/SUVqiche/2022/hkqjxw_ysjstddsjxydpjyxs_43857.html


  • 本网转载的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请联系我们进行修改或删除。