- 从这5个场景, 看MPC多方安全计算的行业应用
- 来源:区块链大本营
在我们之前的“多方安全计算”系列文章中,我们首先通过姚期智教授的“百万富翁问题”引出了数据安全计算这个密码学话题,并介绍了多方安全计算在数据隐私中的应用场景。第二期中,我们又简要的介绍了两种“多方安全计算”的技术路线以及理论知识。
本期,我们将继续深入介绍多方安全计算在行业中的应用。通过这篇文章,读者可以了解到这样一个工具是如何在金融科技,机器学习中发挥作用,打破壁垒,保护隐私。也欢迎读者将安全多方计算放在您的工作场景中来启发出新的行业应用。
场景1 基金联合收益计算
在母基金管理中,我们需要计算每个基金的真实收益情况。而基金的持仓信息是一个非常重要的私密信息,它代表了基金的价值判断和策略导向,也是基金公司的核心机密。
一方面是出于管理预警作用所需要的信息共享,一方面是基金本身的商业信息的保护,传统方法必然导致一方的诉求无法得到满足。
使用MPC计算,不仅能够同时满足双发的利益诉求,甚至可以让基金信息得到有效的政府监管、防止出现市场结构性风险,同时保证商业信息不被泄露。
以一个典型的两方计算场景为例:一方提供编译好的计算函数,一方将加密的数据进行联合计算。代码极其简单,甚至几行代码就能实现其核心逻辑。
场景2 联合个人征信(不经意查询)
个人征信的场景大家再熟悉不过了,通过多个信息渠道对个人历史记录进行多维度计算,反应出一个人的信贷能力。
通过计算信用等级,贷款机构就能算出风险,并能决定是否放贷。个人数据维度越多,信贷能力的计算越准确。传统意义上,我们会使用央行给出的详细个人历史记录作为信用模型计算的依据。
而其他渠道的信息,例如电商购买行为,甚至是手机APP安装情况,都能帮助反应个人的肖像。
然而,多渠道信息融合的难度极大。一方面是法律因素:交易个人隐私信息是违法的;另一方面,处于商业利益的保护,数据共享也会导致数据持有公司失去竞争优势;再次,查询方也会暴露查询的对象和内容,从而在一定程度暴露信息。
而MPC能解决的核心问题,是通过不经意查询,达到数据不被公开、查询对象不暴露、而结果能够被正确查询返回。要达到这个核心目的,我们只需要一下几步:
数据拥有方将查询ID和对应数值构建数组a, b,组成数据库,并秘密分享。这样共享的数据不能被任何一方解密。注意ID需要将asic编码转化成特定的数值编码,方便查询;查询方将查询ID进行秘密分享,这样所有人都不知道真实的ID是什么。这里ID也进行了相应的数值转换;通过遍历计算得到相应的位置值。这里两点需要注意:a)查询必须遍历整个列表而不能终止,不然会暴露查询对象;b)返回的不是真实的位置,而是一个代表位置的表达值;通过位置表达值再进行查询值搜索,最终得到一个多方秘密值;将秘密求和即可得到最终的值。
ARPA已经将整个操作,包括数据库分享、不经意查询封装成简单的函数方便使用。示意代码如下:
场景4 机器学习
人工智能现阶段以机器学习为主,机器学习中使用的算法大体分为 3 类:监督学习、无监督学习和强化学习。
监督学习提供了反馈来表明预测正确与否,而无监督学习没有响应,算法仅尝试根据数据的隐含结构对数据进行分类。
强化学习类似于监督学习,因为它会接收反馈,但反馈并不是对每个输入或状态都是必要的。
目前行业的应用以监督学习为主。通过对数据进行标注所得到的训练数据集,可以用来进行监督训练。
如今,深度学习需要使用大量的数据训练模型。我们发现,一个优秀的深度学习模型是算法通过大量的数据集训练而达到的(而不是一个优秀的算法和少量的数据)。虽然算法理论不断丰富完善,具体的落地模型却被少数人掌握在手中,极为稀少和珍贵。我们都知道,算法+数据=机器学习模型。
然而,这样的共识却会导致一个后果:数据霸权。即数据掌握在少数公司手里。因为数据是企业的核心竞争力,越是有价值的数据,越是没有办法通过共享而产生价值。
这个问题可以通过MPC来解决。企业间可以不用担心数据流失,而是通过MPC实现数据租赁,从而可以得到数据价值变现。同时也让数据的使用价格低至原来的十分之一。
微软研究院也曾在类似方面有所探索,他们在刊发的论文CryptoNet中采用了同态加密的方式来保护CNN中处理的数据,同样因为计算复杂的问题,CryptoNet为CNN中的不同运算进行了对应的优化。
MIT进行生物医药研究的一个小组,利用了安全两方计算来实现了保护隐私的制药实验,传统制药中,可通过受体和药物之间的分子对比来预估药效,这个过程会涉及商业机密,MPC可在制药过程中一些简单步骤上得以应用。
Google则采取了一种完全不同的方案来解决CNN中的数据安全问题,联邦学习,然而这是一个具体问题具体分析的方法,只对分层神经网络有效。
一次CNN训练和预测过程示意图如下:
今天我们展示一下,如何使用Tensorflow实现MPC,从而达到计算深度神经网络。
利用MPC,构建一个CNN模型的代码如下:
最后是实现秘密分享,代码如下所示:
最终实现,使用TensorBoard可视化如下:
场景5 联合风险价值计算
Value at Risk(VaR)按字面的解释就是“处于风险状态的价值”,即在一定置信水平和一定持有期内,某一金融工具或其组合在未来资产价格波动下所面临的最大损失额。
摩根大通定义为:VaR是在既定头寸被冲销(be neutraliged)或重估前可能发生的市场价值最大损失的估计值;而Jorion则把VaR定义为:“给定置信区间的一个持有期内的最坏的预期损失”。
VaR模型计算方法计算VAR相当于计算E(ω)和ω*或者E(R)和R*的数值。从目前来看,主要采用三种方法计算VaR值:1. 历史模拟法(historical simulation method);2. 方差—协方差法;3. 蒙特卡罗模拟法(Monte Carlo simulation)
咱们在这里主要用到历史模拟法。“历史模拟法”是借助于计算过去一段时间内的资产组合风险收益的频度分布,通过找到历史上一段时间内的平均收益,以及在既定置信水平α下的最低收益率,计算资产组合的VaR值。
计算方式为:首先,计算平均每日收入E(ω);其次,确定ω*的大小,相当于图中左端每日收入为负数的区间内,给定置信水平 α,寻找和确定相应最低的每日收益值。
设置信水平为α,由于观测日为T,则意味差在图的左端让出。t=T×α,即可得到α概率水平下的最低值ω*。由此可得:VaR=E(ω)-ω*
从数学上来看,这个工作非常简单。假设现有200支股票持仓的权重向量是w,长度为200。一年的股票价格数据为200x255的矩阵P。如果置信度α为95%,则我们寻找5%的最小的每日持仓价值。1. 每日持仓价值 h = w’*P;2. 排序价值 s = sort(h);3. 找到5%排序价值s作为VaR
在MPC里面,我们除了实现简单的整数、定点小数的四则运算外,还要支持排序和矩阵运算来实现VaR计算。
当然,我们可以用多层循环来实现矩阵叉乘,但实际上,不仅在代码层看起来非常冗余和易错,更重要的是在基于秘密分享的安全计算里面,编译器会将这段逻辑忠诚地反应出来。
这会导致bite code及其庞大,以及计算效率很低。ARPA在矩阵运算上进行了优化,通过局部秘密共享和多线程技术将矩阵乘法优化了一个数量级。
在排序逻辑上,我们也进行了优化。简单来说,通过多个线程实现”Divide and Conquer”,将大量线性运算并行而达到效率的大幅提升。
具体代码示意如下:
推荐阅读:
Libra硬刚微信、支付宝? 你也试试!
用50年前NASA送阿波罗上天的计算机挖矿什么体验? 出一个块要10^18年……
344亿天价罚单也救不了Libra!"别太乐观, 冲破黑暗还很远呀! "
性能提升 3 倍的树莓派 4,被爆设计缺陷!Kubernetes端到端解决方案Part3:如何正确部署Kubernetes金山云肖江:5G 驱动智慧人居新发展中文repo“霸榜”GitHub Trending,国外开发者不开心了
中国第一程序员,微软得不到他就要毁了他!
猛戳""有惊喜哟
老铁在看了吗?👇
CSDN APP
扫一扫下载订阅号助手,用手机发文章
赞赏
长按二维码向我转账
受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
已同步到看一看
取消
发送
我知道了
朋友会在“发现-看一看”看到你“在看”的内容
确定
已同步到看一看写下你的想法
最多200字,当前共字
发送
已发送
朋友将在看一看看到
确定
写下你的想法...
取消
发布到看一看
确定
最多200字,当前共字
发送中
微信扫一扫
使用小程序
取消
允许
即将打开一个新页面
取消
允许
区块
-
-
- 全球区块链早讯(7.21)
- 每日行情快讯:BTC最高触及11000美元 主流币普涨 BTC凌晨开始震荡上涨,OKEx最高触及11000美元,随后于10900美元附近窄幅震荡,OKEx现报10980美元,24h涨幅4.65%。主流
- 全球区块链早讯
-
-
-
- 靠开特展年收入破千万:这位美女CEO打造爆款IP展览 观展人次90万+
- “策展界的极客”,于晓芹这么形容自己的团队。 记者 | 五米 编辑 | 吴晋娜 ““他的鱼都画错了。”一个看着年龄七八岁,刚从展馆出来的小男孩舔着棒棒糖,吸吸鼻子说,“聂璜怕不是个傻子吧!” 站在展
- 铅笔道
-
-
-
- 比原链Bystack侧链主网正式上线
- 点击蓝字关注 比原链公众号 今日,比原链Bystack侧链主网正式上线。各节点投票有序展开。为配合Bystack侧链主网上线,Bycoin 钱包版本更新,目前1.2.0已发布,安卓新版本已上线
- 比原链Bytom
-
-
-
- Libra 是否会带来下一个布雷顿森林体系?
- 点击上方“Unitimes” 可以订阅哦! 作者 | Alessandro Raffelini 编译 | Jhonny 本周的加密货币领域中,最为引人注意的事件当属美国参议两院召开的针对 Libr
- Unitimes
-
-
-
- 从这5个场景, 看MPC多方安全计算的行业应用
- 作者 | 章磊 责编 | Aholiab 出品 | CSDN、ARPA 在我们之前的“多方安全计算”系列文章中,我们首先通过姚期智教授的“百万富翁问题”引出了数据安全计算这个密码学话题,并介绍了多
- 区块链大本营
-
-
-
- 兄弟们,狗哥明天要出门浪了
- 第一个目的地西安,大口吃羊肉去! 西安玩几天以后去西宁参加FIRST青年电影展, 这个电影节可以说是现在国内最先锋的电影节了,展映的影片里经常出黑马,看我这次有没有运气碰上。 话说最近平台币都
- 狗哥币圈实盘日记
-
-
-
- G7警告:如果Libra没有受到严格监管,将会破坏世界经济
- 点击上方“蓝色字”可关注我们! 暴走时评:G7财政部长们警告说,如果没有严格监管,像Libra这样的加密货币可能会让世界金融体系陷入困境。据路透社报道,法国财政部长Bruno Le Mai
- 区块链铅笔Blockchain
-
-
-
- 区块链嫁接物联网的意义在哪里?
- 蓝狐笔记社群有不少朋友想了解区块链跟物联网结合的意义在哪里。蓝狐笔记特地请到物联网公链IoTeX的联合创始人Qevan Guo为我们答疑解惑。Qevan Guo是新加坡国立大学机器学习和机器视觉博士,
- 蓝狐笔记
-
-
-
- 01-50最适合学英语的50部动画电影
- 高清最适合学英语的50部动画电影 地 址 https://dwz.cn/sV2Mxrxk 堤 取 MA:7fh6 效果和最适合学英语的50部动画电影一致 总共180部,这是前50部,rmvb格式。 影
- 全球区块链早讯
-
-
-
- 以太坊、Cosmos 、Polkdot 生态大盘点,或是未来生态最繁荣的三大公链
- “教主,区块链这么火,我想去学个编程做开发,你觉着怎样?” “不太看好……不过你要是真的想学,倒是有三个推荐。” “哪三个语言?C、Java 和 Python 么?” “不是,是 Solidity、G
- 白话区块链
-
-
-
- 参与投资120亿 蚂蚁金服还要再追加:曾经的共享单车“老三”这样上位
- 哈啰凭什么走出了与摩拜和ofo都不一样的命运? 记者 | 付艳翠 编辑 | 吴晋娜 “近日,有消息称,哈啰出行获投4亿美元战略融资,由蚂蚁金服领投。对于融资传闻,双方随后都向媒体表示“不予置评”。为
- 铅笔道
-
-
-
- 7-19|波卡币 预计今年开启公募,开放10%份额、币安调整Launchpad 持仓规则
- 今天主要内容:波卡币 预计今年开启公募,开放10%份额;V神:中继注册燃烧机制是以太坊在隐私解决方面的关键一步;Circle CEO受邀将与孙宇晨共同参加巴菲特午餐;英国一名窃贼试图用绑在汽车上的绳子
- 币圈情报社
-
-
-
- 狗哥日记345:不求操作骚,但求不犯错(加仓2000HT)
- 同志们好!我是狗哥。狗哥日记第 345 天。 狗哥每晚:币乎简书7:00,公众号7:30 跟你不见不散,带你穿越牛熊。 狗哥的初衷是,带10万人学会BI圈投资。 还有一点很重要的是,带500人财富自
- 狗哥币圈实盘日记
-
-
-
- 关于Libra的众议院听证会关键发言
- 点击上方“蓝色字”可关注我们! 暴走时评:当地时间7月17日,美国众议院金融服务委员会于听取了Facebook的David Marcus的证词。Marcus是该社交媒体巨头即将推出的Lib
- 区块链铅笔Blockchain
-
-
-
- 区块链全球巡礼—动荡不安的委内瑞拉和饱受争议的石油币
- 在数字货币短暂的历史中,委内瑞拉一直是对这种工具需求最强烈的国家之一。多年来,这个南美国家的政治紧张局势不断升级,通货膨胀加剧,电力中断,主要的食品和药品短缺加剧了民众的不满。 菜鸟区块链 文|马
- 菜鸟区块链
-