查看原文
其他

电信运营商的反欺诈系统不会侵犯用户隐私!

傅一平 与数据同行 2021-10-15

点击上方蓝字关注公众号

请您点击“与数据同行”以“关注”,关于数据的实践与思考,每周一我在这里等你!

作者:傅一平  目前就职于某电信运营商,从事大数据相关工作。

今日头条发布了《中国移动“天盾”反欺诈系统浙江试点工作显威力》,提到浙江移动采用大数据新技术来实现欺诈反制:

“但是随着诈骗犯罪手段的翻新,给一直从“犯罪源头”反制,实行“黑名单”拦截的反欺诈工作带来了难度。为此,浙江移动的团队成员共同悉心研发,创新思路,从保护诈骗受害用户的角度出发,在对通话行为进行大数据分析的基础上,首创了一套对疑似诈骗行为识别、分析和处置的办法。这套新办法好似一面“照妖镜”,能在诈骗实施之初就第一时间发现抓取并进行事中干预,使得各种竭力藏匿的诈骗行为无所遁形。”

“经过测试验证,该识别模型从识别欺诈行为到实施智能拦截仅需2分钟,从2016年8月上线以来,在两个月的时间里,已累计识别诈骗电话8584起,诈骗识别准确率超过95%,实现月均止损800万元,如果完全投入使用, 2016年预计可以为全国人民挽回直接经济损失2.92亿元。”

的确,采用新型的大数据技术在遏制通讯信息欺诈方面可以发挥重要作用,但也引起了人们对于用户隐私的担心,比如有人就评论道:“看来移动手机号不能用了,这可能监听我的电话内容啊。

笔者长期从事相关工作,也简要谈谈自己的理解,事实上,运营商这类反欺诈系统,绝对不会对于用户隐私形成侵犯。

首先,任何用户的电话内容、短信内容、上网内容,运营商没有任何权利去查看,这是红线,作为负责任的国企,这也不会发生。

现在欺诈电话、垃圾短信,反欺诈拦击这么难,一定程度是因为运营商不允许直接监听通信内容所致,因此需要采用其他的拦截手段,这比很多公司的内容监听行为要正规的多。

事实上,如果真得允许监听用户通信内容,那所谓的垃圾短信,欺诈电话等的算法识别反倒简单了,比如维护一个庞大的语义库就可以了 。

运营商需要在不查看通信内容的条件下,基于非常有限的信息去识别并拦截,这是非常大的挑战和难点。

其次,为什么要用大数据反欺诈?

大家每天都收到垃圾电话,只能说对于用户形成了骚扰,绝大多数并没有形成事实上的欺诈,但还是有极少部分用户是受到欺诈并损失金钱的,这部分用户虽然是小众,但损失的金额是巨大的,每年损失超百亿,对于这类造成实质损失的最后立案的案件,怎么才能实现事中干预从而避免损失呢?

传统的黑名单显然是不靠谱的,因为欺诈成功的号码,大多数是改号的首次使用号码,人家用一次就扔掉,也不会再欺诈下一个,传统黑名单方式怎么拦截?这部分虽然小众但可能造成倾家荡产的被害人如何保护?

因此,必须采用新的技术手段,基于欺诈号码的特定行为去识别规律,这就需要采用大数据的技术。这里的行为规律,是指基于历史欺诈号码的交往圈大小(注意不是具体某个对端号码)、通话的频度、通话的顺序、通话的时段等各类通信要素进行模型训练,找到欺诈号码的行为规律,但不涉及通话内容。

然后基于这套规律去进行现网匹配,找到最为疑似的欺诈号码,然后针对被通话人进行拦截。

这种算法跟AlphGO类似,通过分析历史所有棋盘的棋局,然后找到下棋的规律,从而预测出下一步正确的走棋位置。

显然,这种大数据反欺诈方式不会触及用户隐私。

一是基于前面的分析,大数据反欺诈没有监听用户的通话内容,没有用到用户的任何通信内容数据,这是一个基本点,大数据与用户隐私不能简单划成等号。

三是大数据要识别的对象是欺诈行为模式,不针对任何特定个人,整个模型训练过程涉及到的用户号码等数据也完全脱敏,因为模型没必要知道你是谁,只要找到符合这类模式的,就进行预警和拦截, 这个识别模型就是个黑箱子。

三是输出的拦截信息经过相关执法机构的许可,一切按法办事,运营商不会擅自进行事中干预。

无论是黑名单还是基于大数据的反通讯信息欺诈系统,从当前的实现方式看,不会涉及用户隐私的侵犯,用户可以完全放心。

当然有人可以说,管你用什么保护手段和先进反欺诈算法,反正接触了用户数据,怎么自证清白?但在购物网站人家做个性推荐的时候,人家不仅知道你在购物,还知道内容,哪一样不涉及个人隐私,为什么又要区别对待呢?

隐私总是相对的,只要是于人民有利,不作恶,特别是这类公益事业,是否应该给予更多的宽容?

当前反欺诈的形势比较严峻,需要各界联合起来共同推动,是否需要给予反欺诈工作多一点支持和理解?大数据等新技术也并非洪水猛兽,只要驾驭的好,就可以很好的为人类谋福,还是需要往前看。

从个人的角度看,如果看到自己的亲人、朋友上百万的收入即将被诈骗分子骗取,而天盾及时进行了阻止,那到底是隐私重要还是损失重要?作为旁观者当然可以义正言辞的大谈隐私保护,但当事人怎么办?

事情总有两面性,天下也没有绝对的东西,只不过都是权衡利弊的结果。

历史精选文章
  • BI自助取数是怎么炼成的? 阅读量:1835

  • 为什么BI取数这么难?阅读量:11500

  • 为什么数据管理工作很难成功?阅读量:1900

  • 为什么传统BI没前途?阅读量:4093

  • 大数据,为什么不是传统BI的简单升级?阅读量:3400

  • 数据分析师的自我修养  阅读量:1483

  • 唯有数据创新,运营商才能实现大数据变现的突破?阅读量:1236

  • 中国移动进军大数据征信,一个具有旅程碑意义的事件 阅读量:2380

  • 为什么有些人用3年的时间获得了你12年的数据分析经验?阅读量:1874

  • 数学中的“罗辑思维” 阅读量:1090

  • 数据说谎的艺术  阅读量:2234

  • 看上去很美,谈谈阿里云的大数据平台【数加】  阅读量:1281

  • DPI大数据之战:运营商的艰难抉择 阅读量:2342

还有很多...


长按订阅二维码关注(微信号:ysjtx_fyp)  



: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存