加入收藏 | 设为首页 | 会员中心 | 我要投稿 草根网 (https://www.0515zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据安全及隐私保护浅析(上篇)

发布时间:2023-02-10 14:00:18 所属栏目:大数据 来源:
导读:  一. 大数据安全及隐私保护概述

  IBM2015年度全球数据泄露成本调查显示:调研的350家跨国公司的数据泄露平均成本高达 379 万美元,每条丢失或被窃记录(包含敏感和机密信息)的平均支付成本高达 154 美元。
  一. 大数据安全及隐私保护概述
 
  IBM2015年度全球数据泄露成本调查显示:调研的350家跨国公司的数据泄露平均成本高达 379 万美元,每条丢失或被窃记录(包含敏感和机密信息)的平均支付成本高达 154 美元。大数据时代的安全及隐私保护形势异常艰巨。
 
  各行业的数据泄露成本
 
  1)传统数据管理普遍采用关系型数据库,经过长期改进,其在维护数据安全方面已经非常完善。而大数据依托的基础技术是非关系型数据库,其并没有严格的访问控制机制及完善隐私管理工具。
 
  2)大数据的来源和承载方式多种多样(包括智能手机、Pad、IoT、车联网、各类传感器等),数据分散于各个角落,使得企业将很难定位这些数据和保护所有机密信息。
 
  3)非关系型数据库允许不断对数据记录添加属性,其前瞻安全性变得非常重要,对数据库管理也提出了新的要求。
 
  大数据价值的关键在于数据分析和利用,但同时对用户隐私产生威胁。在大数据时代,想屏蔽外部数据商挖掘个人信息是很难实现的。通过社交网站中的信息、智能手机的位置信息等多种数据组合,已经可以以非常高的精度锁定个人,挖掘出个人信息体系,造成用户隐私安全问题。
 
  为了深入的分析和解决大数据安全与隐私问题,本文将从数据产生、数据获取、数据存储和数据分析4个阶段分别进行阐述。
 
  大数据价值链示意图
 
  二. 数据产生环节
 
  1)大数据时代,新浪、腾讯、淘宝等商家既是数据的生产者,又是数据的存储、管理者和使用者,单纯通过技术手段限制商家对用户信息的使用,实现用户隐私保护将极其困难。
 
  2)目前用户数据的收集、存储、管理与使用等均缺乏规范,更缺乏监管,主要依靠企业的自律。用户无法确定自己隐私信息的用途。
 
  3)服务商内部人员偷盗售卖、网络服务安全漏洞被利用、木马、钓鱼网站恶意盗取等也可能导致该环节的数据安全及隐私问题。
  包括:数据加密技术、个人角度降低数据泄露风险、厂商角度降低数据泄露风险等
 
  1)数据加密技术:在数据生成后,可以采用数据加密,进而有效防止数据库信息失密性的有效手段。通常加密的方法有替换、置换、混合加密等。通过不同版本的密钥对不同的数据信息进行加密处理,可以大大提高数据库数据的安全强度。由于在解密时必须对应匹配的密钥版本,加密时就尽量的挑选最新的加密算法。
 
  2)个人角度降低数据泄露风险:想要规避隐私泄漏风险,需要提高个人账号密码复杂度,尤其是涉及支付类网络服务的账号密码要使用非常用密码,对能够进行多重密码保护的账号尽可能的完成多重保护操作;其次是选择正规下载站点或APP应用商店,不要随便安装不明应用;最后是要养成良好的上网习惯,谨慎提交个人信息,对于安装的手机应用服务,可查看设置权限,禁止获取不必要的个人数据信息。
 
  三. 数据获取及传输环节
 
  数据获取及传输根据传输渠道分为两类:线上传输和线下传输。线上主要指利用互联网等虚拟媒介而实现的一系列没有发生面对面交互的数据传输;线下可理解为有真实发生的、当面的、人与人有通过肢体动态的一系列活动,即通过移动硬盘等移动存储媒介传输数据。
 
  对于线下传输方式,实体媒介的物理安全是数据安全的保障,实体媒介的遗失、被窃、损害等情况,都存在数据保密性、完整性被破坏的风险,可能导致用户隐私信息的泄露。因此,需要一定管理制度进行控制和协调。
 
  对于线上传输方式,比如Internet或Intranet上传输,可以使用 Internet 协议安全性 (IPSec)保证其安全。但用户的数据以明文的形式传输,被黑客截获,很可能存在数据被盗用、滥用情况,导致用户隐私信息泄露。因此,需要对获取和传输阶段的安全&隐私进行保障。
 
  在数据获取及传输环节的保障可以分为安全、认证两方面的规范。安全规范包括加密算法、报文摘要算法、安全通信协议等方面的规范。其中,加密算法在前一个章节中已经进行介绍,这里主要介绍认证规范。

  认证规范:包括数字签名、数字证书、公钥基础设施
 
  1)数字签名:数字签名是公开密钥加密技术的一种应用,是指用发送方的私有密钥加密报文摘要,然后将其与原始的信息附加在一起,合称为数字签名。使用时,报文的发送方从报文文本中生成一个128位或160位的单向散列值,并用自己的私有密钥对这个散列值进行加密,形成发送方的数字签名;然后,将这个数字签名作为报文的附件和报文一起发送给报文的接收方;报文的接收方首先从接收到的原始报文中计算出128位的散列值,接着再用发送方的公开密钥来对报文附加的数字签名进行解密;如果这两个散列值相同大数据隐私安全,那么接收方就能确认该数字签名是发送方的。通过数字签名能够实现对原始报文的鉴别与验证,保证报文的完整性、权威性和发送者对所发报文的不可抵赖性。
 
  2)数字证书:“数字证书”是一个经证书认证中心(CA)数字签名的、包含证书申请者(公开密钥拥有者)个人信息及其公开密钥的文件。基于公开密钥体制(PKI)的数字证书是网络安全体系的核心,用途是利用公共密钥加密系统来保护与验证公众的密钥。CA对申请者所提供的信息进行验证,然后通过向网络中各参与方签发数字证书,来确认各方的身份,保证网上业务的安全性。
 
  3)公钥基础设施(PKI):PKI是通过使用公开密钥技术和数字证书来确保系统信息安全并负责验证数字证书持有者身份的一种体系。企业可以建立公钥基础设施(PKI)体系来控制对其计算机网络的访问。PKI采用各参与方都信任一个同一认证中心,由该认证中心来核对和验证各参与方身份的身份这种信任机制。
 
  注:由于篇幅限制,大数据存储环节、大数据分析及应用环节的安全及隐私问题,将在大数据安全及隐私保护浅析(下篇)进行介绍。
 

(编辑:草根网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!