在创新数据流通技术手段方面,联邦学习是一种重要的机器学习框架。联邦学习是针对“数据孤岛”和数据共享中的隐私安全问题而提出的机器学习框架,传统的方式是需要将数据硬拷贝移动到授信的第三方,而联邦学习则希望达到各个企业和机构的自有数据不出本地,通过加密机制下的参数交换方式,建立一个虚拟的共有模型,数据本身不移动也不泄露隐私或影响数据合规。
2.数据敏捷型经济体
根据中国信通院《大数据白皮书(2020)》,欧盟为了应对未来发展而致力于平衡数据流动与广泛使用,希望通过建立单一的数据市场,确保欧洲在未来的数据经济中占据领先地位。2020年2月,欧盟委员会公布了《欧盟数据战略》,对欧盟数据发展提出了明确的愿景目标——2030年欧洲将成为世界上最具吸引力、最安全、最具活力的数据敏捷型经济体。即在保持高度的隐私、安全和道德标准的前提下,充分发掘数据利用的价值造福经济社会,并确保每个人能从数据红利中受益。
2020年5月,赫尔辛基欧盟办公室成员组织(Helsinki EU Office members)联合发布了《数据敏捷型经济:从被动到主动式,更好的服务社会》白皮书2.0版本,建议了从被动利用数据向主动利用数据而转型的立法框架:创新型跨部门利用数据,从而在更高效、主动和个性化公共服务中起到主要作用;不同生态伙伴之间的紧密合作,包括公共机构、RDI组织、私营企业和NGO非营利性机构,对释放数字化转型潜力起到关键作用;让每个人都可以按自己的方式使用和利用个人数据,从而为个人带来收益以及为社会贡献;通过更好的数据管理和更高水平的数据文化及数字技能,实现数据信任和民众的赋能。
随着大数据的发展,企业和公共机构越来越需要将不同的数据进行有效链接,从而形成新的动态知识,以辅助企业和公共机构的决策。这就需要运用图数据库、图计算引擎和知识图谱,其中知识图谱是图数据库和图计算引擎的重要应用场景。根据DB-Engines排名分析,图数据库关注热度在2013年到2020年间增长了10倍,关注度增长排名第一,远远高于其它数据库或数据引擎。用户画像和信用档案等,是知识图谱的新应用场景。
物联网是大数据的一个重要来源。传统观念认为消费物联网是物联网大数据的主要来源,但随着产业物联网的飞速发展,产业物联网正在超越消费物联网而成为物联网大数据的主要来源。根据中国信通院《物联网白皮书(2020)》,随着物联网加速向各行业渗透,行业的信息化和联网水平不断提升,产业物联网连接数占比将提速。
根据预测,产业物联网设备的联网数将在2024年超过消费物联网的设备数。在中国,2019年中国物联网连接数中,产业物联网与消费者市场各占一半,预计到2025年中国物联网连接数的大部分增长来自产业市场,产业物联网的连接数将占到总体的61.2%。智慧工业、智慧交通、智慧健康、智慧能源等领域,将最有可能成为产业物联网连接数增长最快的领域。
产业物联网的大数据处理涉及到边缘计算。市场调研机构IDC预测,未来超过50%的数据需要在边缘侧进行存储、分析、计算,到2024年全球边缘计算市场将达到2506亿美元。在中国市场,2020新基建中的5G、AI、智慧交通、新能源汽车充电桩、工业互联网等都是与边缘计算相关的技术或场景。
中国信通院《大数据白皮书(2020)》还指出:基于隐私计算的数据流通技术成为实现数据联合计算的主要思路。在数据合规流通需求旺盛的环境下,隐私计算技术发展火热。隐私计算在保护数据本身不对外泄露的前提下,实现了数据融合,为安全合规的数据流通带来了可能。
转自:北京物联网智能技术应用协会