在资讯爆炸的时代,网络上充满各种各样的资讯,这些巨量的资讯,我们称之为大数据(Big Data)。大数据在科技界已经不是陌生的名词,它从企业决策到行为预判,从资讯科技基础建设到日常生活每一个环节,到处都有大数据的踪影,大数据已经成为一种指标,让我们看看大数据对我们有什么影响?

经历过这次的疫情后,很多企业都把他们的业务逐渐转型为数码化,当业务数码化后,管理层开始重视数据分析,藉由数据分析出来的结果,去做更精准的决定。
除此之外,大数据带给企业很多好处,包括更有效的决策、减低投资风险、降低成本、提高生产力、优化客户体验、提升收益等。即使企业本身没有庞大的数据量,又或者没有资源做大数据分析,但可以借助其他平台与工具来做大数据分析。
欺诈检测预先发现问题
大数据分析的另一个常见用途是用于欺诈检测,特别是在金融业。机器学习的大数据分析系统的一大优势,是在异常检测模式非常出色,这些能力可以让银行和信用卡公司能够发现信用卡被盗或欺诈性购买,并且通常是在持卡人知道出现问题之前发现问题。
在我们平日生活里,其实也充满了大数据。打个比方,当你打开YouTube观看喜爱的影片后,YouTube会推送给你更多相似的影片,来吸引你继续观看,这样YouTube就可以从中赚取广告费。
除此之外,Google、Facebook和Instagram会根据你的喜好与搜寻记录,来投放相关广告;换言之,当你在体验他们平台服务的同时,也帮助企业做行销方案。
信息就是力量!
帮助企业收集数据
或许对科技不太熟悉的你会觉得好奇,为什么他们会知道你的喜好或搜寻记录呢?
这是因为网站的Cookies、Facebook Pixel、搜寻引擎的记录、用户的消费记录、个人资料,甚至银行转账记录等,都会被收集,然后企业就会根据这些数据,来推送适合你的资讯,如果不想要被监视,那就要放弃所有的科技产品了。
大数据分析可以在商业市场运行,正是因为信息在数码时代就是力量,而且大数据也帮助企业发现来自不同来源收集到的海量数据集,并加以利用以达到更高的目标。
如果在没有大数据分析的情况下,在竞争激烈的商业市场中,想让业务更上一层楼,或许需要更长时间与更多精力。

大数据的5大特点
1.巨大的数据量(Volume)
大数据的数据量是极为巨大,这包括采集、储存和计算量都非常大,而且数据的起始计算单位至少是Petabyte(1000个Terabyte)、Exabyte(100万个Terabyte)或Zettabyte(10亿个Terabyte),可想而知大数量的数据量是多么的巨大。
2.数据处理速度快(Velocity)
速度是指接收和处理资料的速度率。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
3.数据类型多样化(Variety)
种类是指大数据多样化的资料类型。传统的资料类型结构严谨,并井然有序地存放在关联式资料库中。随着大数据兴起,新的非结构化资料类型也随之应运而生。非结构化和半结构化的资料类型(例如文字、音讯和视讯)需要另外经过预先处理,才能够有效应用。
4.数据准确性高(Veracity)
当资料的来源变得更多元时,这些资料本身的可靠度与品质是否足够,若资料本身就是有问题的,那么分析后的结果将会是错误的。
5.数据价值(Value)
数据所提供的资讯将变成价值,不仅有助于更好地了解他们的客户,还能持续提供相关产品来提高利润。
大数据分析是如何操作?
1.数据收集
不同的企业会以不同的方式来收集数据,例如社交媒体、在线调查、客户反馈、手机App、电子邮件等来源,而这些数据将会收集到原始数据库内。
2.数据处理
在数据处理的阶段,将对原始数据进行验证、排序和筛选,从而使其可供进一步使用并提高查询性能。
3.数据清洗
处理完成后,将擦洗数据。对数据集中的冲突、冗余、无效或不完整的字段以及格式错误做更正和清理,经过这程序后,数据将会变的精准。
4.数据分析
通过数据挖掘、AI、预测分析、机器学习和统计分析等工具和技术来分析大数据,这有助于定义和预测数据中的模式和行为。
※图:互联网
