HI,欢迎来到芯鱼书刊网!

数据挖掘在医疗和电商平台的应用

摘要:20世纪中叶以来,人类发明了计算机并开始了第三次工业革命,即计算机及信息技术革命,于是云计算、物联网、大数据等新型技术开始渗透并应用于人类生活的方方面面,前所未有的电商平台的发展极大便利了人们的生活。但是在人类发展进步的同时,我们也遭受了许多新的考验,比如2002年的SARS病毒和2019年发现的新型冠状病毒2019-ncov,可见人类发展的过程中机遇和挑战并存。如何利用好当下技术更好地服务于人类的生活和未来的发展,探索未知秘密显得尤为重要。本文对数据挖掘在医疗和电商平台的应用做出了阐述,并提出了数据挖掘在未来如何更好地服务于人类的看法。

关键词:数据挖掘;医疗;电商平台

作者简介:冯于连,赵林;贵州师范大学经济与管理学院

引言

近年来,计算机技术的发展,带来空前的技术变革。随着云计算、物联网、大数据的快速发展,带给人类生活极大的便利。为了更好的改善人类的生活的质量水平,各界人士都在最大限度地利用研究现有的数据挖掘技术,期望从现有数据中挖掘出更多蕴含的未知的秘密和规律,从而促进社会发展。一方面,屡屡爆发的医疗卫生危机,不仅为人类带来了巨大的经济损失和人口伤亡,更是阻碍人类的发展;另一方面,生活中的电商平台改变人们的购物方式,这不仅创造了无限的商业潜能,更是便利人们的生活。企业如何充分利用和发挥数据挖掘技术改善自己的经营模式,更快更精准的获取顾客需求信息,做好客户信息管理等都是企业面临的挑战。基于上述的原因,研究数据挖掘在医疗和电商平台的应用,对人类来说有着深远意义。

一、数据挖掘介绍

(一)数据挖掘简介

在这部分主要针对数据挖掘方面的一些知识进行简单介绍,具体包括数据挖掘的概念、特点、步骤和技术。

1.数据挖掘的概念

数据挖掘是指从大量的、不完全的、模糊的、随机的数据中抽取出有效的、新颖的和潜在有用的知识的过程,通过一些专门技术发掘海量数据中隐藏的模式和关系,并将这些规则用于预测未来发展,指导管理决策。从数据挖掘的定义我们可以看出数据挖掘可以抽取出潜在有用的知识,并将这些知识用于预测未来发展。

2.数据挖掘的特点

数据挖掘主要有以下四个特点:

1)数据挖掘要求更高的挖掘效率。数据仓库中的数据浩瀚无边,对比于只存储了少量数据的数据仓库而言,其数量日新月异、内容气象万千,要从中挖掘出有效的信息,其算法具备高效率是必不可少的。

2)动态性。新旧事物不断更替,网络更新的速度更是遥不可及,数据仓库中的旧数据由于新数据源源不断地进入而被淘汰,社会中的现象千变万化,万物都在潜移默化中生成新的规律,这就使得数据仓库时时都在更新。数据的日新月异也决定了数据挖掘过程必然是动态的。

3)强大的并行性。因特网将分散的点面信息连在一起,使得网络数据如同小溪河流一般汇入数据仓库的海洋中,形成数据资源的聚集,这就要求数据挖掘过程在巨大的数据仓库中扩大分析范围。

4)有效地组织、管理好数据。如果数据管理和组织是无效的,这可能会数据挖掘过程中所需要的数据源无效,从而形成无效决策,因此有效组织和管理数据是数据挖掘的重要保障[1]

3.数据挖掘的步骤

在数据挖掘的过程中,从初始到最后结果一般分为以下三个过程[2]

1)数据收集。数据收集是数据挖掘的首要前提,有效的数据来源是数据挖掘结果的重要保障,比如数据服务器日志、客户基本信息、各类交易信息等等。如果自身不能准确地获取客户的数据,那么很大程度上需要去其他统计机构和数据库收集信息,甚至是花钱购买数据,才可能满足数据挖掘中需要数据信息。

2)数据挖掘。数据挖掘包括数据清理转换和模型构建。在数据挖掘是需要清理不需要的数据、转换需要的数据,对数据进行初步的分析和处理,明确自身要研究的问题,也就是数据挖掘的目的,并对数据进行整改和选择对应技术,这是最损耗自身资源的一步;模型构建要使用不同的算法构建多个模型,用一些工具和参数优化模型,提高精确度,择出对应问题的最佳模型。

3)数据结果评估分析和预测。分析报告可包含对结果的预测或者是分析从数据挖掘中发现的规则。

二、数据挖掘的应用

随着互联网的快速发展,人们获取资料的手段不再是单一的书籍资料查询和实践经验,由于数据可以通过互联网进行共享,当人们需要数据时,只需要在一些搜索引擎或网站进行信息检索,便可以发现海量相关信息,而且这些数据每分每秒都在实时更新,就像千万条河流的水会汇入大海一样,它们也最终形成了一片数据的海洋[3]。人们如何保证从浩瀚的数据海洋中寻找利己的数据,从而有机会挖掘出对自身有利的信息资源,以便于满足自身需要,对人类来说已然成为值得思考的问题。而数据挖掘技术的应用就正好化解了这一难题,因此研究数据挖掘,有非常重大的意义。

(一)数据挖掘在医疗中的应用

在医学不断发展的过程中,我们从“神农尝百草”这样的办法中获得经验,从徐霞客和李时珍等许许多多历史上伟大的医学家不断地实践中寻找医学知识,改善医疗技术。现如今,得益于信息技术的不断发展和进步,我们获得新的医学知识、改善医疗技术的方式变得更加准确、快速和安全。;利用数据挖掘技术不断提升和认知新的医学知识,对医学的临床实验和医疗技术的改进都有着十分现实的重要意义。

在大数据的背景下,数据挖掘发挥自己强大的功能。数据挖掘将现有医疗技术中的知识和病理与病人的病历进行整合对比,从而实现医疗技术的个性化,也为个性化医疗提供了实践机会[4]。有了信息技术的支持,越来越多的医院开始淘汰纸质病历,通过将病人的病历信息汇总在网上进行管理和检查,病人可以在网上预约、挂号、排队看病、缴费等等,还可以根据自己的时间合理安排看病复诊等相关事项。正是因为这一系列的信息化管理,医院可以将这些数据保存到自己的数据库,通过数据挖掘后为病人选择最佳的治疗方案。由此可见在数据挖掘技术不断改进和发展的过程中,这项技术对医疗领域产生的正向积极作用正在与日俱增。如世界上已经有的案例中,医生利用数据挖掘技术探讨儿童心脏外科手术与死亡率存在怎样的关系、运用数学统计的方法和数据挖掘技术研究病人术前的对手术的影响等。

面对各种各样的病例数据、医学影像、病例参数、化验结果等,医院对所收集的医疗采用相关技术进行数据挖掘,发现潜在的医学知识,改善现有的医疗技术。比如现在的医院可以将所有的癌症患者的病历信息放在一起,应用数据挖掘技术,分析所有数据之间的潜在关系,发现癌症患病的主要因素和次要因素,然后再对采用的相应医疗技术进行进一步分析,最后发现医疗技术存在的现有缺陷,进行医疗技术的革新。

当这些被挖掘的信息在全球实现共享,就能促进整个世界的医疗技术的进步,从而造福整个人类社会。在医疗上的数据挖掘还可以应用于遗传性疾病。对于遗传性疾病,比如现下先天性心脏病的治疗,对于现有的医疗技术而言难度很大,其关键在于致病原因复杂,根本原因是基因问题,治愈的机会相对较低,同时由于社会的医疗保障措施在某些重大疾病的政策倾向上并不明显,让许多身患重病的人因为医疗费用望而却步,甚至是放弃治疗。如何更加有效地控制像先天性心脏病这样的疾病,找到最有疗效的药物,不让病人遭受更多疾病带来的痛苦,减轻不必要的一些治疗手段和药物,为家庭减轻负担,让更多病人看到希望已然是迫在眉睫。

在数据挖掘的基础下,我们可以有预见性的对疾病进行控制。比如在病人被查出患有先天性心脏病后,医院可以利用数据挖掘技术对以往的病人病历进行分析,然后预测后期病人的发病症状,以及发病时间,找到最适合病人对应阶段的药物和治疗方法,实现精准治疗,让医疗效果在数据挖掘的帮助下实现最大化。除此之外,人类不断发展的过程中,也相继出现越来越多前所未见的人类疾病。这些疾病来源众多、病因复杂,尤其一些新型疾病不断地爆发,比如现在的全球新冠肺炎病毒,感染性极强,传播性极高,防治难度极大。病情爆发初期,人类现有的医疗技术和治疗水准要治疗好病情颇为艰难。随着医学研究者的慢慢摸索,通过大量的病历与实验数据挖掘,找到病因并挖掘出更有效的治疗方法才控制好疫情治疗。否则,必然对社会造成巨大的损失,甚至造成不安定的社会现象和全球经济停滞不前,特别是不能及时地控制疾病和治愈病人,使人类蒙受更大的损失。

2002年爆发的非典和2019年爆发的新冠肺炎,我们对于像SARS和2019-ncov这种闻所未闻的病毒一无所知,没有任何有关的治疗经验和药物来有效的控制和治疗这些疾病,最终就会导致人类遭受巨大的财产损失,人类的生命安全无法得到保障,引发社会问题。然而当新型肺炎以令人发指的速度在世界开始蔓延的时候,数据挖掘技术可以对患病的人群和发病地域的情况进行深度分析,挖掘出病毒可能通过什么方式传播,与以前的SARS病毒等存在哪些方面的差异,最终指导人类要如何防止该病毒的蔓延,我们又该如何改善现有的医疗技术,并从现有的病人病例中查出新型冠状病毒的产生真正根源、传播方式和治疗办法。在这一过程中,数据挖掘发挥了重要的作用,便于医学研究者们快速找到应对方法,从源头上扼杀病毒,增加治愈疾病的概率。

从上面的阐述中可以看出数据挖掘用自己独特的理念,给人们解决问题提供了一种新的思路和方法,对改善人类的医疗技术,最大限度上减少疾病所带来的苦难、保障人类的人身安全、财产安全和保障社会稳定有着重大而深远的意义。因此,数据挖掘技术必然给人类的疾病治疗、医学研究等带来极大的福音。

(二)数据挖掘在电商平台的应用

随着信息科技技术的发展和互联网的快速普及,在二十一世纪,一种新的交易方式应运而生并快速席卷全球,这便是电子商务。电商平台的出现和发展为人类生活提供了巨大的方便,改善了整个社会的购物方式。在经济全球化的背景下,也代表着企业的客户不再局限于某一个地区。面多全球众多的人口,人们有着不同的习惯、风俗和经济能力,更多的信息冲击着市场,企业面临着时时刻刻的信息更新,企业的决策者如何保证顾客忠诚度。如何提高管理效率,为顾客提供完美服务,提升自身的竞争力,实现自己企业的盈利目标,保证企业的长远发展至关重要。

现下的企业通过对客户的购买行为进行挖掘分析,发现新的价值增长点,为新一轮的可观销售进行预测,并为之做出相应的准备措施。作为电商平台的巨头之一,淘宝的成功和数据挖掘有着密切联系。比如在淘宝的服装市场中,淡季与旺季交替时期,对数据的挖掘的精确性有着极大要求,对应年龄阶段的服饰,不同身份职业的穿衣要求,各个地区的气候对应的服饰,这些都大概可以通过以往的交易记录得到数据,挖掘客户的偏好并向客户推荐相关产品[5]。而如果离开了数据挖掘,没有精准的客户定位,没有个性化推出对应的浏览界面,淘宝也不会获得高的顾客忠诚度并拥有那么大的交易量,甚至是现在的规模可能也是个遥遥无期的梦。正因为有了数据挖掘,淘宝各商家才能挖掘出有价值的信息,根据客户的需求与喜好对策划进行调整,达到“与时俱进”,不被市场淘汰,其规模才能越来越大,收益才会越来越可观。其实越是庞大的数据越离不开数据挖掘,越是庞大的数据被有效的挖掘出来,其价值效益也就越大。与其说电子商务推动了数据挖掘的发展,不如说数据挖掘成就了现在的电子商务时代。但这并不代表电子商务的数据挖掘研究到达终点,相反,数据挖掘在电子商务领域的应用有着无限的发展潜力。在数据挖掘中还有些问题亟待解决,比如数据的质量、数据安全、海量数据、数据隐私等问题。在数据挖掘技术被不断完善和发展的过程中,必将促使电子商务走向更加智能化的未来[6]

三、数据挖掘的趋势和展望

如上所述,数据挖掘在医疗和电商平台领域有着广泛的应用,发挥着重要的作用。此外,实际上数据挖掘也早已开始应用于其他行业,比如股票市场分析、销售行业、科学新兴技术等领域。数据挖掘可以帮助这些行业从数据中找出更多前所未有的、具有实用价值的信息,帮助人们进行相关经济决策、更好地服务于商业、更准确地帮助人们减少许多重大工程的失误、更精准地服务人类的生活需求。在全球经济不断发展的过程中,由于大数据时代对于人类的发展而言起着重要的作用,数据挖掘也会更普遍被人类应用到实际生活的方方面面。

在当下各国都追求经济可持续发展的背景下,数据挖掘技术可以应用于生态环境方面的治理。中国的经济在快速发展过程中,由于忽视环境的保护,导致雾霾天气等环境污染问题极大程度上影响了人们的生活。刚出生的婴儿因为雾霾天气患上肺病等现象层出不穷。为了解决这些问题,利用数据挖掘实时获得天气变化和雾霾程度等相关信息,逐步分析这些数据,并挖掘出治理技术中最有效、最方便的办法,改善现存的环境问题。

数据挖掘还应用到现代的服务业当中。比如在旅游业上面,相关的旅游机构可以实时更新游客信息,深挖他们的旅游和出行的特征及需求,然后可以把类似的游客信息分类,对这些游客推荐不同的出行计划,不仅可以留住顾客,更可能节省成本,从而创造更多的利润。

针对于当下火爆依旧的垃圾分类问题,数据挖掘依然可以发挥自己的作用。比如在某个城市进行垃圾分类的试点实验以后,可以分析在什么场合、什么时候人们垃圾分类的意识最强,什么样的模式下人们会更喜欢垃圾分类等等。根据生活中的现象,通过数据挖掘技术找到我们忽视的有价值的信息,就像在人们看来最不可思议的“啤酒与尿布”的经典案例。

数据挖掘技术甚至应用于人类探索未知领域,比如可以将太空中卫星发射回来的所有信息进行深入挖掘,探寻太空中有没有新型能源解决地球的能源危机问题、找寻太空中的“第二个地球”,甚至是找到有没有外星人的存在的证据。着眼当下,展望未来,相信数据挖掘一定会发挥它自身强大的、无法复制的效用,为人类社会的发展和进步贡献来自数据挖掘独有的力量。

参考文献:

[1]黄玲.在电子商务中应用Web数据挖掘的研究[D].湖南大学,2014.

[2]孟强.面向电子商务用户行为的Web数据挖掘模型与应用研究[D].黑龙江大学,2017.

[3]史忠植.知识发现(第二版).北京:清华大学出版社,2011,66-6

[4]徐莉.基于数据挖掘技术的电子商务推荐系统的研究[D].北京邮电大学,2013.

[5]洪亮,李雪思,周莉娜.领域跨越:数据挖掘的应用和发展趋势[J].图书情报知识,2017(04):4+22-32.

顶部