当前位置: 首页 > 技术动态
  • 大数据 需依赖机器学习挖掘有意义信息

  • 2015-02-13 10:33 来源:中关村在线 关键字:大数据,物联网 浏览量:17
  • 导读: 在有物联网的情况下,机器学习可以帮助企业将他们拥有的数十亿个数据点归结为真正有意义的信息。机器学习总的前提是一样的,审查和分析你所收集的数据并从数据中学习“信息”,让我们可以更好的做一些决定。
  •   近年来,随着智能家居、车联网等领域的快速发展,物联网已经从各个方面越来越多地渗透到人们的生活当中。简单地说,物联网就是利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化、远程管理控制和智能化的网络。
      万物相连的物联网,将会产生非常有价值的大数据。这些数据可以帮助城市预测事故与犯罪;让医生实时查看病患的心脏起搏器和生物芯片中的信息;通过预测性维护设备和机械,可以让工业产量最佳化;通过与家用电器的连接,向用户提供与自己的车辆和手持设备的危机通信从而建造真正智能的房屋。这些可能性都是由物联网所带来的,而且它所带来的便利还会越来越多。
      由于连接物联网的设备与传感器还会继续快速扩张,而由这些设备产生的数据总量将会增长到一个难以置信的等级。这些数据拥有着极大的价值,可以让我们洞察出哪些是有用的,哪些是没用的。
      这听起来很不错。然而,最大的问题将是寻找一种方式来分析由这些设备产生的数量极多的数据和信息。如果你曾经尝试过在几TB的数据中找出你所需要的文件的话,那么你就会知道这一做法是有多困难了。对人类而言,要审查并了解所有这些数据根本不可能做到,如果用传统方法这么做的话,即使减少样本大小,仍然需要花费很多时间。
      我们需要提高大数据分析的速度和准确度,从而让物联网实现它所承诺事情。如果我们不这样做,那么后果将会是灾难性的,波及范围将从小到家用电器之间不能互相通信,大到危及生命——心脏起搏器失灵或上百辆车连环相撞。
      唯一一种可以跟上物联网产生数据的速度,并可以挖掘数据中拥有的隐藏信息的方法就是利用机器学习能力。
      机器学习已有应用
      维基百科将机器学习定义为“计算机科学(CS)和人工智能(AI)的子域,随着系统的建设和研究,可以从数据中自行学习,而不是只遵循明确的程序指令。”
      虽然这听起来有点像科幻小说,但是它已经存在于日常生活中。例如,Pandora这个流媒体音乐播放器就在使用这个技术,以确定用户还会喜欢哪些其他的歌曲;Amazon.com也会为用户提供其他书籍和电影的推荐。以上两者都是通过对用户行为的监测,系统自动学习并作出判断。
      在有物联网的情况下,机器学习可以帮助企业将他们拥有的数十亿个数据点归结为真正有意义的信息。机器学习总的前提是一样的,审查和分析你所收集的数据并从数据中学习“信息”,让我们可以更好的做一些决定。
      例如,追踪你健康的穿戴式设备已经成为了一个新兴的产业,但很快这些设备将发展成为既可以相互连接,也可以连接到互联网的产品,跟踪你的健康并提供实时更新的健康服务。
      物联网要做到的是,当你的身体健康出现状况时,你的医生会收到通知,例如你的心率提高到了一个不安全水平,甚至是发生了停止。为了能够发现潜在的问题,数据分析就需要知道什么是正常的,什么不是。相似性、相关性和异常需要基于实时的数据流被快速识别出来。
      为了立即进行数据分析,它在收集数据时就能准确地识别先前已知的信息和以前从未见过的新信息。机器有产生和聚集这些大数据的能力,这些大数据也必须被用于学习每个患者正常行为并追踪、发现和标记在正常行为以外的所有事情,因为这些可能表明了患者存在严重的健康问题。
      物联网的实现依赖于能够获得隐藏在现有庞大的数据和不断增长的数据中的信息,再对信息作出深度挖掘。未来物联网的实现依赖于机器学习,将会改善我们日常生活中的每一个方面。