別讓商務大數據的思路誤了工業大數據
别让商务大数据的思路,误了工业大数据
中国IDC 圈11月25道:最近闭幕的十八届五中全会把大数据战略提高到一个史无前例的层面实行国家大数据战略,推进数据资源开放同享笔者在此想谈一下对推动工业大数据的一点看法
大数据的概念与背景
大数据是最近几年才热起来的一个概念大数据热大约在2012年前后在中国出现其中,涂子沛先生的《大数据》一书起到了重要的作用除了上帝,任何人都必须用数据来说话这句话,更是得到了时任广东省委书记汪洋(现为国务院副总理)的高度肯定
读过这本书的人都知道:涂子沛关注的重点是大数据对政治、社会、伦理等方面的影响后来,各家互联公司、IT公司将人们关注的热门引向了商业领域,再经股评师的运作,使之成为全社会炙手可热的概念与此同时,学术界不失时机地将大数据的概念引入了工业界
然而,工业界重视数据分析早已不是新鲜事了人们很早就希望通过数据发现客观规律、优化生产过程例如,笔者25年前就开始涉足工业数据的分析研究,而数据挖掘等理论也早已广泛传播对数据发掘的价值,一种流行的观点是:当企业竞争进入白热化、所有手段都已用尽时,数据挖掘提供了领先半步的可能与现在的观点相比,这个认识是相当低调的当然,低调背后是有缘由的,由于业界真正成功的案例其实非常少
很多企业急于搭上工业大数据这趟快车,但是在现实中遇到了很多的困惑
人们仿佛都认为数据的作用很大,但从事过工业数据分析的人往往有这样的体会:分析进程往往达不到预想的目标,数据似乎并不是传说中的金矿
这种困惑也体现在商务活动中企业信息化建设本来应当遵守一个基本原则:用户需求驱动系统开发从事大数据业务的IT公司对用户说:你说怎样做,我就怎样做;用户却说:我不知道能得到甚么,也不知道该怎样做,最好你告诉我怎样做
谁都不知道怎样做于是,大家都被畅销书的理念忽悠着做事然而,畅销书的观点是正确的吗在笔者看来,畅销书上的观点常常对不上中国企业的现状或将商务大数据的运用场景套在工业大数据,或将未来的场景套用到现在
工业大数据与商务大数据有甚么不同
现在关于大数据的流行观点,几乎都是针对商务大数据的然而,许多观点可能其实不合适工业界笔者认为,工业和商业至少有以下几点不同:
可发现的新知识少一般来说,发现新知识是大数据分析的一个重要目的但是,在工业领域,人们对生产过程的研究一般比较深入,专业知识也很丰富,很难从数据中发现新的知识与之相比,商务活动的大数据分析常常触及人的喜好,这些恰恰是过去难以量化研究的,故而大数据的含金量高
对分析结果的质量要求高工业界对分析结果的精度和可靠度要求高如果将不可靠、不精确的分析结果用于指点生产,不但不能创造价值,乃至可能导致极大的损失与之相比,在许多商务大数据的运用场景下,即使分析错误,损失也不大
分析难度高工业系统往往是复杂的人造系统,包括大量复杂的前馈和反馈环节这意味着,变量间的相关性往往不是自然的因果关系这个问题很容易误导分析和决策的过程另外,工业数据的信噪比往往比较低,分析结果很容易出现严重偏离事实的畸变(即所谓的有偏估计)
相关性包含的信息少在商务大数据中,数据之间的相关性本身往往就具有很大的参考价值,而在工业体系中则未必是这样
工业大数据体现价值的场景有哪些
价值是用户决定的一杯水,放在沙漠里可以救命,剩在餐桌上就是垃圾工业大数据也是一样,能否创造价值,首先是要看用在什么场景中
笔者认为,用户对工业大数据提不出需求,是客观现实的真实反映大数据有用,但合适的应用场景不一定是现在下面分析几个有用的场景:
质量要求高的生产场景制造业从什么时候开始重视数据显然,当我们追求高质量、高稳定性的时候,数据会显得非常重要,数据的价值才得以体现国外先进企业追求6Sigma(一种改良企业质量流程管理的技术,主要强调通过制定极高的目标、搜集数据和分析结果,来减少产品和服务的缺点),故而强调数据的重要性;许多企业一味寻求低成本,数据的重要性自然就会低
高度自动化及智能化的生产场景在高度自动化和智能化的生产单元,人的介入很少,对质量的要求一般也很高这时候,对设备健康状态和产品质量的自动监控就变得非常重要
工业互联的场景工业互联能使成千上万用户的数据实现同享多个用户的共享会带来两个过去无法企及的效果首先是分析结果的可靠性上升这得益于来自不同用户的实例,可用于对分析结论的重复性认证其次是分析结果可以在众多的用户中分享,以创造更大的价值
在现今的中国企业中,符合上述要求的场景是不多见的多数企业重视本钱远甚于质量,智能制造和自动化的水平低,工业互联还没有起步因而可知,对中国多数企业来讲,工业大数据的价值很可能只是未来时,虽然这个未来可能其实不遥远
推动工业大数据现在该做啥
马云策划淘宝的年代,笔者正在浙江大学攻读博士学位记得那时学校的速只有每秒100个字节这件事启发我们:机会常常发生在条件不太成熟的时候所以,创新者的起步一定要早在工业大数据全面运用之前,是我们培养能力、积累技术的时候
但是,仅起步早是不够的,关键还要走对路子正如培根所说:跛足而走对路的人,胜过健步如飞却误入歧途者怎样尽早捉住机会呢笔者认为,可以从以下几个方面做起:
1是理解工业大数据的本质作用
对企业来讲,大数据用得好坏的关键是看能否创造出高于本钱的价值所以,笔者赞同从功能的角度定义工业大数据:大数据是过程(生产制造、研发服务、采购销售)痕迹的数字化记录
,目的是为用数据说话奠定基础,是对已有系统所产生的数据的二次利用
这意味着,工业大数据平台的建设,应当高度重视数据的组织,避免遗漏重要的数据以及数据之间的联系例如,实时的装备状态和工艺参数应当与所生产的产品准确对应,相干的时钟不能混乱
二是以方便人的分析为出发点
在商务大数据中,很多人强调机器学习,强调从大量数据中取得规律性、重复性的知识对工业大数据,这种认识要做调剂:工业知识主要来自人脑,数据的作用是对已有认识的确认、分辨与准确化这就意味着,大数据平台的要点是方便人从事分析工作而人的分析工作常常是针对特定事件驱动的
使得这些过程做到透明化,提高管理水平,通过更有效的管理创造效益这样,建立大数据平台的一个重要任务是:让相关进程显性化,避免人陷落在信息和数据的海洋中,丧失关注的焦点依照这个观点,在工业领域,知识自动化的重点应该是知识的管理,而非知识的发现
三是正确认识工业大数据的知识发现
如前所述,由于工业数据体现出来的规律性往往难以突破人已有的认识范围,发现规律性的知识(如工艺与质量之间的关系)是比较困难的然而,工业大数据往往适合发现另外一类知识,即从数据中提炼信息的知识,将物理量的检测数据转化成产品质量、能耗、效率、装备状态等信息的软测量算法,其实就是这种类型的知识这些知识往往是生产技术人员其实不熟悉的盲点故而,从数据研究者的角度看,它们属于容易出成绩的领域
过去,学术界对这些问题很热衷,企业却不重视,由于这种知识很难创造价值不能创造价值的原因,是未能将其纳入管理或者控制的流程中,故而创造价值的途径不畅通为此,企业可能会需要一个平台,以便将这些知识转化成数字化的模型,并纳入生产制造等流程中,以便创造经济价值
四是重视与智能制造的结合
在笔者看来,数字化、络化引发的智能制造大体是这样一个逻辑:信息驱动知识,在决策进程中创造价值、体现智能其中,信息来自供应链、客户、智能装备、物联,知识表现为软件化的模型,决策则包括自动或人工的管理与控制
如前所述,工业大数据在这个逻辑中有两个重要作用:获得从数据提炼成信息的知识;决策和专业知识主要来自人脑,但需要用大数据将其验证、改正和精确化
五是加强数据分析可靠性理论研究
在工业系统中,可靠分析的结果才有使用价值可靠性分析本来是统计理论的重要组成部分但用于大数据明显是不合适的这些理论的基本假定条件常常都是不成立的而且,许多理论和著名观点也造成了大量的误导,如盲目强调分析结果的准确性、认为大数据强调相互关系而轻视因果等
大数据的因果分析是个十分需要重视的领域,但过去主要是科学、哲学研究的范畴,统计学家对其重视不足笔者认为,其实,可以从杜绝假象、通过证伪等思路来逼近因果也就是说,重点分析那些容易导致错误结果的情况同时,逻辑链的完整性和证据的独立性也很重要
笔者认为,数据的质量和完整性是导致分析毛病的重要诱因因此,建立大数据平台时,不仅要关注数据本身,更要关注数据之间的对应性;不但要关注数据是什么,还要关注数据的采集过程数据的采集过程不同,意味着内涵产生了变化如果数据质量不高,大数据很可能是一堆垃圾这样看来,盲从商务大数据非结构化的观点也是不对的
5个月宝宝咳嗽小儿大便干
小孩健脾胃的药有哪些
-
斯诺克海口赛吕昊天惨遭塞尔比零封赵心童无
人工智能 | 2020-07-09
-
利物浦大将不关心曼城战绩他们不可能场场
人工智能 | 2020-07-01
-
视频弹幕网A站与B站为何发展出两条不同的
人工智能 | 2019-07-16