摘自《谁说菜鸟不会数据分析》第一章
Mr.林看到小白斗志昂扬的样子非常高兴:别光说不做啊,要成为一名优秀的数据分析师,并非一件容易的事。虽然所学的专业与数据分析不相关,但你可以通过工作中的实践学习数据分析,需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻香?
下面,我给你介绍一名合格的数据分析师需要具备的五大基本能力和素质。
1、态度严谨负责
严谨负责是数据分析师的必备素质之一,只有本着严谨负责的态度,才能保证数据的客观、准确。在企业里,数据分析师可以说是企业的医生,他们通过对企业运营数据的分析,为企业寻找症结及问题。一名合格的数据分析师,应具有严谨、负责的态度,保持中立立场,客观评价企业发展过程中存在的问题,为决策层提供有效的参考依据;不应受其他因素影响而更改数据,隐瞒企业存在的问题,这样做对企业发展是非常不利的,甚至会造成严重的后果。而且,对数据分析师自身来说,也是前途尽毁,从此以后所做的数据分析结果都将受到质疑,因为你已经不再是可信赖的人,在同事、领导、客户面前已经失去了信任。所以,作为一名数据分析师就必须持有严谨负责的态度,这也是最基本的职业道德。
2、好奇心强烈
好奇心人皆有之,但是作为数据分析师,这份好奇心就应该更强烈,要积极主动地发现和挖掘隐藏在数据内部的真相。在数据分析师的脑子里,应该充满着无数个“为什么”,为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等。这一系列问题都要在进行数据分析时提出来,并且通过数据分析,给自己一个满意的答案。越是优秀的数据分析师,好奇心也越不容易满足,回答了一个问题,又会抛出一个新的问题,继续研究下去。只有拥有了这样一种刨根问底的精神,才会对数据和结论保持敏感,继而顺藤摸瓜,找出数据背后的真相。
3、逻辑思维清晰
除了一颗探索真相的好奇心,数据分析师还需要具备缜密的思维和清晰的逻辑推理能力。我记得有位大师说过:结构为王。何谓结构,结构就是我们常说的逻辑,不论说话还是写文章,都要有条理,有目的,不可眉毛胡子一把抓,不分主次。
通常从事数据分析时所面对的商业问题都是较为复杂的,我们要考虑错综复杂的成因,分析所面对的各种复杂的环境因素,并在若干发展可能性中选择一个最优的方向。这就需要我们对事实有足够的了解,同时也需要我们能真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。
4、擅长模仿
在做数据分析时,有自己的想法固然重要,但是“前车之鉴”也是非常有必要学习的,它能帮助数据分析师迅速地成长,因此,模仿是快速提高学习成果的有效方法。这里说的模仿主要是参考他人优秀的分析思路和方法,而并不是说直接“照搬”。成功的模仿需要领会他人方法精髓,理解其分析原理,透过表面达到实质。万变不离其宗,要善于将这些精华转化为自己的知识,否则,只能是“一直在模仿,从未超越过”。
5、勇于创新
通过模仿可以借鉴他人的成功经验,但模仿的时间不宜太长,并且建议每次模仿后都要进行总结,提出可以改进的地方,甚至要有所创新。创新是一个优秀数据分析师应具备的精神,只有不断的创新,才能提高自己的分析水平,使自己站在更高的角度来分析问题,为整个研究领域乃至社会带来更多的价值。现在的分析方法和研究课题千变万化,墨守成规是无法很好地解决所面临的新问题的。
听到这里,小白就掰着手指头算自己符合几条优秀数据分析师的素质和能力。
Mr.林继续说道:这些素质能力不是说有就有的,需要慢慢培养形成,不能一蹴而就。
商业智能技术未来发展趋势
作者:CIO时代网
伴随着全球经济一体化进程的加快,国内企业将面临来自国际大型跨国公司的巨大竞争压力,企业所处的环
境更加复杂多变,市场竞争趋向白热化,企业在不断壮大自身的同时,其组织结构也变得越来越复杂。企业要想
在这种环境下生存和发展,就必须高效、正确的响应各种状况,这时候就需要一种手段来帮助企业对经营过程中
产生的数据进行收集、整理、分析以及评估,然后做出正确的预测,从而实现从数据到信息、从信息到知识、从
知识到利润的转化,这种手段就是商业智能(BI)。
商业智能(BI)是在计算机软硬件、网络、通讯、决策等多种成熟技术的基础上出现的,用于处理海量数据
的一项技术。它需要从来源多样的数据资源(数据库、数据仓库、Web等)中发现规律,而这将主要依赖数据仓库
(DW),联机分析处理(OLAP),数据挖掘(DM)等技术来实现。商业智能不仅用来辅助商业活动作出快速反应
,发现商务运营过程中存在的问题,加快知识的获取速度,满足决策层对信息知识的时间性和准确性的要求。而
且通过商业智能,能够把先进的信息技术应用到整个企业、不仅为其提供信息获取能力,而且通过对信息的开发
,将其转变为企业的竞争优势。
商业智能(BI)为什么受到目前国内外企业界和软件界如此广泛的关注?可以用两点来回答这种热点出现的
原因:首先、信息技术的高速发展带来了企业利用信息技术提高本身竞争力的巨大空间:信息技术不但使企业获
取需要的信息,而且,促进企业对信息的再利用,以此营造企业的竞争优势:其次、IT界许多以提供软件平台和
工具平台的大公司通过多年与企业的交流,已经认识到企业对商业智能的迫切需求,纷纷加入到从事商业智能的
研究与开发上来。
目前,商业智能及其技术的理念以及它们可能为企业、事业和政府所带来的经济效益和管理水平的提高已经
得到部分认可。但由于BI目前尚处于从起步阶段到发展阶段的转型时期,国内许多企业决策者对BI及其技术尚处
于观望状态,甚至许多人对BI的理解存在一定的偏差。很多人认为BI仅仅是一个进行数据分析的软件包,一些较
为悲观的人认为BI是存在于理想家头脑中的、企业永远不可能达到的境界。
应该掌握的数据分析术语
1、增长:
增长就是指连续发生的经济事实的变动,其意义就是考查对象数量的增多或减少。
2、百分点:
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。
3、倍数与番数:
倍数:两个数字做商,得到两个数间的倍数。
番数:翻几番,就是变成2的几次方倍。
4、指数:
指数是指将被比较数视为100,比较数相当于被比较数的多少得到的数。
5、比重:
比重是指总体中某部分占总体的百分比
6、拉动。。。增长。。。:
即总体中某部分的增加值造成的总体增长的百分比。
summitzhu网友给的例子:某业务增量除以上年度的整体基数=某业务增量贡献度乘以整体业务的增长率。例如:去年收入为23(其中增值业务3),今年收入为34(其中增值业务5),则增值业务拉动收入增长计算公式就为:(5-2)/23=(5-2)/(34-23)×(34-23)/23,解释3/(34-23)为数据业务增量的贡献,后面的(34-23)/23为增长率。
7、年均增长率:
即某变量平均每年的增长幅度。
8、平均数:
平均数是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。
公式为:总数量和÷总份数=平均数。
9、同比与环比
同比:同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比而达到的相对发展速度。如,本期2月比去年2月,本期6月比去年6月等。
环比:环比发展速度是报告期水平与前一时期水平之比,表明现象逐期的发展速度。如计算一年内各月与前一个月对比,即2月比1月,3月比2月,4月比3月 ……12月比11月,说明逐月的发展程度。
10、复合增长率
复合增长率是指一项投资在特定时期内的年度增长率,计算方法为总增长率百分比的n方根,n相等于有关时期内的年数。
公式为:(现有价值/基础价值)^(1/年数)-1
我用迈普通信技术股份有限公司CIO郑雪:我们为什么选择了非SaaS结构?的文章回复你:
显性费用就如同购买软件的费用、购买license用户数的费用、购买定制服务的费用、购买实施服务/咨询服务/项目管理服务的费用、购买主动运维服务/技术支持服务/应用支持服务的费用。但国内目前现状是,这些服务类的费用往往不显性,或打包,或打折,或收不到钱只能低质量低免费相互将就做。
这样来看,似乎SaaS这样明算账的费用,确实比现有非SaaS软件要高。
如果是非SaaS类,服务器就在我自己的机房,软件和数据就在我的服务器上,除了网上的黑客攻击窃取数据,剩下的只能是自己的员工。黑客没脾气对付,只能加强硬件防火墙和IP限制VPN限制。对自己内鬼,惩罚措施就多了。但对于软件和数据如果在SaaS提供商手中,虽然对付黑客能力高了一些,各种灾备方案多了一些,但对内鬼的惩罚却多了一道口子。怎么举证?怎么惩罚?
俺也来提几个问题,请高手解答:
与许多的公司一样,企业在发展壮大进程中,现有IT架构是否遇到以下困难: | ||||||
|
老毕这几个问题有点意思了
1、IT架构问题 - 现在不是云计算么?如果真的规模大,用这个也不错啊。还有就是专业的IT infrastructure 外包的服务,如果生意上几十亿的,可以考虑的。这个问题好像是老生长谈了,只是很多零售企业想不明白。
2、大量数据产生,如何管理 - 一直在谈客户驱动的零售业转型,什么供应链啊、营销啊,都必须看客户的需求,所以,充分利用好宝贵的海量的数据,是很有意思的一个话题。当然,技术上如何管理海量数据,让系统不慢,这就看如何规划应用架构了,什么时期的数据放什么地方,怎么利用,等等,都是需要充分考虑的,如果实在对业务有影响了,那么重新进行应用架构的调整,虽然痛苦,但是也不得不为的。