收集方法
1、调查法
调查方法一般分为普查和抽样调查两大类。
2、观察法
主要包括两个方面:一是对人的行为的观察,二是对客观事物的观察。观察法应用很广泛,常和询问法、搜集实物结合使用,以提高所收集信息的可靠性。
3、实验方法
实验方法能通过实验过程获取其他手段难以获得的信息或结论。
实验方法也有多种形式,如实验室实验、现场实验、计算机模拟实验、计算机网络环境下人机结合实验等。现代管理科学中新兴的管理实验,现代经济学中正在形成的实验经济学中的经济实验,实质上就是通过实验获取与管理或经济相关的信息。
4、文献检索
文献检索就是从浩繁的文献中检索出所需的信息的过程。文献检索分为手工检索和计算机检索。
5、网络信息收集
网络信息是指通过计算机网络发布、传递和存储的各种信息。收集网络信息的最终目标是给广大用户提供网络信息资源服务,整个过程经过网络信息搜索、整合、保存和服务四个步骤,
参考资料来源:搜狗百科-信息收集
业务上
1.业务为核心,数据为王
了解整个产业链的结构
制定好业务的发展规划
了解衡量的核心指标
有了数据必须和业务结合才有效果
需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。
2.思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状对
比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
争对核心用户,单独进行产品用研与需求挖掘
业务的分析大多是定性的,需要培养一种客观的感觉意识。定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。
3.规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。
技能上
1.Excel是否精钻?
除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你需要更懂数据库
常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。
3.掌握数据整理、可视化和报表制作
数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
试读结束,如需阅读或下载,请点击购买>
原发布者:阳夏秋天
数据中心数据管理方案1、公司现有数据现状现公司主要的大数据容量的主要为公司的航片数据和卫片数据、警用调查成果的照片数据,以及用来做调查的大比例尺地形图数据,目前公司勘测、数据、软件部门加起来大概50T的容量。考虑到以后的扩展和数据备份,数据中心此次预计100T的容量进行数据管理。针对这种大容量数据管理有三种解决方案:1、支持大容量的存储+磁带库备份2、多个NAS级存储3、购买大量1T和2T的硬盘(一份存储+一份备份)+行之有效的数据进出及保存制度。前段时间与公司领导从管理的方便性、投入的成本等各方面考虑讨论的结果来看,决定采用第三种解决方案——用大容量硬盘进行管理。2、硬盘购买的数量及总价存储100T左右的数据,可以采购1T或2T的硬盘进行存储(1T的硬盘相对比较稳定)。选购硬盘时需考虑到硬盘的转速、硬盘的缓存容量、硬盘的平均寻道时间、硬盘的功耗以及硬盘的价格。单碟容量是目前硬盘发展的重点,几乎就是决定硬盘档次的标准,目前盘片数量最多为5张,在盘片数无法增加的情况下,提升单碟容量是提升硬盘容量的唯一办法。所以,我们在购买硬盘的时候,选择采用垂直记录技术的产品,在性能方面表现更出色。缓存就作为硬盘中的一个缓冲的区域,调节两者之间的数据传输,缓存的大小直接影响到硬盘的性能,缓存区域越大数据的稳定性就越好,自然数据等待时间也就越短,一般反应到实际操作中就是运行速度越快。转速是影响硬盘性能的主要因素,目前主流硬盘都采用了
业务上1.业务为核心,数据为王了解整个产业链的结构制定好业务的发展规划了解衡量的核心指标有了数据必须和业务结合才有效果需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。
然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。
前期资料的收集以及业务现况的全面掌握非常关键。2.思考指标现状,发现多维规律熟悉产品框架,全面定义每个指标的运营现状对比同行业指标,挖掘隐藏的提升空间拆解关键指标,合理设置运营方法来观察效果争对核心用户,单独进行产品用研与需求挖掘业务的分析大多是定性的,需要培养一种客观的感觉意识。
定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。
3.规律验证,经验总结发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。技能上1.Excel是否精钻?除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你需要更懂数据库常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。
3.掌握数据整理、可视化和报表制作数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
如何提高数据分析能力? (2012-02-19 16:19:19)转载▼
标签: 数据分析 数据挖掘 杂谈
作为一个合格的咨询师,除了快速的学习能力和敏捷的分析能力,强大的数据分析能力也是必不可少的。笔者根据自己的经验,总结出以下几个对提高数据分析能力有帮助的方法,以供参考。一、熟悉公司业务 首先要熟悉公司业务及流程。若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值。数据分析的最终目的是作为一种分析方法来为整个项目服务。二、明确分析目的 常常会有人问这些数据可以做什么分析?这是典型的“为了分析而分析”。数据分析的前提是先明确分析目的,这样的分析才有意义;三、运用营销、管理等理论 营销、管理等理论是数据分析的指导思想,使分析思路系统化。例如4P理论等,从哪几个维度去分析?考虑哪几个方面?只有这样做才能使数据分析变得有血有肉有脉络,真正做到理论指导实践;四、掌握有效数据分析方法 了解数据分析流程,掌握数据分析基本原理与方法,并灵活运用到实践工作中,不论简单还是复杂的分析方法,只要能解决问题的方法就是好方法;五、玩转数据分析工具 数据分析工具,建议先玩转excel数据透视表,有兴趣、实践、需要的话,再学习SPSS、SAS等统计分析工具。同样,只要能解决问题的工具就是好工具;六、学会用图表说话,玩转PPT等工具 学会如何用图表有效展现分析结果,PPT有助于数据分析结果展现,达人必备;水晶易表亦对分析结果的展现有很大帮助,选择性使用;思维导图可帮助理清分析思路,根据需要选用。光做数据分析是不够的,真正要做的是将数据分析结果清晰地展现给其他人看;七、勤思考、多动手、多总结 需要经常发问为什么是这样的、为什么不是那样的。只有这样勤于思考才有突破点; 光靠脑袋想是不够的,需要多动手实践,不要怕错,大不了错了重来,数据分析就是一个不断假设、验证的过程; 不断总结分析方法、分析思路、分析流程,在总结中前行;八、关注行业动态 关注数据分析行业动态,积极地学习他人的数据分析经验;九、收藏几本分析秘籍 可在家中收藏一些使用的分析工具书,以便随时查阅,如《用图表说话》、《excel图表之道》等; 数据分析不仅是个工具,而且是门艺术,希望能与大家共勉,提高自己的数据分析能力。
参照这个来提升自己。希望对你有所帮助
我以前收藏的,挺不错:
1、存储
将硬盘分成NTFS格式,NTFS比FAT32快,并看你的数据文件大小,1G以上你可以采用多数据库文件,这样可以将存取负载分散到多个物理硬盘或磁盘阵列上。
2、tempdb
tempdb也应该被单独的物理硬盘或磁盘阵列上,建议放在RAID 0上,这样它的性能最高,不要对它设置最大值让它自动增长
3、日志文件
日志文件也应该和数据文件分开在不同的理硬盘或磁盘阵列上,这样也可以提高硬盘I/O性能。
4、分区视图
就是将你的数据水平分割在集群服务器上,它适合大规模OLTP,SQL群集上,如果你数据库不是访问特别大不建议使用。
5、簇索引
你的表一定有个簇索引,在使用簇索引查询的时候,区块查询是最快的,如用between,应为他是物理连续的,你应该尽量减少对它的updaet,应为这可以使它物理不连续。
6、非簇索引
非簇索引与物理顺序无关,设计它时必须有高度的可选择性,可以提高查询速度,但对表update的时候这些非簇索引会影响速度,且占用空间大,如果你愿意用空间和修改时间换取速度可以考虑。
7、索引视图
如果在视图上建立索引,那视图的结果集就会被存储起来,对与特定的查询性能可以提高很多,但同样对update语句时它也会严重减低性能,一般用在数据相对稳定的数据仓库中。
8、维护索引
你在将索引建好后,定期维护是很重要的,用dbcc showcontig来观察页密度、扫描密度等等,及时用dbcc indexdefrag来整理表或视图的索引,在必要的时候用dbcc dbreindex来重建索引可以受到良好的效果。
不论你是用几个表1、2、3点都可以提高一定的性能,5、6、8点你是必须做的,至于4、7点看你的需求。
表格的应用 由于工作原因,经常接触到表格。
我们发现,表格不但广泛的运用在各类数据收集和分析,同时通过表格这样一种二维矩阵来整理和陈列信息时(即便最后的展示方式并非一个典型的表格样式),能够很好的表达信息之间的逻辑关系,易于帮助理解横纵信息之间的关系。在实际的网页设计应用中,表格横纵相互独立又相互关联的模式尤其适用于:1.组织和展示大量的信息 表格简单的结构不但能包含大量的信息,且同时保证信息的可读性,便于读者快速扫描信息、从大量的条目中找到所需的信息。
2.展示对比性信息 通过合理的布局,表格能清晰的展示出同类对比信息,便于读者分辨不同条目信息之间的关联和区别,从而关注到关键、问题条目。总的来说,一个构造清晰的表格布局,将大大提升读者对信息的接收速度和理解程度。
例如下图中苹果官网对不同型号mac book的信息陈列方式,就采用了表格的结构,清晰的展示了4款不同的macbook,及各自的性能、售价等属性,同时读者第一眼就可以扫描到并理解表格结构,横向是4款macbook的排列,纵向分别列出了各自的属性,然后进一步就可以根据自己的兴趣点就4款macbook的不同属性进行对比,信息完整且便于扫描。如上所述,表格常用来展示大量的、对比性的信息,因此提高表格的可读性、便于用户快速扫描,是表格设计的关键。
本文仅就笔者阅读过的几篇关于表格设计的文章结合工作中的一些拙见,整理成文,分享如下。表格的要素 研究如何提高表格可读性之前,我们先简要阐述下表格的组成要素,这里我们暂且这么总结:表格 = 标题 + 表头 + 行标签 + 单元格数据(信息),如下图 表格标题是对表格整体的描述,应包含表格数据的来源及属性,使读者对表格内容有所认识,例如数据收集的日期、地区及其表格数据的其他属性。
行标签和列标签(表头) 是对本行/本列数据的描述,可以理解为是表格的骨架,是用户快速扫描并接收表格布局的关键要素。单元格数据(单元格信息)这里就不在多说,是表格的主体内容。
提高表格可读性的一些技巧 1. 根据表格的用途,设计表格的布局 如下图,两张表格中所包含的数据完全相同,是关于10座山峰的高度和人类登顶年份数据。不同的是他们的成列方式:表1a根据山峰的高度排序陈列,而表1b则根据人类登顶山峰的年份排序陈列,一眼之下,这两张表无设计优劣高下之分,决定使用两站表中的哪一张的根据是这组数据的用途,如果这张表是用于向读者展示世界上的TOP 10山峰,则山峰的高度则是重点信息,a表的展示方式会更加合适;反之,如果这张表意在展示10大高峰中,哪座山峰是人类最先登顶的,人类先后登顶的时间顺序是读者的主要兴趣点,则表b就更加适用。
2. 减少读者计算 其实类似上一点,表格的指标也不是永远固定的,而是从读者阅读表格的目的出发,调整所需展示的指标。在原始数据的基础上给出差值、总计等分析性的数据,可以直达用户阅读的目标,而尽量减少用户心算或者线下处理的过程。
例如下图展示了2010年与2009年两年的公司财政报表,查看两年的具体数据当然必要,但深入分析,读者之所以要并列查看两年的数据,目的在于对比两年的数据变化,因此将指标变化情况列出能帮助用户更快的达成目标。3.精简指标,创造信息层级 尽量减少或压缩指标数量,避免出现用户不需要的数据,默认只展示用户所必须的信息,用户需要的非重点辅助信息可以通过提供深入细节的入口(弹窗、下拉)等形式来解决,仅在用户需要时进行提供。
创造信息层级,避免无主次的铺出所有信息,干扰用户快速扫描定位目标条目。例如易迅的“我的订单”列表中,就将用户的信息、订单状态跟踪信息进行了默认隐藏,同时通过链接色很好的提示了进一步细节信息的入口,在用户需要时,可以方便的查阅。
4.不留空白单元格 当表格单元格中没有相应数据时,要避免直接留出空白单元格。空白单元格容易造成读者的困惑甚至误解,读者会搞不清楚到底是没有数据,还是根本没有值?正确做法,没有数据的显示0,给没有值的单元格划线或者打叉。
如下图:5.斑马条的运用 横向或纵向的斑马线以及悬停高亮底色能够很好的引导用户的视线,避免在阅读时出现错行、迷失的情况:斑马线会使得行与行的界限更为分明,尤其对数据列较多时的横向引导得到加强,这样看行内的内容时不容易错行,而悬停变色行主要是配合操作交互,明确区分出光标所在的行。6.高亮重点信息,提高阅读速度 通过合理的使用icon、背景色等视觉元素高亮重点信息,能够提高用户的阅读速度,帮助读者更快定位重点信息,例如下表中利用红绿的上下箭头很好的向用户表达了年度财务的变化情况。
7.对齐,便于用户快速浏览 对比的数据如果有了明确的对齐方式,会大大提升数据的浏览效率,增加对比的效果。通常,我们将数据右对齐,便于对比:通过数字位数的长短即可对比数字的量级和大小;文字左对齐,符合人们阅读从左到右的习惯;而对一些固定长度的状态文字(如已完成,待支付等)采用居中对齐,使这些状态文字更突出。
像下面的图中,如果数据居中对齐没。
数据分析的三个常用方法:
1. 数据趋势分析
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
趋势分析,最好的产出是比值。在趋势分析的时候需要明确几个概念:环比,同比,定基比。环比是指,是本期统计数据与上期比较,例如2019年2月份与2019年1月份相比较,环比可以知道最近的变化趋势,但是会有些季节性差异。为了消除季节差异,于是有了同比的概念,例如2019年2月份和2018年2月份进行比较。定基比更好理解,就是和某个基点进行比较,比如2018年1月作为基点,定基比则为2019年2月和2018年1月进行比较。
比如:2019年2月份某APP月活跃用户数我2000万,相比1月份,环比增加2%,相比去年2月份,同比增长20%。趋势分析另一个核心目的则是对趋势做出解释,对于趋势线中明显的拐点,发生了什么事情要给出合理的解释,无论是外部原因还是内部原因。
2. 数据对比分析
数据的趋势变化独立的看,其实很多情况下并不能说明问题,比如如果一个企业盈利增长10%,我们并无法判断这个企业的好坏,如果这个企业所处行业的其他企业普遍为负增长,则5%很多,如果行业其他企业增长平均为50%,则这是一个很差的数据。
对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。在此我向大家推荐一个大数据技术交流圈: 658558542 突破技术瓶颈,提升思维能力 。
一般而言,对比的数据是数据的基本面,比如行业的情况,全站的情况等。有的时候,在产品迭代测试的时候,为了增加说服力,会人为的设置对比的基准。也就是A/B test。
比较试验最关键的是A/B两组只保持单一变量,其他条件保持一致。比如测试首页改版的效果,就需要保持A/B两组用户质量保持相同,上线时间保持相同,来源渠道相同等。只有这样才能得到比较有说服力的数据。
3. 数据细分分析
在得到一些初步结论的时候,需要进一步地细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分一定要进行多维度的细拆。常见的拆分方法包括:
分时 :不同时间短数据是否有变化。
分渠道 :不同来源的流量或者产品是否有变化。
分用户 :新注册用户和老用户相比是否有差异,高等级用户和低等级用户相比是否有差异。
分地区 :不同地区的数据是否有变化。
组成拆分 :比如搜索由搜索词组成,可以拆分不同搜索词;店铺流量由不用店铺产生,可以分拆不同的店铺。
细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。
统计数据的搜集方法:
在实际调查中,搜集数据的具体方法主要有访问调查、邮寄调查、电话调查、座谈会、个别深度访问、网上调查。
1、访问调查:
访问调查又称派员调查,它是调查者与被调查者通过面对面地交谈从而得到所需资料的调查方法。
2、邮寄调查:
邮寄调查是通过邮寄或其他方式将调查问卷送至被调查者,由被调查者填写,然后将问卷寄回或投放到指定收集点的一种调查方法。
3、电话调查:
电话调查是调查人员利用电话通受访者进行语言交流,从而获得信息的一种调查方式。电话调查优点是时效快、费用低;不足是调查问题的数量不能过多。
4、座谈会:
座谈会也称为集体访谈法,它是将一组受访者集中在调查现场,让他们对调查的主题发表意见,从而获取调查资料的一种方法。这种方法适用于搜集与研究课题有密切关系的少数人员的倾向和意见。
5、个别深度访问:
个别深度访问是一次只有一名受访者参加的特殊的定性研究。常用于动机研究,以发掘受访者非表面化的深层次意见。这种方法最适宜于研究较隐秘的问题,如个人隐私;较敏感的问题等。
6、网上调查:
网上调查主要有E-mail、交互式CATI系统、互联网CGI程序三种方法。
拓展资料:
统计数据搜集的组织形式:
统计数据搜集的组织形式有普查、抽样调查、统计报表、重点调查、典型调查等。
1、普查:
普查是为了某种特定的目的而专门组织的一次性的全面调查,用以搜集重要国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。
2、抽样调查:
抽样调查是实际应用中最广泛的一种调查方法,他是从调查对象的总体中随机抽取一部分单位座位样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法。
3、统计报表:
统计报表是一种以全面调查为主的调查方式,它是由政府主管部门根据统计法规,以统计表格形式和行政手段自上而下布置,而后由企、事业单位自下而上层层汇总上报逐级提供基本统计数据的一种调查方式
4、重点调查:
重点调查是专门组织的一种非全面调查,它是在总体中选择个别的或部分重点单位进行调查,以了解总体的基本情况。
5、典型调查:
典型调查也是专门组织的一种非全面调查,它是根据调查研究的目的和要求,在对总体进行全面分析的基础上,有意识的选择其中有代表性的典型单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化规律。
一、掌握基础、更新知识。
基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识), 多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。
数据库查询—SQL 数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个数据提取的问题。有机会可以去逛逛一些专业的数据论坛,学习一些SQL技巧、新的函数,对你工作效率的提高是很有帮助的。
统计知识与数据挖掘 你要掌握基础的、成熟的数据建模方法、数据挖掘方法。例如:多元统计:回归分析、因子分析、离散等,数据挖掘中的:决策树、聚类、关联规则、神经网络等。
但是还是应该关注一些博客、论坛中大家对于最新方法的介绍,或者是对老方法的新运用,不断更新自己知识,才能跟上时代,也许你工作中根本不会用到,但是未来呢?行业知识 如果数据不结合具体的行业、业务知识,数据就是一堆数字,不代表任何东西。是冷冰冰,是不会产生任何价值的,数据驱动营销、提高科学决策一切都是空的。
一名数据分析师,一定要对所在行业知识、业务知识有深入的了解。例如:看到某个数据,你首先必须要知道,这个数据的统计口径是什么?是如何取出来的?这个数据在这个行业, 在相应的业务是在哪个环节是产生的?数值的代表业务发生了什么(背景是什么)?对于A部门来说,本月新会员有10万,10万好还是不好呢?先问问上面的这个问题:对于A部门,1、新会员的统计口径是什么。
第一次在使用A部门的产品的会员?还是在站在公司角度上说,第一次在公司发展业务接触的会员?2、是如何统计出来的。A:时间;是通过创建时间,还是业务完成时间。
B:业务场景。是只要与业务发接触,例如下了单,还是要业务完成后,到成功支付。
3、这个数据是在哪个环节统计出来。在注册环节,在下单环节,在成功支付环节。
4、这个数据代表着什么。10万高吗?与历史相同比较?是否做了营销活动?这个行业处理行业生命同期哪个阶段?在前面二点,更多要求你能按业务逻辑,来进行数据的提取(更多是写SQL代码从数据库取出数据)。
后面二点,更重要是对业务了解,更行业知识了解,你才能进行相应的数据解读,才能让数据产生真正的价值,不是吗?对于新进入数据行业或者刚进入数据行业的朋友来说:行业知识都重要,也许你看到很多的数据行业的同仁,在微博或者写文章说,数据分析思想、行业知识、业务知识很重要。我非常同意。
因为作为数据分析师,在发表任何观点的时候,都不要忘记你居于的背景是什么?但大家一定不要忘记了一些基本的技术,不要把基础去忘记了,如果一名数据分析师不会写SQL,那麻烦就大了。哈哈。
你只有把数据先取对了,才能正确的分析,否则一切都是错误了,甚至会导致致命的结论。
新同学,还是好好花时间把基础技能学好。因为基础技能你可以在短期内快速提高,但是在行业、业务知识的是一点一滴的积累起来的,有时候是急不来的,这更需要花时间慢慢去沉淀下来。
不要过于追求很高级、高深的统计方法,我提倡有空还是要多去学习基本的统计学知识,从而提高工作效率,达到事半功倍。以我经验来说,我负责任告诉新进的同学,永远不要忘记基本知识、基本技能的学习。
二、要有三心。1、细心。
2、耐心。3、静心。
数据分析师其实是一个细活,特别是在前文提到的例子中的前面二点。而且在数据分析过程中,是一个不断循环迭代的过程,所以一定在耐心,不怕麻烦,能静下心来不断去修改自己的分析思路。
三、形成自己结构化的思维。数据分析师一定要严谨。
而严谨一定要很强的结构化思维,如何提高结构化思维,也许只需要工作队中不断的实践。但是我推荐你用mindmanagement,首先把你的整个思路整理出来,然后根据分析不断深入、得到的信息不断增加的情况下去完善你的结构,慢慢你会形成一套自己的思想。
当然有空的时候去看看《麦肯锡思维》、结构化逻辑思维训练的书也不错。在我以为多看看你身边更资深同事的报告,多问问他们是怎么去考虑这个问题的,别人的思想是怎么样的?他是怎么构建整个分析体系的。
四、业务、行业、商业知识。当你掌握好前面的基本知识和一些技巧性东西的时候,你应该在业务、行业、商业知识的学习与积累上了。
这个放在最后,不是不重要,而且非常重要,如果前面三点是决定你能否进入这个行业,那么这则是你进入这个行业后,能否成功的最根本的因素。 数据与具体行业知识的关系,比作池塘中鱼与水的关系一点都不过分,数据(鱼)离开了行业、业务背景(水)是死的,是不可能是“活”。
而没有“鱼”的水,更像是“死”水,你去根本不知道看什么(方向在哪)。如何提高业务知识,特别是没有相关背景的同学。
很简单,我总结了几点:1、多向业务部门的同事请教,多沟通。多向他们请教,数据分析师与业务部门没有利益冲突,而更向是共生体,所以如果你态度好,相信业务部门的同事也很愿意把他们知道的告诉你。
2、永远不要忘记了google大神,定制一些行业的关键字,每天都先看看定制的邮件。3、每天有空去浏。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.365秒