贵州“大扶贫 数据分析”正是十三五期间最大的发展战略。从贵阳机场到市区的路上,“抓紧推进大扶贫 数据分析两个战略行动”的横幅时常进入视野。那么在“数据分析时代“下,我们应该如何去创造一个”数据分析“产品?如何采集并利用数据?以下几点是我在“数据分析时代”下的产品思考。
确定产品定位
数据收集
数据收集即自己去收集数据,成为数据拥有者,通过数据授权等方式利用数据。
数据分析
拥有出色的数据分析技术,从别人提供的数据那挖掘数据的价值。
数据创新
没有数据,也没有出色的技术。但是看到了数据之间的联系,预见到了数据存在的价值,成为这方面的先行者。
转变产品思维
很多时候,我们能获取约等于全局的数据量,但是我们很多时候还是用原先的数据处理方式。
原先我们只能获取一部分数据,然后以这部分数据去估算。所以我们的数学模型对数据的精确性和随机性要求非常高,因为数据是这么的少,改变一点点就能带来结果上的巨大偏差。现在我们拥有了更多的数据,使用相对简单的算法,只需带入更多的数据就会拥有更精确的结果。
数据不再是单一的,结构化的,而是混杂的。
“小数据”时,我们会去给数据分类分级,去尽可能的结构化他们,我们能应付过来,但是如今,数据多种多样,很多时候你根本没有办法把他们分类分级。但我们可以利用这种混乱,比如给照片设定标签,开辟一个新的数据种类。
数据分析时代推崇的是相关关系而不是因果关系。
这也是数据分析的核心:利用相关关系作出预测,而不去分析它的原因。我们只知道“是什么”,而不知道“为什么”。但是前者很明显更简单直接的解决了问题。但是这并不意味着“因果关系”不再重要,我们要抛弃它。比如沃尔玛通过数据分析发现,飓风来临的时候蛋挞销量特别好,那么我们就可以在飓风来临时,多做蛋挞并摆在显眼的位置以增加销量。但是我们并不知道为什么它们会相关。
获取数据
数字化同时数据化。
数字化是数据化的基础,比如仅仅扫描一本书,让它能够在电子设备上阅读,这叫数字化。但是你还不能处理上面的文字,做一些分析,我们需要通过图片文字识别技术,来将扫描的书转化成可以提取分析的文本数据。只有数据化的数据才对我们的产品有价值。
从看似不可能的地方提取数据。
因为数据存储成本的变低和数据价值的巨大,我们可以收集更多的数据存储起来以期日后能挖掘出价值。我们要开拓思维,从许多看似不可能的地方收集数据。比如,一家日本汽车服务商,创新的把传感器放到了汽车座椅上,经过记录与分析,我们可以判断司机的体型,习惯坐姿,受力等等数据,如果一个小偷坐上了汽车,传感器感受到了变化,就会让其输入启动密码以确认身份。
提前设计扩展数据。
数据在不断的再利用中才能发挥出其最大的价值,一开始就设计好数据的可扩展性能让这种再利用更容易,虽然这并不总是可能。谷歌街景车在收集信息之初,考虑到了自己未来的自动汽车计划。所以在采集的时候,记录下的街景和GPS定位信息将来不仅可以优化地图也能用于自动汽车的研发。
利用数据废气。
我们看看谷歌是怎么利用登录的验证码的:它将验证码变成一些常见的错误拼写单词,每次用户登录输入这些验证码的时候就要求其输入成正确的单词。这一举措让谷歌的拼写检查器得到了巨大的提高,而且还是免费的。
三句话总结贵州数据分析发展特点:一是天赐加良机,立足气候凉爽、地质稳定、电力充足等先天优势,抓住了稍纵即逝的窗口期,与世界处在同一起跑线上;二是笨鸟加先飞,虽然‘家底’薄,但是敢于先发声,在以‘月’为单位变化的数据分析行业成了领路人;三是领跑加群跑,政府领跑、企业群跑,数据分析生态链逐步形成。
服务热线
0571-85383032
售前咨询(09:00-17:00)
Copyright@2008-2016 博软(杭州)科技有限公司 版权所有 浙ICP备18055996号