2018年计划

自从2016年年末入坑数据方面的工作之后,感觉很多东西与理想还是有一定的差距的,简单的说就是1种探索的过程吧。
虽然在工作方面一直让我们关注如下一些技术:

  • 图数据库
  • d3与可视化
  • MPI与多核开发
  • GPU与多核开发

当然还有一些其他的内容,就不一一叙述了。
在之前,自己对数据质量的认知只局限于数据处理的前几步而已,没想到结果出来的是1个系统。
对于可视化方面,自己的认知只是抽象的几个点,而实际更多的是业务上的图形表示,就是将点换成图标而已,对于底层的很多内容都是不涉及的。
因此,在距离2018还有半个月的日子里,总结自己在2017年的不足,提供2018年的方向。
2018年,更多的不是追随这些所谓的技术,毕竟替代性太强了,也没什么意义。
自2016年末,自己逐渐不追求什么所谓的技术,更多的是面向理论后,2018年更要坚持这个方向。
在2017年对以下的内容有了一定的建树:

  • 统计学与数理统计
  • 线性代数

实话说,会调用几个api不是什么厉害的事情,你说你会numpy、scipy、pandas真的不是什么稀罕的事情,谁都会。
但是你如果能把实际的业务转换为模型,然后再使用Python来操作,这就不是一个简单的事情了。
有时候,要放下浮躁的心态,尽量少去研究什么机器算法,什么TensorFlow这样的库。针对没啥意思,还不如把基础打牢了。
很多东西,实际上不需要什么机器算法也可以很简单的解决,甚至比他做的还要简单,这是自己这么多年的感触。就比如图遍历的问题,很多人一上来就说什么深度遍历、广度遍历算法,于是在网上找了个库或复制了一段代码,就说自己把图遍历算法学会了。
对于这个问题,实际上有很多的解决方式,只是看你哪个比较熟手,就用哪个。至于效率,那只能有了其他的解决方式之后才能比较。
因此,2018年更多的是对如下的内容进行建树:

  • 时间序列
  • 贝叶斯统计
  • 非参数统计

简单的说,就是数据科学中更多的内容。你说你是数据工程师,真的没什么吸引力。说句不好听的,你就是个会查数据、会画图表的程序员而已,这就是当前国内对数据工程师的定义。
当然,更多的是要锻炼自己对业务逻辑的处理才是王道。
最后,关于deliver(交付)的问题,就不明说了。有些东西,人家看的一知半解,就没必要提醒别人了。毕竟我同意你的观点,你的观点很有建设意义,但是我还是坚持我的观点,就这么简单。

若文章对您有帮助,请打赏1块钱。您的支持,可以让我分享更多精彩的文章。转载请注明来源


知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议进行许可。