关于编程语言Pig的几点看法

近期入门了下Pig编程语言,发现这个数据流(dataflow)编程语言也没有什么神奇的地方,至少它能实现的功能,使用其他的语言也是可以实现的。
但是,使用pig比使用其他语言会更加方便一些,至少不需要编写那么多的代码。而且它的执行过程是结构化的,通过你编写的脚本,将其转换为MapReduce对应的代码,再执行。
而Hadoop也不是什么的东西,它实现了自己的文件系统。只是这个文件系统可以彼此连接在一起,然后将对应的程序上传到该文件系统HDFS上,读取并进行相应的执行。
使用Pig有1个好处,那就是不需要执行代码,就可以看出其流程及结果,对于调试来说是很方便的。
Pig作为1门数据流编程语言,通过了1种分布式的编程方式。对于菱形的数据流处理也是支持的,换句话说,其支持DAG(有向图)的方式处理数据。
更多的看法,只有在更多的时候后才能给出。

若文章对您有帮助,请打赏1块钱。您的支持,可以让我分享更多精彩的文章。转载请注明来源


知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议进行许可。