1. Pig :
Pig用于分析大量的数据。它是对MapReduce的抽象。Pig用于在Hadoop中执行各种数据处理操作。它提供了Pig-Latin语言来编写代码,其中包含许多内置的功能,如连接、过滤等。Apache Pig的两个部分是Pig-Latin和Pig-Engine。Pig引擎用于将所有这些脚本转换为特定的映射和还原任务。Pig的抽象是在一个较高的水平。与MapReduce相比,它包含的代码行数更少。

2. Hue :
Hue是一个网络用户界面,提供一些服务,Hue是一个Hadoop框架。Hue提供了一个网络用户界面,以及浏览HDFS的文件路径。Hue最重要的功能是作业浏览器、Hadoop shell、用户管理权限、Impala编辑器、HDFS文件浏览器、Pig编辑器、Hive编辑器、Ozzie网页界面和Hadoop API访问。这种网络用户界面布局有助于用户浏览文件,类似于普通的windows用户在他的机器上定位他的文件。Hue为编程语言提供了一个网络用户界面,这是一个方便的工具,可以让用户在执行查询时避免语法错误。Hue只需使用网络浏览器就可以安装或配置。

Pig和Hue之间的区别:

Pig Hue
Pig在集群的客户端运行。 Hue是一个网络用户界面,提供一些服务,Hue是一个Hadoop框架。
Pig不支持JDBC。 Hue支持JDBC。
Pig是通过Web UI界面或命令行界面实现和访问的。 Hue是在一个网络浏览器上实现的,我们可以访问安装在Cloudera上的多个程序。
Pig不支持模式来存储数据。 Hue支持在表中插入数据的模式。
Pig是由研究人员和程序员使用的。 Hue主要由数据分析师使用。
Pig用于处理结构化和半结构化的数据。 Hue主要用于处理结构化数据。
Pig不支持ODBC。 Hue支持ODBC。
Pig支持Avro文件格式。 Hue不支持Avro文件格式。
Pig使用map-reduce算法来处理和分析数据。 Hue提供Web UI编辑器,可以通过Hive和其他编程语言访问。