大數據的一指禪--Hcatalog

Hcatalog盡管作為一個子項目，卻給整個Hadoop生態環境帶來了一股清流，它讓數據的訪問不再雜亂無章，那么Hcatalog有什么樣的作用呢？它是怎樣統一定義數據的呢？

創新互聯是一家集網站建設,新興企業網站建設,新興品牌網站建設,網站定制,新興網站建設報價,網絡營銷,網絡優化,新興網站推廣為一體的創新建站企業，幫助傳統企業提升企業形象加強企業競爭力。可充分滿足這一群體相比中小企業更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業、時尚、前沿，時刻以成就客戶成長自我，堅持不斷學習、思考、沉淀、凈化自己，讓我們為更多的企業打造出實用型網站。

HCatalog是用來訪問Metastore的Hive子項目，它的存在給了整個Hadoop生態環境一個統一的定義。

為什么這樣說呢？在整個生態中，使用HDFS的項目是很多的，比如Hive、Pig、Spark，它們會去使用同樣一個HDFS的數據。當它們訪問數據的時候，Hive可能會將數據解析為整型，Pig解析成String類型，Spark解析成其它的類型，所以這個定義并沒有統一起來。而Hcatalog就可以統一給一個定義，例如數據定義為整型，所有項目通過Hcatalog來訪問數據，訪問到的數據類型就都為整型。

Hcatalog可以通過命令行及RESTAPI來訪問，允許你使用HiveQLDDL語法來定義表。從Hive、Impala、MapReduce、Pig和其他工具來訪問表，包含在CDH4.2及之后的版本中。