Hcatalog盡管作為一個子項目,卻給整個Hadoop生態環境帶來了一股清流,它讓數據的訪問不再雜亂無章,那么Hcatalog有什么樣的作用呢?它是怎樣統一定義數據的呢?
創新互聯是一家集網站建設,新興企業網站建設,新興品牌網站建設,網站定制,新興網站建設報價,網絡營銷,網絡優化,新興網站推廣為一體的創新建站企業,幫助傳統企業提升企業形象加強企業競爭力。可充分滿足這一群體相比中小企業更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們為更多的企業打造出實用型網站。
HCatalog是用來訪問Metastore的Hive子項目,它的存在給了整個Hadoop生態環境一個統一的定義。
為什么這樣說呢?在整個生態中,使用HDFS的項目是很多的,比如Hive、Pig、Spark,它們會去使用同樣一個HDFS的數據。當它們訪問數據的時候,Hive可能會將數據解析為整型,Pig解析成String類型,Spark解析成其它的類型,所以這個定義并沒有統一起來。而Hcatalog就可以統一給一個定義,例如數據定義為整型,所有項目通過Hcatalog來訪問數據,訪問到的數據類型就都為整型。
Hcatalog可以通過命令行及RESTAPI來訪問,允許你使用HiveQLDDL語法來定義表。從Hive、Impala、MapReduce、Pig和其他工具來訪問表,包含在CDH4.2及之后的版本中。
在HCatalog中創建表
(1)HCatalog使用Hive的DDL語法,可以使用-e選項來指定單個命令。
(2)Tip:保存很長的命令為文件,使用-f選項. 如果文件中包含多條語句,使用分號分隔
在HCatalog里查看元數據
(1)SHOW TABLES命令也可以直接查看表
(2)DESCRIBE命令列出指定表的字段,允許你使用HiveQLDDL語法來定義表
在HCatalog里移除表
(1)DROP TABLE命令跟Hive和Impala里一樣
注意:將同時移除數據和元數據(除了外部表)
我們在平常學習的過程中就要重視此類子項目的使用以及它們的作用,掌握和理解它們對于我們更好的掌握大數據技術有著重要的意義。我平時喜歡關注微信資訊平臺“大數據cn”,關注一些大數據的最新信息及一些知識經驗分享,改善了我自己的知識架構。
文章題目:大數據的一指禪--Hcatalog
文章起源:http://m.newbst.com/article32/isgjsc.html
成都網站建設公司_創新互聯,為您提供手機網站建設、建站公司、網站排名、網站策劃、ChatGPT、網站改版
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯