這篇文章將為大家詳細講解有關hive支持MongoDB具體的連接方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創新互聯-專業網站定制、快速模板網站建設、高性價比甘谷網站開發、企業建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式甘谷網站制作公司更省心,省錢,快速模板網站建設找我們,業務覆蓋甘谷地區。費用合理售后完善,10年實體公司更值得信賴。
hive支持mongodb,具體的連接方法如下:
創建基于MongoDB的Hive表是通過MongoStorageHandler來處理的。它同樣處理從Hive表里查詢與插入數據(通過select與insert)。
CREATE [EXTERNAL] TABLE <tablename> (<schema>) STORED BY 'com.mongodb.hadoop.hive.MongoStorageHandler' [WITH SERDEPROPERTIES('mongo.columns.mapping'='<JSON mapping>')] TBLPROPERTIES('mongo.uri'='<MongoURI>');
有兩種方式來指定所需連接的Mongo Collection。
1. 在上述示例里面,通過mongo.uri這個表屬性來指定,屬性的值填入的是MongoDB connection string,通過它來指向具體的collection。這種方式會將這個URI存入表的metadata里面,如果需要填寫連接的一些認證信息(如username:password等),該方式不太適合。
2. 第二種方式是把connection string填入一個properties文件,如:
# HiveTable.properties mongo.input.uri=mongodb://...
然后提供這個文件的路徑給mongo.properties.path這個表參數,如
CREATE TABLE ... TBLPROPERTIES('mongo.properties.path'='HiveTable.properties')
備注:在創建相應Hive表時所引用的MongoDB collection不一定要空的。
在創建Hive表的時候,也可以選擇性的指定MongoDB collection里的字段與Hive的列字段或struct字段的映射。指定的方式是在SERDEPROPERTIES里通過mongo.columns.mapping屬性來指定。在創建基于BSON文件的Hive表時也可以用到。
如果創建的表是EXTERNAL的,那么在Hive里刪除這張表時,不會影響MongoDB里面的數據,只會刪除這張表的metadata。如果沒有指定EXTERNAL,那么刪除表的時候會連帶MongoDB里的數據一并刪除,因此最好是指定創建的表為EXTERNAL。
關于hive支持mongodb具體的連接方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
網站名稱:hive支持mongodb具體的連接方法
網站路徑:http://m.newbst.com/article30/jechso.html
成都網站建設公司_創新互聯,為您提供商城網站、自適應網站、建站公司、營銷型網站建設、企業建站、關鍵詞優化
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯