Hive 分區(qū)

2021-09-28 14:25 更新

Hive組織表到分區(qū)。它是將一個(gè)表到基于分區(qū)列,如日期,城市和部門的值相關(guān)方式。使用分區(qū),很容易對(duì)數(shù)據(jù)進(jìn)行部分查詢。

表或分區(qū)是細(xì)分成桶,以提供額外的結(jié)構(gòu),可以使用更高效的查詢的數(shù)據(jù)。桶的工作是基于表的一些列的散列函數(shù)值。

例如,一個(gè)名為Tab1表包含雇員數(shù)據(jù),如 id, name, dept 和yoj (即加盟年份)。假設(shè)需要檢索所有在2012年加入,查詢搜索整個(gè)表所需的信息員工的詳細(xì)信息。但是,如果用年份分區(qū)雇員數(shù)據(jù)并將其存儲(chǔ)在一個(gè)單獨(dú)的文件,它減少了查詢處理時(shí)間。下面的示例演示如何分區(qū)的文件和數(shù)據(jù):

下面文件包含employee 數(shù)據(jù)表。

/tab1/employeedata/file1

id, name, dept, yoj
1, gopal, TP, 2012
2, kiran, HR, 2012
3, kaleel,SC, 2013
4, Prasanth, SC, 2013

上面的數(shù)據(jù)被劃分成使用年兩個(gè)文件。

/tab1/employeedata/2012/file2

1, gopal, TP, 2012
2, kiran, HR, 2012

/tab1/employeedata/2013/file3

3, kaleel,SC, 2013
4, Prasanth, SC, 2013

添加分區(qū)

可以通過(guò)添加分區(qū)表改變所述表。假設(shè)我們有一個(gè)表叫employee ,擁有如 Id, Name, Salary, Designation, Dept, 和 yoj等字段。

語(yǔ)法:

ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec
[LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;

partition_spec:
: (p_column = p_col_value, p_column = p_col_value, ...)

以下查詢用于將分區(qū)添加到employee表。

hive> ALTER TABLE employee
> ADD PARTITION (year=’2013’)
> location '/2012/part2012';

重命名分區(qū)

此命令的語(yǔ)法如下。

ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查詢用來(lái)命名一個(gè)分區(qū):

hive> ALTER TABLE employee PARTITION (year=’1203’)
   > RENAME TO PARTITION (Yoj=’1203’);

刪除分區(qū)

下面語(yǔ)法用于刪除分區(qū):

ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查詢是用來(lái)刪除分區(qū):

hive> ALTER TABLE employee DROP [IF EXISTS]
   > PARTITION (year=’1203’);




以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)