SpringBoot連接Hive實現(xiàn)自助取數(shù)的示例
原文鏈接: http://www.ikeguang.com/?p=815
公司運營免不了讓我們數(shù)據(jù)做一些臨時取數(shù),這些取數(shù)有時候是重復的,或者可以做成可配置的。需要開發(fā)成界面,供他們選擇,自然想到SpringBoot連接Hive,可以把取數(shù)做成一鍵生成,或者讓他們自己寫sql,通常大多人是不會sql的。
1. 需要的依賴配置
為了節(jié)省篇幅,這里給出hiveserver2方式連接hive主要的maven依賴,父工程springboot依賴省略。
<!-- 版本信息 -->
<properties>
<hadoop.version>2.6.5</hadoop.version>
<mybatis.version>3.2.7</mybatis.version>
<scopeType>compile</scopeType>
</properties>
<dependency>
<groupId>org.mybatis</groupId>
<artifactId>mybatis</artifactId>
<version>${mybatis.version}</version>
</dependency>
<!-- hadoop依賴 -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${hadoop.version}</version>
<scope>${scopeType}</scope>
</dependency>
<!-- hive-jdbc -->
<!-- https://mvnrepository.com/artifact/org.apache.hive/hive-jdbc -->
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-jdbc</artifactId>
<exclusions>
<exclusion>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-api</artifactId>
</exclusion>
<exclusion>
<groupId>ch.qos.logback</groupId>
<artifactId>logback-core</artifactId>
</exclusion>
<exclusion>
<groupId>ch.qos.logback</groupId>
<artifactId>logback-classic</artifactId>
</exclusion>
</exclusions>
<version>1.2.1</version>
<scope>${scopeType}</scope>
</dependency>
<!-- 解析html -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.8.3</version>
</dependency>
application-test.yml配置數(shù)據(jù)庫連接,這里用的是druid連接池管理hiveserver2連接,也是沒有問題的。
# Spring配置 spring: datasource: type: com.alibaba.druid.pool.DruidDataSource driverClassName: com.mysql.cj.jdbc.Driver druid: # 多數(shù)據(jù)源**省略若干*** # hive數(shù)據(jù)源 slave3: # 從數(shù)據(jù)源開關/默認關閉 enabled: true driverClassName: org.apache.hive.jdbc.HiveDriver url: jdbc:hive2://cdh:10000/default username: bigdata password: bigdata
2. 代碼實現(xiàn)
代碼實現(xiàn)跟其它程序一樣,都是mapper、service、controller層,套路一模一樣。一共設置了實時和離線兩個yarn資源隊列,由于其它部門人使用可能存在隊列壓力過大的情況,需要對數(shù)據(jù)量按照每次查詢的數(shù)據(jù)范圍不超過60天來限制,和此時集群使用資源不能大于55%,這里重點說明一下controller層對數(shù)據(jù)量的預防。
實體類UserModel:
@NoArgsConstructor
@AllArgsConstructor
@Data
@ToString
public class UserModel extends BaseEntity{
private String userId;
private Integer count;
}
2.1 集群資源使用率不大于55%
因為很多業(yè)務查詢邏輯controller都要用到數(shù)據(jù)量防御過大的問題,這里使用了被Spring切面關聯(lián)的注解來標識controller。
定義切面YarnResourceAspect,并且關聯(lián)注解@YarnResource
@Target({ElementType.TYPE, ElementType.METHOD})
@Retention(RetentionPolicy.RUNTIME)
public @interface YarnResource {
}
@Aspect
@Component
public class YarnResourceAspect {
private static final Logger log = LoggerFactory.getLogger(YarnResourceAspect.class);
/**
* 配置切入點
*/
@Pointcut("@annotation(com.ruoyi.common.annotation.YarnResource)")
public void yarnResourcdPointCut(){
}
/**
* 檢查yarn的資源是否可用
*/
@Before("yarnResourcdPointCut()")
public void before(){
log.info("************************************檢查yarn的資源是否可用*******************************");
// yarn資源緊張
if(!YarnClient.yarnResourceOk()){
throw new InvalidStatusException();
}
}
}
獲取yarn的資源使用數(shù)據(jù):
@Slf4j
public class YarnClient {
/**
* yarn資源不能超過多少
*/
private static final int YARN_RESOURCE = 55;
/**
*
* @return true : 表示資源正常, false: 資源緊張
*/
public static boolean yarnResourceOk() {
try {
URL url = new URL("http://master:8088/cluster/scheduler");
HttpURLConnection conn = null;
conn = (HttpURLConnection) url.openConnection();
conn.setRequestMethod("GET");
conn.setUseCaches(false);
// 請求超時5秒
conn.setConnectTimeout(5000);
// 設置HTTP頭:
conn.setRequestProperty("Accept", "*/*");
conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36");
// 連接并發(fā)送HTTP請求:
conn.connect();
// 判斷HTTP響應是否200:
if (conn.getResponseCode() != 200) {
throw new RuntimeException("bad response");
}
// 獲取所有響應Header:
Map<String, List<String>> map = conn.getHeaderFields();
for (String key : map.keySet()) {
System.out.println(key + ": " + map.get(key));
}
// 獲取響應內(nèi)容:
InputStream input = conn.getInputStream();
byte[] datas = null;
try {
// 從輸入流中讀取數(shù)據(jù)
datas = readInputStream(input);
} catch (Exception e) {
e.printStackTrace();
}
String result = new String(datas, "UTF-8");// 將二進制流轉為String
Document document = Jsoup.parse(result);
Elements elements = document.getElementsByClass("qstats");
String[] ratios = elements.text().split("used");
return Double.valueOf(ratios[3].replace("%", "")) < YARN_RESOURCE;
} catch (IOException e) {
log.error("yarn資源獲取失敗");
}
return false;
}
private static byte[] readInputStream(InputStream inStream) throws Exception {
ByteArrayOutputStream outStream = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len = 0;
while ((len = inStream.read(buffer)) != -1) {
outStream.write(buffer, 0, len);
}
byte[] data = outStream.toByteArray();
outStream.close();
inStream.close();
return data;
}
}
在controller上通過注解@YarnResource標識:
@Controller
@RequestMapping("/hero/hive")
public class HiveController {
/**
* html 文件地址前綴
*/
private String prefix = "hero";
@Autowired
IUserService iUserService;
@RequestMapping("")
@RequiresPermissions("hero:hive:view")
public String heroHive(){
return prefix + "/hive";
}
@YarnResource
@RequestMapping("/user")
@RequiresPermissions("hero:hive:user")
@ResponseBody
public TableDataInfo user(UserModel userModel){
DateCheckUtils.checkInputDate(userModel);
PageInfo pageInfo = iUserService.queryUser(userModel);
TableDataInfo tableDataInfo = new TableDataInfo();
tableDataInfo.setTotal(pageInfo.getTotal());
tableDataInfo.setRows(pageInfo.getList());
return tableDataInfo;
}
}
2.2 查詢數(shù)據(jù)跨度不超過60天檢查
這樣每次請求進入controller的時候就會自動檢查查詢的日期是否超過60天了,防止載入數(shù)據(jù)過多,引發(fā)其它任務資源不夠。
public class DateCheckUtils {
/**
* 對前臺傳入過來的日期進行判斷,防止查詢大量數(shù)據(jù),造成集群負載過大
* @param o
*/
public static void checkInputDate(BaseEntity o){
if("".equals(o.getParams().get("beginTime")) && "".equals(o.getParams().get("endTime"))){
throw new InvalidTaskException();
}
String beginTime = "2019-01-01";
String endTime = DateUtils.getDate();
if(!"".equals(o.getParams().get("beginTime"))){
beginTime = String.valueOf(o.getParams().get("beginTime"));
}
if(!"".equals(o.getParams().get("endTime"))){
endTime = String.valueOf(o.getParams().get("endTime"));
}
// 查詢數(shù)據(jù)時間跨度大于兩個月
if(DateUtils.getDayBetween(beginTime, endTime) > 60){
throw new InvalidTaskException();
}
}
}
這里訪問hive肯定需要切換數(shù)據(jù)源的,因為其它頁面還有對mysql的數(shù)據(jù)訪問,需要注意一下。
目前功能看起來很簡單,沒有用到什么高大上的東西,后面慢慢完善。
以上就是SpringBoot連接Hive實現(xiàn)自助取數(shù)的示例的詳細內(nèi)容,更多關于SpringBoot連接Hive的資料請關注腳本之家其它相關文章!
- springboot+idea+maven 多模塊項目搭建的詳細過程(連接數(shù)據(jù)庫進行測試)
- SpringBoot集成WebSocket長連接實際應用詳解
- 基于SpringBoot集成測試遠程連接Redis服務的教程詳解
- 解決springboot 連接 mysql 時報錯 using password: NO的方案
- springboot2.0使用Hikari連接池的方法(替換druid)
- springboot websocket集群(stomp協(xié)議)連接時候傳遞參數(shù)
- Springboot2.X集成redis集群(Lettuce)連接的方法
- SpringBoot開發(fā)案例之配置Druid數(shù)據(jù)庫連接池的示例
- SpringBoot整合Mybatis使用Druid數(shù)據(jù)庫連接池
- 詳解springboot 使用c3p0數(shù)據(jù)庫連接池的方法
相關文章
Springboot連接數(shù)據(jù)庫及查詢數(shù)據(jù)完整流程
今天給大家?guī)淼氖顷P于Springboot的相關知識,文章圍繞著Springboot連接數(shù)據(jù)庫及查詢數(shù)據(jù)完整流程展開,文中有非常詳細的介紹及代碼示例,需要的朋友可以參考下2021-06-06
@Configuration與@Component作為配置類的區(qū)別詳解
這篇文章主要介紹了@Configuration與@Component作為配置類的區(qū)別詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-06-06
SpringBoot集成swagger-ui以及swagger分組顯示操作
這篇文章主要介紹了SpringBoot集成swagger-ui以及swagger分組顯示操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-09-09
Spring框架中一個有用的小組件之Spring Retry組件詳解
Spring Retry 是從 Spring batch 中獨立出來的一個功能,主要實現(xiàn)了重試和熔斷,對于那些重試后不會改變結果,毫無意義的操作,不建議使用重試,今天通過本文給大家介紹Spring Retry組件詳解,感興趣的朋友一起看看吧2021-07-07
MyBatis創(chuàng)建存儲過程的實例代碼_動力節(jié)點Java學院整理
本節(jié)需要用到的有2部分,第一部分是如何在Derby中創(chuàng)建存儲過程,第二部分是如何在Mybatis中調(diào)用存儲過程,具體實例代碼大家參考下本文吧2017-09-09

