flink的時(shí)間及時(shí)區(qū)問題怎樣解決,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
武清網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、自適應(yīng)網(wǎng)站建設(shè)等網(wǎng)站項(xiàng)目制作,到程序開發(fā),運(yùn)營維護(hù)。創(chuàng)新互聯(lián)2013年開創(chuàng)至今到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。
1.時(shí)間紀(jì)元
所謂的”時(shí)間紀(jì)元”就是1970年1月1日0時(shí)0分0秒,指的是開始的時(shí)間。比如Java類代碼:
Date date = new Date(0);
System.out.println(date);
打印出來的結(jié)果:
Thu Jan 01 08:00:00 CST 1970
也是1970年1月1日,實(shí)際上時(shí)分秒是0點(diǎn)0分0秒,這里打印出來的時(shí)間是8點(diǎn)而非0點(diǎn),原因是存在系統(tǒng)時(shí)間和本地時(shí)間的問題,其實(shí)系統(tǒng)時(shí)間依然是0點(diǎn),只不過我們的電腦時(shí)區(qū)設(shè)置為東8區(qū),故打印的結(jié)果是8點(diǎn)。
只需要將時(shí)區(qū)設(shè)置為GMT+0,即可打印出0點(diǎn)0分0秒
System.setProperty("user.timezone","GMT+0");
實(shí)際上時(shí)區(qū)問題都是在此時(shí)間紀(jì)元基礎(chǔ)上加/減一定的offset。
2.Flink時(shí)間
說java紀(jì)元跟本文將的flink時(shí)間問題有啥關(guān)系呢?
Flink在使用時(shí)間的這個(gè)概念的時(shí)候就是基于時(shí)間紀(jì)元這個(gè)概念的。比如首先,我們的時(shí)區(qū)是東八區(qū),在我們的視野中UTC-0時(shí)間應(yīng)該加8小時(shí)的offset,才是我們看到的時(shí)間,所以在使用flink的窗口的時(shí)候往往比我們當(dāng)前的時(shí)間少8小時(shí)。
還有flink的窗口對其,也是基于紀(jì)元時(shí)間的。比如下面的有三個(gè)窗口函數(shù)的例子
1).5min滾動(dòng)窗口
14:16:391啟動(dòng)的窗口,滾動(dòng)窗口時(shí)間是5min,會(huì)發(fā)現(xiàn)并不是等待五分鐘之后才有結(jié)果輸出,而是到了14:20:00.0的時(shí)候就直接輸出結(jié)果了。
2).30min滾動(dòng)窗口
14:27:11啟動(dòng)的滾動(dòng)窗口,是在14:30:00的時(shí)候就直接輸出了,而不是等待半小時(shí)。
3).1hour滾動(dòng)窗口
15:54:48啟動(dòng)的一小時(shí)的滾動(dòng)窗口,輸出時(shí)間是16點(diǎn)整。
時(shí)間上差了八小時(shí),但是對齊是基于時(shí)間紀(jì)元的整數(shù)單位。
3.解決差八小時(shí)問題
實(shí)際在使用的時(shí)候flink輸出的時(shí)差很令人反感,但是沒辦法flink目前不支持配置時(shí)區(qū),但是blink支持,等待著合并吧。
其實(shí),時(shí)區(qū)問題解決方案比較多吧,要想不傷筋動(dòng)骨,主要介紹以下三種:
flink端不做處理。也即是在讀取數(shù)據(jù)的時(shí)候加上8小時(shí)的offset。
使用udf等算子給時(shí)間戳加上8小時(shí)的offset。
sink內(nèi)部做處理。
1).Udf實(shí)現(xiàn)
sink端處理
import org.apache.flink.table.functions.ScalarFunction;
import java.sql.Timestamp;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.TimeZone;
public class UTC2Local extends ScalarFunction {
public Timestamp eval(Timestamp s) {
long timestamp = s.getTime() + 28800000;
return new Timestamp(timestamp);
}
}
注冊udf
tEnv.registerFunction("utc2local",new UTC2Local());
使用udf
Table table1 = tEnv.sqlQuery("select count(number),utc2local(TUMBLE_END(proctime, INTERVAL '1' HOUR)) from res group by TUMBLE(proctime, INTERVAL '1' HOUR)");
2). sink內(nèi)部支持
sink端的實(shí)現(xiàn)也比較簡單,主要是判斷輸出字段類型,然后加上8小時(shí)offset即可??梢詤⒖糱link的printtablesink的實(shí)現(xiàn)。
override def invoke(in: JTuple2[JBool, Row]): Unit = {
val sb = new StringBuilder
val row = in.f1
for (i <- 0 to row.getArity - 1) {
if (i > 0) sb.append(",")
val f = row.getField(i)
if (f.isInstanceOf[Date]) {
sb.append(DateTimeFunctions.dateFormat(f.asInstanceOf[JDate].getTime, "yyyy-MM-dd", tz))
} else if (f.isInstanceOf[Time]) {
sb.append(DateTimeFunctions.dateFormat(f.asInstanceOf[JDate].getTime, "HH:mm:ss", tz))
} else if (f.isInstanceOf[Timestamp]) {
sb.append(DateTimeFunctions.dateFormat(f.asInstanceOf[JDate].getTime,
"yyyy-MM-dd HH:mm:ss.SSS", tz))
} else {
sb.append(StringUtils.arrayAwareToString(f))
}
}
if (in.f0) {
System.out.println(prefix + "(+)" + sb.toString())
} else {
System.out.println(prefix + "(-)" + sb.toString())
}
}
看完上述內(nèi)容,你們掌握flink的時(shí)間及時(shí)區(qū)問題怎樣解決的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
網(wǎng)站欄目:flink的時(shí)間及時(shí)區(qū)問題怎樣解決
URL鏈接:http://sd-ha.com/article32/pephsc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、App設(shè)計(jì)、App開發(fā)、品牌網(wǎng)站制作、搜索引擎優(yōu)化、網(wǎng)站設(shè)計(jì)公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)