欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

informatical lookup的使用詳解

 更新時間:2013年05月30日 10:02:55   作者:  
本篇文章是對informatical lookup的使用進行了詳細的分析介紹,需要的朋友參考下

Lookup在ETL中是一種常見的操作,比如產(chǎn)品鍵到代理鍵的轉(zhuǎn)換,ID到name的轉(zhuǎn)換等,都可以通過lookup來實現(xiàn)。Informatica中的lookup transformation組件除了能實現(xiàn)這種普通的轉(zhuǎn)換,還可以用來更新緩慢變化維等,功能可謂強大。本文根據(jù)Informatcia8.1的聯(lián)機文檔,簡單介紹一下informatica的lookup transformation。
中英文名詞對應:
•transformation:轉(zhuǎn)換
•connected:連接的
•unconnected:未連接的
•cache:緩存

一、lookup的功能
•獲得相關(guān)值:例如根據(jù)ID查找name
•執(zhí)行計算:例如得到計算公式得到一個結(jié)果
•更新緩慢變化維:根據(jù)lookup的條件決定是插入還是更新記錄等

二、rational lookups vs flat file lookups
lookup的源可以是關(guān)系數(shù)據(jù)庫中的表,也可以是平文件。對于關(guān)系表,可以從source或者target中選擇,也可以和平文件一樣,通過import向?qū)瓿伞?/P>

三、connected lookups vs unconnected lookups
informatica的轉(zhuǎn)換可以分為連接的和非連接的兩種。
所謂連接的轉(zhuǎn)換,就是該轉(zhuǎn)換是處于整個ETL的數(shù)據(jù)流中的,其輸入ort是直接從另外一個轉(zhuǎn)換,而非連接的,則獨立于主數(shù)據(jù)流之外,通過其他轉(zhuǎn)換中的表達式得到輸入數(shù)據(jù)。
連接的lookup轉(zhuǎn)換將處理數(shù)據(jù)流中的每一條數(shù)據(jù),對于不符合lookup條件的,則輸出預先指定的默認值,并且可以更新動態(tài)緩存。輸出值是所有的output/lookup port??梢允褂渺o態(tài)或者動態(tài)的緩存。
未連接的lookup轉(zhuǎn)換只處理符合lookup條件的數(shù)據(jù),并且只返回一個值。對于不符合條件的,輸出NULL。未連接的lookup轉(zhuǎn)換可以被多次調(diào)用。輸出值在唯一的return port。只能使用靜態(tài)緩存。

四、cache
informatica對于lookup使用了cache機制。服務器對于cache的處理流程大致如下:
開始處理第一條數(shù)據(jù)的時候,服務器會在內(nèi)存中建立緩存,緩存的大小有l(wèi)ookup轉(zhuǎn)換的一些屬性決定。對于lookup條件,建立一個index cache,而對于輸出值,則放在data cache中。
如果內(nèi)存緩存大小不夠,則會將溢出的緩存放到文件中。會話結(jié)束后,緩存會被清除,除非lookup緩存被設置為永久性的。
對于靜態(tài)的cache,是不允許lookup轉(zhuǎn)換對其進行更新的。而動態(tài)的cache,在lookup中如果發(fā)現(xiàn)不符合條件的值,可以對cache進行插入或者更新處理。
當然也可以選擇不使用任何cache。

五、lookup transmation組件
lookup共有5個組件,也就是在lookup轉(zhuǎn)換上點右鍵,選編輯后看到的5個標簽頁。實際上,基本上informatica所有的transformation都差不多是5個組件。
其中第一個transformation頁簽,第二個ports頁簽和第五個metadata extensions頁簽基本都差不多。只是lookup的port除了通常的I(input),O(output)外,還有L(lookup),R(return)。其中return port只能有一個,并且不能和其他轉(zhuǎn)換直接連接,只能通過LKP:表達式獲得。
第四個condition頁簽指定lookup的條件,實際上就是設置兩個表的關(guān)聯(lián)條件。
第三個properties是最重要的,可以在這里重寫SQL來自定義lookup,設置符合條件返回多條記錄時的處理方式,設置是否使用動態(tài)cache,以及cache的大小等等。

六、lookup tips
•在lookup條件列上創(chuàng)建index
•盡量使用=條件。如果有多個條件,盡量將=條件放到最前面
•對于小表,盡量使用cache,并且設置cache大小,使得整個table可以cache到內(nèi)存中
•如果lookup的表和源表在同一個數(shù)據(jù)庫中,并且cache不夠大,那么盡量使用join而不是lookup
•對于靜態(tài)的lookup,盡量使用永久cache(persistent cache),這樣多個session可以重用。

相關(guān)文章

最新評論