Pentaho

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Joins Pentaho Octubre, 2022

1- Join Rows

Esta función permite crear un producto cartesiano entre los valores de dos campos diferentes.

Si A = {x, y} y B = {1, 2, 3} entonces A x B = {x1, x2, x3, y1, y2, y3}

⚫ 1. Clic en la carpeta Joins y


seleccionar la opción “Join rows”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.

⚫ Para emplear esta transformación, primero es


necesario que existan dos entradas de datos.
1- Join Rows (Cartesian product)

⚫ 3. Dar nombre a la etapa. 4. Si se desea realizar un producto simple,


Ok y clic en el ícono de play.
1- Join Rows (Cartesian product)

⚫ Si se desea descartar algún elemento En el caso del ejemplo, se omitió el


del producto, se indica en las relleno “Carnitas.”
condiciones.
1- Join Rows (Cartesian product)

⚫ Si se desea descartar algún elemento En el caso del ejemplo, se omitió el


del producto, se indica en las relleno “Carnitas.”
condiciones.
2. Merge Join

Esta función unir los campos de dos fuentes, empleando el valor de un registro como punto de
comparación y mezcla. El registro debe tener el mismo valor para poder usarse.
2. Merge Join

Merge Join, puede mostrar las combinaciones del Diagrama de Venn: Inner Join, Left Outer Join, Right
Outer Join y Full Outer Join.

El significado de las combinaciones se puede observar en el siguiente diagrama.


2. Merge Join

Esta función unir los campos de dos fuentes, empleando el valor de un registro como llave de
comparación y mezcla. El registro debe tener el mismo valor para poder usarse.

⚫ 1. Clic en la carpeta Joins y


seleccionar la opción “Merge join”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.

⚫ Para emplear esta transformación, primero es


necesario que existan dos entradas de datos.
2. Merge Join

⚫ 3. Dar nombre a la etapa.


⚫ Seleccionar la primer fuente a
consultar.
⚫ Seleccionar la segunda fuente a
consultar.
⚫ Elegir el tipo de Unión a realizar.
⚫ Seleccionar la Llave de
comparación.
2. Merge Join

4. Ok y clic en el ícono de play.


3. Multiway Merge Join

Esta función unir los campos de dos o más fuentes, empleando el valor de un registro como llave de
comparación y mezcla. El registro debe tener el mismo valor para poder usarse.

⚫ 1. Clic en la carpeta Joins y


seleccionar la opción “Merge join”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.

⚫ Para emplear esta transformación, primero es


necesario que existan entradas previas de datos.
3. Multiway Merge Join

⚫ 3. Dar nombre a la etapa.


⚫ Selecccionar los pasos de entrada en orden de prioridad.
⚫ Seleccionar la llave de comparación.
3. Multiway Merge Join

4. Ok y clic en el ícono de play.


4. Flow: Dummy

Esta función no ejecuta acción alguna, se emplea para almacenar información de prueba que no se
almacenará en algún tipo de archivo o base de datos.

⚫ 1. Clic en la carpeta Flow y seleccionar


la opción “Dummy (do nothing)”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.

⚫ Para emplear esta transformación, primero es


necesario que existan entradas previas de datos.
4. Flow: Dummy

⚫ 3. Dar nombre a la etapa.

4. Ok y clic en el ícono de play.


4. Filter rows

Esta función permite ejecutar y filtrar los datos, según cumplan o no una condición específica.

⚫ 1. Clic en la carpeta Flow y


seleccionar la opción “Filter rows”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.

⚫ Para emplear esta transformación, primero es


necesario que existan entradas previas de datos.
4. Filter rows

⚫ 3. Para emplear esta etapa, se ⚫ 4. Dar nombre a la etapa, Seleccionar


deben colocar los destinos para el destino de los datos que cumplen la
almacenar la información. condición y los que no.
⚫ Crear el criterio de selección
4. Filter rows

4. Ok y clic en el ícono de play.


5. Switch / case

Esta función permite ejecutar y clasificar los datos, según cumplan o no una condición específica.

⚫ 1. Clic en la carpeta Flow y


seleccionar la opción “Switch/case”

⚫ 2. Clic y arrastrar al área de trabajo de


Pentaho y conectar la lectura con la
transformación.
⚫ Para emplear esta transformación,
⚫ primero es necesario que existan
entradas previas de datos.
5. Switch / case

⚫ 3. Colocar y nombrar los destinos ⚫ 4. Unir el paso Switch con los destinos.
de cada caso a clasificar. ⚫ AL unir un destino, dar clic sobre el
destino y elegir la opción “Create a new
target case for this step”
5. Switch / case

⚫ Si se realiza de forma correcta el ⚫ Si hay datos que no se


paso 4, en la configuración del clasificacrán, entonces se
Switch, aparecerá el target selecciona la opción “The default
realizado. target step”
5. Switch / case

⚫ 5. Una vez conluidas los enlaces,


se configura el campo que se
empleará para la clasificación.
5. Switch / case

6. Ok y clic en el ícono de play.

También podría gustarte