Creación de “.xaction” para planificación de ETL con Pentaho Design Studio y Pentaho Administration Console.


INTRODUCCIÓN:

¿Qué es Pentaho Design Studio?

Pentaho Design Studio (PDS), es una herramienta para la creación reportes, dashboards, pero también es usada para crear flujos de trabajo y acciones que trabajaran con el contenido existente de Pentaho User Console (PUC).

Pentaho Design Studio es un plugin de Eclipse, el Propósito de esta herramienta es crear las secuencias de acción… (Mejore conocidas como las “.xaction”).

¿Qué es un secuencia de acción?

Es un conjunto predefinido de acciones que serán ejecutadas en Pentaho User Console (PUC) ya sea de forma manual o con una planificación definida en la consola de administración de Pentaho (PAC), de todas maneras la próxima pregunta y respuesta responde a esto ultimo.

¿Y que detona la ejecución de una secuencia de acción?

  • Un trabajo planificado (Desde Pentaho Administration Console).
  • Alguna otra secuencia de acción.
  • La acción de un usuario.

Ambiente utilizado:

Producto Version Sistema Operativo Arquitectura
Pentaho Design Studio 4.0.0 Windows Server 2008 x64 y x86
Pentaho Design Studio 4.0.0 Windows Seven x64 y x86
Pentaho BI Server 3.10.0 Windows Server 2008 x64 y x86
Pentaho BI Server 4.5.0 Windows Seven x64 y x86

DESARROLLO:

1- Abrimos PDS y configuramos el espacio de trabajo (workspace) que será nuestro repositorio de proyectos donde en cada proyecto tendremos nuestros archivos de secuencia (.xaction), para esto nos dirigimos a “File -> Switch Workspace -> Other ” y seleccionamos una carpeta en nuestro disco para que funcione como el espacio de trabajo para PDS.

Creamos un espacio de trabajo en Pentaho Design Studio.

2- Una vez configurado el espacio de trabajo en PDS tenemos la posibilidad de crear nuevos proyectos para esto nos dirigimos a “File -> New -> Project”

Nuevo proyecto en Pentaho Design Studio

Le damos un nombre al proyecto: “PruebasPDS” y presionamos “Finish”

Nombre al proyecto

3- Ahora desde el botón “New Action Sequence Wizard” y seleccionando el proyecto antes creado vamos a crear nuestro “.xaction”

Creando un xaction

Seleccionamos el proyecto presionando el botón “Browser” en el campo “File name” colocamos el nombre de nuestro “.xaction” y en “template” seleccionamos el tipo “blank” y presionamos “Finish” tal como lo muestra la foto a continuación:

Selecciono proyecto para nuestro xaction.

4-

    • En la solapa “General” completamos todos los campos necesarios: “Title”, “Version”, “Logging Level”, “Author”.

Completamos datos en la solapa General

    • En la solapa “Define Process” se definirá el tipo de secuencia y proceso que tiene que llevar a cabo nuestro “.xaction”, en la sección “Process Inputs” de esta debemos agregar a la carpeta “resources” un objeto de tipo “resource” que es justamente el archivo “.kjb” que queremos ejecutar.

Resource para el archivo kjb

    • Y ahora definimos el objeto “resource” completando todos sus campos.

Definicion de objeto resource

    • En la sección “Process Actions” debemos agregar un objeto de tipo “Pentaho Data integration Job” que lo vamos a encontrar presionando el signo más y “Execute -> Pentaho Data integration Job”

Nuevo objeto pdi job

    • Definimos el objeto “Pentaho Data Integration Job” completando cada uno de sus campos:
      • “Name”: Nombre del objeto “Process Action”
      • “Input Selections”: dentro de este recuadro vamos a encontrar todo lo relacionado a la ejecución del archivo “.kjb”, tenemos dos posibilidades: ejecutar un Job dentro de un repositorio (Kettle Repository) donde deberíamos seleccionar el directorio que funciona como repositorio para nuestro “.kjb”/elt y luego el nombre del archivo “.kjb”, sin embargo en este caso opte por des tildar la opción “Use Kettle Repository” y directamente llenar el campo “Job File” indicándole que mi archivo “.kjb” que quiero ejecutar se encuentra dentro de una carpeta “solution” de Pentaho User Console; lo hice de esta manera: Job File = solution:ExecuteJobBpbiVentas.kjb
      • El campo “Kettle Login Level” nos permite indicarle un nivel de Log al Job que vamos a ejecutar.
      • La lista “Job inputs” (que en este ejemplo no se utiliza), nos permite enviarle parámetros al Job, pero antes debemos definir estos en la sección “Process Inputs” indicando el nombre del parámetro, tipo y la posibilidad de ponerle un valor como default.
      • En el recuadro “Outputo Section” definimos cuales son los valores de salida luego de que el Job finalice su ejecución, en este ejemplo solo vamos a llenar el campo “Output Execution Status Name”, como para darle un nombre y nos muestre en pantalla el resultado que nos arrojó la ejecución de este Job en Pentaho User Console.
    • Entonces la solapa “Define Process” para este ejemplo debería quedar así:

Asi deberia queda la solapa "Define Process"

    • En la solapa “XML Source” vamos a poder ver el código XML que nos genero la creación de este “.xaction”

XML que nos genero la creación de este “.xaction”

5- Sí todo fue creado y configurado correctamente ya estamos listos para probar el funcionamiento de este “.xaction” en nuestra solución en Pentaho User Console.

    • Copiar el archivo “ExecuteJobTest1.xaction” junto con nuestro Job (.kjb) a una carpeta en nuestra solución de Pentaho User Console.
    • La carpeta debería verse así: (No olviden el archivo “index.xml” que necesita Pentaho User Console para agregar una carpeta al repositorio, a continuación detallo el archivo XML y la jerarquías de carpetas que se puede ver en la ruta del explorador)

Directorio solucion Pentaho BI Server

    • Actualizamos el repositorio e iniciamos Pentaho administration console (PAC) desde el archivo “start-pac.bat” ubicado en la carpeta “administration-console”
    • En la solapa “scheduler” de PAC vamos a poder planificar nuestro “.xaction”:

Lista de planificaciones en Pentaho Administration Console

    • Para agregar una nueva tarea planificada tenemos que presionar en el icono “Create Schedule”, completar cada uno de los campos, donde además de asignarle un nombre nos permite crear grupos y por supuesto planificar su ejecución; diaria, semanal, cada hora, etc.
    • Configuramos nuestra planificación:

Configuramos nuestra planificacion.

    • En la solapa “Selected Files” seleccionamos el archivo de secuencia “ExecuteJobTest1.xaction” que debe aparecer con el nombre que le asignamos en la propiedad “Title” de la solapa “General” en Pentaho Design Studio.

Seleccionamos el xaction que vamos a planificar.

  • Presionamos “Ok” y vamos a poder ver un nuevo registro con que nos indicara: nombre de la planificación, fecha de última ejecución, fecha de próxima ejecución, estado y grupo.

El archivo de secuencia ya fue configurado y esta lista para entrar en accion.

  • También tenemos la posibilidad de ejecutar el “ExecuteJobTest1.xaction” desde el explorador de Pentaho User Console tal como se muestra en la foto a continuación:

Ejecutamos xaction en Pentaho User Console

Creación de “.xaction” para planificación de ETL con Pentaho Design Studio y Pentaho Administration Console..

Acerca de albertoarceti
Administrador de sistemas informáticos, y erps en la industria farmacéutica.

5 Responses to Creación de “.xaction” para planificación de ETL con Pentaho Design Studio y Pentaho Administration Console.

  1. Ezequiel dice:

    Muy bien por difundir

  2. Ale dice:

    Pone la fuente guachin

  3. Javier dice:

    como podría ejecutarlo desde el repositorio??
    Tengo todas las configuraciones correctas con los archivos .Kettle/Repositiry.xml y también los archivos /PentahoSolutions/System/Kettle/Settings.xml.
    Aun así el xAction me reconoce la ruta del repositorio, pero no encuentra el repositorio especificado. creo que el problema esta en la configuracion del xAction.

    Saludos

  4. anita canedo dice:

    Hola Ezequiel, no puedo ver las imagenes cargadas, sin embargo segui todas las instrucciones y cuando finalmente me voy al PAC, puedo ver que en la version 5.2 de Pentaho, no esta habilitados el boton de creacion de nuevas planificaciones. Podrias decirme como habilitarlo?? Necesito una respuesta por favor.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: