Holocron: enero 2018

martes, 16 de enero de 2018

Tableau Architecture

Como funciona Tableau? La pregunta es orientada a ver como esta su arquitectura, de esa forma podemos visualizar, planificar, estimar como se comportará bajo ciertas condiciones. Según la explicación que tenemos de Rush Shan es un aplicativo basado en el lightweight Apache Web Server, con esta primera pista podemos imaginarnos ya, como se comportaría, o al menos tener indicios de ello. Comparado con Glashfish, o JBoss, apache es ligero, sencillo y comodo según la comunidad OpenSource. Apache es básicamente un Web Server y Servlet Container, es decir no viene con todas la aplicaciones que estan definidad en el JavaEE, como por ejemplo EJB container, JPA, pero eso no es limitante, ya que todas ellas se pueden agregar por aparte al Apache, como OpenJPA, Hibernate, OpenEJB, y otras más. Además Existe TomEE+ que es una versión que integra todas características de JavaEE.
En las laminas de abajo que salen del webinario de Rush Shan, se muestran los elementos que integran la aplicación de Tableau, su funcionalidad y responsabilidades. Se puede tener acceso a servicios del modulo VizQL Server para incorporalos como gráficas a aplicaciones foráneas de usuarios. el VizQL Server es muy demandante de CPU y memoria. Una limitación es que el modulo Data Engine que adquiere los datos de una base de datos, está limitado a solo dos nodos, Esto es si se distrubuyen en más servidores, solo dos nodos podrán fungir como Data Engine en la arquitectura.
Tableau tiene un repositorio interno basado en PostgreSQL, donde guarda datos funcionales propios como usuarios, grupos....
Se muestran 3 configuraciones básicas de la arquitectura que se puede tener en Tableau, Single Node, 3 Nodes, y 5 nodes, en las cuales de consideran aspectos de Alta Disponibilidad y Recuperación de desastres.

Introduction to Tableau Architecture https://www.youtube.com/watch?v=v8_iLBdGlm4

Planing and Architecting Tableau https://www.youtube.com/watch?v=CpyrCryHr8c

miércoles, 3 de enero de 2018

Netezza AMPP (Asymmetric Massively Parallel Processing) for Business Intelligence

Indice de referencia de conceptos, ideas y prácticas del webinario de Netezza, la cual es una base de datos especializada para manejo de grandes volumenes de datos con aplicaciones en Data Warehouse, Business Intelligence. En particular esta solución viene en un appliance o gabinete, caja negra, aparato, ya que tiene un hardware especializado, utilizando FPGAs para búsqueda, filtro, compresión/decompresión de datos. Los FPGA son dispositivos en los cuales se programan a nivel de compuertas lógicas los algoritmos de alguna solución, cuya ejecución de circuitos se paralelizan en tiempo real, haciendo de sean realmente rápidas sus operaciones. La idea en términos generales es realizar la menor cantidad de movimiento de datos de Disco a memoria y a Host, teniendo catalogados los accesos con la certidumbre de que se sabe con certeza que el/los datos solicitados están en una ubicación en disco estratégicamente granularizada con ayuda de Zone Maps, Distributed Keys, SPUs (snippet process units), CTAS (Create Table AS), CBT (Cluster Based Table), Materialized Views. todo ello con procesamiento paralelo.

Estas laminillas se extrajeron del webinario de Tom Coffing, con la idea de que sirvan de referencia visual rápida.

referencia:
The Brilliance of Neteeza: Tom Coffing