26 de octubre de 2010

Síntesis del artículo de Agrupamiento de Grafos

En este artículo la Dra. Elisa Scheaffer presenta un estudio realizado sobre el agrupamiento de grafos.
El proceso de identificar la heterogeneidad de los datos no uniformes se le llama agrupamiento clasificación de datos. Los grafos son estructuras formadas por un conjunto de vértices (o nodos) y aristas que conectan un par de nodos.
El agrupamiento de grafos es una tarea de agrupar vértices de la gráfica en grupos de tal manera que queden pocos vértices fuera de los grupos.
El estudio consta de 10 secciones, en donde se abordan desde las definiciones básicas y necesarias para comprender el agrupamiento de grafos, hasta los problemas que quedan inconclusos, las direcciones futuras y las conclusiones sobre este tema.
En la sección 2 de este estudio, se otorgan los términos y definiciones que facilitan el entendimiento del resto del estudio. En esta se proveen términos de complejidad computacional, algoritmos de aproximación, teoría de grafos y cadenas de Markov.
En la sección 3, se comienza con la tarea de definir lo que constituye una agrupación en un grafo y lo que una agrupación debería ser. También se discuten algunas clases especiales de gráficos. En esta sección también se menciona cual es el objetivo de la agrupación, una vez dado un conjunto de datos, este consiste en dividir el conjunto de datos en grupos de tal manera que los elementos asignados a un grupo determinado son similares o conectados en sentido predefinido.
En esta sección se abordan temas de modelos de generación para los grafos agrupados, propiedades deseables del grupo y las representaciones de los grupos para las diferentes clases de grafos, como lo son los grafos bipartitas y los grafos directos.
En la sección 4 se aborda el tema de las mediciones para identificar grupos, en donde primeramente se hace una visión de las medidas de similitud de vértices que pueden ser utilizadas de former manner para identificar el conjunto de un vértice específico o para agrupar todos los vértices en un conjunto de grupos, y luego presentar las posibles cluster fitness measures que sirven para métodos que producen la agrupación mediante la comparación de diferentes grupos y seleccionando uno que cumpla u optimice un criterio determinado.
En la sección 5 se ve el tema de los métodos globales para agrupamiento de grafos, en donde se ve la complejidad del agrupamiento global, cálculo iterativo o en línea de los agrupamientos globales, agrupamiento jerárquico, agrupamiento de división global y agrupamiento aglomerativo global.
En la sección 6 se ven los métodos locales para el agrupamiento en grafos, los cuales son utilizados para encontrar un buen grupo que contiene un vértice especificado o un conjunto de vértices mediante el examen de un número limitado de vértices a la vez, los cuales están en la "vecindad" del vértice especificado.
En la sección 7 se describe la dificultad de comparar, evaluar y realizar el benchmarking de los métodos de agrupamiento de grafos.
En la sección 8 se presentan las aplicaciones del agrupamiento de grafos, aplicaciones en agrupamiento de datos, en redes de información y uso de la información, en sistemas de bases de datos, en redes sociológicas y biológicas, entre otras.
En la Sección 9 se revisan los problemas abiertos y las direcciones futuras, y en la Sección 10 se llega a la conclusión del estudio.

12 de octubre de 2010

Proyecto - Sistemas de soporte para la toma de decisiones

Hola a todos, buen día,

Este blog será el medio por el cual estaré publicando las tareas e investigaciones de la clase de maestría "Sistemas de soporte para la toma de decisiones", así como los avances que se vayan registrando en el proyecto que estará desarrollando para esta materia.

Como opciones para el proyecto estoy contemplando analizar alguno de los siguientes (aunque aún no lo tengo definido, se aceptan sugerencias):


  1. Los datos de las becas otorgadas por el Conacyt, tanto para ejercerlas en México como en el extranjero.
  2. Según los datos publicados por el INEGI, la pobreza que se registra en nuestro país.
  3. Los datos de la alfabetización con la que se cuenta actualmente en Nuevo León, según la SEP de este estado.
  4. El comportamiento en las búsquedas registradas en el sistema OPAC de CÓDICE. (Proyecto Seleccionado)

Reseña del libro de Data Warehouse

Libro: Building a Data Warehouse With Examples in SQL Server
Autor: Vincent Rainardi

Liga del libro en Google Books


Este libro está escrito por un arquitecto y desarrollador de Data Warehouses Vicent Rainardi, quien tiene 12 años de experiencia en TI. Tiene experiencia también en el desarrollo de bases de datos en SQL desde el 2000 y escribe artículos sobre data warehouses para SQLServerCentral.com.

El libro viene adentrándonos en lo que son las data warehouses en sus primeros capítulos, tanto en lo que son éstas, su arquitectura y metodología.

Este libro también es una ayuda en cuanto a la definición de los requerimientos para nuestras data warehouses, tanto funcionales como no funcionales, así como en el modelado de datos.

En cuanto al diseño físico de la base de datos también nos explica Vicent Rainardi las consideraciones que debemos tener en el almacenaje de la información, en la configuración y normalización de la Base de Datos, así como en el uso de índices y vistas.

Dentro de este libro también encontraremos las guías para la extracción de información usando los SSIS (SQL Server Integration Services) o desde archivos de texto, Bases de datos relacionales, entre otras. Además de información sobre el llenado del data warehouse, sobre el cómo asegurar la calidad de los datos.

También, dentro del capítulo 11 de este libro se viene hablando sobre cómo generar reportes desde el data warehouse, en él se explica el Wizard para la generación de reportes, el uso apropiado de parámetros, del layout del reporte, el agrupamiento, ordenación y filtrado de información, entre otros.

En el resto de los capítulos se hace mención sobre cómo administrar las data warehouses, cómo usar estos data warehouses para Business Intelligence, así como las pruebas que se pueden aplicar a las data warehouses.

En general este libro parece ser una excelente guía para la generación de data warehouses en SQL Server 2005, desde su concepción hasta su administración.