BYG

sábado, 7 de mayo de 2016

Tema 6 - Business intelligence y la empresa

Imagen de advanz101.com

En esta entrada hablare del concepto bussines intelligence (a partir de ahora nos referiremos a ello como BI) dentro de las empresas. Seguramente os estéis preguntando que tiene que ver la inteligencia empresarial con el mundo de los datos, ya que, este blog gira entorno a eso, gestión de datos, información, búsqueda y manipulación de los datos y la información. Pues tiene mucho que ver, ya que, el concepto de BI se crea gracias a la necesidad en las empresas de poder administrar, crear conocimiento y realizar estrategias a través de los datos de dichas organizaciones (empresas). Dicho esto, entraremos en materia.

Imagen de MEVESI.COM

¿Qué es BI?

BI es la habilidad o capacidad que dispone una empresa para convertir la información (obtenida de los datos de la empresa) en conocimiento, para después utilizarlo en nuestro beneficio. Es decir, con el conocimiento que ha sido generado gracias a los datos empresariales, podremos tomar decisiones con más seguridad y probabilidad de que la decisión tomada genere un caso de éxito.

En la siguiente imagen podemos contemplar que la relación que guardan los datos con la información se denomina como BO (Busnisse operator, que son una serie de componentes que explicaremos más adelante) y que sin el BO, no podríamos obtener la información necesaria para convertirla posteriormente en conocimiento.

Imagen de sinnexusCOM

Bi se compone de varias herramientas que nos facilitan la extracción de datos y su compresión.

¿Qué herramientas pueden componer BI?

Como hemos mencionado BI se compone de varias herramientas. Principalmente hay tres herramientas.

Cuadro de mando. Es una herramienta de monitorización del rencimiento, ayuda a reducir la incertidumbre y facilitar la toma de decisiones. Por lo cual es una herramienta a la ayuda de toma de decisiones. Existen dos tipos de cuadros de mando:

o Cuadro de mando operativo (CMO) Herramienta de control, está enfocada a recoger información de variables operativas(pertenecientes a departamentos específicos). Un CMO debe estar siempre ligado a un DSS para poder profundizar en los datos.

o Cuadro de mando integral (CMI) Es una herramienta de control que ayuda a las organizaciones a expresar sus objetivos e iniciativas necesarias a llevar a cabo para cumplir con las estrategias fijadas. En otras palabras, es una herramienta que nos ayuda a fijar objetivos en los diferentes departamentos de la organización y monitorizarlos. En dicho cuadro de mando podemos observar 4 perspectivas genéricas(que no en todas las organizaciones tienen que existir)

Imagen de sinnexusCOM

Sistema de soporte a la decisión (DSS) Herramienta enfocada al análisis de datos en una organización. Nos permite resolver gran parte de las limitaciones de los programas de gestión de datos, ya que normalmente dichos programas suelen disponer de informes estáticos y generales. Las características principales de un DSS son:

o Informes dinámicos, flexibles e interactivos. Como hemos mencionado anteriormente, rompemos la limitación de tener informes estáticos y generales.

o No requiere conocimientos técnicos. Un usuario puede utilizar dicha herramienta para generar gráficos e informes de manera fácil.

o Rapidez en tiempo de respuesta. Gracias a que las bases de datos que usan están optimizadas para el análisis de grandes volúmenes de información y datos.

o Perfiles de usuarios. Cada usuario tiene su propio perfil, por lo cual, tendrá acceso a la información adecuada a dicho perfil.

o Historial. Dispone de un historial accesible para ver los movimientos de cada periodo histórico de la compañía.

Imagen de 4.bp.blogspot.COM

Sistema de información para ejecutivos (EIS) Es una herramienta SW, basada en un Sistema de soporte a la decisión (DSS), con la peculiaridad de que está enfocada a que los gerentes de la organización tengan un acceso sencilla a la información. Lo que le proporciona es la posibilidad de analizar al detalle cada indicador del negocio. Y así, poder establecer estrategias necesarias a cada indicador.

Estas son las principales herramientas que contiene un BI. Pero, por otro lado, los datos que emplea BI para llevar a cabo su correcto funcionamiento son obtenidos de los siguientes componentes:

Datamart. Es una base de datos departamental, esto quiere decir que la base de datos está especializada en el almacenamiento de datos de un área específica. Este componente se caracteriza por disponer de una estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que puedan afectar a los procesos de dicho departamento. Para la creación de un datamart de área funcional, es preciso encontrar una estructura óptima para el análisis de la información. Dependiendo de los datos, requisitos y características específicas de cada departamento, podremos decidir entre los siguientes tipos de datamart.

o Datamart OLAP

Construido a partir de la agregación de las dimensiones e indicadores necesarios según los requisitos de cada área.

o Datamart OLTP

Introduciendo mejoras en su rendimiento, aprovechando las características particulares de cada departamento.

Las características que hay que tener en cuenta para reconocer si estamos ante un buen datamart son:

o Bajo volumen de datos

o Validación directa de la información

o Rapidez de consulta

o Facilidad para guardar historiales.

o Consultas sencillas

Datawarehouse. Datawarehouse o también conocido como almacén de datos, es una Base de datos corporativa, caracterizada por integrar y depurar la información de una o varias fuentes, para luego poder procesarla, permitiendo el análisis de dicha información desde distintas perspectivas y con gran velocidad de procesamiento. La instalación de un Datawarehouse es el primer paso, desde un punto de vista técnico, para implantar una solución completa y fiable de BI. Los Datawarehouse son caracterizados por ser:

o Integrados. Las inconsistencias existentes deben ser eliminadas.

o Temáticos. Los datos son organizados por temas para facilitar el acceso y el entendimiento por parte de los usuarios.

o Históricos. Deben tener una correlación temporal.

o No volátil. Los datos almacenados no pueden ser modificados ni borrados.

o Metadatos. Contiene datos sobre los datos. Es decir, esos datos permiten saber la procedencia de la información, si están actualizados, fiabilidad, etc. El objetivo de estos metadatos es:

>Soporte al usuario final. Dar ayuda al usuario para la construcción de consultas, informes, análisis, etc.

>Soporte a responsables. Especificación de las interfaces para la realimentación de los sistemas a través de los resultados obtenidos.

Con esta información podemos decir que Los sistemas y componentes del BI se diferencian de los sistemas operacionales, en que están optimizados para realizar consultas y divulgar los datos. Con esto queremos decir que un datawarehouse, contiene los datos desnormalizados para apoyar las consultar realizadas de alto rendimiento, mientras que los sistemas operacionales , se suelen encontrar los datos normalizados, para apoyar operaciones continuas , como son de inserción, modificación y borrado. Por lo cual, los procesos de extracción, transformación y carga que nutren los sistemas BI, Tienen que tomar los datos de uno o varios sistemas operacionales normalizados a un único sistema desnormalizado, cuyos datos estén completamente integrados en nuestro sistema.

Como resumen podemos quedarnos con que una solución completa de BI nos permitirá:

Observar Que está ocurriendo en la organización
Comprender Por qué está ocurriendo esto en la organización
Predecir teniendo cierta información ser capaces de saber que ocurrirá
Colaborar Que debería hacer el equipo para mejorar la situación
Decidir Que escoger en las diferentes situaciones

Es decir, tendremos una serie de información, que nos servirá para decidir y tomar acciones, dichas acciones nos darán más información para volver a decidir y volver a tomar más acciones. En definitiva, tendremos un sistema de retroalimentación que podemos observar en la image anterior.

Un saludo y unicamente se me ocurre una cosa que deciros por seguir este blog.

Bibliografía

Wikipedia

Apuntes de clase

http://www.sinnexus.com/business_intelligence/

http://www.cuadro-de-mando.org/

www.sinnexus.com

domingo, 17 de abril de 2016

Tema 5 - Recuperacion de la informacion

Imagen de transarchivos.co

Aprovechando que la entrada anterior explicábamos que procesos seguía el buscador de Google, esta semana hablaremos de un tema que está relacionado con la búsqueda de información, este tema se denomina como la recuperación de la información. ¿Por qué está relacionado con la entrada anterior? Evidentemente la recuperación de información es todo aquello que a través de unos parámetros localiza y nos muestra esa información deseada, por lo cual, podemos deducir que el buscador de Google realiza dicha recuperación cuando nos mostrando los resultados de una búsqueda, pero no quiere decir que solo se realice en un buscador. Como he comentado antes, también podría realizarse una búsqueda en una base de datos cualquiera, y esta recuperar dicha información para posteriormente mostrárnosla.

Después de esta pequeña introducción vamos a explicar cómo se produce dicha recuperación.

¿Cómo se produce la recuperación de la información?

El proceso de recuperación es muy similar al descrito en la entrada anterior ya que todo empieza cuando un usuario desea encontrar algo. En dicho proceso podemos diferenciar las siguientes fases.

Imagen de upf.edu

Indexación: Mediante unos algoritmos se generara un índice que contiene descripciones de los documentos. Esa descripción se realiza mediante el conjunto de términos que mejor representa su contenido.
Realización de la consulta: El usuario realiza la consulta al sistema, dicho sistema analiza la consulta y si es necesario la transformaría, para que a la hora de comparar los resultados fuera más fácil llevar dicha tarea.
El sistema compara la descripción con la consulta realizada y las comparaciones que han sido satisfactorias se las presenta al usuario.
Los resultados que se muestran al usuario son mostrados en orden de relevancia, según el grado de similitud entre la descripción del documento y la consulta realizada por el usuario.

Como he mencionado anteriormente, dichos pasos guardan cierta similitud con el algoritmo que explicamos en la entrada anterior de Google. Pero no se pueden omitir esas similitudes ya que estamos hablando de recuperar información, y dicho proceso se realiza siempre de la misma manera, más o menos efectiva dependiendo de los algoritmos utilizados, pero siempre, se realizaran los mismos pasos.

A la hora de realizar la recuperación podemos encontrarnos también con dos enfoques diferentes.

El primer enfoque es el Procesamiento estadístico. Guarda mucha similitud con lo mencionado anteriormente ya que cada documento es descrito por palabras claves (índices).

En este enfoque, todas las palabras de un documento son tratadas como términos de índices. También se asigna un peso a cada termino en función de la importancia que tenga respecto a los demás términos, normalmente se determina por la frecuencia que aparece en dicho documento, de este modo no se tiene en cuenta el orden ni la estructura, únicamente el valor asignado a cada palabra.

Este tipo de modelos se limitan únicamente a emparejas las palabras de los documentos con las palabras que se realizan en la consulta. Gracias a esto (lo simple que resulta) es uno de los modelos más utilizados en los sistemas de recuperación.

Este tipo de modelo se puede constituir por dos etapas.

Preprocesador: prepara los documentos, eliminando los elementos que se consideran innecesarios.
Parametrizacion: Se realiza la cuantificación de las descripciones del documento.

El siguiente enfoque que vamos a comentar se llama Procesamiento lingüístico.

Este enfoque se basa en la aplicación de una serie de técnicas y reglas para codificar la información lingüística. Los documentos son analizados a partir de distintos niveles lingüísticos, que se han establecido con anterioridad por unas herramientas que incorporan anotaciones propias a cada texto del documento.

Los pasos que sigue este enfoque son los siguientes:

El análisis morfológico es ejecutado a través de etiquetas que asignan a cada palabra una categoría gramatical.
Analizar las palabras para ver cómo se relacionan y se combinan entre si para generar las frases.(se realiza un análisis sintáctico)
Se aplican formalismos descriptivos con el objetivo de fijar una estructura sintáctica al documento.(este tipo de reglas son muy variadas)
Una vez realizada una estructura sintáctica del documento , obtendremos el significado de las frases que lo compone
Se realizan sinónimos en las diferentes lenguas y se almacenan las diferentes relaciones semánticas entre esos sinónimos para posteriormente mostrarlas en las búsquedas que coincidan.

Como podemos deducir este último enfoque es algo más complejo, pero posiblemente mostraría información mucho más precisa que el anterior.

Dicho esto quiero añadir que estos son los dos enfoques que he encontrado y desconozco actualmente si existe algún tipo de enfoque más. Pero, creo que es más que suficiente para hacernos una idea de lo que podemos encontrarnos en el mundo respecto a este tema.

Como conclusiones he de decir que, como he mencionado anteriormente, el enfoque más utilizado a la hora de recuperar información es Procesamiento estadístico por su simplicidad a la hora de aplicar el algoritmo.

También añadir que esta entrada sirve como complemento a la anterior ya que son dos temas que guardan mucha relación.

Un saludo.

Imagen de recinfo.blog

Bibliografía

https://www.upf.edu/hipertextnet/

http://escritura.proyectolatin.org/

http://www.uah.es

http://www.wikipedia.es

domingo, 3 de abril de 2016

Tema 4 - Sistema de búsqueda Google

En la entrada de hoy hablaremos del funcionamiento que tiene el buscador de Google.

Seguramente todos conozcamos que es Google, pero para los que no lo conozcan por que usan algún otro tipo de buscador como Bing,Yahoo,etc. Explicare brevemente que es Google y después comentare como funciona y los mecanismos de búsqueda que utiliza este buscador.

¿Qué es Google?

Google es una compañía… cuyo servicio/producto principal era proporcionar al usuario un motor de búsqueda (como he mencionado anteriormente), pero no solo se dedica a ofrecer este servicio, la compañía ha crecido mucho desde sus inicios y actualmente ofrece diferentes tipos de servicios que los podríamos categorizar en:

· Web : Aplicaciones/Complementos para tu navegador.

· Móvil: Aplicaciones para móviles.

· Para empresa: Aplicaciones enfocadas a las empresas.

· Para medios: Recursos multimedia.

· Geo: Geolocalización y mapas.

· Búsquedas especializadas: Realizaciones e búsquedas en la web.

· Para hogar y oficina: Nos ayuda a la organización personal

· Sociales: Redes sociales.

· Innovación: Recursos y APIs para poder programar.

Pero estos no son los únicos campos a los que se dedica Google, se dedica a muchos más.

A continuación pondré unas imágenes de la evolución de Google(un gráfico de la evolución en el tiempo, a la izquierda Google al empezar y a la derecha Google en la actualidad).

¿Por qué nos interesa saber cómo funciona el motor de búsqueda de Google?

Al inicio de la entrada hemos mencionado que lo mismo alguien no podía conocer google por ciertos motivos, y uno de ellos podía ser que esa persona usara otro navegador y por eso desconocer la existencia de Google, pero lo cierto es que el mercado de buscadores se reparte de la siguiente manera:

Por lo cual… Google tiene que tener algo que lo hace número uno y no vamos a decir que es un monopolio porque existen más competidores pero… Google tiene más del 80% de usuarios (y cada día más)

A mí personalmente, al ver esa grafica me entra curiosidad por conocer como Google ha conseguido tanto éxito.

Una vez dicho esto y sabiendo que es Google y donde está situado, pasaremos a destripar y a comentar el funcionamiento que tiene a la hora de realizar búsquedas.

¿Cómo funciona el motor de búsqueda de Google?

Navegando por internet encontré un artículo de la página web 20minutos que explica el funcionamiento del motor de búsqueda de Google, en el cual mencionan como Google explica su propio funcionamiento.

Este es dicho titular de la página 20minutos.

Así que lo tendremos en cuenta para explicar su funcionamiento, junto con otra información encontrada en otras páginas, pero principalmente usaremos dicha página.

Para poder hacer más fácil la compresión de dicho algoritmo vamos a diferenciar una serie de etapas a tener en cuenta.

· Primera fase: rastreo

· Segunda fase: comprensión/indexación

· Tercera fase: descarte

Vamos a explicar que sucede en cada fase.

1. Rastreo

En la primera fase que hemos denominado como rastreo, Google realiza una búsqueda/Rastreo en toda la red (más de 30billones de páginas). En este proceso, la búsqueda se realiza en milésimas de segundo.

Después de realizar este rastreo, Google clasifica las paginas según el contenido y otras variables.

2. Comprensión/indexación

Para esta segunda fase que la podemos denominar como compresión, lo que se intenta es comprender que busca exactamente el usuario, para ello, lo que Google realiza es utilizar sus programas/algoritmos para ofrecer el mejor resultado al usuario.

Entre los algoritmos utilizados podemos encontrar los siguientes:

· Deletrear la búsqueda: Hacer una búsqueda por todas las palabras que se pueden encontrar.

· Autocompletar: Ofrecer al usuario búsquedas ya predefinidas con los campos que se están escribiendo en el cuadro de la búsqueda

· Buscar sinónimos: Buscar palabras sinónimas en las búsquedas realizadas.

Teniendo en cuenta estos algoritmos el buscador extrae toda la documentación que es relevante para la búsqueda y los ordena utilizando diferentes variables(Comentan que se trabaja constantemente en estos algoritmos para mejorarlos).

3. Descarte

Después de la fase de compresión y ordenar todos los resultados se hace una lucha contra el contenido que no se interesa, o como se suele denominar (Spam).

Para esto se suele utilizar una lista indexada que tiene Google y si la página se encuentra en dicha lista no se mostrara al usuario final.

También mencionan que esta tarea la tienen tanto automatizada como en programas como de carácter manual y se revisa diariamente para ofrecer el mejor servicio al usuario.

¿Este es el éxito de Google?

Sinceramente… creo que esto es todo lo que Google nos quiere contar, pero por detrás, será más complejo… no obstante mientras iba leyendo se me venía a la cabeza constantemente que este tipo de búsqueda es la denominada como posicionamiento SEO(también existe otro posicionamiento que se denomina como SEM).

¿Qué es el posicionamiento SEM y SEO?

SEO: A través de palabras claves, se ordena la búsqueda y muestra las coincidencias en el buscador.

SEM: Se muestran las búsquedas en forma de anuncio, las empresas pagan por que esos anuncios aparezcan en primera posición o en un lugar llamativo de su buscador en caso de que introduzcan unas palabras claves en la búsqueda.

Claramente Google utiliza estos dos mecanismos de posicionamiento también ya que realizando una búsqueda podemos observarlo.

Aquí ponemos un ejemplo sacado de una página (ideaschicago.com) en el que podemos observar lo mencionado anteriormente.

Dicho todo esto, podemos hacernos una idea de cómo funciona el buscador de Google a un nivel usuario. Pero antes de despedirme me gustaría hacer las siguientes preguntas.

¿El motor de búsqueda de Google solo realiza esas tareas que se han mencionado?

¿El apartado de descartes…Únicamente descarta el Spam?

¿Por qué mostrar resultados de la competencia también?

Al realizar esta última pregunta he escrito en el buscador de Google la siguiente palabra “Smartphone”…¿Por qué aparece como anunciante Apple y no un propio teléfono de Google?

Un saludo!

domingo, 13 de marzo de 2016

Tema 3 - Sistemas de almacenamiento

Sistemas de almacenamiento.

imagen obtenida de advicetech-cr.com

En esta entrada quisiera hablar de los sistemas de almacenamientos actuales , hacia dónde va dirigiéndose dichos sistemas en un futuro y qué relación tienen con los sistemas gestores bases de datos.

A lo largo de mi vida he visto una evolución constante respecto a estos sistemas/dispositivos. Pero lo que más me llama la atención en este tema es la rapidez con la que evolucionan dichos sistemas actualmente. Es decir… antiguamente la tecnología avanzaba de una manera muchísimo más lenta y un soporte/dispositivo/sistema de almacenamiento tenía una vida mucho más larga que la actual. Me explicare con unos ejemplos de los dispositivos de almacenamiento “portátiles” (Los datos de fechas que usare son orientativos , guiándome de información encontrada internet y mi visión del mundo, por lo cual algunas fechas no serán exactas y podrán variar un poco):

imagenes obtenida de taringa

Antiguamente teníamos como sistema de almacenamiento los disquetes, que fueron lanzados en 1969 y descatalogados en el año 2000, su tiempo de vida fue de 31 años.

imagen obtenida de advicetech-cr.com

Después de los disquetes pudimos utilizar los Cd’s , que fueron lanzados al mercado en 1979 , pese a que aún no se han descatalogado … actualmente están obsoletos… y se quedaron obsoletos con la llegada del DVD (esto en el año 1995) es decir… podríamos decir que han tenido una vida entorno a los 16-20 años.

imagenes obtenidas de taringa

imagen obtenida de welivesecurity.com

Los DVD’s fueron lanzados en 1995 y con la llegada de los blu-ray se quedarían obsoletos ya que la cantidad de información en comparación con los anteriores que se podría guardar era enorme, esto ocurriría en el 2002. ¿7 años? Los DVD seguirían usándose y bueno , el principal cambio de dispositivo no fue por el blu-ray… si no por las memorias usb o discos duros extraíbles, ya que fueron lanzadas a la par que los DVD , pero estaban limitadas por la capacidad que podían almacenar… con el tiempo evolucionaron y dejaron atrás la capacidad del DVD pudiendo guardar hasta cantidades de 1Tera en un mismo dispositivo extraíble, esto empezó a ocurrir entorno al 2007 hasta aproximadamente el 2011 que se empezaría a usar el almacenamiento en la nube, ya que, daría muchísimas más ventajas que los otros sistemas, unas de las características más importantes de este sistema serian:

Capacidad ilimitada
Acceso a los datos desde cualquier nodo que disponga de una conexión son las características más llamativas

Actualmente nos encontramos en este punto, gran parte de la población sigue usando las memorias USB o memorias extraíbles, ya que subir los datos a la nube puede tener también sus inconvenientes (temas de seguridad y privacidad) , pero la gran mayoría de la población suele utilizar los sistemas de almacenamiento en la nube por que se trabaja cada día para que sean más seguro y es mucho más cómodo que el anterior sistema.

Con este fragmento de historia contado rápidamente(no he mencionado muchos de los otros dispositivos que han existido, como por ejemplo el Casete de cinta o el minidisk… solo mencione los que creo más relevantes) llego a la siguiente reflexión.

El primer dispositivo mencionado se sustituyó completamente pasados 31 años , el segundo dispositivo mencionado fue con 16 años , el tercero con poco más de 7 años , las memorias usb desde que empezaron a ganar relevancia hasta que empezaron a dejarse de usar(pero no completamente) 4 años … visto esto podemos ver que la vida de este tipo de tecnología cada vez es menor… pero actualmente… con el almacenamiento en la nube… llevamos 5 años, por lo cual podemos ver que vuelve a aumentar el tiempo de vida… por lo cual… ¿Hemos encontrado una tecnología de almacenamiento que no será sustituida ya?¿Que tecnología veremos dentro de 5 años?¿Seguiremos usando almacenamiento en la nube?

imagen obtenida de freepik.es

Los que hayáis respondido a las preguntas, creo que independientemente de la respuesta que dierais todos tendríais razón ya que yo creo que… en un futuro… Seguiremos usando el almacenamiento en la nube pero no como lo conocemos actualmente… posiblemente exista otro tipo de tecnología para almacenar en la nube, mucho más segura y más eficaz.

Posiblemente… llegados a este punto también os estéis preguntando lo siguiente ¿Que tiene que ver esto con el tema de la información? En mis entradas anteriores todos los temas van dirigidos a eso… la información. Y este, no va a ser menos… también está dirigido a la información, y esto tiene que ver mucho con la información. Ya que, la información puede ser almacenada en Bases de datos, pero… ¿Dónde encontrar las bases de datos? Pues en todos los sistemas que he mencionado anteriormente podemos encontrar Bases de datos que guarden diferentes tipos de información. Por lo cual, antes de terminar mi entrada me gustaría hablar de las Bases de datos y los diferentes tipos de bases de datos que existen. Ya sabiendo algunos de los diferentes sistemas en donde podemos encontrarlas.

imagen obtenida de olarweb.com

¿Qué son las BBDD?

Creo que todos conocemos el concepto de base de datos, pero para el que no lo conozca – “conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso” (Wikipedia total)

También podemos mencionar que existen diferentes tipos de BBDD, y sabiendo esto podemos clasificarlas:

Según la variabilidad de los datos:

Estáticas: únicamente aceptan peticiones de lectura
Dinámicas: Aceptan peticiones de lectura y también de escritura ya que permiten modificar y actualizar los datos de dicha BBDD.

Según el contenido que almacenan:

Bibliográficas: contienen la dirección o referencia de una fuente de información primaria, esto lo que permite es localizar dicha fuente de información.
Textos completos: almacena la fuente de información primaria con todo su contenido.

O según su modelo de administración de los datos:

Jerárquicas: Un nodo envía información a los hijos, un hijo solo puede tener un nodo padre y un nodo padre muchos hijos. (podría decirse que estamos hablando de un árbol B+ en programación)
De red: Este modelo es similar al de bases de datos jerárquicas, únicamente que el un hijo puede tener varios nodos padre
Transacciones: Están propuestas con el fin de recoger y enviar datos a gran velocidad, utilizadas en bancos por ejemplo ya que se necesita enviar y actualizar la información casi a tiempo real.

Esto son solo algunos de los tipos de bases de datos que hay según sus características, si queréis completar más la información os recomiendo que le echéis un vistazo a la Wikipedia.

Como mencione en mi anterior entrada… las BBDD están programadas en el lenguaje SQL y para controlar toda la información que se genera diariamente se necesitan BBDD enormes , también se genera información redundante , por lo cual actualmente hay un problema con la información que se genera y se guarda.

Actualmente hay varias empresas que han creado un nuevo modelo a la hora de administrar, generar y explotar la información en sus BBDD, este nuevo modelo se denomina como DataMining (Minería de datos).

imagen obtenida de innovanauta.com

¿Qué es la minería de datos?

La minería de datos consiste en extraer la información de los conjuntos de las bases de datos y transformarla en información útil para las empresas, descartando la información redundante y que no es útil.

Empresas que utilizan este método son Twitter y google(entre muchísimas otras como Facebook,amazon…). Dichas empresas tienen unos volúmenes de información en su base de datos que es difícil de administrar de una manera convencional, por lo cual utilizan este método, eliminando la información que no es necesaria y quedándose con información relevante y útil para ellos. Con este método, intentan predecir el comportamiento de la información para poder crear patrones de comportamiento.

Esto no solo les sirve a Twitter y google para predecir que va a comprar o que no va a comprar un usuario y así poder vender esos datos a otras empresas y hacer negocio… también puede servir a otras empresas o incluso al gobierno para predecir el comportamiento de las personas en determinadas circunstancias.

Pero no obstante en la actualidad el área del DataMining aún tiene que madurar para poder predecir con exactitud y sea más fiable. No obstante no podemos dejar de lado que es una realidad que con esta técnica puedan predecir patrones de comportamiento solo con analizar ciertos datos (en mi opinión nunca tendrá una fiabilidad plena del 100% pero si una fiabilidad lo bastante cercana al 100% para que sea valiosa).

¿Y por qué os he contado lo de los dispositivos de almacenamiento y ahora lo de las bases de datos?

Por qué en la actualidad las BBDD de las empresas mencionadas anteriormente se encuentran en la nube. Ya que no podrían realizar DataMining de una manera tan eficaz si se encontraran en otros tipos de dispositivos, ya sea por cantidad de datos y por el tipo de acceso.

Por lo cual, llegados a este punto, podemos preguntarnos algo similar a las preguntas realizadas anteriormente... ¿Qué futuro tienen las bases de datos?¿Cambiaremos de tecnología para poder administrarlas mejor?¿Hay información redundante?¿Como la eliminamos?¿El DataMining es el futuro y cambiaremos la forma de administrar todas las bases de datos?

En mi opinión, creo que el DataMining será muy importante en un futuro y la gran mayoría de las empresas y organismos utilizaran este modelo a la hora de tratar los datos… pero las empresas que tengan mucho menos volumen de datos seguirán usando un tratado convencional.

Dicho esto me despido y os dejo aquí las preguntas que he realizado.

imagen obtenida de pixabay.com

Sistemas de almacenamiento.

¿Hemos encontrado una tecnología de almacenamiento que no será sustituida ya?

¿Qué tecnología veremos dentro de 5 años?

¿Seguiremos usando almacenamiento en la nube?

BBDD

¿Qué futuro tienen las bases de datos?

¿Cambiaremos de tecnología para poder administrarlas mejor?

¿Hay información redundante?

¿Cómo la eliminamos?

¿El DataMining es el futuro y cambiaremos la forma de administrar todas las bases de datos?

Un saludo.

Información obtenida de:
Apuntes de clase.
Videoconferencia.
Wikipedia.
sinnexus.com
ccm.net.
monografías.com
proyectoova.webcindario.com