Que es la Minería de Datos.

Estándar

Recientemente este concepto, lo  escuchamos hablar con más frecuencia consiste en extraer información de una base de datos y transformarla para su posterior uso. Esta extracción de datos se hace mediante un análisis los cuales sale a deducir un patrón. Esta minería puede aplicarse a distintas áreas como mercadeo, ventas, medicina, clima, banca, entre otros.

Ejemplos de cada área

  • Mercadeo. Predicción de ventas.
  • Ventas. Público meta al que está dirigido cierto  producto, fidelidad de clientes a un producto.
  • Medicina. Respuestas ante cierto tratamiento médico, pruebas de cierto producto.
  • Clima. Predicción del mismo.
  • Banca. Aprobación de préstamos, montos, entre otros.

Para realizar este proceso de minería de datos se deben de hacer  una serie de preguntas  acerca de los datos almacenados. Para realizar esto se beben de seguir una serie de pasos:

  1. Definir el problema: Se analizan los requerimientos empresariales, a cubrir por el problema, es decir, el ámbito aquí se da una revisión de la base de datos, columnas, tipos de datos y relaciones que existen.
  2. Preparar los datos: Verificar que los datos tengan el mismo tipo de datos, quitar los datos no validos.
  3. Explorar los datos: Conocer los datos para la toma de decisiones aquí entra en más detalle los cálculos.
  4. Generar modelos: Definir cuales columnas se desean utilizar, es decir, crear la estructura de minería de datos. Aquí todavía no se encuentran disponibles los datos ya que todavía no han sido procesados, contiene solo las columnas que servirán de entrada de datos y como se debe de procesar los mismos este proceso es conocido como entrenamiento
  5.  Validar el modelo: Se prueba el modelo para verificar que este funciona de la mejor manera, ya que el mismo debe ser eficaz y preciso.
  6. Implementar el modelo: Se desarrolla el modelo para ser utilizado en la empresa.

Administración de Bases de Datos.

Estándar

La administración de bases de datos se da gracias a un sistema conocido como el DBMS (Database Management System) o también conocido como SGBD (Sistema Gestor de Bases de Datos), el cual nos ayuda a tener un control sobre nuestra base de datos, además de mantener de forma aislada los datos de nuestra aplicación sus funciones son:

  • Tener un fácil acceso a los datos.
  • Dar acceso a ciertos usuarios.
  • Manipular la Base de Datos.

Los SGBD o DBMS cuentan con una serie de componentes para poder operar y mantener las BD:

  • Lenguaje de Definición de Datos (DDL). Ayuda a crear los diferentes elementos de la BD.
  • Lenguaje de Manipulación de Datos (DML).Ayuda a añadir, cambiar y borrar la información de la BD.
  • Data Dictionary: Es un diccionario de datos para referirse a ellos contiene nombre, descripción, alias, contenido entre otros.

Ventajas del SGBD

  • Integridad de los datos. Los datos se encuentran en un solo lugar , y hay restricciones o reglas las cuales no se pueden violar .
  • Seguridad. Permite que la BD no sea vulnerable, como también ciertas restricciones a los usuarios.
  • Acceso a los Datos. Se da por medio de los lenguajes de consulta.
  • Copias de Seguridad. Ayudan a proteger los datos ante fallos ya que estos son utilizados para recuperarse.

Desventajas del SGDB

  • La gran mayoría de estos sistema son utilizados por programadores y no por usuarios finales debido a su complejidad de operación
  • Tamaño. Estos sistemas ocupan gran cantidad de espacio en disco para trabajar de manera rápida e eficiente.
  • Costo. La gran mayoría de estos sistemas son de elevado costo aunque existen sistemas gratuitos.

Entre los sistemas más populares encontramos los siguientes:

  • Oracle.
  • SQL Server.
  • My SQL.
  • Posgre SQL.
  • Informix.
  • DB2.
  • Derby.
  • SQLite.

Conociendo el mundo de las Bases de Datos.

Estándar

Hoy en día estamos entrando en las puertas de la era digital, cada vez más las empresas encuentran indispensable contar con un programa que facilite algún proceso de su  negocio, pero tras de ese programa se encuentran dos cosas indispensables que son: el código de programa el cual tiene el plasmado la abstracción del proceso de negocio y un lugar que permite almacenar los datos el cual es llamado base de datos.

Una base de datos se define como un “conjunto de datos almacenados de un mismo concepto para su posterior uso”. Es decir, nuestro programa por sí solo no se podría nutrirse de información si no existiera una base de datos. Podemos almacenar información de cualquier tipo como por ejemplo:

  • Los libros que tenemos en la biblioteca de nuestra casa.
  • Nuestra agenda con contactos familiares y de negocio.
  • Los datos arrojados por una encuesta a nivel nacional.
  • Información manejada por un banco entre otras.

Para que nuestro programa pueda almacenar estos datos de forma ordenada y después poder operar con ellos necesitamos de un programa llamado sistema gestor de bases de datos.

Las bases de datos se clasifican de muchos tipos de acuerdo a varios aspectos los cuales son:

Variabilidad.

Se refiere si los datos que se van a almacenar van a cambiar o no con el tiempo.

Dentro de ellas encontramos dos tipos:

  • Estáticas.
  • Dinámicas.

Contenido.

Se refiere a la información que estas van a almacenar.

Dentro de ellas encontramos los siguientes tipos:

  • Bibliográficas.
  • De texto completo.
  • Bancos de datos químico y biológico.
  • Clínicas.