Historia de las Bases de Datos

Bases de Datos: Desde Tarjetas a SQL y NoSQL

En la era de las computadoras, la clasificación de datos se convirtió en una necesidad. En ese sentido, se han desarrollado modelos de bases de datos, sistemas de gestión de bases de datos y lenguajes de consulta.

Sin la correcta organización de datos, internet sería un caos, o más bien ni siquiera existiría, pues la clasificación de datos es elemental desde los procesos más primitivos de computación. Así que hoy nos daremos a la tarea de explicar la historia y evolución de las bases de datos.

Historia de las Bases de datos

Las bases de datos, tal y como las conocemos  hoy, nacieron en los años 50. No obstante, la necesidad de organizar y guardar datos es por mucho anterior.

Los primeros esfuerzos del hombre por recolectar datos conectan con las pinturas rupestres  y las raras tabletas de arcilla que se encuentran por separado en la biblioteca de Ugarit (una ciudad en lo que hoy es Siria). Entonces, en efecto, la recolección de datos es bastante antigua.

Sin embargo, esta recolección consistía en guardar esos datos, no en clasificarlos y organizarlos. Posiblemente, las grandes bibliotecas antiguas, como la del Foro Romano, sean las primeras intenciones del hombre de clasificar datos.

No obstante, lo que en definitiva se considera un antecesor de las bases de datos son las tarjetas de índices, que de hecho no son tan antiguas.

El naturalista Carl Linnaeus, en el siglo XVIII, introdujo un sistema para clasificar sus registros, donde cada especie se colocaba en una hoja de papel por separado. De esa manera, organizó fácilmente todo su trabajo de investigación.

Pero ¿cómo llega esta iniciativa al mundo electrónico? Veámoslo a continuación.

Los datos electrónicos

En el año 1890, el estadístico e inventor estadounidense Herman Hollerith creó una máquina de conteo para las necesidades de los ayuntamientos en los procesos de censos.

La máquina se encargaba de utilizar tarjetas perforadas para almacenar información, y de esa manera, se convirtió en el primer procesamiento electrónico de datos.

Posteriormente, en 1911, cuatro empresas se unieron para crear Computing Tabulating Recording Corporation, compañía que más tarde pasó a llamarse International Business Machines Corporation. Actualmente, esta compañía sigue en funciones bajo el acrónimo de IBM.

En adelante, la necesidad de contabilizar personas y datos se hizo cada vez más latente, y en ese sentido, los sistemas de recopilación y organización de datos se hicieron cada vez más populares.

Por ejemplo, previo a la Segunda Guerra Mundial, registras los números de seguridad social era una necesidad en los EEUU. Por eso, IBM creó una máquina que fue lanzada posteriormente para 1951, se llamaba UNIVAC I, y de hecho fue la primera  computadora digital de producción masiva para uso comercial.

Aunque posteriormente se dejó en evidencia la ineficiencia del uso del código fuente para las tareas de la base de datos.

La llegada de los lenguajes de programación

Los lenguajes de programación llegaron en los 60. Ya en 1959,  hubo una conferencia cuyo objetivo fue considerar las posibilidades de introducir un lenguaje de programación común para las computadoras.

En 1960, Conferencia sobre lenguajes de sistemas de datos (conocido por el acrónimo CODASYL) se estableció con estos propósitos. Ese mismo años se creó el Lenguaje común orientado a los negocios, o COBOL (versión COBOL-60). La idea se le ocurrió al oficial de la Marina de los Estados Unidos, Grace Hopper, y se trataba de un lenguaje de programación cercano al inglés. Este sistema tuvo mucho peso y aún en la actualidad sigue vigente.

Pero fue en 1961 cuando finalmente Charles Bachman de General Electric presentó el primer almacén de datos. Más tarde, Bachman también fue miembro del Grupo de tareas de base de datos, que tenía la intención de desarrollar un nuevo sistema.

El proyecto salió a la luz en 1971, y con él llegaron los conceptos de integridad de datos, modelo de datos, esquema de base de datos, atomicidad, entidad y relación. En pocas palabras, se describió la arquitectura del sistema de base de datos de red.

La edad de oro de las bases de datos

Los sistemas de bases de datos que llegaron después introdujeron conocimientos de álgebra, cálculo racional y el lenguaje comprensible. Al sistema integrador se le llamó SEQUEL (Structured English Query Language), y más tarde lenguaje de consulta estructurado (SQL). Este lenguaje se aprobó en 1987 y se estableció como norma ISO y ANSI.

Esto dio paso a que en los 90 naciera el desarrollo de un modelo relacional de objetos y a que las bases de datos se orientaran exclusivamente a objetos.

Posteriormente, a finales de los 90, hubo un cierto cambio en la percepción de los datos. Llegaron las bases de datos no estructuradas llamadas NoSQL, que sin duda están siendo impulsadas por gigantes de la industria como Google.

Próximas tendencias en bases de datos

Actualmente, sobre todo las empresas necesitan obtener datos en tiempo real, por eso, los sistemas son cada vez más sofisticados.

En los últimos años, han surgido tecnologías de bases de datos alternativas como Hadoop y NoSQL. Para nadie es un secreto que ahora los expertos en bases de datos operan desde la nube para abordar cargas más grandes.

En ese orden, la tendencia actual es el análisis en tiempo real sobre datos transaccionales. De esa manera se busca garantizar detección, focalización o recomendaciones de fraude en tiempo real.

Asimismo, las bases de datos transaccionales híbridas ya no son opcionales, sino una necesidad absoluta; además, vienen con una memoria, porque sin duda es más fácil mantener un sistema de base de datos sin la transferencia o el intercambio de datos.

Se espera que en un futuro cercano, la información evolucione para facilitar la orquestación y la gestión de fuentes de datos dispares. Próximamente, los científicos de datos desarrollarán bases que facilitarán el uso de todos los datos en tiempo real y en ese sentido, los analistas de datos serán cada vez más imprescindibles.

Actualmente, los datos que se obtienen son masivos, por eso, la tarea fundamental está en saber cómo clasificarlos y a futuro, el trabajo será cada vez más arduo en este sentido.