Qué es un sistema de gestión documental

Publicado el: 01/02/2013 / Leido: 21225 veces / Comentarios: 0 / Archivos Adjuntos: 0

Compartir:

Este artículo fue presentado en el año 1993, algunos de sus aspectos críticos siguen vigentes no obstante los esfuerzos realizados por muchas instituciones sobre el tema, razón la cual lo presento nuevamente para analizar ese aspecto crítico. (vhaj)

 

Mayo 1993

Qué es un sistema de gestión documental

Por Lluís Codina

Los sistemas de gestión documental son programas de gestión de bases de datos que disponen de una tecnología idónea para el tratamiento de documentos científicos, culturales y técnicos. Estos sistemas difieren en aspectos fundamentales de los de gestión de bases de datos convencionales, o de aplicación general, que se utilizan para la gestión de documentos administrativos.

La industria informática, por motivos de marketing o, simplemente, por mal conocimiento del sector, ofrece como documentales soluciones que sirven perfectamente para gestionar documentos administrativos, pero no para gestionar documentación científico-técnica.

Por otro lado, en los departamentos de informática de las empresas, es frecuente que el personal informático desconozca el hecho de que existen programas especialmente diseñados para ese tipo de documentos y, normalmente, tienden a imponer aquellas soluciones que conocen bien, pero que no proporcionan a los documentalistas las herramientas adecuadas para su trabajo.

Sin embargo, tanto los profesionales de la información como la industria deberían estar interesados en no confundir estos dos tipos de sistemas, porque lo contrario conduce a los profesionales a errores de implantación; y a la industria, a errores de marketing.

Por ello, en el momento de considerar la adquisición de un sistema documental, es importante disponer de criterios que ayuden, bien a adoptar las decisiones de compra más correctas, bien a disponer de argumentos de negociación con el departamento de informática.

Este artículo se ha estructurado en tres partes: en la primera se discute el problema de la designación y la diferencia entre las dos clases principales de sistemas que actualmente la industria de la información denomina "documentales", aunque solo una de ellas sea documental en el sentido que le damos los documentalistas. En la segunda parte se detallan las características técnicas más importantes de estos sistemas documentales, explicando el modelo clásico. En la tercera parte, se describen algunas variaciones sobre este modelo clásico.

1. Bases de datos y ambigüedad del adjetivo documental

En los países de habla latina los documentalistas arrastramos una tradicional insatisfacción por la problemática denominación de nuestro campo de actividades ("¿documentación?... ¿y que es eso?"). Es una denominación poco intuitiva, como demuestra el hecho de que, incluso las personas cultas, salvo que trabajen en temas de documentación, ignoran qué es la documentación. No sucede lo mismo con otras profesiones, cuya denominación, por alguna razón, ya da una idea sobre cual es su campo de actividad, incluso a los profanos.

Esta ambigua denominación induce también una constante confusión en el terreno de los sistemas de información, incluso entre profesionales, porque documental , aplicado a bases de datos, puede referirse a tecnologías de la información que, a veces, se aplican a gestionar documentos administrativos; o puede referirse a tecnologías especializadas en el almacenamiento y recuperación de información documental científico-técnica .

Desde el punto de vista estricto del idioma, es indudable que ambas tecnologías pueden adoptar con todo derecho el adjetivo documental , pero solo una de ellas es documental en el sentido que le otorga la Documentación, como disciplina científica, como sector de la economía -el sector de la información registrada- o como actividad profesional -aquella que desarrollan documentalistas y bibliotecarios-.

Así pues, para entendernos, en el resto de este informe hablaremos de sistemas administrativos a secas cuando nos refiramos a sistemas de documentación administrativos; y hablaremos de sistemas documentales a secas cuando nos refiramos a sistemas de documentación científica-cultural-técnica.

1.1. Entornos de trabajo en la empresa

En la gestión de documentos existen, de acuerdo con lo señalado, por lo menos dos entornos de trabajo, muy diferenciados: un entorno administrativo y un entorno documental. El entorno administrativo utiliza documentos administrativos, que son aquellos que permiten la gestión diaria de cada empresa. Este entorno, como es obvio, está presente en cualquier empresa o unidad de producción.

El otro entorno utiliza documentación científica o técnica que es necesaria para dar soporte a ciertos departamentos de la empresa, como el de I+D, el de planificación y proyectos, el de ingeniería, el de investigación de mercados, etc.; así como a aquellos empleados que entran en la categoría de lo que se denomina knowledge workers : ejecutivos, asesores, analistas, etc. A esta documentación se le denomina informativa o cognitiva. No todas las empresas disponen de tales entornos de trabajo. Las pequeñas y medianas empresas, por ejemplo, no suelen tener departamentos de I+D ni de ingeniería; y la cultura de los knowledge workers españoles no suele valorar la documentación. Como consecuencia, ni utilizan sistemas documentales ni conocen siquiera su existencia, y suelen informarse por el castizo método de "estar a verlas venir".

En cambio, es un entorno imprescindible en ciertos sectores de la economía y de la sociedad; por ejemplo, en prensa, sanidad, administración pública, enseñanza, etc.; así como para satisfacer ciertas necesidades relacionadas con la calidad de vida (sistema de lectura pública), y para dar soporte a las actividades de ciencia y tecnología de un país (infraestructura de información y documentación nacional).

1.2. Estructura de una base de datos

Recordemos que, actualmente, se tiende a adoptar una concepción muy laxa de base de datos, y se tiene por tal a cualquier colección de datos grabados en un soporte legible por ordenador, que exista con el propósito de proveer información a otras aplicaciones o a usuarios finales.

Estos datos se agrupan en unidades de tratamiento denominadas registros, los cuales, a su vez, están organizados en zonas o sub-elementos denominados campos. Los objetos materiales o conceptuales de los que trata una base de datos se denominan entidades, y así a cada entidad del mundo real corresponde un registro en el mundo simbólico de las bases de datos, donde aquellas entidades están representadas mediante un modelo simplificado: el registro. Las entidades del mundo real poseen unos atributos determinados, y aquellos atributos que son más pertinentes para representar la entidad se convierten en los campos del registro.

Por ejemplo, si los clientes de una empresa son la entidad representada en una base de datos, entonces a cada cliente le corresponderá un registro. Cada elemento de información, o atributo del cliente, como nombre, dirección, población, etc., será un campo del registro.

Hasta aquí se han visto las similitudes en los dos sistemas de bases de datos existentes actualmente. Las características y propiedades de los registros y campos, la forma de acceso a la información y las herramientas complementarias difieren considerablemente entre unos y otros sistemas.

1.3. Sistemas administrativos versus sistemas documentales

La tecnología de los sistemas administrativos suele basarse en el modelo relacional, y la tecnología de los sistemas documentales se basa en el modelo textual. En los dos casos, ambas tecnologías disponen de un sistema de gestión de bases de datos como núcleo. Últimamente han aparecido soluciones que combinan ambas.

Los sistemas relacionales utilizan la tabla como estructura de datos. Una tabla es una matriz de dos dimensiones compuesta de filas y columnas. Cada columna corresponde a un campo, y cada fila corresponde a un registro. En una tabla, la longitud de cada campo debe estar determinada y prefijada de antemano, y no admite valores repetidos (por ejemplo, dos autores, o diversas palabras clave).

Los sistemas documentales, en cambio, utilizan el modelo textual, basado en el fichero invertido y campos de extensión variable con valores repetidos. Es el único modelo que, por ahora, se ajusta a la necesidad de los documentos científico-técnicos.

En este modelo textual, cada cadena de caracteres puede ser un punto de acceso al registro, y aquí aparece una de las diferencias más notables <197>pero no la única<197> respecto al modelo relacional. Es decir, en el modelo textual la descripción del documento cumple un papel doble, y esto es importante comprenderlo bien: por un lado actúa como representación del documento original y, por otro lado, cada término o palabra de la descripción actúa como un punto de acceso al documento. En cambio, en los sistemas relacionales sólo sirve como punto de acceso la primera cadena de caracteres de cada campo. Más adelante volveremos sobre el modelo textual.

1.4. Sistemas administrativos u ofimáticos

Los sistemas automatizados de gestión de documentos administrativos suelen recibir el nombre de sistemas ofimáticos, y están orientados a las necesidades de gestión de documentos propios de las empresas. Suelen consistir en extensiones de los sistemas de gestión de bases de datos convencionales, es decir, en sistemas relacionales.

El tipo de documentos que gestionan, por más que sean vitales para la empresa, no necesitan el análisis ni la indización que, en cambio, necesitan los documentos técnicos o científicos, tales como artículos de revistas, noticias de actualidad o informes técnicos.

El modelo relacional se desarrolló, en realidad, para gestionar datos, no tanto para gestionar objetos más complejos, como documentos, pero aún así puede gestionarlos siempre que sean muy estructurados, como suelen ser los administrativos.

La clase de documentos que puede gestionarse con estos sistemas acostumbra a poseer un pequeño conjunto de atributos que basta para permitir su manejo con eficacia. Tales atributos suelen ser el autor del documento, el destinatario, la fecha de emisión, el tipo básico (factura, correo, etc) y algunos pocos más. Tales atributos son evidentes y objetivos. No es necesaria una actividad intelectual para descubrirlos y describirlos. Sería grotesco pensar en una descripción de ellos mediante palabras clave o encabezamientos de materia. Si se someten a una gestión de tipo archivístico pueden ser objeto de una clasificación jerárquica en el cuadro de clasificación general de todas las series documentales de la empresa. La dificultad intelectual, en tal caso, descansará en el diseño del cuadro de clasificación, pero no en el análisis de los documentos que, por decirlo de alguna manera, están autoindizados.

2. El modelo clásico de los sistemas documentales o cognitivos

La documentación científico-técnica, también llamada informativa y cognitiva, requiere para su gestión sistemas muy especializados que permiten recuperar información a partir del análisis y la descripción del contenido o materia del documento.

Los sistemas documentales se basan en una estructura menos formalizada que los sistemas ofimáticos. La estructura clásica incluye cuatro elementos principales: un modelo de registro textual estructurado en campos de extensión variable; la inversión de términos que conduce a la creación de un fichero invertido; uno o más diccionarios que controlan la indexación (diccionario de palabras vacías, de sinónimos, de palabras autorizadas, etc.); un sistema de recuperación basado en el álgebra de Boole para realizar operaciones lógicas con conjuntos de documentos y otro sistema complementario de recuperación basado en comparaciones, truncamientos, proximidad, etc. de cadenas de caracteres.

En este sentido, un sistema documental clásico intenta proporcionar herramientas para gestionar información no estructurada (es decir, cuyos atributos no son deducibles sin una operación compleja de análisis intelectual), ni posee propiedades repetitivas, como un impreso de oficina, sino que su estructura es sumamente variable de un documento a otro.

Un artículo de una publicación científica o un informe técnico, por ejemplo, sería el paradigma de tal tipo de información. Para su recuperación no basta registrar datos como el autor, el destinatario y la fecha de creación. Debe representarse también la información y el conocimiento que pueda contener ese documento.

Los sistemas documentales proporcionan las herramientas para ello: registros que admiten campos de gran extensión; recuperación del documento por cualquier palabra que forma parte de su descripción; edición e impresión del fichero invertido y de los diversos diccionarios, etc.

Sin estos elementos mínimos es imposible controlar un fondo documental de tipo cognitivo. No podemos esperar que los usuarios de un centro de documentación soliciten documentos mediante su número de ISBN. En realidad los usuarios de un sistema de información documental detectan una necesidad de información, expresada de forma borrosa, que el sistema habrá de traducir a una expresión de búsqueda precisa mediante términos de indización.

El motor de recuperación del sistema deberá ejecutar entonces una función de concordancia con el fin de determinar el conjunto de documentos pertinentes a esa necesidad de información.

Por citar sólo algunos programas representativos de este modelo, podemos mencionar a Knosys (Micronet), Inmagic (Doc-6), IRS (Infodoc), Invesdoc (Investronica), Texto (Chemdata), Taurus (Chemdata), Concord (The Lagrange Group), Archivist (Glahn), HyperMap-Doc (Cognivision Research), Flashmedia (Centrisa), Windows Personal Librarian (CSI), BRS (Baratz, Eurotelematica), Odis (Olivetti) para el entorno microinformático; así como Basis (Centrisa), Basis Plus (Centrisa) Mistral (Bull España), Texto (Chemdata), BRS (Baratz y Eurotelematica) para minis y grandes sistemas.

3. Variaciones sobre el modelo clásico

En los últimos años se ha producido una serie de innovaciones en la tecnología documental que, sin negar el modelo clásico, lo extienden y complementan. Veamos estas innovaciones a partir de los siguientes parámetros: el modelo de registro, el sistema de recuperación y la combinación con el modelo relacional.

3.1. La estructura del registro

El concepto de registro ha sufrido una extraordinaria ampliación. Algunos sistemas admiten cualquier formato, con o sin campos, incluso el registro puede mantener el formato nativo de la aplicación con la que ha sido creado, es decir, que indexan y gestionan documentos sin necesidad de adaptarlos al formato de la base de datos.

Algunos sistemas permiten también la gestión de los así llamados documentos compuestos , que consisten en documentos que incluyen información multimedia (texto, gráficos y sonido) creada con diversas aplicaciones. Estos documentos compuestos conservan la vinculación con los diversos programas que han creado cada parte del documento.

Una innovación menos radical, pero extremadamente útil consiste en la posibilidad de asociar imagen a los registros textuales convencionales. De este modo el registro textual puede activar la visualización en pantalla de la imagen facsímil del documento original, que puede también imprimirse en una impresora con posibilidades gráficas (láser o chorro de tinta). Flashmedia, Clarity, Docu/Image, Docu/Imagen, Invesdoc, IRS, Texto-GED, Taurus, BRS, Odis , entre otros, soportan tales prestaciones.

3.2. Sistemas de interrogación

En cuanto al método de recuperación, comienzan a aparecer sistemas que incorporan aportaciones de la teoría de recuperación de información, tales como el cálculo de relevancia de cada uno de los documentos recuperados, con tal de presentarlos por su grado de probabilidad de satisfacer la demanda del usuario, o sistemas que convierten un texto de un documento en un modelo de búsqueda de documentos con contenidos similares. Windows Personal Librarian (CSI) es uno de los programas que incorpora tales características.

3.3. Motores combinados

En tercer lugar, existe una serie de sistemas ( Invesdoc, HyperMap-Doc, Docu/Imagen, Basis Plus y FlashMedia , por ejemplo) que combinan tecnología relacional y tecnología textual. Se trata de programas que disponen de dos motores distintos de recuperación de información: un sistema relacional, para información muy estructurada que admite una representación tabular, y un motor de recuperación textual de tipo documental. Disponen de una capa de software que presenta ambas tecnologías bajo una interfase común.

En futuros informes, IWE irá revisando con mayor detalle la oferta de sistemas documentales existente en España, dedicando su atención a los diversos modelos existentes: clásicos, evolucionados e hipertextos.

Epílogo: cómo lo resuelven en otras áreas idiomáticas

Respecto a la ambigüedad señalada al principio de este informe, y sólo por curiosidad, digamos que en los países anglosajones, y a modo de ejemplo, el término data base management system (dbms) se reserva exclusivamente a sistemas ofimáticos; y para los sistemas documentales se reservan ciertas expresiones, tales como information retrieval system , text retrieval system o document retrieval system , con lo cual las confusiones están menos extendidas, por lo menos en ambientes profesionales.

Como es sabido, nuestra disciplina o dominio de actividad, recibe en aquellos países el nombre de Information science o de Library and information science . En el mundo anglófono, en cambio y por citar otro país latino, algunos autores (Van Slype), seguramente como fruto de la desesperación, han propuesto como término Documentologie .

Autor: Lluís Codina

Para la elaboración de este informe especial, se han utilizado las siguientes fuentes de información: prensa informática (Datamation, Binary, Byte y PC Magazine, principalmente); revistas sobre Documentación (Electronic Library, Journal of American Society for Information Science, Information Management & Processing, Item y Revista Española de Documentación Científica), revistas sobre actualidad del sector (Information World Review, Information World en Español), la base de datos LISA en CD-ROM, así como documentación técnica cedida por empresas como Chemdata, Micronet, Olivetti, Investronica, Cognivision Research, Centrisa, Compact Software International (CSI), Bull España, Doc-6 y Eurotelematica

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1993/mayo/qu_es_un_sistema_de_gestin_documental.html

 

Publicado el: 01/02/2013 / Leido: 21225 veces / Comentarios: 0 / Archivos Adjuntos: 0

Compartir:
Dejar comentario

Comentarios