Para compreender o conceito de bases de dados documentais iniciaremos por um conceito global, posteriormente
direcionando para as tipologias que formam as bases de dados documentais.
Bases de dados são um conjunto de informações
estruturadas em registros e armazenada em suportes eletrônicos legíveis por
computador. Cada registro constitui uma unidade autônoma de informação que pode
ser estruturada em diferentes campos ou tipos de dados que são coletados nas
bases de dados. É criada e mantida de forma contínua, com o objetivo de
resolver necessidades de informação de uma biblioteca, uma organização ou
demanda social específica.
Modelos de
bases de dados
Existem diversos modelos de bases de dados
(relacionais, orientados a objetos, em rede, documentais, hierárquicas, etc). Os
modelos mais utilizados atualmente e os que mais nos interessam desde o ponto
de vista da gestão da informação sejam:
Bases de Dados Relacionais:
os dados são armazenados seguindo um modelo que contem os seguintes
elementos:
Entidades: unidade
de dados em relação com um conjunto de atributos;
Relação:
coleção de objetos que tem em comum um conjunto de características;
Características:
atributo que define uma entidade e que tem um domínio no qual toma seus
valores;
Domínio:
conjunto de valores que pode tomar um atributo em uma relação.
Exemplo:
Na FURG, as entidades
são as disciplinas e os alunos.
A disciplina
apresenta as seguintes características:
Código
·Nome disciplina
·Número de créditos
Em aluno
temos as seguintes características
·Nome aluno
·Código das disciplinas (realizadas)
A relação entre aluno e
disciplina apresenta a seguinte característica em comum:
Disciplinas cursadas pelo aluno
(dentro do domínio de disciplinas ofertadas pela FURG)
Bases de Dados Documentais:
contem um conjunto de registros, cada registro se corresponde com um
documento, seja este de qualquer tipo: uma publicação impressa, um documento
audiovisual, gráfico ou sonoro, um documento de arquivo, um documento
eletrônico, etc.
Categorias de
bases de dados documentais
As bases de dados documentais podem incluir ou não o
conteúdo completo dos documentos que descrevem. Portanto, temos duas categorias:
Banco de dados
documentais referenciais: seus registros não contem o texto original,
somente a informação fundamental para descrever e permitir a localização de
documentos impressos, sonoros, iconográficos, audiovisuais ou eletrônico. Nestes
sistemas de informação somente é possível obter referenciais sobre documentos
possíveis de localizar posteriormente em outro serviço (arquivo, biblioteca,
hemeroteca) ou solicitar um serviço de fornecimento de documentos.
Banco de dados documentais
de texto completo: seus registros contem os próprios documentos em formato
eletrônico. Estas bases de dados podem incorporar campos que contem a
informação documental para facilitar dia descrição e recuperação. Nestes
sistemas as operações de busca (que pode incluir a totalidade do texto) e a
consulta do documento final se realizam sem sair do próprio sistema de
informação.
A tecnologia tem transformado de
forma progressiva a maneira com que os arquivos, as bibliotecas, os museus e os
centros de documentação prestam seus serviços, talvez de forma difícil de ser
imaginada a poucos anos atrás. Atualmente os usuários estão acostumados a
prestação de serviços online, como vem
ocorrendo no comércio em geral.
Para viabilizar a infraestrutura
necessária para automatização de bibliotecas, retomaremos alguns conceitos
apresentados em aula:
Os servidores
Um servidor é uma aplicação ou
programa que realiza algumas tarefas em benefício de outras aplicações chamadas
clientes. Alguns serviços habituais
são os serviços de arquivos, que permitem aos usuários armazenar e autenticar
os serviços de um computador e os serviços de aplicações, que realizam tarefas
em benefício direto do usuário final.
É possível que um computador
cumpra simultaneamente as funções de cliente e servidor. A arquitetura cliente-servidor é uma forma de dividir e especializar
programas e equipes de cálculo a fim de que a tarefa realizada de cada um deles
seja efetuada com a maior eficiência e permita simplificar as atualizações e
manutenção do sistema. Nesta arquitetura a capacidade do processo está dividida
o servidor e os clientes.
Para funcionalidade de um
programa distribuído é possível distinguir 3 camadas ou níveis:
Treinamento de bases de dados
(nível de armazenamento)
Processador de aplicações ou
regras de negócio (nível lógico)
Interface do usuário (nível de
apresentação)
Um servidor web é um programa que
implementa o protocolo http (hypertext transfer protocol). Este protocolo está
projetado para transferir conteúdos web ou páginas HTML (hypertext markup
language): textos complexos com links, formulários, botões e objetos
incorporados como animações ou reprodutor de sons.
O fato dos termos HTTP e HTML
estarem intimamente ligados não deve confundí-los, pois HTML é um formato de
arquivo enquanto HTTP é um protocolo. Cabe destacar que a palavra servidor identifica tanto o programa
como a máquina em que em que o programa é executado. Portanto, existe certa
ambiguidade no uso do termo, ainda que não seja difícil diferenciar sobre qual
nos referimos em cada caso.
Um servidor web se encarrega de armazenar
os pedidos HTTP transportados por um cliente HTTP, geralmente um navegador web.
O navegador realiza um pedido ao servidor e este responde com o conteúdo que o
cliente solicita.
Com o serviço web clássico é
possível desenvolver diversas aplicações
web. Trata-se de fragmentos de código que se executam quando são realizadas
certas petições ou respostas HTTP. Assim, devemos distinguir entre:
Aplicações ao lado do cliente: o cliente web é o encarregado de
executá-las na máquina do usuário. São as aplicações Java ou Javascript: o
serviço proporciona o código das aplicações ao cliente e este, utilizando um
navegador, as executa. É um necessário que o cliente disponha de um navegador
com capacidade para executar aplicações (também chamadas scripts). Normalmente, os navegadores permitem executar aplicações
escritas em linguagem Javascript e Java, embora possam adicionar mais
linguagens mediante o uso de plugins.
Aplicações ao lado do servidor: o
servidor web executa a aplicação que, uma vez executada, gera um código HTML; o
servidor toma este código recém criado e envia para o cliente por meio de
protocolo HTTP. As aplicações diretamente no servidor geralmente é escolhida
como opção na maioria das ocasiões para realizar aplicações web. A razão é que,
ao executá-la em um servidor e não na máquina do cliente, não necessita nenhuma
capacidade adicional, como ocorre no caso de querer executar aplicações
Javascript ou Java. Assim, para qualquer cliente dotado de um navegador web
pode utilizar este tipo de aplicação.
·Alguns tipos de servidores web importantes:
Apache e IIS.
·Alguns conceitos relacionados com as aplicações
web: PHP, ASP, JSP, CGI, .NET, etc.
O texto não trata de ecologia e nem de questões ambientais. A preservação enfocada é a dos registros bibliográficos, por meio do uso de sistemas informatizados, na gestão de biblioteca. Em especial no que envolve o tratamento técnico.
O catálogo bibliográfico é, ainda, um recurso essencial como canal de comunicação e mediação entre o público e o acervo bibliográfico.
Apesar das dificuldades que as bibliotecas brasileiras, de todas as matrizes, enfrentam em seus processos de informatização, os tempos são novos em termos de condições e opções. O crescimento econômico e a diminuição das mazelas sociais (cultura e educação), decorrente da ausência de políticas públicas, ainda que em ritmo lento, aumentaram as condições de investimento em tecnologias no setor público e privado.
Apesar de não eliminar totalmente a sensação na qual "a grama do vizinho é sempre mais verde" do que a nossa, a expressão é aplicável no caso das bibliotecas, especialmente públicas, que padecem em sua maioria, de dificuldades na sua plena informatização. De maneira geral, ao olhar o universo brasileiro em relação ao universo norte-americano e/ou europeu, “a grama do vizinho é sempre mais verde”.
Em termos globais sobre os recursos para automação de bibliotecas, o cenário apresenta opções variadas, diversificadas e inovadoras. Softwares comerciais e, especialmente, softwares livres de código aberto disputam o mercado das bibliotecas.
Aliás, se as tecnologias do século 21 não provocaram grandes desafios para as bibliotecas quanto a sua adoção, ao menos trouxeram oportunidades na gestão dos processos, e na geração de produtos e serviços. Os sistemas operacionais, bancos de dados e aplicativos diversos que podendo ser usados nas configurações de hardwares disponíveis no mercado, tornaram mais barato o processamento de dados. Apesar de não terem sido desenvolvidos especificamente para uso em serviços de informação bibliográficos, as tecnologias computacionais têm sido aproveitadas na criação de sistemas integrados de bibliotecas (integrated library systems - ILS).
Portanto, diante da evolução tecnológica, torna-se necessário ao bibliotecário buscar tecnologias normatizadas com os parâmetros computacionais, da internet, e aos padrões bibliográficos como: MARC, Z39.50, OAI-PMH e outras normas da área. Aspecto essencial para a interoperabilidade entre sistemas, inclusive como a garantia futura de migração dos dados bibliográficos.
Além disto, há a nova modelagem de relacionamento dos registros bibliográficos. Neste sentido, alguns softwares bibliográficos têm incorporado tendências e interfaces que os tornam mais fluídos aos processos de tratamento bibliotecários. Ao menos deveriam.
Dentre esses softwares o que tem conquistado popularidade pelas inovações apresentadas é oEvergreen. O programa nasceu da ação do sistema de bibliotecas públicas do estado da Geórgia, nos Estados Unidos da América - EUA. A Georgia Public Library Service (GPLS) buscava um sistema integrado para substituir o adotado por suas bibliotecas, e não encontrava alternativas satisfatórias no mercado. Por meio do seu consórcio de bibliotecas, Public Information Network for Electronic Services (PINES), que integra centenas de bibliotecas em todo o Estado, concluiu-se pelo desenvolvimento de algo próprio e adaptado às necessidades dos cooperantes, e que resultaria mais econômico que prosseguir pagando licenças de suporte aos fornecedores de programas.
O Evergreen foi desenvolvido por uma equipe do PINES. Projetado com base em tecnologias de código aberto e distribuído sob a licença GNU GPL. Aspecto que tornou o programa disponível gratuitamente para uso em outras bibliotecas. Com interface moderna e soluções atuais para os problemas de automação das funções de bibliotecas; apresenta configuração ajustada para servir aos consórcios de bibliotecas ou aplicado individualmente em organizações informacionais de pequeno e grande porte, independente da complexidade. Esses fatos tornaram o sistema uma alternativa interessante.
Aliás, o desenvolvimento de softwares em geral mudou muito na última década, em grande parte devido ao movimento crescente do código-fonte aberto (open source). Ao invés de construir componentes de programas a partir do zero, pode-se usufruir de uma variedade de componentes altamente refinados para várias funções. Aproveitar o código-fonte existente e livremente disponível significa que os desenvolvedores podem construir sistemas baseados em experiência de outros que forneceram soluções para problemas comuns.
O projeto Evergreen foi iniciado em 2004, e efetivamente lançado em cinco de setembro de 2006. Obteve ampla e rápida aceitação entre bibliotecas (públicas) dos EUA e do Canadá. Aspecto que contribuiu para que a equipe desenvolvedora criasse uma empresa de suporte e prestação de serviço, Equinox Software.
Entre as características de recursos do Evergreen está a verificação ortográfica dos termos de pesquisa como alternativas sugeridas, semelhante ao recurso de sugestões do Google quando se digita incorretamente uma palavra. O sistema possui navegação facetada por assuntos, autores e série para encontrar facilmente materiais relacionados, bem como convenientemente agrupando em várias edições e formatos do mesmo título (segundo o modelo FRBR).
É possível integrar ao conteúdo de registros o enriquecimento com capas, sumários e comentários, diferente de outros catálogos onde tais informações são apresentadas em uma janela distinta para desconforto do usuário.
A interface do catálogo também melhora a capacidade do usuário em gerenciar suas contas. Ele pode ver que materiais estão emprestados, renovar empréstimos e criar sua própria lista de itens consultados ou de leitura, além de compartilha-la com outros usuários.
Sobre as informações técnicas, o Evergreen é programado nas linguagens Perl e C. Apresenta arquitetura cliente-servidor. Na parte de servidor, ele requer equipamento com sistema operacional Linux, software de servidor Apache e banco de dados PostgreSQL. Já na parte do software cliente, utiliza aplicação baseada em XULRunner, que é um aplicativo executável desenvolvido pela Fundação Mozilla com finalidade de permitir a criação de aplicações baseadas no sistema. Esta aplicação cliente necessita ser instalada no computador que executa oEvergreen, oferecendo a possibilidade de montar uma interface mais sofisticada que as do tipo web. A aplicação cliente também permite usar o sistema em modo “off-line”, para o caso de perda de conexão ou adoção de serviços do tipo ônibus-biblioteca.
A versão atual do Evergreen é a 2.3.0. Destaca-se que em maio de 2012 se publicou atualização para as versões 2.2.2 e 2.1.3, de modo que, na atualidade, existem versões estáveis do mesmo produto para baixar e implementar. Quanto à estrutura de operação, o programa é composto dos seguintes módulos: Circulação; Aquisição; Catalogação; Reservas e Empréstimos; Publicações periódicas; Gestão; Informes; OPAC.
Para conhecer o nível de adesão ao software, na página Evergreen Libraries é apresentada, em lista por país, a relação de bibliotecas usuárias. No mesmo endereço também é apresentado um mapa desta distribuição. Para visualizar a interface do catálogo bibliográfico do Evergreen, no endereço http://gapines.org/opac/en-US/skin/default/xml/index.xml é disponibilizado o módulo. Ao realizar consulta observar a apresentação dos dados, além da constituição, à esquerda da tela, de opções de refinamento da busca dentro do conceito FRBR.
Ao levantar informações sobre o software foi destaque a adesão das bibliotecas públicas, em especial na maneira como desenvolvem o projeto de informatização. No geral, os projetos ocorrem por meio de consórcios de bibliotecas. Até pela crise financeira que assola as bibliotecas norte-americanas, o comportamento de atuação cooperativa ajuda no enfrentamento da crise.
Ao olhar para o cenário brasileiro, as bibliotecas públicas seguem isoladas na questão, ainda que em algumas regiões possa haver um sistema estadual de bibliotecas. Porém, não é observável, de forma consistente, a constituição de consórcios de bibliotecas públicas para o planejamento e a adesão aos recursos tecnológicos. Nem ações conjuntas na capacitação para saltos mais dinâmicos na disponibilização de seus acervos e serviços, ou na constituição de ativos digitais. Ativos esses, normalmente submersos nas comunidades locais pela falta de exploração e tratamento.
Como exemplo de uso do Evergreen, há o relato de aplicação feito pela Indiana State Libraryao destacar como o programa contribuiu para a performance das bibliotecas de Indiana, nos EUA, por meio do compartilhamento de recursos. Comenta que a biblioteca pública do Estado é parte do consórcio de bibliotecas “Evergreen Indiana”. O Consórcio agrega um crescente número de bibliotecas públicas e escolares, e institucionais, todas usando o ILS Evergreen.
O catálogo cooperativo do Consórcio detém mais de três milhões de registros bibliográficos, e fornece acesso a mais de 5,5 milhões de itens. Para a biblioteca estadual o fato de o produto ser de código aberto, permitiu ao Estado economizar algumas dezenas de milhares de dólares por ano em taxas de licenciamento com fornecedor comercial. O potencial de poupança para o contribuinte e a conveniência para o usuário da biblioteca é o que motivou o Consórcio em prosseguir com a iniciativa viável para as bibliotecas públicas.
No endereço http://evergreen.lib.in.us/eg/opac/home é possível visualizar o catálogo da biblioteca e realizar consulta que permite observar a interface de apresentação dos resultados, e os conceitos bibliográficos empregados.
Cativado por um tweet eu visitei o lindo novo site da biblioteca de Stanford. Só passei alguns minutos lá, mas fui imediata e fortemente atingido por duas coisas. Cada uma faz tanto sentido que eu imagino que vão se tornar rotina.
A primeira era a evidenciação do espaço da biblioteca como um serviço. A segunda foi o que eu poderia chamar de descoberta completa da biblioteca, a possibilidade de buscar a capacidade total da biblioteca, não apenas as coleções, com uma única pesquisa.
Espaço da biblioteca como um serviço Uma mudança está em curso no ambiente das bibliotecas, de ser configurado em torno de coleções para ser configurado em torno de aprendizagem, pesquisa e comportamentos sociais relacionados. Deste modo, o espaço é um aspecto importante de como uma biblioteca de relaciona com os seus usuários; é um serviço por si só, não apenas uma parte da infra-estrutura para gerir coleções.
Isto é reconhecido observando que dois dos elementos na esperta barra de navegação central são sobre o espaço: horários de funcionamento da biblioteca e locais para estudar.
Se você olhar para horário de funcionamento [Library hours], diz-lhe quais bibliotecas da rede estão abertas agora, no exato momento em que você realiza a consulta. Não é apenas uma lista estática de horários e locais.
Se você olhar para a guia dos lugares para estudar [Places to study] o quadro se abre para que você possa filtrar de acordo com sua exigência – para estudo individual, para o silêncio, para estudo em grupo, para bibliotecas setoriais específicas, e assim por diante.
De “coleção completa” para “descoberta completa da biblioteca”
Houve um grande foco em serviços de busca integrada nos últimos anos, com o modelo de catálogo central baseado em nuvem se tornando o padrão. O objetivo era “descoberta completa da coleção” entregue em uma única caixa de busca [como o google].
Estamos vendo agora uma extensão desta ambição de cobrir a “descoberta total” da biblioteca, onde serviços, perfis dos funcionários e seus conhecimentos, ou outros aspectos da prestação de serviço são detectáveis ao mesmo tempo e no mesmo ambiente da pesquisa sobre as coleções.
Eu escrevi antes sobre o site da Universidade de Michigan, que é um bom exemplo. Ele funciona bem para projetar a biblioteca na web como um serviço unificado. Uma parte central disso é a pesquisa integrada sobre coleções, o website da biblioteca, LibGuides e perfis de funcionários da biblioteca. A apresentação de bibliotecários especialistas em assuntos relevantes que correspondam à consulta no painel de resultados em separado é particularmente interessante. E está alinhado com a minha opinião de que se bibliotecas desejam ser vistas como especializadas, então seus especialistas deve estar visíveis.
O site de Stanford oferece uma guia para “Pesquise tudo”, com este slogan chamativo: “Não sabe por onde começar? Tente isso”. O que eu gosto é que os exemplos de busca mostrados enfatizam o aspecto “biblioteca completa” do que está em oferta aqui: eles estão deliberadamente lançando isto em um nível mais amplo do que os livros e artigos. As pesquisas de exemplo são “renovar livros, dissertações, estudos feministas, WorldCat”: eles tem relação com as perguntas que as pessoas podem fazer quando vêm para a página da biblioteca, não só sobre os itens que poderiam encontrar na coleção.
Agora, na prática alguns resultados funcionam melhor do que outros, mas o princípio geral é bom e você pode ver como ele melhora ao longo do tempo. Em uma descrição do blog de acompanhamento, Chris Bourg repete “estudos feministas” como um exemplo. Observe no lado direito os links para os perfis pessoais dos bibliotecários [Library Website], retornados na pesquisa do site da biblioteca.
Com as bibliotecas movendo nessa direção, várias tendências são aparentes. Uma delas é o uso de Drupal, Blacklight e outros “recipientes” de quadros para oferecer serviços unificados. A segunda é um repensar na forma como os serviços, perfis de funcionários e suas competências, e outras atividades da bibliotecas são representadas e indexadas. O aumento do uso de guias de recursos – Libguides – é um aspecto disso, em particular quando são usados como uma estrutura simples de gerenciamento de conteúdo para diversos tipos de informações sobre a biblioteca, e não apenas para listas de recursos de informação. Outra é o estilo de resultado da “caixa Bento“, não só pelo fato de ser difícil ou confuso para classificar os resultados em diferentes tipos de recursos, mas uma apresentação tabular como esta poder fazer mais sentido para os usuários.
Para mais informações sobre as decisões de design da Universidade de Stanford veja o blog de Chris Bourg.
Aos 73 anos, o escritor, historiador e presidente da biblioteca de Harvard, Robert Darnton, se vê com um novo desafio nas mãos: criar uma gigantesca biblioteca digital no Estados Unidos aberta para todo o mundo.
Na era em que a tecnologia não é mais uma novidade, mas uma facilitação do cotidiano de pessoas de todo o mundo, o livro passa a ter um novo formato; o digital. Nos últimos anos muitos rumores a respeito da extinção do impresso surgem, mas Darnton afirma com precisão que o livro está mais vivo do que nunca. “Os números de publicações estão crescendo”, afirma o pesquisador. “Eu leio livros impressos, prefiro esse tipo. Mas acredito nos livros digitais. O livro não está morto. As pessoas adoram o livro impresso, mas isso não exclui o digital”.
O historiador, que dirige a maior biblioteca universitária do mundo, não recusa o fato de que a tecnologia facilita a vida das pessoas, democratizando também a informação. Mas ele alerta que tudo o que envolve tecnologia conta com empresas que visam lucros: “As grandes empresas poderiam monopolizar por quererem ganhar mais dinheiro”.
O Google, na opinião de Darnton, mostrou a possibilidade dos arquivos digitais para as universidades. E o historiador agora tenta, com ajuda financeiras de fundações privadas, criar a maior biblioteca digital do mundo. “Nós temos a internet e podemos acontecer, e faremos”.
Um dos problemas que Darnton tem enfrentado em sua caminhada ruma ao digital é a monopolização de editoras especializadas. “As editoras controlam o mercado de livros digitais e ganham muito dinheiro com isso”. Elas descobriram o potencial de publicações cientificas e cobram caro por elas. Outra questão que tem sido um problema é o direito autoral. “Maior do que o dinheiro e do que a tecnologia”, segundo Darnton.
Hoje, a biblioteca de Harvard conta com 17 milhões de volumes em 350 línguas. A intenção do presidente é fazer o mesmo com a versão digitalizada, tornando o acesso à informação algo mais acessível a qualquer pessoa. Para esse projeto, Darnton diz que conta com 100 milhões de dólares. “Podemos fazer isso graças às fundações. Elas foram criadas por empresas que ganham muito dinheiro, mas possuem total autonomia”.
Apresentado pelo jornalista Mario Sergio Conti, o Roda Viva contou com os entrevistadores: Beatriz Kushnir (doutora em História pela Unicamp e diretora do arquivo geral da cidade do Rio de Janeiro); Paulo Werneck (editor do caderno Ilustríssima, do jornal Folha de S. Paulo), Lilia Schwarcz (historiadora e antropóloga, professora titular de Antropologia da USP); e Cassiano Elek Machado (jornalista e editor).
Possui uma grade de apresentações, que funciona por meio de um sistema online parecido com o hangout, bastando que a pessoa interessada siga o link, na hora certa, para participar.Library 2.012 é uma conferência virtual mundial, grátis. Vai acontecer essa semana, nos dias 3, 4 e 5.
Como a conferência é global, é necessário seguir a escala de apresentações de acordo com o seu fuso horário local.
A lista de apresentações é imensa, acho que vale a pena vocês olharem e anotar aquelas apresentações que acharem interessantes e reservar um horário no computador pra assistir, interagir.
Esse ano estou escalado como um doskeynote speakers, que são as palestras centrais. A apresentação vai ser em inglês, e eu devo falar sobre algumas coisas que o Brasil têm a oferecer ao mundo e aos colegas bibliotecários de outros países. Vai ter um pouco do estado das bibliotecas públicas, um pouco das coleções digitais e um pouco de redes sociais. Quem quiser acompanhar, vai ser quinta-feira, dia 4/10, 22h (de Brasília). O link para a sessão éesse(talvez seja necessário atualizar o java, algo parecido).