Cultura

A Biblioteca Pública de Boston visa aumentar o acesso a um vasto arquivo histórico usando AI: NPR

As pilhas da Biblioteca Pública de Boston, uma das maiores e mais antigas sistemas de bibliotecas públicas do país

As pilhas da Biblioteca Pública de Boston, um dos maiores e mais antigos sistemas de bibliotecas públicas do país.

Aram Boghosian para Biblioteca Pública de Boston

ocultar a legenda

Alternar a legenda

Aram Boghosian para Biblioteca Pública de Boston

Biblioteca Pública de BostonUm dos mais antigos e maiores sistemas de bibliotecas públicas do país está lançando um projeto neste verão com a Openai e Harvard Law School para tornar seus documentos do governo historicamente significativos mais acessíveis ao público.

Os documentos datam do início do século XIX e incluem histórias orais, relatórios do Congresso e pesquisas de diferentes indústrias e comunidades.

“É realmente um repositório incrível de materiais de origem primária, cobrindo toda a história dos Estados Unidos, pois foi expressa através de publicações do governo”, disse Jessica ChapelO chefe de serviços digitais e on -line da Biblioteca Pública de Boston.

Atualmente, os membros do público que desejam acessar esses documentos devem aparecer pessoalmente. O projeto aprimorará os metadados de cada documento e permitirá que os usuários pesquisem e referam textos inteiros de referência cruzada de qualquer lugar do mundo.

A Chapel disse que a Boston Public Library planeja digitalizar 5.000 documentos até o final do ano e, se tudo correr bem, expandir o projeto a partir daí.

Fazendo uma pechincha com ai

Devido ao enorme tamanho e fragilidade desta coleção histórica, chegar a esse objetivo é um processo assustador. Cada item deve ser executado através de um scanner manualmente. Demora cerca de uma hora para fazer 300-400 páginas.

Um livro passando pelo processo de digitalização em um scanner na Biblioteca Pública de Boston.

Um livro passando pelo processo de digitalização em um scanner na Biblioteca Pública de Boston.

Biblioteca Pública de Boston


ocultar a legenda

Alternar a legenda

Biblioteca Pública de Boston

A Universidade de Harvard disse que poderia ajudar. Pesquisadores da biblioteca da Harvard Law School Iniciativa de dados institucionais estão trabalhando com bibliotecas, museus e arquivos em várias frentes, incluindo o treinamento de novos modelos de IA para ajudar as bibliotecas a melhorar a pesquisa de suas coleções.

As empresas de IA ajudam a financiar esses esforços e, em troca, treine seus grandes modelos de idiomas em materiais de alta qualidade que estão fora de direitos autorais e, portanto, menos propensos a levar a ações judiciais. (A Microsoft e o OpenAI estão entre os muitos jogadores de IA direcionados por processos de violação de direitos autorais recentes, nos quais demandantes como autores afirmam que as empresas roubaram seus trabalhos sem permissão.)

“Ter instituições de informação como bibliotecas envolvidas na construção de um ecossistema de dados sustentável para IA é fundamental, pois não apenas melhora a quantidade de dados que temos disponível, mas também melhora a qualidade dos dados e nossa compreensão do que está nele”, disse Burton Davis, vice -presidente do Grupo de Propriedade Intelectual da Microsoft.

Acesso para todos

Greg Leppert, diretor executivo da Iniciativa Institucional da Iniciativa de Dados Institucionais da Harvard Law School, disse que não é o objetivo da iniciativa conceder às empresas de IA acesso privilegiado aos ricos tesouros de informações fora de coproadia realizadas em bibliotecas e arquivos. Qualquer um pode ter acesso aos dados após o fato de terem sido digitalizados.

“É uma rua de mão dupla, onde estamos melhorando os dados de uma maneira que ajudará a IA, mas essas melhorias voltam à biblioteca”, disse Leppert. “Então isso melhora a experiência do patrono também”.

O OpenAI está ajudando a Boston Public Library a cobrir custos como digitalização e gerenciamento de projetos. A empresa de tecnologia não possui direitos exclusivos aos dados digitalizados.

“Nós nos beneficiamos, como outros, de seus esforços para digitalizar o domínio público, expandindo os dados de alta qualidade e o conhecimento público de que os sistemas de IA, incluindo o nosso, podem desenvolver”, disse a empresa em comunicado à NPR.

Desafios de parcerias públicas-privadas

Os profissionais da biblioteca dizem que trabalhar com empresas de IA fornecerá acesso mais amplo às informações.

“Acho que essa é uma parceria realmente que vale a pena, da qual obteremos coleções mais acessíveis”, disse a capela da Biblioteca Pública de Boston.

E, como os bibliotecários estão envolvidos na curadoria e na categorização dessas informações, a integridade dos materiais usados pelas empresas de IA pode ser mais facilmente protegida.

“Ter profissionais treinados com conhecimento profundo dos sujeitos é crucial neste momento, quando começamos a desenvolver o que o futuro trará”, disse o presidente da American Library Association, Sam Helmick.

Mas os especialistas em bibliotecas também expressaram cautela sobre essas parcerias por causa das diferenças culturais entre instituições públicas e corporações.

“O tipo de ethos de ‘mover rápido e quebrar coisas’ do Vale do Silício é contra os valores da biblioteconomia, que são sobre acesso e transparência”, disse Michael Hanegan, co-autor do novo livro AI e bibliotecas generativas.

“Tudo isso está se movendo tão rápido: a tecnologia está se movendo rapidamente. As empresas estão se movendo rapidamente”, disse Chapel. “E as bibliotecas funcionam em uma escala de tempo muito diferente. Então, há um pouco de um confronto cultural”.

Jennifer Vanasco editou esta história para transmissão e digital.

Source link

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo