Mostrar mensagens com a etiqueta Digitalização. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta Digitalização. Mostrar todas as mensagens

24 setembro 2008

Manuscritos medievais digitalizados

A Universidade de Manchester John Rylands Library vai digitalizar a maior parte da sua colecção de manuscritos medievais, que inclui partes de Chaucer's Canterbury Tales. O resultado poderá ser avaliado no fim de 2009.

John Rylands Library
A fragment of the Canterbury Tales
Para mais informações ver aqui.

04 setembro 2008

Manuscritos do Mar Morto disponíveis na Internet

Cientistas israelitas estão a digitalizar documentos dos Manuscritos do Mar Morto, com cerca de dois mil anos, com o propósito de os disponibilizarem na Internet. A Autoridade Israelita de Antiguidades, que tem sob custódia os textos que lançam luz sobre a vida dos judeus e dos primeiros cristãos, disse que serão necessários mais de dois anos para completar o projecto.
Os documentos — considerados alguns dos mais estudados e, ainda assim, controversos da História — foram encontrados em cavernas próximas ao Mar Morto, em 1947, por pastores beduínos e durante muitos anos só um reduzido número de estudiosos pôde vê-los. O acesso, entretanto, foi ampliado depois e os textos foram publicados na íntegra há sete anos. A chegada dos textos à Internet poderá aumentar a controvérsia, pois permitirá novas interpretações para pontos que hoje já são debatidos.
Usando câmaras de precisão e focos que não emitem calor, os cientistas israelitas puderam decifrar capítulos e caracteres invisíveis ao olho humano.Os manuscritos são as cópias mais antigas da Bíblia em hebraico e incluem textos apócrifos que remontam do século III a.C. até o primeiro século da era cristã. Os especialistas fotografaram cerca de nove mil fragmentos. No total há 900 rolos, com 15 mil fragmentos. Como estão partidos, os textos permitem mais de uma interpretação.
Parte dos manuscritos está em exposição permanente no Museu de Israel. A colecção completa só havia sido fotografada uma vez, nos anos 50, com a ajuda de infravermelho. As imagens reveladas estão acomodadas em salas com temperatura controlada porque mostram detalhes que foram perdidos dos originais. Essas antigas fotos também serão digitalizadas dentro do novo projecto. Os cientistas esperam que a tecnologia ajude também a preservar os manuscritos ao detectar qualquer dano causado por humidade e calor.


Fonte: O Globo, Rio de Janeiro.

01 setembro 2008

Jornal "The Times" lança Arquivo Digital

"O site do jornal inglês "The Times" digitalizou 200 anos de seu acervo - de 1785, quando começou a circular, até 1985. O melhor de tudo é que todo o material está online, com exceção do período entre 1º de dezembro de 1978 e 12 de novembro de 1979, quando o jornal não foi publicado. É uma tremenda viagem no tempo, absolutamente viciante.
O acervo digital (anote logo: http://archive.timesonline.co.uk/tol/archive/) já contém cerca de 20 milhões de artigos, num total de 7,8 milhões de documentos únicos e mais de 35 milhões de imagens. Algumas das edições cujos originais em papel estavam danificados, mas que já estão em processo de restauração, ainda serão digitalizadas e incorporadas ao conteúdo online.

Tecnologia usada permite que conteúdo seja copiado
O plano é expandir o projeto, digitalizando também as edições de 1985 a 2005 do "Times" e as edições de 1822 a 2000 do "The Sunday Times", outro periódico da mesma empresa, a News International - que faz parte da gigante de mídia News Corp.

Nesta fase inicial, a oferta online está sendo gratuita, mas é preciso registrar-se. Embora o processo de registro no "Times" seja um tanto chato (é preciso fornecer dados como endereço, telefone etc, esperar a confirmação no email e completar mais um questionário), vale a pena adentrar o arquivo.
As páginas são vistas em sua tipografia original, há possibilidade de zoom, e o leitor pode salvar os artigos que forem de seu interesse.

Para que tudo desse certo, cada página do "Times" foi escaneada, passando depois por um processo de reconhecimento ótico de caracteres, vulgo OCR (Optical Character Recognition), que interpreta cada letra na versão impressa convertendo-a para um caractere codificado, transformando a imagem original de uma página impressa em um arquivo-texto convencional.
As páginas, escaneadas na íntegra, foram divididas em artigos, fotos, anúncios, cartas para o editor, além de registros de nascimentos, casamentos e óbitos. A parte textual dos artigos é indexada, permitindo que o arquivo inteiro seja encontrado por data e por palavra-chave. O texto pode ser aproveitado pelo usuário selecionando-o com o mouse e usando o velho copiar/colar (Ctrl C/Ctrl V).

A finalização do projeto promete ser uma tarefa bastante difícil em termos de volume de dados, pois as edições digitalizadas dos períodos mais recentes do "Times" vão consumir muito mais espaço em disco do que as mais antigas. Só os últimos 20 anos representam um conteúdo maior do que o dos 200 anos entre 1785 e 1985.

Segundo Anne Spackman, editora-chefe do Times Online (...) [esta] reconhece que haveria soluções mais baratas, mas afirma que a empresa queria o melhor resultado possível. O sistema utiliza um sofware para visualização de imagens, desenvolvido especialmente para a aplicação.
No processo de digitalização, os pontos críticos foram a qualidade e a consistência dos dados. Foram também criados scripts automatizados para verificação das imagens, utilizando a fina flor dos algoritmos de checagem. Apesar de inteiramente automatizados, esses scripts levaram quase um mês para checar todas as imagens.

Escanear documentos antigos exigiu muito cuidado
Alguns dos documentos originais são muito velhos, frágeis e valiosos. Foram necessários muito cuidado e experiência para escaneá-los e etiquetá-los, num processo que durou quase seis meses, com recursos técnicos baseados em Londres, Índia e Israel, para coordenar a digitalização e o reforço de qualidade final do processo de OCR.

No que tange ao armazenamento das imagens, os requisitos de espaço eram tão imensos que os ambientes de testes e implementação se tornaram altamente complexos. Mas o desafio foi vencido pela divisão de TI da News International. O site alocou servidores de imagens inteiramente dedicados à publicação online das fotos e bitmaps do arquivo. Além disso, foram usados os mais modernos algoritmos de compressão de imagens. Coisa finíssima.
Boa parte do arquivo online se baseia em registro e restrições de acesso, de modo a garantir os direitos de propriedade intelectual. Foi desenvolvida internamente toda a tecnologia de personalização que permitiu acesso controlado ao acervo. Afinal, cada documento da base de dados exige autenticação individual para determinar se um usuário pode ou não ter acesso a determinado conteúdo.

Para professor internet é ferramenta fundamental de pesquisa
Para Marcello Rangel, professor de História e coordenador setorial do Instituto Gay-Lussac, a iniciativa do britânico "Times" é fantástica. Ela mostra como a internet se tornou uma ferramenta de pesquisa fundamental para cientistas e historiadores.
" A historiografia avançou muito, e a academia já aceita tais fontes digitais "
- Já não é mais necessária a atitude positivista de ter que segurar nas mãos o original do documento histórico - diz Marcello. - A historiografia (a maneira como se compreende e escreve a História) avançou muito, e a academia já aceita tais fontes digitais. Naturalmente, pesquisar em jornais é uma parte do trabalho. O ofício do historiador é verificar a alteridade dos fatos (por exemplo, como o português vê o índio e como o índio vê o português), estudar diversos tipos de documentos e assim fazer a reconstituição da História.
Marcello cita outros arquivos presentes na internet, que a gente aqui consultou e ficou absolutamente surpreso. São ótimas fontes, como o Rare Maps ( raremaps.com ), o sistema de bibliotecas da Unicamp ( http://www.uni%20camp.br/bc/ ), a Biblioteca Virtual do Estudante Brasileiro ( bibvirt.futuro.usp.br/textos ), o Projeto Gutenberg ( gutenberg.org ) e o Archive Org, de páginas web ( .archive.org , que guardaria inclusive versões antigas de sites - 85 bilhões deles).

Entre os jornais, o "New York Times" tem uma seção livre de busca entre 1851 e 1890 e entre 1981 e 1987 (depois, é paga), em tinyurl.com/avxq6 . O "Los Angeles Times" parte de 1881 (em tinyurl.com/alvaa ). Já o francês "Le Figaro" tem as edições de 1826 a 1942 listadas em tinyurl.com/6kek82 e se dá ao luxo de ter um arquivo separado para o seu suplemento literário, em http://tinyurl.com/6sxetp , entre 1876 e 1929.

Embora a iniciativa do "The Times" seja a mais abrangente de um jornalão de renome internacional, arquivos ainda mais antigos estão disponíveis online. É o caso do jornal local "Hartford Courant", do estado americano de Connecticut, que regride até o longínquo ano de 1764 ( tinyurl.com/pmknk ). Não tem nada de muito interessante para o pesquisador brasileiro, mas não deixa de ser um prato cheio para os curiosos de plantão (categoria de que fazemos parte).

No caso do grandioso trabalho de digitalização e oferta online do acervo do "Times", uma das mais difíceis decisões estratégicas do projeto foi quanto ao modelo de negócio, mais especificamente na escolha de como o serviço seria cobrado - ou, mesmo, se não seria - já desde o início da operação. Uma opção seria um serviço grátis para o usuário e patrocinado por anúncios, a outra seria funcionar por assinatura paga.
Essa questão foi fundamental na arquitetura do projeto e na implementação da solução, já que o modelo de preço afeta a popularidade do site. E isso tem decisivo impacto nas exigências tecnológicas e arquiteturais do sistema.
Esse debate também levou em conta o valor dos mecanismos de busca, os métodos de proteção da propriedade intelectual, o potencial de captar e remunerar anunciantes e patrocinadores, a possibilidade de capturar mais ou menos dados dos internautas visitantes e, por fim, o próprio preço da assinatura, caso fosse essa a opção escolhida. (...)"

Fonte: O Globo Online 11/08/2008
A título de curiosidade, fiz uma pesquisa utilizando ´Portugal´e o período de tempo mínimo e máximo permitido para a mesma (1785-1985). Os resultados? Fascinantes para quem gosta de história, da nossa história! Experimentem....

07 fevereiro 2008

Processos da Inquisição de Lisboa vão ser digitalizados

Digitalização de Cinco milhões de imagens do arquivo da Inquisição

Cinco milhões de imagens do arquivo da Inquisição de Lisboa vão estar disponíveis on-line. O processo de recuperação e digitalização integral dos 17.980 processos, referentes ao período entre 1536 e 1821, ainda vai demorar cerca de três anos a estar completo, mas constitui, sem dúvida, uma boa notícia para os investigadores.
O anúncio foi feito pelo director do Arquivo Nacional da Torre do Tombo, Silvestre Lacerda que considera que a disponibilização destes processos é uma prioridade, já que são os mais consultados e os mais procurados por investigadores nacionais e estrangeiros.
O custo do projecto foi avaliado em um milhão de euros, mais de metade financiados pela REN (Redes Energética Nacionais), o mecenas desta iniciativa.
A Inquisição, como tribunal eclesiástico, perseguiu e condenou aqueles cujas acções e convicções diferiam das leis da Igreja Católica. De acordo com o historiador António Borges Coelho, a Inquisição de Lisboa é especialmente relevante no contexto português, já que "as comunidades estrangeiras estavam sediadas em Lisboa, a liberdade de pensamento emergia mais facilmente, os livros clandestinos chegavam mais facilmente a Lisboa".
Era mais fácil encontrar na capital as principais vítimas da Inquisição: os judeus, as bruxas, os mancebos, os homossexuais, explica o historiador. "Os processos da Inquisição de Lisboa são especialmente ricos por isso."
O escritor e dramaturgo António José da Silva foi uma das vítimas do Santo Ofício. Preso e torturado pelos membros da Inquisição por ser judeu, acabou por ser queimado num auto-de-fé. Este é apenas um dos muitos processos que vão estar acessíveis a partir de qualquer computador.Para António Borges Coelho, a digitalização destes processos "é uma notícia magnífica", mas não é suficiente para reavivar na memória que "milhares de pessoas passaram pela humilhação dos autos-de-fé". E lança a questão: "Para quando uma oliveira nas praças portuguesas, em Lisboa, Évora, Coimbra, onde mais de 2000 pessoas foram queimadas por expressarem opiniões diferentes?".
Fonte: Jornal O Público
Mais uma iniciativa a seguir com atenção!!!

02 agosto 2007

Digital archivists look to porn

BERKELEY, Calif.--How can society preserve digital art on the Internet the way brick-and-mortar museums can for Picassos and van Goghs?

Oddly enough, at least one preservationist believes the answer might be found in an expression that most curators don't consider art--online pornography.

"I guarantee that a wealth of pornography from the late 20th century will survive in digital distributed form (because) it's a social model that's working extremely well," said Kurt Bollacker, digital research manager at the Long Now Foundation, a nonprofit fostering several digital-works preservation projects. Bollacker spoke Thursday at a symposium called "New Media and Social Memory" at the University of California at Berkeley Art Museum and Pacific Film Archive.

He held up the adult industry--always the digital pioneer--as one example of a self-selected community on the Web that swaps images and videos so regularly and widely that that activity will ultimately help preserve an archive over years. Similarly, he pointed to successful niche archives like the Multi-Arcade Machine Emulator, or MAME, a collective of programmers who preserved video games from the 1980s with CPU and hardware emulators.

"Anyone interested in preserving digital art should evaluate ongoing distributed data efforts," said Bollacker, who has a background in artificial intelligence and previously worked with the Internet Archive, a Web preservation project.

Bollacker was among several technologists, academics and curators considering the question of digital art and how to preserve it in a fast-moving world of technological change.

Challenges to preservationTraditionally, preserving any art--books, music or paintings--has been highly controlled by skilled professionals, who often deal with tangible, long-lasting and, in the case of museum quality art, highly expensive materials. But in the digital world, that model is turned on its ear--just ask the record labels if controlling distribution of digital music is easy. On the Internet, moving data is cheap and easy, the media is ephemeral, and preservationists are amateurs.

And as Bollacker said, "Millions of people can make digital art, and maybe most of it is crap, so we don't know which to save."

The challenges to cataloging and preserving any work online are common to all fields of art. Those include the limits of human resources to track the body of work online--and those are only getting more finite. Another is the obsolescence of file formats: how can future generations access digital media if the formats and software they're recorded in are eventually replaced?

The digital realm does have its benefits, however. Costs of storage have dropped so low that Hitachi recently unveiled the first terabyte hard drive, opening up the possibility of storing all of the text of the Library of Congress on one server, for example. Low-cost bandwidth also makes it easy for people to move media relatively easily. And the Internet is not short on creativity or motivation from the millions of people it attracts.

Still, preservationists are asking themselves how best to record history (...)."
CNET News.com
E pronto quando é para arquivar, é para arquivar MESMO TUDO!
E AGORA DIGAM LÁ QUE SER ARQUIVISTA É MAU?! EHEHEHEHE