Para instituciones patrimoniales

Inteligencia artificial para bibliotecas, archivos y patrimonio

Ocho herramientas de IA que cubren los 8 objetivos estratégicos publicados por BNElab, integrables bajo un mismo ecosistema. Construido en Europa, con datos en suelo europeo, por Videoconversion Digital Lab — más de 20 años en digitalización documental.

Los 8 objetivos de BNElab sobre IA, cubiertos hoy

BNElab publica ocho áreas estratégicas de trabajo con IA. Para cada una tenemos una herramienta operativa, con referentes mundiales comparables.

Interrogación con lenguaje natural

RAG multilingüe sobre corpus documentales con detección de intención, sub-consultas paralelas y citas obligatorias con página. 9 idiomas nativos.

Referente mundial:Primo Research Assistant · Overdrive Inspire Me

OCR y transcripción de manuscritos

OCR clásico + HTR neural con Gemini Vision. Detección automática de tipología documental, serie archivística y localización geográfica.

Referente mundial:British Library · Transkribus

Identificación y extracción en imágenes

Detección de sellos, mapas, tablas, grabados y miniaturas. Embeddings visuales con índice HNSW para búsqueda por similitud. Upscale y restauración con GPU dedicada.

Referente mundial:British Library MapReader · KB Bildsök

Extracción de entidades en texto

NER con confidence score: personas, lugares, organizaciones, fechas, eventos. Preparado para integrar modelos especializados en español histórico.

Nuestra solución:Scriptorium IAVerbaDoc Pro
Referente mundial:Finlandia Annif · DNB NLP indexación

Reconocimiento de partituras

Prototipo H-OMR funcional — uno de los objetivos BNElab que muy pocas instituciones en el mundo cubren a nivel operativo.

Referente mundial:Pocas bibliotecas en el mundo lo cubren

Chatbots asistenciales

Conversación en lenguaje natural sobre el corpus documental con memoria de contexto, citas obligatorias a la fuente y disponibilidad 24/7.

Nuestra solución:VerbaDoc ProAnnalysis Media
Referente mundial:Primo Research Assistant

Catalogación automatizada

Generación automática de metadatos: Dublin Core 15 elementos, MODS, METS 2.x, PREMIS v3, MIX. Sugerencia de serie documental y tipología con humans-in-the-loop.

Referente mundial:Ex Libris Alma Specto · Library of Congress ECD (95 % F1)

Clasificación automatizada

Clasificación por tipología diplomática, serie, idioma, período y geografía. Revisión humana de alta confianza en cada etiqueta.

Nuestra solución:Scriptorium IAVerbaDoc Pro
Referente mundial:Proyecto Languid (British Library — 3 M registros)

Lo que nos hace diferentes

Ventajas que ningún proveedor internacional reúne bajo un solo techo.

20+ años de trayectoria

Videoconversion Digital Lab (Barcelona) lleva más de dos décadas digitalizando patrimonio documental. No llegamos a la IA desde una startup — la aplicamos al oficio que ya dominamos.

100 % datos en suelo europeo

Neon PostgreSQL y Vercel alojados en la UE. Cumplimiento RGPD y ENS nativo. Sin transferencias transatlánticas, sin sorpresas legales.

Integración con MarIA (BNE)

Diseñado para incorporar MarIA — el modelo de lenguaje español de la BNE entrenado con 135 000 millones de palabras en MareNostrum — como motor opcional de NER y análisis lingüístico.

7 tipologías de material

Texto, manuscrito, imagen, plano, mapa, audio, vídeo y partitura — todos procesables en un solo ecosistema coherente. Otros proveedores cubren una o dos.

Validación multi-LLM

Arquitectura con Gemini + GPT-4o + Claude votando resultados críticos. Reduce alucinaciones por debajo del umbral del 95 % F1 fijado por la Library of Congress.

Reconocimiento de partituras

Prototipo H-OMR en producción temprana — uno de los objetivos BNElab que muy pocas instituciones en el mundo han abordado a nivel de producto.

Flexibilidad por tamaño de institución

Mismo ecosistema, tres tallas de despliegue. Desde una biblioteca municipal hasta una nacional.

Municipal · Universitaria

Hasta 100 000 documentos

  • SaaS en la plataforma mediasolam
  • Despliegue inmediato, sin infraestructura propia
  • Pago mensual sin compromiso
  • Bibliotecas municipales, archivos diocesanos, fundaciones

Autonómica · Provincial

Hasta 2 millones de documentos

  • Despliegue dedicado en EU con base de datos exclusiva
  • SLA y soporte con ANS
  • Integración con el catálogo existente (Koha, Alma)
  • Bibliotecas regionales, archivos provinciales
BNElab

Nacional · Edición BNElab

Sin límite operativo

  • Arquitectura híbrida cloud + on-premises
  • Integración con MarIA y con el repositorio OAIS institucional
  • Política de IA co-redactada con la institución
  • Soporte L3 dedicado y roadmap conjunto

Los 3 principios transversales que BNElab exige

Uso ético, sostenible y transparente de la IA — no como promesa, sino como arquitectura.

Ético

Humans-in-the-loop obligatorio en toda decisión automatizada. Confidence score visible. Derecho a explicación y corrección humana en todo momento. Política formal de IA responsable, inspirada en el proyecto FRAIM de la British Library.

Sostenible

Medición de consumo energético por llamada a modelo. Caché agresivo de embeddings. Uso de modelos más pequeños cuando bastan. Dashboard trimestral de huella. Compatible con MarIA on-premises para reducir transporte de datos.

Transparente

Audit trail completo: qué modelo procesó qué documento, cuándo y con qué prompt. Prompts versionados. Reproducibilidad documentada. Metadatos generados en estándares abiertos (Dublin Core, MODS, METS, MARC21).

Alineados con los referentes mundiales

Las principales bibliotecas nacionales y redes europeas de IA aplicada al patrimonio documental son nuestras coordenadas de referencia.

CENL AI in Libraries

Grupo AI in Libraries de la Conference of European National Librarians. BNE participa activamente.

AI4LAM · Fantastic Futures

Comunidad internacional de IA aplicada a bibliotecas, archivos y museos. Organiza las conferencias Fantastic Futures.

ALT-EDIC

Alianza europea coordinada por Francia, con 17 estados miembros incluida España, para tecnologías del lenguaje.

Library of Congress ECD

Exploring Computational Description — aplicación de transformers a más de 23 000 ebooks con umbral de calidad del 95 % F1.

British Library MapReader

Modelo de visión por computador para mapas históricos, desarrollado con el Alan Turing Institute.

KB Suecia · KB-BERT

KB-BERT, modelo de lenguaje sueco de la Biblioteca Nacional, entrenado en Nvidia DGX on-premises sobre 500 años de texto sueco.

Finlandia · Annif

Microservicio de indización temática automatizada en producción en la Biblioteca Nacional de Finlandia.

BNE MarIA

Primer sistema masivo de IA experto en lengua española — 135 000 millones de palabras, entrenado en MareNostrum.

Hablemos de su institución

Todas las apps están operativas y pueden probarse con sus propios fondos digitalizados. Organice una demo institucional con nuestro equipo.