Inteligencia artificial para bibliotecas, archivos y patrimonio
Ocho herramientas de IA que cubren los 8 objetivos estratégicos publicados por BNElab, integrables bajo un mismo ecosistema. Construido en Europa, con datos en suelo europeo, por Videoconversion Digital Lab — más de 20 años en digitalización documental.
Los 8 objetivos de BNElab sobre IA, cubiertos hoy
BNElab publica ocho áreas estratégicas de trabajo con IA. Para cada una tenemos una herramienta operativa, con referentes mundiales comparables.
Interrogación con lenguaje natural
RAG multilingüe sobre corpus documentales con detección de intención, sub-consultas paralelas y citas obligatorias con página. 9 idiomas nativos.
OCR y transcripción de manuscritos
OCR clásico + HTR neural con Gemini Vision. Detección automática de tipología documental, serie archivística y localización geográfica.
Identificación y extracción en imágenes
Detección de sellos, mapas, tablas, grabados y miniaturas. Embeddings visuales con índice HNSW para búsqueda por similitud. Upscale y restauración con GPU dedicada.
Extracción de entidades en texto
NER con confidence score: personas, lugares, organizaciones, fechas, eventos. Preparado para integrar modelos especializados en español histórico.
Reconocimiento de partituras
Prototipo H-OMR funcional — uno de los objetivos BNElab que muy pocas instituciones en el mundo cubren a nivel operativo.
Chatbots asistenciales
Conversación en lenguaje natural sobre el corpus documental con memoria de contexto, citas obligatorias a la fuente y disponibilidad 24/7.
Catalogación automatizada
Generación automática de metadatos: Dublin Core 15 elementos, MODS, METS 2.x, PREMIS v3, MIX. Sugerencia de serie documental y tipología con humans-in-the-loop.
Clasificación automatizada
Clasificación por tipología diplomática, serie, idioma, período y geografía. Revisión humana de alta confianza en cada etiqueta.
Lo que nos hace diferentes
Ventajas que ningún proveedor internacional reúne bajo un solo techo.
20+ años de trayectoria
Videoconversion Digital Lab (Barcelona) lleva más de dos décadas digitalizando patrimonio documental. No llegamos a la IA desde una startup — la aplicamos al oficio que ya dominamos.
100 % datos en suelo europeo
Neon PostgreSQL y Vercel alojados en la UE. Cumplimiento RGPD y ENS nativo. Sin transferencias transatlánticas, sin sorpresas legales.
Integración con MarIA (BNE)
Diseñado para incorporar MarIA — el modelo de lenguaje español de la BNE entrenado con 135 000 millones de palabras en MareNostrum — como motor opcional de NER y análisis lingüístico.
7 tipologías de material
Texto, manuscrito, imagen, plano, mapa, audio, vídeo y partitura — todos procesables en un solo ecosistema coherente. Otros proveedores cubren una o dos.
Validación multi-LLM
Arquitectura con Gemini + GPT-4o + Claude votando resultados críticos. Reduce alucinaciones por debajo del umbral del 95 % F1 fijado por la Library of Congress.
Reconocimiento de partituras
Prototipo H-OMR en producción temprana — uno de los objetivos BNElab que muy pocas instituciones en el mundo han abordado a nivel de producto.
Flexibilidad por tamaño de institución
Mismo ecosistema, tres tallas de despliegue. Desde una biblioteca municipal hasta una nacional.
Municipal · Universitaria
Hasta 100 000 documentos
- SaaS en la plataforma mediasolam
- Despliegue inmediato, sin infraestructura propia
- Pago mensual sin compromiso
- Bibliotecas municipales, archivos diocesanos, fundaciones
Autonómica · Provincial
Hasta 2 millones de documentos
- Despliegue dedicado en EU con base de datos exclusiva
- SLA y soporte con ANS
- Integración con el catálogo existente (Koha, Alma)
- Bibliotecas regionales, archivos provinciales
Nacional · Edición BNElab
Sin límite operativo
- Arquitectura híbrida cloud + on-premises
- Integración con MarIA y con el repositorio OAIS institucional
- Política de IA co-redactada con la institución
- Soporte L3 dedicado y roadmap conjunto
Los 3 principios transversales que BNElab exige
Uso ético, sostenible y transparente de la IA — no como promesa, sino como arquitectura.
Ético
Humans-in-the-loop obligatorio en toda decisión automatizada. Confidence score visible. Derecho a explicación y corrección humana en todo momento. Política formal de IA responsable, inspirada en el proyecto FRAIM de la British Library.
Sostenible
Medición de consumo energético por llamada a modelo. Caché agresivo de embeddings. Uso de modelos más pequeños cuando bastan. Dashboard trimestral de huella. Compatible con MarIA on-premises para reducir transporte de datos.
Transparente
Audit trail completo: qué modelo procesó qué documento, cuándo y con qué prompt. Prompts versionados. Reproducibilidad documentada. Metadatos generados en estándares abiertos (Dublin Core, MODS, METS, MARC21).
Alineados con los referentes mundiales
Las principales bibliotecas nacionales y redes europeas de IA aplicada al patrimonio documental son nuestras coordenadas de referencia.
Grupo AI in Libraries de la Conference of European National Librarians. BNE participa activamente.
Comunidad internacional de IA aplicada a bibliotecas, archivos y museos. Organiza las conferencias Fantastic Futures.
ALT-EDIC
Alianza europea coordinada por Francia, con 17 estados miembros incluida España, para tecnologías del lenguaje.
Exploring Computational Description — aplicación de transformers a más de 23 000 ebooks con umbral de calidad del 95 % F1.
Modelo de visión por computador para mapas históricos, desarrollado con el Alan Turing Institute.
KB-BERT, modelo de lenguaje sueco de la Biblioteca Nacional, entrenado en Nvidia DGX on-premises sobre 500 años de texto sueco.
Microservicio de indización temática automatizada en producción en la Biblioteca Nacional de Finlandia.
El ecosistema en vivo
Ocho aplicaciones en producción. Puedes probarlas.
Hablemos de su institución
Todas las apps están operativas y pueden probarse con sus propios fondos digitalizados. Organice una demo institucional con nuestro equipo.