[Música] Vamos a comenzar lo que es la mesa redonda, la gestión de datos de investigación en las bibliotecas universitarias y científicas españolas, me van a acompañar o me acompañan aquí Mireia Alcalá, no las voy a presentar más allá de de dónde trabajan por brevedad. Mireia Alcalá del CSUC del Consorci. A ver que siempre me confundo, de Universitat de Cataluña e Isabel Bernal de digital CSIC y Rosa Gallego de Madroño como veis pues son los tres grandes proyectos que han desarrollado lo que es la gestión de datos a nivel nacional son los que más experiencia tienen Aunque en todas las universidades estamos intentando hacer un poquito nuestras cosas obviamente después de de lo que se ha presentado hoy aunque ya lo teníamos todos claros sabemos que que nos va a venir a partir de ahora mucho lo que es la gestión de los datos y lo tenemos que asumir ya nos preocupaba pero es que ahora es una urgencia absoluta y creo que la experiencia que nos nos pueden proporcionar ellas es es muy interesante empieza Mireya Gracias perfecto muchas gracias Buenos días gracias por estar aquí aguantar hasta la hora que es eh que vamos Así un poco tarde intentaré ser breve eh Yo vengo a ent aros un poco lo que es ha sido la la visión del cesc respecto a la gestión de datos de investigación como podéis ver Nosotros siempre enseñamos que para nosotros la gestión de datos no se ciñe únicamente en depositar los datos que también sino que se incluyen eh otros otros temas el primero es que se deben y se debe a dar soporte a los planes de gestión de datos obviamente se tienen que depositar en repositorios de confianza y que ofrezcan estos servicios servicios de preservación como comentaba el compañero anteriormente todo esto tiene que venir acompañado de que tengan una política eh Y que la institución se eh ponga de su lado y tenga Clara Hacia dónde deben ir eh eh la estrategia en su institución y finalmente todo esto no se puede hacer si no formamos no solo a los investigadores sino al personal de apoyo eh que que dan este tipo de servicios en las instituciones eh haciendo un poco de de de historia eh el cesu empezó en 2014 inició esta línea estratégica de eh apoyo a la investigación donde obviamente se incluía la gestión de datos 2 años después y varios trabajos entre medio todas las universidades en Cataluña y ya decían que ofrecían un servicio de apoyo a la gestión de datos de investigación qué incluía este servicio básicamente asesoramiento y apoyo con qué con para hacer planes de gestión de datos con una herramienta que es leina dmp después os la os La explico también en 2016 todos los vicerrectores de investigación de las universidades hicieron un acuerdo marco en el que propusieron y estaban de acuerdo que los datos eh tendrían que tener una política y que se propusiera y se promoviera el acceso abierto a esos datos esta este acuerdo se materializó 2 años después en 2018 con una plantilla un modelo en el que todas las universidades podían recoger y y aprobarla con las especificidades que que tuvieran también se empezaron los los cursos de formación eh Como ya os he dicho este esta primera fase en el que se se puso eh mucho énfasis y se y se dio mucho trabajo en eh servicios de apoyo y de asesoramiento se vio necesario eh Ya empezar a ofrecer infraestructura es decir eh se veía la necesidad los nuestros investigadores en Cataluña ya veían que necesitaban un lugar donde poder publicar esos datos Eh Al principio siempre se hablaba abiertos ahora estamos hablando que tienen que ser unos datos cer es decir que sean encontra bles accesibles interoperables y reutilizables vale e y esto promovió en 2021 el la apertura del repositorio de datos de de investigación eh bajo el nombre de Cora y finalmente los dos últimos años lo que hemos estado haciendo es ampliar eh y desarrollar eh estos estos todos estos servicios eh Como os he dicho en el primer bloque de planes de gestión de datos se tiene una herramienta vale es es un un una herramienta que utiliza un software libre para eh estar dentro de la filosofía de la ciencia abierta Es una herramienta en línea gratuita que pueden Los investigadores entrar rellenar una serie de de de formularios y pueden obtener un un plan de gestión de datos Qué tiene de bueno esta herramienta eh básicamente de que incluye unas unas descripciones unas guías unos ejemplos que entre todas las universidades hemos estado redactando y y desarrollando aparte eh No solo eh se se puede eh crear el plan de gestión de datos sino que damos la posibilidad de que todo aquel personal investigador eh que necesite puede solicitar que eh alguien de su institución revise ese plan Vale entonces es una manera de comunicar fácilmente eh el investigador con eh los servicios de apoyo a a la gestión de datos aquí para que veáis un poco las cifras ahora mismo hay 34 instituciones que participan el cesc da servicio no solo a universidades sino también a centros de investigación de la institución cerca y ahora mismo Pues tenemos 12 más 22 hay unos 600 planes de gestión de datos reales creados es decir que no es el típico plan que entras voy a probar y lo dejó allí a media sino que hay alguien que lo ha redactado ha sido revisado y finalmente se ha presentado en cualquiera de las agencias que lo piden más de 1800 usuarios registrados y como ya os he día el gran valor de esta herramienta Es que eh todo investigador de del que es que que trabaja e investiga en las universidades de Cataluña tiene la misma información tiene los mismos recursos hemos aprovechado el la la experiencia del colectivo y y y hemos reaprovechar recursos pero aparte si cada institución tiene cualquier especificidad o o quiere hacer alguna puntualización en algún momento concreto puede hacerlo eh Por eh el repositorio eh No me voy a extender mucho porque los los compañeros de madroño eh Ya lo harán eh Y y somos casi similares eh pero que sepáis que también existe eh un repositorio de datos de investigación nosotros decimos que es federado esto que quiere decir que dentro de un mismo espacio común cada institución tiene su propio espacio y es la la la la institución la que tiene todo el derecho y toda la toda la gobernanza eh dentro de de su espacio también está pensado para universidades y centros de investigación eh Y eh permitimos que deposite y publique eh el personal de El pdi y en los doctorandos sigue las filosofías eh que se han ido remarcando de durante toda la mañana que es que los datasets tienen que ser tan abiertos como como sea posible pero los tenemos que cerrar siempre que sean necesarios por lo tanto tenemos que dejar este abanico y esta oportunidad y obviamente pues cumple con todos los requisitos que piden las agencias de la financiación y los principios Fer aquí para que veáis solo un poco lo que cómo ha ido creciendo el repositorio en los últimos años el 202 básicamente hicimos tareas de trabajo y y organización y a partir del 2021 podéis ir viendo como solo ha ido creciendo casi verticalmente Pero es verdad que e las cifras son muy positivas pero responden a que aunque el crecimiento ha sido sostenible la hay algunas instituciones que lo que han hecho es [__] su histórico de datasets en repositorios institucionales y los han depositado en el repositorio de datos que es donde deben estar en los datos eh ahora mismo ya tenemos más de 750 datasets publicados que nos ocupan más o menos 1 tb de ocupación para que para que tengáis una idea eh para nosotros en el repositorio lo más importante era desarrollar y la gobernanza no tenía que ser un proyecto donde el cesc dirigiera y y desarrollara sino que cada institución tuviera la oportunidad de poner encima a la mesa sus necesidades y pactar lasas de la misma manera con sus eh con sus vecinos vamos a decirlo de una manera y por lo tanto entre todos entre entre las 34 instituciones que participan en el repositorio eh se han consensuado un reglamento de que se puede depositar en qué condiciones eh etcétera etcétera y se ha hecho entre todos también hemos acordado eh una de las cosas para mí que es muy importante a la hora de publicar datos que es que estos tengan calidad para intentar que sean el máximo de Fer posible el Fer se consigue depositando datos en repositorio pero la calidad de los datos También tienen que ser fair y los podemos maximizar en este revisad que no es nada más que un conjunto de criterios para que tengan un listón eh las instituciones eh se se establece que antes de publicar pues revisan que todo eso esté correcto a nosotros como ces qué nos permite este revisar hacer grandes revisiones a gran escala y poder ver que y hacer actuaciones de cualidad para que se mejoren el contenido de esos datasets También tenemos espacios como el cur alcora que nos permiten entre todos pues eh avanzar y aprender entre entre todos eh Y y a nivel de repositorio como os decía eh es muy importante que estos datasets sean preservados y el repositorio tiene que ofrecer unas garantías altas de preservación esto qué quiere decir eh que debe estar certificado y tener un sello eh como el que tienen todos los repositorios de datos que es el cort trasil los compañeros de madroño ya lo tienen nosotros estamos en proceso de obtención vale o sea eso es un un un un criterio que seguramente en poco tiempo la comisión ya lo pondrá eh Como un requisito Y entonces qué qué qué es unos estándares altos de de preservación pues tener diferentes copias revisar la integridad mirar que tiene un control de antivirus etcétera etcétera por lo que refiere a la política como ya os he dicho partimos de un acuerdo entre todos los vi rectores y un modelo podéis ver que a partir del 2019 ya todas las universidades en Cataluña han ido aprobando su política institucional en el que pues eh todas abogan por lo mismo a un acceso abierto a los datos en depositar los datos en su repositorio institucional que es el repositorio de dadas de recerca etcétera etcétera y finalmente eh el tema de la formación entre el 2015 y el 2021 se hicieron 11 cursos de formación est eran cursos destinados al personal de apoyo que tenía que ofrecer estos servicios de gestión de datos para poder para poder hacer así el el la formación en cascada nosotros formamos para que ellos formen eh estos cursos tenían diferentes temáticas de desplegar el servicio los planes de gestión de datos publicar eh curar bla bla bla eh Y solo para que tengáis una idea eh este 2023 hemos hecho todo esto que yo destacaría dos cosas La la primera son las sesiones de autoaprendizaje de de curación de datos en el que juntamos a todas las a todos los curadores de datos que participan en el repositorio y entre todos creamos conocimiento con el colectivo entre las diferentes instituciones se ayudan a mejorar la calidad de los datasets publicados y finalmente una fira una jornada que estuvo diría que el mes de junio donde juntamos físicamente a todos los curadores y durante todo el día se presentaron experiencias casos buenos casos malos casos y workshops sobre Cómo publicar datos Y hasta aquí la la experiencia del muchas gra muchas muchas gracias por la velocidad has podido concentrarlo todo pasamos a la experiencia de Isabel Bernal en este caso deles Hola gracias por la invitación yo voy a intentar ser breve considerando el retraso que llevamos a ver si aparece la presentación y yo voy a contaros un poco la experiencia que hemos tenido en en digital cesic en el repositorio institucional del del cesic em y a mí me gustaría o sea os voy a contar un poquito eh vista la brevedad de del tiempo pues nuestra experiencia eh que nosotros siempre cuando empezamos a poner en en marcha eh todo el servicio de gestión de datos de investigación el el objetivo principal siempre es cubrir las necesidades del personal investigador del cesic eh Y entonces empezamos a hacer a ver si va apareciendo eh trabajo de una manera piloto y experimental en el repositorio en digital cesic que en principio nació como la gran mayoría de los repositorios institucionales como un repositorio para publicaciones literatura gris eh pero ya en el 2010 Ahí está sí lo podéis poner un poquito más grande vale bueno empezamos en el 2010 como como digo como un proyecto piloto porque me gusta contar la anécdota se presentaron en mi despacho un par de investigadores de cambio climático con un disco duro así de esos viejos no que ya no existen y ellos vinieron preguntando que querían subir sus datos de investigación al repositorio para darle difusión en acceso abierto quio decir siempre ha habido investigadores interesados en difundir en abierto en compartir que han entendido Cuáles son los beneficios y las ventajas de lo que es la ciencia abierta sin necesidad de esperar ningún boe y ninguna política eh para para eh reglamentar su su carrera científica Entonces nosotros a partir de ahí a partir del 2010 empezamos a poner en marcha este servicio nuevo que giraba en torno al principio de la subida de colecciones de conjuntos de de datos eh a demanda o sea al principio era una situación en la que no hacíamos mucha promoción existía ahí ese servicio pero era más bien grupos de investigadores eh que eran los que se acercaban a nosotros eh proponiéndoles hacer esta carga esta difusión esta publicación de conjuntos de datos que ellos habían ido generando en algunos casos en proyectos de investigación que habían durado muchísimos años y querían darle como una segunda vida a estos conjuntos de datos entonces vimos que esto realmente era una necesidad en la institución y en la comunidad científica Quiero que penséis en en la situación era 2010 todavía no se hablaba pues mucho de los datos de investigación est estamos todos pues muy centrados y muy obsesionados con los preprints y los postprint y este tipo de cosas no Y a partir de ahí hemos ido desarrollando una estrategia eh gradualmente eh cada vez más ambiciosa eh Y hemos ido pues superando etapas no vimos que teníamos que hacer pública nuestra política de gestión de datos para que la comunidad científica del cesic supiera Eh pues qué tipo de colecciones de datos qué formatos eh Qué tipos de accesos e Cómo es nuestro workflow de trabajo y demás para que supieran exactamente la cartera de servicios que les ofrecíamos eh Y después a partir de ahí pues empezamos a nos hicimos miembros de datasite eh Para eh empezar a asignar los doys famosos a los conjuntos de datos eh pasamos también el certificado del Data seal of approval que yo diría que es el abuelo del Core Trust seal eh las certificaciones estas de de de datos y de buenos repositorios de confianza pues eh También tienen muchísimo recorrido ahora está muy de moda pero llevamos ya Eh pues bastantes años con con este asunto y después en el 2019 el 1 de abril entró en vigor el mandato institucional del cesic de acceso abierto y este es un mandato como voy a contar ahora pues que no solamente se centró en las publicaciones quas por pares de los investigadores del cesic sino también en sus conjuntos de datos asociados los que en inglés serían los underling Data O sea que nosotros a partir del 2010 llevábamos ya una un cierto recorrido con con la gestión de datos pero con esta política con este refuerzo de política de acceso abierto institucional que de ser recomendación pasaba a ser un mandato con una conexión con los ejercicios de evaluación científica de la institución pues hemos ido e aumentando la cartera de servicios en el 2019 también empezamos a contribuir con algunos conjuntos de datos a la nube Europea de ciencia abierta que seguro que la conocéis es esta gran Federación de infraestructuras abiertas de datos y herramientas a nivel europeo y en estos últimos años pues eh un poco estamos haciendo eh desarrollando desplegando una eh eh política y una estrategia de promoción eh de de de servicios que no solamente es eh la publicación y la descripción y la curación de los datos de investigación según los principios fair sino también que queremos ir progresivamente más allá porque en el fondo eh el objetivo de todo esto es que la ciencia sea reproducible no eh salió hace unos años un artículo en nature eh eh que se llamaba es Eh así Open is not Enough no como diciendo Sí el acceso abierto es un eh requerimiento sinequanon para que la ciencia sea abierta pero en realidad tenemos que ir hacia lo que es la ciencia reproducible y para que la ciencia sea reproducible no solamente se tienen que abrir o poner a disposición eh en una infraestructura abierta accesible los datos de investigación sino tamb bien todo su contexto que son los metadatos que son los métodos y los protocolos de investigación Mediante los cuales eh Esa investigación se ha realizado eh todo el software de investigación que se eh ha hecho que se ha usado y que se ha hecho durante el curso del proyecto para que otros grupos de investigación puedan eh Reproducir y replicar eh los resultados entonces en torno a esto pues hemos ido eh eh extendiendo nuestra cartera de servicios por ejemplo eemplo también en el cesic este año se ha creado un un grupo de trabajo para Eh Eh delimitar Eh muy claramente Cuál es la estrategia del cesic eh en su participación en la nube Europea de ciencia abierta de manera que ahí conflu eh distintos eh proyectos institucionales y distintas infraestructuras que gestionamos eh o generamos o promocionamos eh datos de investigación esto es únicamente una panorámica para que veáis desde el 2010 Cómo ha sido esta andadura de conjuntos de datos como todos vosotros Pues el de s que es una institución eh multidisciplinar eh a día de hoy pues eh alcanzamos casi 15,000 conjuntos de datos es la cuarta tipología de resultado de investigación eh más abundante en digital cesic después de eh los artículos científicos y las contribuciones eh a congreso y también tengo que decir aquí que eh desde el principio hemos tenido muchísimo interés y una actitud muy proactiva por parte de grupos de investigación de humanidades y de ciencias sociales Eh quiero decir que no solamente son grupos eh de las ciencias experimentales como se hemos estado hablando antes eh y demás sino que también son distintos colectivos distintas disciplinas que ven que publicar compartir los datos de investigación que generan en sus proyectos pues eh eh es una cosa que hay que hacer por honestidad intelectual y por transparencia de la investigación sino que también a los propios investigadores pues le reporta muchos beneficios no eh un poco lo que os estaba comentando el mandato cesic del 2019 lo único que ha hecho es darnos un empuje eh ulterior a a toda esta cartera de servicios que hemos ido montando a lo largo de estos últimos años en torno a la gestión de los datos aquí únicamente pongo e lo que son las disposiciones del mandato que tienen que ver con los datos de investigación claramente dice que estos datos de investigación que están asociados a las publicaciones científicas o sea datos sin sin los cuales es imposible entender cómo se ha llegado a las conclusiones y resultados científicos que cuenta un artículo científico que es En definitiva lo que hace la publicación eh estos datos tienen que depositarse en digital cesic esto no significa que y tienen que ponerse en acceso abierto Tan pronto como sea posible esto no significa que estos datos de investigación no puedan estar también depositados en otros repositorios O sea no es un requerimiento exclusivo eh pero sí que ha supuesto Un aumento muy grande en el número de conjuntos de datos que se nos están eh subiendo y nos están facilitando e Los investigadores también a lo mejor Aquí hago un inciso que nosotros en digital cesic desde prácticamente los inicios hemos promocionado mucho un una carga delegada eh un poco porque no promocionamos tanto que los investigadores hagan el depósito eh de sus resultados de investigación en el repositorio sino que siempre hemos pensado que las bibliotecas lo hacemos mejor vale Por qué Pues porque sabéis que en el tema del acceso abierto tenemos mucha cuestión de gestión de propiedad intelectual cuando estamos hablando de el acceso abierto a las publicaciones a través de los repositorios sabemos que hay que tener un conocimiento de propiedad intelectual importante para evitar violaciones de copyright y en el caso de los datos de investigación si bien la colaboración con Los investigadores fundament tal porque una gran parte de Estos principios Fer tienen que ver con la granularidad con la riqueza de los metadatos eh siempre hemos pensado que somos los bibliotecarios los que tenemos que estar dando ahí el apoyo y explicando cómo eh tienen que estar estos conjuntos depositados y gestionados y descritos en el repositorio para que cumplan con Estos principios lo mejor posible O sea que nosotros tenemos una estrategia de eh promocionar o hacer recaer en las bibliotecas en el personal bibliotecario cesic pues lo que es la carga de estos datos de investigación si bien la colaboración de los investigadores a la hora de describir es importante porque solo un creador de datos sabe cómo lo ha hecho no qué metodología qué Qué herramientas Qué tecnologías ha usado para para generarlos también eh se hace una referencia que tienen que estar en línea con los principios Fer Y estos datos solamente tienen que estar en acceso bien acceso abierto siempre y cuando no haya eh situaciones eh contrarias aquí nos estamos refiriendo sobre todo a temas de confidencialidad eh temas a lo mejor de e explotación Industrial que pongan en peligro este tipo de eh estrategia de comercialización aparte de promocionar y poner eh eh los medios para que la comunidad científica del cesip pueda cumplir con con el mandato del cesic nosotros hacemos una monitorización anual o sea nos lo tomamos en serio Cómo se está cumpliendo el mandato porque ya sabemos que es muy fácil escribir un mandato una política y dejarlo ahí en el papel hay que después ir y y ver si efectivamente Esto se está cumpliendo no Y entonces nosotros tenemos un portal en que publicamos una vez al año una foto fija del nivel de cumplimiento por cada uno de los 122 institutos del cesic eh Cómo se está cumpliendo con cada una de las disposiciones del mandato y ahí únicamente si me refiero a a lo que son las disposiciones de en torno a los conjuntos de datos en este ejercicio que estamos ahora realizando todavía no es público Eh Pues en comparación con con el volumen de datos de investigación de años anteriores pues vemos que el el aumento es muy grande o sea que también eh vemos Que eh la ciencia abierta yo creo que ya los investigadores no lo ponen en cuestión Los investigadores lo que necesitan es apoyo formación eh personal bibliotecario que les ayude a hacer que su ciencia sea abierta pero yo creo que esa fase previa que teníamos en los años anteriores en que se cuestionaba el acceso abierto y Donde había muchos mitos y malentendidos y distorsiones sobre lo que realmente quiere hacer el acceso abierto Yo creo que es es una etapa que ya hemos superado y la comunidad científica en general también pues porque precisamente llevamos muchos años trabajando en esto eh También hay disposiciones en el mandato sobre eh los principios Fer e pero Cómo se miden los principios Fer porque claro los principios da igual que sean Fer u otro tipo en general son siempre eh adrede eh consideraciones Muy generales pero después los principios tú los tienes que llevar a la práctica los tienes que ejecutar en la realidad eh Y lo puedes hacer de maneras muy diferentes utilizando metodologías diferentes e indicadores y métricas diferentes eh aviso Navegantes eh significa que tú teniendo siempre los mismos principios fair dependiendo de qué checklist de indicadores s métricas vas a utilizar para ver en qué grado son Fer eh tus conjuntos de datos los resultados pueden ser diferentes Entonces nosotros en un proyecto que ha terminado hace un año europeo em liderado por el cesic pues uno de los principales entregables del del proyecto fue realizar una herramienta eh Open source eh que nos sirviera a los repositorios institucionales para poder medir el grado de fairness eh Cómo estamos cumpliendo con estas consideraciones generales que son los principios Fer en nuestro repositorio teniendo en cuenta las características de los repositorios institucionales o sea queríamos hacer una evaluación que fuera también Fer De nada me sirve [__] una herramienta eh para medir los principios Fer que está pensada para conjuntos de datos en Salud si yo fundamentalmente lo que tengo mi repositorio son conjuntos de datos Pues de agrarias o de ciencias marinas porque eh los esquemas de metadatos los vocabularios controlados eh los distintos tipos de políticas y buenas prácticas de curación van a ser completamente diferentes Entonces por supuesto que teníamos un compromiso con En qué medida estamos cumpliendo Con los principios Fer tal y como dice la el mandato institucional Pero queríamos que fuera Fer o sea teniendo en cuenta no eh eh carácter multidisciplinar y un poco enlazando con la última diapositiva que que que hizo Ángel Pues yo también estaba pensando en el camino Cuál va a ser el camino pero yo lo veía un poco más como piedras no pero era un poco también para fomentar el debate que a lo mejor va a ser mejor hacerlo durante la comida Cuáles son las piedras en el camino o o o cuáles son los retos que nosotros vemos o sea yo creo que HM un gran problema eh que nos encontramos constantemente es que nos hemos centrado tanto en en en lo que es la fase final de la gestión de datos que es publicar los datos de investigación en un repositorio dando por hecho que los grupos de investigación lo traen todo muy documentado y todo muy bien organizado y muy bien estructurado desde el principio de su proyecto de investigación y no es verdad no es verdad ponerse a describir a metad datar a organizar los conjuntos de datos en la fase final del proyecto de investigación que es cuando el proyecto ha terminado o 2 años más tarde y empezar a ponerle metadatos a unas ristras de números o de fotos o de lo que sea diapositivas que tú has ido generando eso genera un coste enorme desde el punto de vista de trabajo y y y de tiempo o sea que yo creo que este es una piedra en el camino importante a nivel práctico pedestre para poder realizar Fer y otra cosa que digo y ya doy paso a mi compañera es cómo vamos a medir la reusabilidad porque la r de Fer es muy difícil de medir cómo vamos a medir Hasta qué punto todos estos conjuntos de datos que estamos poniendo en acceso abierto en los repositorios están siendo reutilizados y por quién Y cómo así que estoy de acuerdo que tenemos mucho trabajo por hacer gracias pasamos a toda velocidad a Rosa Gallego que antes la verdad que te he dicho he dicho madroño sin más y la verdad que eres de la Universidad de alcalda de enares que no lo he dicho y hay y a la institución madre hay que mencionarla Pero vamos en este caso vienes por pues tu trabajo de datos en madroño Muchas gracias Bueno pues Buenas tardes Bueno creo que puedo empezar sí eh vengo representación del consorcio madroño para hablarles para hablaros de nuestro portal de ciencia abierta y sobre todo del repositorio de datos de de investigación ya está No pues voy a pasar sí bien bueno un poquito de historia en el año 2016 es cuando se pone en marcha el repositorio de datos del consorcio e ciencia datos eh es el resultado de un grupo de trabajo de 2 años de duración eh un grupo formado por representante de todas las universidades una o dos personas y los informáticos del del consorcio madroño eh Igualmente eh En este año eh se publica un nuevo portal de ciencia abierta del consorcio madroño se ve la necesidad debido a la expansión a la explosión de la ciencia abierta todas las normativas que van surgiendo etcétera de aglutinar un poco las herramientas que hasta ese momento ya teníamos que eran e cencia la plataforma digital que daba acceso a a la producción científica a las publicaciones de de los miembros del consorcio madroño y el portal pagoda que integraba toda la información relativa a datos de investigación y la herramienta pgd Online para la elaboración de planes de gestión de datos entonces todo se aglutina en esta nueva página investigam Investiga más la m por Madrid eh en el año 2017 se publica una nueva aclaración del consorcio madrono de apoño al acceso abierto porque la anterior que había que era del año 2013 no contemplaba los datos de investigación entonces en el año 2017 se redacta una nueva con un anexo dedicado íntegramente a los datos de investigación bien el portal investigam es el portal de ciencia abierta del consorcio madroño y cuyo objetivo es dar visibilidad y difusión a toda la actividad investigadora de los investigadores que forman parte de las universidades miembros del consorcio e incluye todo lo relativo a actividad investigadora tanto eh publicaciones a través de ciencia como datos de investigación a través de ciencia datos bueno y la herramienta pgd online Esta es la página web del consorcio madroño y en la parte superior tengo el acceso a la al portal investigan y aquí como veis pues lo que os decía se aglutina toda la información eh referente a la producción científica de de los investigadores del consorcio y la parte central es la que está dedicada a nuestro repositorio de datos e ciencia datos eh desde aquí podemos Acceder al propio repositorio al propio repositorio y donde he puesto las flechas Bueno pues información relativa documentación relativa a la gestión de datos de investigación el portal pagoda preguntas frecuentes etcétera toda la información relativa que tenemos en el consorcio a al repositorio a los datos de investigación y al repositorio bueno nuestro repositorio de datos e ciencia datos Pues que pretende pues ser una herramienta que permita no solo el depósito de los datos de investigación de nuestros investigadores sino además la preservación y la difusión de los mismos utiliza un software dataverse que es un software libre también el mismo que utiliza el consorcio Catalán y se estructura como un sistema centralizado constituido por comunidades que agrupan los dataset de las diferentes universidades si accedo al repositorio de datos Esta es la la interfaz Esta es la primera pantalla que me aparece como veis en la parte superior pues las diferentes universidades que formamos partes del consorcio cada una de ellas constituye una comunidad lo llamamos así o dataverse quiero decir que cuando dentro de una universidad suben datos de un proyecto de especial envergadura proyectos de larga duración proyectos que suelen estar subvencionados a nivel nacional o por la Unión Europea etcétera debido precisamente a esa gran envergadura del proyecto eh a esas dimensiones del proyecto se le da también categoría de comunidad o dataverse digamos equiparable a la propia universidad Por eso ahora mismo en los datos que veis aquí en los datos estadísticos del consorcio veréis que tenéis tenemos 25 dataverse o grandes proyectos con un total de 1017 datasets y 5694 ficheros de datos estos bueno esta diapositivas de la semana pasada puede que hayan variado en algo las las cifras me voy al repositorio de la Universidad de Alcalá como veis la interfaz de búsqueda es exactamente la misma eh puedo buscar desde la pantalla anterior eh datos en todas las universidades a la vez oyéndome a cada repositorio en concreto en este caso al de la Universidad de Alcalá datos solo en el repositorio nuestro de la Universidad de Alcalá los datos de la del repositorio de la Universidad de Alcalá pues son de cuatro grandes proyectos o comunidades o dataverse con 446 datasets y 2763 ficheros somos de momento la universidad que más ficheros está subiendo al repositorio voy a ver un ejemplo concreto de uno de estos grandes proyectos de la Universidad de Alcalá Front Expo eh como decíamos antes o comentó algún compañero eh la mayoría de los datasets que tenemos en la universidad de Alcalá son del área de las ciencias de la técnica medicina sin embargo nuestro gran proyecto un poco nuestro buque insignia porque fue el primer proyecto del que empezamos a subir datos es precisamente y por contradicción un proyecto del área de humanid unidades frontes que es un proyecto que va analizando la lengua de los pueblos eh cercanos a la frontera entre España y Portugal Bueno es un proyecto de estos de larga duración que se le ha dado también categoría de comunidad y este es un ejemplo concreto de uno de los archivos o de los eh datos que se están subiendo de de de este proyecto bueno en la la parte superior del registro tenemos una descripción general una descripción básica de estos datos de este dataset se la descripción se facilita tanto en español como en inglés eh se el repositorio facilita una cita normalizada en varios formatos se puede exportar en varios formatos de de dicho dataset en la parte inferior del registro tenemos nos encontramos con cuatro pestañas que ya facilitan la información más detallada de de este conjunto de datos o datasets en la primera de estas pestañas se recogen los archivos un en este caso está formado por eh cinco archivos o conjuntos de datos Pero hay eh proyectos que pueden ser solamente un archivo otros que pueden ser 15 o 20 bueno según la magnitud del proyecto en este caso eh los archivos que recoge este dataset son tanto archivos como de audio o de vídeo el repositorio de de datos admite cualquier tipo de formatos en principio junto con los archivos de datos hay que subir siempre Se le pide al investigador que nos envíe el último archivo que es una plantilla o ritmi donde se da una explicación detallada del proyecto eh nosotros los bibliotecarios cuando subimos luego al repositorio estos datos nos basamos en el contenido de esta plantilla para describir esos datos es digamos también un punto de diálogo con el investigador si no entendemos algo que muchas veces los datos para nosotros sobre todo en las áreas de la ciencia la técnica etcétera son incomprensibles si no entendemos alto queremos matizar algo más o ampliar algo más eh es este ritmo y esta plantilla la que nos sirve como punto de diálogo con el con el investigador es obligatorio subirlo con el conjunto de de archivos que forman ese ese dataset es obligatorio subirlo al repositorio también es la manera en que una persona que desde fuera accede al repositorio viendo la información que viene en esta plantilla o ritmi puede saber si le va a interesar o no luego acceder a cada uno de los archivos o conjuntos de datos en la segunda eh pestaña que tenemos Disculpa desde aquí no la vea muy bien es la de metadatos eh los metadatos pues se utilizan utilizamos los estándares eh H que hay a nivel internacional de metadatos el dublin Corel principalmente y bueno destacar de aquí el metadato del doi eh e ciencia datos asigna automáticamente cuando se sube un dataset un doi a dicho dataset los doy se asignan a nivel de dataset otro metadato interesante es el de publicaciones relacionadas si ese proyecto como es este caso ha dado lugar a una a una serie de publicaciones se ponen aquí las citas de dichas publicaciones Y si esas publicaciones están en abierto en el repositorio de publicaciones como es este caso se le hace un enlace al repositorio de publicaciones la tercera pestaña son las licencias eh la licencia de uso eh ponemos la que nos dice el investigador con la que quiere se consulten sus datos nosotros intentamos que estas licencias sean lo más amplias posibles lo más permisivas posibles como mucho que sea una creative commons eh ccb pero se respeta aquello que el investigador nos dice y la licencia que el investigador eh quiere utilizar en este caso como veis es más restrictiva eh Y finalmente la última eh pestaña es la de versiones eh un conjunto de datos Eh puede conocer eh diferentes versiones a lo largo del tiempo el investigador o grupo de investigación puede querer realizar modificaciones en ese conjunto de datos Y entonces se van publicando diferentes versiones todas las versiones son consultables en el repositorio bien eh las características principales de nuestro repositorio de datos ya he mencionado algunas de ellas cuando he ido poniendo las diapositivas No las voy a repetir Pero bueno eh las que no he dicho alberga datos finales en abierto salvo que por algún motivo por razones éticas legales etcétera etcétera eh tenga que tener un embargo con lo cual e ciencia datos Eh puede tener datasets con embargo hay una cosa interesante que es lo que llamamos el libro de visitas no es un embargo de los datos pero es cuando un investigador quiere saber no quiere cerrar sus datos quiere que estén en abiertos pero quiere saber quién los está utilizando y el motivo por el que lo está utilizando entonces antes de Acceder al conjunto de datos a los datasets hay un libro de visitas en el cual esa persona que quiere consultar esos datos se identifica para que el investigador sepa quién los está consultando eh creo que todo el resto de características lo los los he mencionado previamente Así que paso eh quién puede depositar en ciencia datos pueden depositar Los investigadores miembro de las universidades del consorcio madroño de momento qué se puede depositar pues datos finales de cualquier disciplina es un repositorio multidisciplinar se tiene que publicar como decía antes junto con esta plantilla o ritmi que de una explicación detallada de los datos y y no solo se pueden depositar lo que entendemos por datos de investigación datos en bruto sino toda aquella documentación que eh le permita a cualquier persona que acceda al repositorio entender de que van esos datos Y que el investigador quiera poner en abierto que pueden ser métodos y procedimientos de trabajo protocolos etcétera Cómo se depositan los datos se depositan mediante eh archivo delegado es decir el investigador nos envía los datos nosotros los revisamos los trabajamos trabajamos con el investigador a través de del ritmi también y los depositamos en el en el archivo pero hemos abierto hace nada hace en la última reunión que tuvimos de de del repositorio de datos de ciencia datos hemos abierto la posibilidad del autoarchivo es decir que sea el propio investigador el que deposite sus datos en en el repositorio qué licencias se utilizan pues como os decía con relación a las licencias de uso se aconseja que sean lo más abiertas posible que los datos estén en abierto pero nos ajustamos aquello que el investigador eh quiera y al tipo de licencia que quiera y la licencia de depósito pues es un digamos una licencia que tiene que firmar el investigador eh Por la que nos autoriza al repositorio de de datos a depositar sus datos en en nuestro repositorio la cesión no es exclusiva esto quiere decir que si un investigador aparte de nuestro reposit orio que es multidisciplinar quiere depositar los datos en un repositorio temático puede hacerlo el tamaño de los datasets Bueno pues es un tamaño amplio nunca ha habido problemas es el de 100 GB Pero bueno nunca se ha llegado a ese tamaño y si fuera necesario ampliarlo y según la disponibilidad del almacenamiento se podría ampliar Esa esa capacidad cuánto tiempo se preservan los datos bueno se garantiza un mínimo de 20 años pero tampoco hay eh una fecha es decir a partir de los 20 años ya no se van poder no se van a poder consultar determinados datos no se prevé una posibilidad de acceso a largo plazo a destacar a destacar ya termino solo me quedan dos diapositivas a destacar eh hemos obtenido este año en el repositorio de ciencia datos el Sor cor tril que ya mencionaba mi compañera Isabel en el que digamos que ya se está diciendo que los datos no se deben depositar solo en un repositorio o en un repositorio cualquiera sino en un repositorio de confianza y es un poco asegurar que nuestro repositorio eh cumple eh para los datos de investigación que estos sean Fer preservación tenemos un acuerdo con el consejo Catalán con el consorcio Catalán por el cual nos hacemos copias cruzadas nosotros eh eh hacemos una copia de sus datos Y ellos de la nuestras con lo cual la preservación en cuestión de seguridad de los datos de que no haya deterioro etcétera Yo creo que es prácticamente del 100% este año hemos migrado a una nueva herramienta para la elaboración del plan de gestión de datos antes utilizábamos una herramienta bueno que era traducción de del digital curation Center inglés y ahora utilizamos la herramienta Argos desarrollada por Open aire Open Air y que se ajusta mejor a las necesidades de de horizonte Europa se trabaja mucho con las estadísticas se quiere que los investigadores tengan las estadísticas lo más detalladas posibles de sus datos se asignan dois por dataset eso ya lo he comentado tenemos visibilidad internacional a través de otros recolectores directorios de datos y el consorcio madroño cada vez está más presente en foros tanto nacionales como internacionales de datos de investigación y planes de futuro tenemos ahí planificado sesiones de formación de ciencia abierta también con el consorcio Catalán queremos seguir mejorando las estadísticas eh De cara al investigador de Cara a la visibilidad descargas etcétera de los datos queremos intentar recolectar eh datasets que hay en otras en otros repositorios de investigadores de nuestras universidades evaluación Fer eh queremos llevar a cabo un estudio de herramientas que haya para para la evolución de de datos fair para poder asegurar con más con más seguridad que los datos que integramos en nuestro repositorio cumplen los los famosos principios Fer y se va a solicitarse miembro de esta organización que es la que desarrolla el software dataverse para poder contribuir a las mejoras del del Software que con el que mantenemos el repositorio y ya está por mi parte nada más Muchas gracias a las tres eh Por vuestra rapidez y bueno y que pero nos hemos salido totalmente de hora deberemos cortar aquí lo siento no va a haber tiempo me temo para preguntas pero bueno os quedáis las tres espero a la comida no Supongo que sí O sea que que os podremos asaltar durante durante la comida solo bueno agradecer por supuesto a la neca la predisposición y vamos y lo lo que nos han transmitido y la la B de comunicación en general que está que se Está realizando que creo que es muy intensa y muy importante y muy interesante agradecer por supuesto a la politécnica de Madrid que nos haya acogido aquí hoy y de parte de Bueno lo que es la comisión permanente Muchas gracias a todos los asistentes también [Aplausos] gracias