Il bando del Programma Horizon 2020 EINFRA-1-2014 “Managing, preserving and computing with big research data” all’interno della call H2020-EINFRA-2014-2 “e-Infrastructures” implementa lo schema di finanziamento delle Research and Innovation Actions (RIA), finanziate per il 100% dei costi totali eleggibili (Consulta la nostra Guida Pratica per sapere tutto quello di cui hai bisogno sul meccanismo di finanziamento delle RIA e visita la sezione del nostro sito dedicata al Programma Quadro).
Lo sviluppo e l’implementazione di e-infrastructures integrate, sicure, permanenti, on-demand service-driven, compatibili con la privacy e sostenibili, che incorporano risorse e software di calcolo avanzati sono essenziali al fine di aumentare la capacità di gestire, archiviare e analizzare datasets estremamente ampi, eterogenei e complessi, tra cui il text mining. Queste e-infrastructures devono fornire servizi che intersecano una vasta gamma di comunità scientifiche ed affrontano una diversità di esigenze computazionali, vincoli e requisiti legali, architetture di sistema e di servizio, formati, tipi, vocabolari e pratiche istituzionali delle comunità scientifiche che generano, analizzano e utilizzano i dati. Le proposte devono riguardare almeno una delle primi cinque attività o le attività 6, 7 o 8 singolarmente.
- Creazione di una federata e-infrastructure di dati paneuropea per fornire soluzioni convenienti ed interoperabili per la gestione dei dati e la conservazione nel lungo termine. Le esigenze di accesso ai dati, archiviazione, replicazione, annotazione, ricerca, elaborazione, analisi e riutilizzo delle informazioni attraverso le discipline devono essere adattate in diversi contesti di ricerca e istruzione. Tutte queste funzioni devono offrire interfacce standard per l’interoperabilità con altre sorgenti di dati per aggregarli o essere aggregati, tenendo conto anche dei requisiti etici e normativi per i dati sensibili. Le sfide previste sono di carattere tecnico, giuridico e organizzativo, compreso l’impegno degli operatori di e-infrastructure e di altri fornitori di servizi.
- I servizi per garantire la qualità e l’affidabilità della e-infrastructure, compresi i meccanismi di certificazione per banche dati e servizi di certificazione per test e benchmark di capacità in termini di resilienza e continuità del servizio delle e-infrastructures.
- Federazione istituzionale e, se possibile, gestione dei dati privati e strumenti e servizi di “curation”utilizzati in tutto o in qualche punto dell’intero ciclo di vita dei dati, compresi gli approcci per l’identificazione delle fonti di open data e dati raccolti con caratteristiche di accesso sensibile o ristretto.
- Virtualizzazione su larga scala delle risorse di centri di calcolo/dati per ottenere capacità di calcolo su richiesta, per migliorare la flessibilità per l’analisi dei dati e per evitare inutili costosi trasferimenti di dati di grandi dimensioni.
- Sviluppo ed adozione di una piattaforma informatica basata su standard (con stack software aperto) che può essere implementata su hardware ed e-infrastructures diversi (come clouds che forniscono infrastructure-as-a-service (IaaS), HPC, infrastrutture di rete,…) per lo sviluppo e l’esecuzione di applicazioni dai sistemi informatici disponibili (possibilmente remoti). Questa piattaforma dovrebbe essere in grado di federare più risorse o servizi cloud commerciali e/o pubblici e fornire Platform-as-a-Service (PaaS) adatta alla comunità scientifica con una breve curva di apprendimento.
- Sostegno alla evoluzione di EGI (European Infrastructure Grid) verso un’infrastruttura di calcolo/dati flessibile in grado di federare e consentire la condivisione delle risorse di qualsiasi natura (pubblica o privata, di rete o cloud, ecc) al fine di offrire servizi di calcolo e di storage a tutta la comunità scientifica europea. La proposta riguarderà le operazioni per la fornitura di servizi (IaaS, PaaS, SaaS) a livello europeo, l’impegno a confezionare servizi a nuove comunità di utenti e attività di divulgazione.
- Proof of concept e prototipi di software per infrastruttura dati (ad esempio per database e data mining) per insiemi di dati estremamente grandi o altamente eterogenei scalando allo zetabyte e a trilioni di oggetti.
- Consentire la creazione di una piattaforma ed infrastrutture per il mining di testi aggregati da diverse fonti/editori che risponda alle esigenze degli utenti (ricercatori). Ciò include la definizione dei requisiti tecnici (ad esempio in materia di interoperabilità, standards di metadati e l’aggregazione di nuovi servizi), nonché affrontare le questioni legali e contrattuali per soddisfare le esigenze delle comunità per il text mining.
Gli impatti attesi:
- Aumento della disponibilità di dati scientifici per le comunità scientifiche
- Una migliore ottimizzazione dell’uso delle apparecchiature IT per la ricerca
- Evitare lock-in per particolari piattaforme hardware o software nello sviluppo della scienza
- Le comunità scientifiche abbracciano infrastrutture di storage e di calcolo poiché servizi diventano disponibili e la curva di apprendimento per il loro uso diventa meno ripida; questo sarà misurato dalla capacità di storage disponibile per uso paneuropeo nonché dal numero di utenti di EGI e altre e-infrastructures produttive in quest’area.
- Attraverso lo sviluppo di grandi infrastrutture di text mining riunite ed interoperabili, le efficienze di scala ridurranno i costi complessivi, e più aperti sistemi di licenza diffonderanno l’uso di tali licenze e aumentaranno lo scambio di risorse e di pratiche di text mining.
Il bando FETHPC-1-2014 (RIA) prevede una sottomissione ad uno stadio. La scadenza per la presentazione della proposta di progetto è fissata al 25/11/2014. È previsto un massimo di 8 milioni di euro del budget totale per il topic relativo all’attività (6).
©RIPRODUZIONE RISERVATA
©RIPRODUZIONE RISERVATA