![]() |
||||||||||||
| chi siamo |
![]() |
prodotti |
![]() |
ricerca e sviluppo |
![]() |
aree applicative |
![]() |
opportunità di lavoro |
![]() |
contatta |
![]() |
staff only |
Progetto CIPRESS» obiettivi» architettura » ruolo Aleph » applicazioni » partners |
![]() |
![]() |
Progetto CIPRESS |
L'obiettivo del progetto
L'obiettivo del progetto Esprit denominato CIPRESS (Complex Information
Patterns Retrieval with a parallel distributed processing knowledge Engine
Search System) è stato lo sviluppo di un database con avanzate funzionalità
di ricerca ed elevate performance.
Il motore di ricerca è in grado di "scoprire" relazioni tra i dati
(processo di associazione) e, attraverso un meccanismo di "apprendimento",
offrire all'utente un supporto per ricerche contestualizzate utilizzando
un "dizionario" di parole chiave organizzate gerarchicamente. Il compito
di Aleph, partner del progetto, è stato la realizzazione dell'interfaccia
utente e del protocollo di comunicazione.
Il Problema
La ricerca di informazioni in database di grandi dimensioni
è un problema critico non solo per i tempi di ricerca, spesso elevati,
ma anche per la difficoltà nel mantenere le relazioni tra tutti i “documenti”,
siano essi testuali, dati numerici, immagini, o altro. Un buon esempio
è rappresentato da Internet e dai tanti motori di ricerca che, attraverso
l'uso di parole chiave, restituiscono all'utente liste di riferimenti
a documentazione.
Un altro esempio è il settore medico dove migliaia di documeni
tecnici vengono prodotti ogni anno e messi a disposizione, spesso, tramite
Internet. Analizzare una tale quantità di dati per esplicitare tutte le
possibili relazioni risulta un compito sempre più oneroso e, se non progettato
correttamente, ha dirette conseguenze sui tempi di ricerca e sulla qualità
dei dati estrapolati dal database.
Architettura della soluzione
Il progetto CIPRESS è nato con l'obiettivo di realizzare un sistema che fornisca una valida soluzione a queste problematiche. Anzituè stato realizzato un motore di ricerca molto efficiente che supporti l'utente non solo nelle fasi di ricerca dei dati ma anche nell'organizzazione logica degli stessi. Di seguito forniamo una descrizione generale dei componenti principali del sistema.
- Un Analizzatore che colleziona informazioni come parole, riferimenti a documenti, ecc.. che sono utilizzate da un motore di ricerca per la costruzione di una rete di associazioni.
- Un Motore di ricerca basato sul "Metodo Associativo" sviluppato dalla società svedese Virtual Genetics Laboratory.
- Una Rete neurale per assistere l'utente nella ricerca dei documenti, è infatti disponibile un dizionario di termini "pesati" per guidare la ricerca con vocaboli che sicuramente sono presenti nei documenti. Il monitoraggio della creazione delle associazioni (da parte dell'Analizzatore) e delle interazioni con l'utente (per la ricerca di documenti) al fine di ottimizzare entrambi i processi sono un task della rete neurale.
Il sistema è stato disegnato e realizzato per supportare
una elaborazione a multi processore sfruttando al massimo le risorse disponibili
per ottimizzare i tempi di costruzione delle relazioni e di ricerca dei
dati. I servizi messi a disposizione dal database sono accessibili in
modalità remota da un qualunque client. Il database e il motore di ricerca
sono localizzati su uno o più server.
I servizi messi a disposizione sono accessibili tramite una interfaccia
avanzata residente sui vari client.
Il protocollo di comunicazione tra i due ambienti è basato sullo
standard Tcp/Ip.
Il ruolo di Aleph
Il ruolo della nostra societ&agraè stato duplice: da un lato lo sviluppo
dell'interfaccia utente, dall'altro lo sviluppo del protocollo di comunicazione
tra client e server. L'interfaccia uteè stata sviluppata in
JAVA garantendo al massimo il requisito di indipendenza dalla piattaforma,
di modularizzazione del codice e di sua riusabilità.
Incorpora funzionalità avanzate per assistere l'utente nella ricerca dei
documenti trasformando in eventi visivi i servizi disponibili dal motore
di ricerca e dalla rete neurale. Altro importante obiettivo è stata la
sincronizzazione dell'interfaccia e del database che avviene dinamicamente
per allineare l'interfaccia alle funzionalità che il server rende disponibili.
Il protocollo di comunicazione, come detto, è basato su Tcp/Ip,
ed utilizza strutture C/C++ per codificare i dati rendendoli indipendenti
dalla piattaforma e basando l'evento comunicativo su socket.
Campi di applicazione
Il primo campo di applicazione é quello medico dove già numerosi sistemi di ricerca sono disponibili (Medline, CANCERLIT, DrugLine, ecc.). Il Karolinska è infatti un partner del progetto sia in qualità di progettista di una parte del motore di ricerca che come futuro utente del sistema. Altri campi riguardano settori scientifici, militari, finanziari.
I Partners di CIPRESS
CIPRESS è un progetto Esprit interamente finanziato dalla Comunità Europea che ha visto come partner:
- Aleph Informatica srl
- Arakne
- HealthGate Europe Ltd
- Karolinska Institute
- Virtual Genetics Laboratory
Il progetto ha avuto inizio nel marzo 1998 e si è concluso nel settembre 2000.



