![]() |
||||||||||||
| chi siamo |
![]() |
prodotti |
![]() |
ricerca e sviluppo |
![]() |
aree applicative |
![]() |
opportunità di lavoro |
![]() |
contatta |
![]() |
staff only |
Air CD Ware» obiettivi » architettura » disk builder » retrieval enviorement |
![]() |
![]() |
AIR CD-Ware |
AIR CD-Ware si propone come un ambiente completo per lo sviluppo e la consultazione di archivi dati testuali e grafici basati sulla tecnologia CD-ROM.
Obiettivi del prodotto
L'opportunità di sviluppare un prodotto come AIR CD-Ware si basa sulla considerazione di alcuni fattori, sia di natura tecnica, sia di natura commerciale, che presenteremo sinteticamente di seguito:
— L'iter tradizionale di produzione di un CD-ROM prevede più passi e l'interazione da parte dell'editore con organizzazioni esterne che curano l'indicizzazione e l'organizzazione del materiale e la produzione del gold disk utilizzato poi come base per la duplicazione in serie vera e propria. In questo modo risulta complesso e costoso apportare modifiche, correzioni e aggiornamenti al materiale, ed è difficile adattare i tempi di approntamento del disco master alle esigenze commerciali e produttive dell'azienda editrice.
AIR CD-Ware permette all'editore di sfruttare i sistemi che il mercato ha reso ora disponibili a costi relativamente bassi per la produzione di gold disk, detti CD-R (CD Recordable), per portare all'interno della propria organizzazione tutti i processi di elaborazione ed indicizzazione delle informazioni necessarie a produrre un gold disk, in modo da ottimizzare tempi e costi di tale operazione.
— Le applicazioni di interrogazione e navigazione di un'opera su CD-ROM sono nella maggior parte dei casi sviluppate ad hoc, con elevati costi e con rilevanti problematiche di test. Inoltre l'editore dipende da un fornitore esterno per ogni necessità di modifica o manutenzione della propria applicazione.
AIR CD-Ware rende disponibile un controllo (OCX) per lo sviluppo di applicazioni su CD-ROM prodotti con AIR CD-Ware stesso. Tale controllo è utilizzabili con i linguaggi di programmazione “C++” e “VB” e fornisce tutte le primitive necessarie alla consultazione dei dati sul CD-ROM.
— I sistemi di indicizzazione e consultazione dei dati utilizzati per la produzione delle applicazioni per CD-ROM sono spesso basati su sistemi di information retrieval progettati per un uso interattivo. Le problematiche tipiche della consultazione di un CD-ROM sono molto più semplici, visto che i dati non possono essere modificati. Spesso i prodotti presenti sul mercato portano con sè complessità inutili che ne abbassano le prestazioni e aumentano le richieste minime sul dimensionamento degli elaboratori.
AIR CD-Ware è stato progettato espressamente per l'uso con i CD-ROM, ed è dunque ottimizzato sia dal punto di vista delle prestazioni sia dal punto di vista delle funzionalità che offre per tale utilizzo.
— Molti prodotti per la consultazione di CD-ROM prevedono costi runtime per ogni copia venduta dell'opera realizzata, rendendo complessa la gestione dei rapporti amministrativi fra editore e fornitore del software stesso.
AIR CD-Ware si indirizza sia al grande editore che produce opere con tirature di migliaia di copie, sia al piccolo editore con tirature da poche decine di copie. Sono previste formule commerciali personalizzate per le diverse esigenze, anche senza alcun costo runtime.
AIR CD-Ware L'architettura
AIR CD-Ware si compone di due parti fondamentali, una destinata alla produzione del master disk (AIR CD-Ware Disk Builder), ed una utilizzata per la realizzazione delle applicazioni di interrogazione e navigazione dei CD-ROM stessi (AIR CD-Ware Retrieval Environment).
AIR CD-Ware Disk Builder
È il modulo che provvede alla indicizzazione dei dati e alla loro formattazione
per il CD-ROM. Tale modulo richiede la disponibilità di un sistema con
elevate capacità di memoria di massa e di potenza elaborativa. Per tali
considerazioni, il Disk Builder è disponibile solo in ambiente UNIX su
piattaforma Sun Sparc o Intel e compatibili.
Il Disk Builder si compone di diversi moduli destinati
all'input dei dati e al loro controllo. Presentiamo sinteticamente le
principali caratteristiche funzionali di tali moduli:
Input dei dati
Gestione parametrica dei file di input, con possibilità di definire il
formato di tali file. Il sistema fornisce un completo logging delle attività
di import dei dati e prevede la possibilità di importare uno o più file.
Definizione del database
Sono gestite le seguenti tipologie di campi:
- Numerico
- Carattere
- Data
- Ora
- Testo
- Generico (suono, immagine, filmato...)
Un elemento molto importante e caratteristico di AIR CD-Ware è la possibilità
di trattare record di tipo complesso, cioè contenenti parti che si possono
ripetere (si pensi ad esempio ad un libro che puo' essere composto di
diversi capitoli, o ad una legge che è composta di diversi articoli, ecc.).
Sono definibili per ciascun campo attributi di gestione
e le politiche di indicizzazione; in particolare è possibile stabile se
un campo è:
- Visualizzabile dalle applicazioni di consultazione.
- Stampabile dall'utente mediante l'applicazione di consultazione.
- Esportabile su file mediante l'applicazione di consultazione.
È inoltre disponibile un'opzione che permette di comprimere,
sulla base di diversi algoritmi, i campi all'atto del loro inserimento
nel database.
Le politiche di indicizzazione disponibili sono le seguenti:
- Indicizzare o meno.
- Indicizzare con un indice composto, ottenuto dalla giustapposizione di più campi.
- Nel caso di indici testuali, possibilità di indicare una lista di stop word specifica per ogni campo e di ammettere o meno campi numerici o misti numerici e alfabetici.
Verifica dei dati
Possibilità di visualizzare i dati record per record e campo per campo,
con strumenti di browsing degli indici per controllare i termini inseriti.
Compressione
Disk Builder è estremamente ottimizzato per quanto concerne l'utilizzo
dello spazio sul CD-ROM. Il formato degli indici è estremamente compatto:
tipicamente gli indici non occupano più del 40% dei dati indicizzati.
Sono inoltre disponibili diversi algoritmi di compressione da applicare
ai dati, in particolare:
- Huffman
- Byte Pair Encoding
- SixPack
Tutti gli algoritmi previsti sono stati particolarmente ottimizzati per ottenere i migliori risultati di velocità e di utilizzo della memoria in fase di decompressione, per rendere i programmi che consultano gli archivi più veloci ed efficienti. A seconda della natura dei dati e dell'algoritmo utilizzato si possono ottenere percentuali di compressione dei dati dal 35% al 60% ed anche oltre in casi particolari.
AIR CD-Ware Retrieval Enviorement
È la parte di AIR CD-Ware destinata alla costruzione
delle applicazioni di consultazione e navigazione dei CD-ROM.
Retrieval Engine
Alla base del AIR CD-Ware Retrieval Envronment si trova il Retrieval Engine,
capace di consultare i dati indicizzati presenti sul CD-ROM. Il Retrieval
Engine è caratterizzato dalle seguenti funzionalità:
- Possibilità di utilizzare metacaratteri nel testo (* match di una insieme di 0 o più caratteri, ? match di un singolo carattere, [ e ] per il match di un range di caratteri).
- Operatori relazionali =. <, >, <=, >=
- Operatori logici (AND, OR, NOT).
- Possibilità di costruire con le parentesi condizioni complesse.
- Operatori di adiacenza sui testi (entro n parole).
- Operatori di contesto per restringere le ricerche nell'ambito di particolari sezioni di un record complesso.
Il Retrieval Engine è particolarmente ottimizzato per l'uso
con CD-ROM, caratterizzati da tempi di accesso relativamente lenti. A
questo scopo sono previsti meccanismi di caching degli indici in memoria
RAM e su hard disk, in modo da permettere l'accesso ai dati con un unico
accesso fisico al CD-ROM.
Controllo OCX
Le applicazioni di consultazione e navigazione dei CD-ROM sono costruite
a partire da un controllo OCX richiamabile dai linguaggi “C++” e “VB”,
che offre servizi nei seguenti ambiti:
- Completo accesso al Retrieval Engine attraverso un modello di interazione basato sui "cursori"
- Servizi di interfaccia utente, con routine specializzate per la visualizzazione di testi (a linee o da formattare).
- Possibilità di salvare e ripristinare query utente su hard disk per una successiva consultazione o raffinamento.
- Stampa o export su file ASCII di informazioni estratte dal CD-ROM.
- Possibilitàdi estrarre immagini (anche 3D), filmati e suoni.



