Text mining: teoria e applicazioni

A cura di: Susi Dulli, Paola Polpettini, Massimiliano Trotta

Text mining: teoria e applicazioni

Edizione a stampa

23,50

Pagine: 176

ISBN: 9788846460585

Edizione: 1a edizione 2004

Codice editore: 720.1.19

Disponibilità: Discreta

La disponibilità di documenti elettronici in forma non strutturata (e-mail, articoli, agende, cartelle cliniche, relazioni, pagine web), e la necessità di elaborarli, hanno portato alla realizzazione di nuovi strumenti e tecnologie per la manipolazione automatica del linguaggio naturale nei più svariati ambiti, quali i processi produttivi, di marketing e amministrativi.

Questo volume vuole sopperire alla mancanza di testi di riferimento in lingua italiana, completi e strutturati, che descrivano la teoria e la pratica dell'elaborazione dei documenti: il Text Mining.

L'obiettivo è fornire concetti fondamentali, quali l'elaborazione del linguaggio naturale, la rappresentazione della conoscenza e l'analisi statistica. Si vuole quindi sottolineare come questi concetti possano essere applicati con successo nella pratica, se affiancati a software performanti come SAS(r) Text Miner, il software utilizzato per i casi studio descritti nel volume.

Il testo si rivolge al mondo accademico e ai professionisti che vogliono cogliere nuove opportunità di mercato, sfruttando tecnologie innovative.

Susi Dulli , docente alla Facoltà di Scienze Statistiche dell'Università di Padova e al Master universitario in Business Analysis, di cui è responsabile per l'area informatica. I suoi interessi di ricerca negli ultimi anni riguardano il Data Mining e il Data Warehousing. È autore di articoli scientifici e di alcuni testi tra cui: Il problema del Data Mining: algoritmi e applicazioni (Cleup 1998), Modelli e Strutture per il Data Warehousing (Diade 2000), Il Datawarehouse al centro del sistema informativo (Diade 2000), Metodi di Data Mining per il CRM (FrancoAngeli 2000).

Paola Polpettini , laureata in Economia e Commercio all'Università degli Studi di Perugia, ricopre dal 2004 il ruolo di specialista per le tecnologie Analitiche e di Customer Intelligence in SAS. Negli ultimi anni ha curato progetti di Data Mining per importanti aziende nei settori servizi e telecomunicazioni.

Massimiliano Trotta , laureato presso la Facoltà di Scienze Statistiche dell'Università di Padova è dottore in Scienze statistiche demografiche e sociali. Attualmente svolge l'attività di analista quantitativo presso Nunatac.


Alberto Saccardi, Presentazione
Walter Lanzani, Presentazione
Massimiliano Trotta, Introduzione
Massimiliano Trotta, Susi Dulli, Verso una definizione di KDT e di TM
(Dal KDD al KDT; Le fasi del processo; Rassegna critica di alcune definizioni)
Massimiliano Trotta, Susi Dulli, Analisi di un processo KDT
(Un approfondimento; Text Refining (TR); Text mining (TM); Risorse)
Massimiliano Trotta, Susi Dulli, Lo scenario attuale
(Sequenze lunghe più frequenti; TM in presenza di conoscenza specifica di settore; Authorship Categorization; Content-Based Collaborative Filtering; Mining e finanza; Mining su conoscenza estratta dal Web; Ricerca di bibliografie scientifiche complementari; Ricerca di regole causali; Tavola riassuntiva; Conclusioni)
Paola Polpettini, Metodologia SAS per il Text Mining
(Introduzione; File pre-processing: preparazione dei documenti per l'analisi; Text parsing: inizia l'analisi dei documenti; Trasformazione: dimension reducation; Clustering: classificazione e previsione; Scoring: applicazione del processo di text mining ad una nuova raccolta di documenti)
Andrea Rizzi, Dal testo non strutturato all'informazione: text mining su PubMed
(Introduzione; Acquisire, sviluppare ed esplicare conoscenza; Prima fase del progetto: indirizzamento automatico di documenti; Seconda parte del progetto: cluster analysis e indirizzamento nelle classi tematiche)
Roberto Fontana, Il text mining è in tavola
(Introduzione; Raccolta e predisposizione dati per l'analisi; Processo di analisi; Text parsing; Singular Value Decomposition; Cluster analysis; Report e profiling; Risultati e considerazioni finali)
Norma Sanga, Text mining per l'analisi dei siti web
(Introduzione; Raccolta e predisposizione dei dati per l'analisi; Processo di text mining; Risultati e considerazioni finali)
Patricia Cerrito, Una potente diagnosi dei livelli di qualità ospedalieri tramite il text mining
(Introduzione; Fattori di rischio dei pazienti; Utilizzo del text mining)

Contributi: Alberto Saccardi, Walter Lanzani, Andrea Rizzi, Roberto Fontana, Patricia Cerrito

Collana: Informatica

Livello: Testi per professional