7.10.05

Il Text Mining: prima parte

Per una definizione di Text Mining
Sappiamo che il data mining permette di scoprire nuovi punti di vista e correlazioni trovando dei pattern in dati che non sarebbero correlabili con le tradizionali query e le tecniche di reporting. Queste tecniche permettono di confrontare dati provenienti da fonti eterogenee di diverso tipo ed estrarre informazioni che non sarebbero visibili all’utente, organizzare documenti e informazioni per soggetto e argomento.
Il text mining è l’applicazione delle metodologie del data mining a dati poco o non strutturati.
Opera in un mondo meno strutturato dove i documenti hanno raramente una strutturazione, e, laddove esiste, è inerente al formato del documento, non al contenuto.
Il text mining permette l’estrazione di metadati dai documenti e il conseguente inserimento in un DB sul quale si potranno effettuare analisi di data mining.
Le tecniche di text mining sono il modo per estendere le metodologie di data mining al volume di testi immenso e in via di espansione mediante un processo automatico che produce dati strutturati.
In questo breve articolo parlerò di tre aspetti dell’impiego delle tcnologie di TM, ovvero dei settori di interesse, dei tipi di applicazione e delle strategie da adottare.
Da un esame della letteratura e delle applicazioni disponibili, al momento il TM è stato impiegato nei seguenti settori di mercato:

  • Information Technology e Internet
  • Aziende di telecomunicazione
  • Editoria
  • Pubblica amministrazione
  • Aziende finanziarie ed assicuratrici
  • Aziende farmaceutiche


Sebbene apparentemente si possano riscontrare scarsi legami tra i settori sopra citati, è opportuno precisare che il TM non si occupa solo di documenti, ma di dati testuali in genere: quindi, che si tratti di brevetti, di e-mail dei propri clienti, di sondaggi, di articoli di giornale, di informazioni pubblicate su un sito web, di pratiche amministrative e legali, di curriculum vitae, il text mining viene in aiuto per estrarre e organizzare l’informazione.

Knowledge Management
Il text mining è usato per supportare i processi decisionali in situazioni dove è presente un sovraccarico di informazioni (information overflow). Utlizzato per estrarre informazioni significative per scopi di Business Intelligence e per classificare documenti non strutturati, il text mining permette l’indicizzazione di testi utilizzando keyword, temi e concetti.
Un interessante applicazione è nella gestione del personale dove, attraverso applicazioni di TM è possibile monitorare le opinioni dei dipendendi di un’azienda e ottimizzare la gestione dei curriculum vitae, estraendone le informazioni ed inserendole in un apposito DB.

Marketing
Il TM può qui essere utilizzato soprattutto in due ambiti: il CRM e l’analisi del mercato
Nella gestione dei clienti, il TM consente la raccolta, l’analisi e la gestione di documenti o di testi liberi contenuti in centinaia di siti web, agenzie stampa, e-mail, chat line, news group, forum, e blog, nonché nei messaggi stessi che i clienti inviano all’azienda (sotto forma di email o di trascrizioni di chamate telefoniche).
Le soluzioni coprono differenti aree applicative: servizi e prodotti offerti ai clienti, call center, customer care, previsione e ottimizzazione della relazione con i clienti, trend di mercato, etc.
Queste soluzioni consentono alle società di:

  • ottenere un monitoraggio immediato sulle opinioni dei clienti, sia sulla propria azienda , sia sui competitor;
  • consentire aggiornamenti costanti sui trend di comportamento;
  • fare opera di prevenzione e contenimento;
  • risparmiare i costi di sondaggi a campione;
  • fidelizzare i cliente attraverso l’erogazione di servizi puntuali ed efficienti.

L’opportuna applicazione delle metodologie di TM abilita i clienti all’analisi dell’attività della concorrenza nei diversi ambiti del mercato: in questo caso gli strumenti di Text Mining permettono di verificare, in funzione di determinati parametri, (ad esempio storicamente) l’impegno di una determinata azienda in un settore specifico e successivamente di organizzare le informazioni estratte.Il sistema consente attraverso meccanismi di Clustering di mettere in relazione determinati eventi quali la partecipazione di un azienda a particolari congressi o conferenze, la presenza di determinati brevetti, etc. e individuare quali relazioni intercorrono tra la stessa società e specifiche metodologie di produzione al fine di intuire quali nuovi prodotti sono in fase di studio o di test.

Tecnologia
Il Technology Watch consente di individuare l’emergere di nuovi trend nell’ambito delle tecnologie già affermate o al contrario di mostrare l’inizio del declino di altre tecnologie consolidate e tutto questo fin dai primi indizi.
Stime recenti attestano che il TW riesca ad identificare una nuova via d’accesso sul mercato tecnologico con circa cinque anni di anticipo rispetto al suo definitivo consolidamento.
Il Technology Watch consente di monitorare in modo costante l’attività di diversi attori della scena tecnologica, identificando gli eventuali legami e determinando l’andamento nel tempo del loro impegno nello sviluppo di specifiche tecnologie.
L’attività di Technology Watch riguarda argomenti diversi, dando così vita a varie tipologie di monitoraggio tecnologico:

  • Monitoraggio tecnologico sulle innovazioni e i servizi di Ricerca e Sviluppo
  • Monitoraggio sulle pubblicazioni scientifiche
  • Analisi dei brevetti

Il TW è indirizzato:

  • All’azienda che desidera ricercare in modo efficiente nuove metodologie di produzione o individuare tempestivamente le strategie della concorrenze
  • Al parco scientifico e tecnologico impegnato in ambito nazionale nella valorizzazione, nell’analisi e nel trasferimento dell’innovazione verso il tessuto produttivo.

Continua...

Nessun commento: