24.10.05

[marketing] La risposta italiana a Skype fa Skypho

Non me ne vogliano gli “informatici eclettici” di Eutelia, ma la possibilità di giocare con il nome da loro scelto per il nuovo servizio di VoIP era troppo allettante.
Ebbene, come segnalato nell’articolo di Dario Bonacina (fratellino del sottoscritto, n.d.r.), l’azienda di telecomunicazioni di Arezzo, società quotata in Borsa, ha appena lanciato un nuovo servizio con tariffe piuttosto interessanti.
Non parlerò, però, qui delle caratteristiche di Skypho, già ampiamente illustrate con maestria e perizia dall’autore sopra citato (e qui verrò tacciato di facile piaggeria, ma infatti è proprio così), ma di temi inerenti il marketing di prodotto.
Skypho è, infatti, un tipico esempio di servizio nato e promosso in un ambiente esclusivamente e squisitamente tecnologico.
I laboriosi informatici di Eutelia, avrebbero dovuto essere accompagnati, al termine del loro viaggio di sviluppo, da altrettanto dinamici consulenti di marketing, che li avrebbero dissuasi dal battezzare un servizio con questo nome.
Le cui motivazioni, peraltro, non convincono affatto. Si legge infatti sul sito: “Il giorno in cui il progetto prendeva forma, un temporale sovrastava la sede di Eutelia ed i fulmini colpivano il traliccio in ferro che la domina; da qui il nome Skypho quale diminutivo di Sky Phone (telefono del cielo)."
Non stento a credere che sulla home page di Eutelia non appaia il lancio di Skypho, quasi a intendere che lo si voglia allontanare dai riflettori.
Dal momento che ho la presunzione di scrivere un blog che ha anche una funzione educativa, snocciolerò alcuni pratici consigli a l’americaine a vantaggio di tutti i tecnologi che provano un prurito alle mani quando si interfacciano con gli addetti del marketing:
  • metti a freno l’entusiasmo di avere finalmente in mano il prodotto finito. Ora comincia un lavoro altrettanto difficile di promozione, nonché di mantenimento. È richiesta una pianificazione e un po' di pratica di organizzazione: vendere un prodotto non è un'attività che si improvvisa. Cosa penseresti se tutti gli sforzi che hai profuso nella creazione di qualcosa venissero vanificati da una campagna di vendita fallimentare?
  • non affidare mai il nome, che è un brand a tutti gli effetti, a un “eclettico tecnico informatico” senza infarinature di marketing;
  • puoi scegliere per il tuo prodotto un nome spiritoso, ma non grottesco. Terminologicamente c’è una grande differenza tra i due vocaboli, sebbene possano sembrare vicini tra loro. Lo spiritoso è ammiccante, il grottesco turba. Nell’esempio in questione Skypho mi sa tanto di presa per i fondelli;
  • non presentare un prodotto con frasi prive di effetto come "È un progetto nato dalle menti sconvolte di alcuni informatici eclettici di Eutelia spa". Raccoglierai simpatie tra gli addetti ai lavori, non tra il grande pubblico. Per pensare a come strutturare un messaggio, mettiti nei panni dell’utente a cui è rivolto: cosa possono pensare un avvocato, una casalinga di Voghera qualsiasi, un giornalista, un tecnico meccanico, un impiegato amministrativo, quando leggono quella frase? Vedo già le loro espressioni perplesse.
  • mai creare un brand che fa il verso al nome di un prodotto concorrente. Verrai identificato subito come un follower, uno che sta dietro, anzi, peggio, che vuole stare dietro. Ma non solo. Tutti penseranno a te come a un gregario, perché non stai facendo altro che far pubblicità a Skype. Se il servizio si fosse chiamato, supponiamo, EuPhone, l’utente avrebbe avuto meno possibilità di collegarsi mentalmente a Skype.
  • Rivolgiti pure a me se hai bisogno di un ausilio. Tariffe scontate per chi legge conneXioni

[tendenze] Inform trova le notizie giuste al momento giusto

Ecco un bell’esempio di come stanno evolvendo i motori di ricerca per offrire servizi innovativi alle sempre crescenti esigenze degli utenti.
Inform è un motore di ricerca, dedicato esclusivamente alle news, che consente di trovare le news che interessano con collegamenti ad altre notizie correlate.
Utilizzando tecnologie di Text Mining, mediante l’elaborazione del linguaggio naturale e la strutturazione dell’informazione, Inform categorizza automaticamente gli articoli provenienti da centinaia di fonti informative diverse (agenzie, giornali, ma anche blog), ne estrae gli elementi fondamentali e permette il collegamento delle news attraverso questi.
Altra caratteristica differenziante di Inform, è l’analisi del’intero testo, e non, come spesso avviene in altri strumenti automatici, solo dell’abstract o delle prime righe.
La pagina introduttiva di Inform presenta le Top News, ma c’è la possibilità di creare una propria cartella dove depositare le news di interesse.
È possibile connettere gli argomenti rilevanti di un articolo, le persone, i luoghi, le aziende, i prodotti, con altri articoli, attività che solitamente richiede una specializzazione e un dispendio di risorse e di denaro: basta ciccare sull’immagine Collegamento a fianco del titolo della notizia.
Per il momento la connessione con altre news è un processo perfettibile: appaiono infatti dei macroargomenti e/o delle entità i cui collegamenti sono a categorie o ad altre entità un po' generiche.
Al momento, quindi, la tecnologia sembra ancora un po’ primitiva: ho condotto alcuni test e i collegamenti forniti non sempre sono puntuali, ma spesso piuttosto generici.
Ma mi aspetto che da una società formata da 55 persone fondata da Neal Goldman, fondatore e CEO di CapitalIQ (acquisita da Standard Poors l'anno scorso per circa 225 milioni di dollari), prima o poi esca uno strumento raffinato e meglio utilizzabile.

18.10.05

[tendenze] In E-stonia si vota online

Anche se si tratta solo dell'1% degli aventi diritto al voto su una popolazione totale di 1.400.000 abitanti, in Estonia 10.000 persone hanno dato la loro preferenza nelle elezioni amministrative attraverso un sistema di voto via Internet.
L'esperimento, condotto da lunedì a mercoledì scorso è stato, secondo le autorità, un successo: non sono state riportate frodi né brogli né tentativi di intrusione da parte di hackers, tanto che il governo prevede votazioni online anche per le prossime elezioni parlamentari del 2007.
Nel resto del mondo sussiste invece ancora un vasto timore sulla sicurezza di questo approccio: nel 2004 il Pentagono ha cancellato un progetto di votazione via Internet dedicato ai militari e ai cittadini residenti oltreoceano, e anche nel Regno Unito il piano di diffusione del voto elettronico si è fermato.
Dall'altra parte, le primarie del 2000 in Arizona e del 2004 in Michigan si sono svolte in parte anche online e, inoltre, la città di Ginevra in Svizzera nel 2003 ha cominciato ad accettare voti via Internet per alcuni referendum comunali.
Secondo alcuni esperti, il sistema di voto dell'Estonia è il più avanzato del mondo e inoltre la repubblica baltica possiede l'infrastruttura informatica più all'avanguardia nelle repubbliche dell'ex Unione Sovietica.
Il sistema, basato su Linux, è stato testato nel gennaio scorso, quando 600 persone votarono per un referendum riguardante la capitale, Tallinn.
Per dare il proprio voto, gli elettori devono fornirsi di un lettore di carte con microchip (del costo di 22 €) utilizzate dal 2002 per accedere ai servizi bancari e fiscali.

17.10.05

Il Text Mining per la Business Intelligence: parte II

In questa percorso all’interno del Text Mining ho voluto stravolgere il modello espositivo canonico che prevede prima una descrizione e un’esposizione teorica dell’argomento e poi un’esposizione delle possibili applicazioni, allo scopo di andare incontro all’esigenza del lettore di delinearsi delle applicazioni esemplificative e poi rispondere all’eventuale esigenza di approfondimento.
Nella seconda parte, quindi, si parlerà della teoria che sta dietro al Text Mining e di come è possibile estendere la conoscenza di un’azienda per abbracciare tutte quell’abbondanza di informazioni all’interno di testi e documenti che normalmente vengono ignorate.

Il Text Mining per la Business Intelligence
Sebbene i data warehouse siano ormai uno strumento consolidato nelle aziende, molti di essi non hanno le caratteristiche per trattare documenti testuali: l’obiettivo primario è stato fino ad oggi sviluppare warehouse per gestire dati numerici, e i ritorni sono stati considerevoli. Le metodologie e gli strumenti sono ormai maturi e vengono accompagnati da best practice elaborate nel corso degli ultimi 5-6 anni.
È giunto il momento per focalizzarsi sul valore contenuto nei documenti e le tecnologie di Text Mining ci consentono di gestire nuove fonti di Business Intelligence.
Quali sono I motivi per cui diventa necessario inserire il trattamento delle informazioni all’interno della Business Intelligence?
Innanzitutto, ci sono moltissime informazioni critiche all’interno dei documenti che rimangono non accessibili: i sistemi di BI che poggiano sui data warehouse forniscono dati fattuali (che rispondono alla domanda che cosa è successo), ma solitamente non riescono a comprenderne i motivi. Ad esempio, supponiamo di scoprire che i margini sulle vendite di un prodotto sono diminuiti del 20% negli ultimi tre mesi, ma di non conoscerne le cause. Forse un concorrente ha lanciato sul mercato un prodotto alternativo a minor prezzo o di qualità superiore? Forse una politica di cross-selling ha comportato una limitazione dei margini? Che ci sia un altro distributore dello stesso prodotto e quindi un nuovo concorrente?
Non è semplice avere una risposta chiara a queste domande, soprattutto perché è necessario ricercarla in una plethora di documenti che va dalle e-mail, alle notizie, dai comunicati stampa alle campagne marketing, dai bilanci alle analisi di mercato.
Inoltre, gli attuali strumenti di gestione dei documenti non sono adeguati per incontrare esigenze della BI, poiché sono dedicati a insiemi di documenti omogenei, non all’eterogeneità dei testi che ogni giorno abbiamo a disposizione.
Anche i motori di ricerca non consentono di raggiungere un’alta precisione e un alta percentuale di recall (per precisione definiamo una misura di quanti documenti risultano da una ricerca che soddisfano il criterio di ricerca, mentre per recall si intende una misura percentuale di quanti documenti sono stati individuati su quanti invece avrebbero dovuto essere individuati).
Infine, i documenti sono distribuiti in una serie di piattaforme eterogenee, in diversi formati e linguaggi, solitamente senza un associazione con metadati che consentono di comprenderne il contenuto.

Davvero i testi non sono strutturati?
Una delle caratteristiche degli strumenti di BI è di consentire una visione integrata dell’organizzazione senza che l’utilizzatore si preoccupi della fonte originale dei dati
Sebbene sia semplice con strumenti di ETL (extraction-trasformation-loading) accedere alle fonti informative strutturate, così non è per i testi non strutturati.
Qui però è opportuno fare un’osservazione: il testo è spesso descritto come non strutturato, ma questo non è un attributo del tutto corretto. Il linguaggio è estremamente strutturato su molteplici livelli, come ben affermano i linguisti: i principi strutturali sono identificati nella formazione delle parole (morfologia), nella creazione di frasi grammaticali (sintassi) e nella rappresentazione del significato (semantica).
Più alti livelli di struttura possono essere identificati in discorsi, conversazioni, trattati, etc.
Analizzando la struttura del linguaggio è possibile quindi estrarre le informazioni contenute nel testo e dopo decenni di lavoro nel campo della linguistica computazionale, questa è diventata un’attività a cui possono accedere sempre più utilizzatori.

Le basi del Text Mining

Definito come studio e attività di estrazione di informazioni da testi utilizzando la linguistica computazionale, il Text Mining è costituito da un insieme di metodologie e tecnologie che consentono di:

  • Estrarre dati e entità (features) un testo
  • Effettuare un’indicizzazione tematica
  • Raggruppare documenti dello stesso argomento (Clustering)
  • Riassumere un testo

Queste quattro tecniche sono essenziali perchè consentono di risolvere due problemi chiave dell’utilizzo dei testi nella Business Intelligence: rendono l’informazione testuale accessibile e riducono il volume di testi che devono essere letti e analizzati dagli utenti finali alla ricerca di informazioni.
L’estrazione di features consente di individuare particolari informazioni all’interno di un testo: un’applicazione può determinare che l’azienda A fa parte del gruppo di aziende B e che l’amministratore delegato di D è il signor K.
Oppure, in un’analisi di merge & acquisitions, si possono determinare le aziende coinvolte, i costi, i meccanismi di finanziamento etc. O ancora che la società E ha, tra i suoi shareholders, una quota consistente appartenente alla società F che a sua volta è partecipata o di proprietà dell’azienda G.
L’indicizzazione tematica utilizza la conoscenza del significato dei termini di un testo per identificare gli argomenti trattati in un documento: ad esempio, documenti che parlano di aspirina o ibuprofene possono essere classificati sotto la categoria analgesici.
Spesso l’indicizzazione è implementata utilizzando tassonomie multidimensionali: una tassonomia è uno schema gerarchico di rappresentazione della conoscenza, ed è spesso definita anche con il termine di ontologia. A differenza delle tassonomie implementate da Yahoo o da dmoz, che consentono una navigazione ad albero all’interno delle categorie, le tassonomie consentono di ricercare un documento per argomento anziché per parole chiave.
Il Clustering è una tecnica utilizzata per raggruppare documenti simili dipendentemente dalle caratteristiche dominanti: per descrivere un documento, infatti, viene utilizzato un vettore contenente una lista degli argomenti principali o delle parole chiave con un peso numerico indicante l’importanza di ogni argomento o termine.
I documenti sono descritti con un piccolo insieme di termini o argomenti scelti da migliaia di potenziali dimensioni.
Non esiste un’unico modo per gestire il clustering, ma a tutt’oggi vengono applicati tre approcci: il clustering gerarchico, quello binario e le mappe auto-organizzate.
Il primo tipo di clustering utilizza un approccio basato su un set: il vertice della gerarchia è un set di tutti i documenti appartenente a una collezione, e le foglie dell’albero sono set con documenti individuali, mentre i livelli intermedi contengono insiemi di documenti via via meno popolosi.
I cluster binari sono simili ai cluster k-NN del data mining: ogni documento è contenuto in uno e un solo cluster, ed essi sono creati per massimizzare la similarità tra documenti in un cluster e minimizzarla tra documenti in cluster differenti.
Le mappe auto organizzate utilizzano le reti neurali per mappare documenti da spazi multi-dimensionali in mappe bidimensionali: documenti simili tendono verso la medesima posizione in una griglia a due dimensioni.
Riassunto di un testo (summarization): lo scopo della summarization è la descrizione del contenuto di un documento e la riduzione del testo da leggere. Gli argomenti principali di molti documenti possono essere descritti con solo il 20% del testo originale, senza perderne il senso.
Come nel clustering, esistono diversi approcci e algoritmi alla summarization: alcuni usano l’analisi morfologica dei termini per identificare le parole più utilizzate eliminando le parole poco significative. Altri algoritmi pesano maggiormente i termini usati nell’apertura o nella chiusura delle frasi, mentre altri approcci cercano frasi chiave che identificano frasi importanti come ad esempio “in conclusione” e “il concetto fondamentale” etc

Il Text Warehouse
Per estendere il Data Warehouse con una componente in grado di gestire testi sono necessarie nuove strutture dati e nuovi strumenti.
Introdurre testi in un DB non è un problema, in quanto ogni RDBMS supporta i BLOB (Binary Large Objects); per quanto riguarda i metadati, sarà necessario supportare informazioni inerenti il documento originale, la sua analisi, il contenuto, i collegamenti.
I metadati di analisi descrivono il tipo di processo di Text Mining applicato ai documenti, mentre i dati di contenuto includono gli attributi delineati dal Dublin Core, uno standard per metadati dedicato alle risorse Internet che include titolo, autore, soggetto, descrizione, data di pubblicazione, formato e collegamenti con altri documenti. I metadati sul contenuto includeranno anche informazioni estratte dal Text Mining, come le features e le relazioni di business menzionate nel testo.

16.10.05

[sicurezza] Apre Anti-Phishing Italia

Da alcuni giorni è attivo in rete il sito http://www.anti-phishing.it/ dedicato alla lotta alle truffe on-line.Gli obiettivi di Anti-phishing Italia sono essenzialmente rivolti ad informare gli utenti dei rischi che corrono durante la navigazione ed a suggerire loro alcuni rimedi per evitare spiacevoli conseguenze. Il sito si articola in approfondimenti tematici relativi ai più importanti argomenti della società dell’informazione, archivi aggiornati circa i principali attacchi segnalati e riscontrati, contributi di carattere legale dedicati agli illeciti informatici ed un’apposita sezione relativa alle leggi ed alle sentenze principalmente rilevanti per l’internet.
Anti-phishing Italia è un osservatorio sul mondo degli illeciti legati alla rete, promosso da uno staff formato da informatici, giornalisti, avvocati ed aperto a collaborazioni esterne.
Fonte: i-dome

7.10.05

Il Text Mining: prima parte

Per una definizione di Text Mining
Sappiamo che il data mining permette di scoprire nuovi punti di vista e correlazioni trovando dei pattern in dati che non sarebbero correlabili con le tradizionali query e le tecniche di reporting. Queste tecniche permettono di confrontare dati provenienti da fonti eterogenee di diverso tipo ed estrarre informazioni che non sarebbero visibili all’utente, organizzare documenti e informazioni per soggetto e argomento.
Il text mining è l’applicazione delle metodologie del data mining a dati poco o non strutturati.
Opera in un mondo meno strutturato dove i documenti hanno raramente una strutturazione, e, laddove esiste, è inerente al formato del documento, non al contenuto.
Il text mining permette l’estrazione di metadati dai documenti e il conseguente inserimento in un DB sul quale si potranno effettuare analisi di data mining.
Le tecniche di text mining sono il modo per estendere le metodologie di data mining al volume di testi immenso e in via di espansione mediante un processo automatico che produce dati strutturati.
In questo breve articolo parlerò di tre aspetti dell’impiego delle tcnologie di TM, ovvero dei settori di interesse, dei tipi di applicazione e delle strategie da adottare.
Da un esame della letteratura e delle applicazioni disponibili, al momento il TM è stato impiegato nei seguenti settori di mercato:

  • Information Technology e Internet
  • Aziende di telecomunicazione
  • Editoria
  • Pubblica amministrazione
  • Aziende finanziarie ed assicuratrici
  • Aziende farmaceutiche


Sebbene apparentemente si possano riscontrare scarsi legami tra i settori sopra citati, è opportuno precisare che il TM non si occupa solo di documenti, ma di dati testuali in genere: quindi, che si tratti di brevetti, di e-mail dei propri clienti, di sondaggi, di articoli di giornale, di informazioni pubblicate su un sito web, di pratiche amministrative e legali, di curriculum vitae, il text mining viene in aiuto per estrarre e organizzare l’informazione.

Knowledge Management
Il text mining è usato per supportare i processi decisionali in situazioni dove è presente un sovraccarico di informazioni (information overflow). Utlizzato per estrarre informazioni significative per scopi di Business Intelligence e per classificare documenti non strutturati, il text mining permette l’indicizzazione di testi utilizzando keyword, temi e concetti.
Un interessante applicazione è nella gestione del personale dove, attraverso applicazioni di TM è possibile monitorare le opinioni dei dipendendi di un’azienda e ottimizzare la gestione dei curriculum vitae, estraendone le informazioni ed inserendole in un apposito DB.

Marketing
Il TM può qui essere utilizzato soprattutto in due ambiti: il CRM e l’analisi del mercato
Nella gestione dei clienti, il TM consente la raccolta, l’analisi e la gestione di documenti o di testi liberi contenuti in centinaia di siti web, agenzie stampa, e-mail, chat line, news group, forum, e blog, nonché nei messaggi stessi che i clienti inviano all’azienda (sotto forma di email o di trascrizioni di chamate telefoniche).
Le soluzioni coprono differenti aree applicative: servizi e prodotti offerti ai clienti, call center, customer care, previsione e ottimizzazione della relazione con i clienti, trend di mercato, etc.
Queste soluzioni consentono alle società di:

  • ottenere un monitoraggio immediato sulle opinioni dei clienti, sia sulla propria azienda , sia sui competitor;
  • consentire aggiornamenti costanti sui trend di comportamento;
  • fare opera di prevenzione e contenimento;
  • risparmiare i costi di sondaggi a campione;
  • fidelizzare i cliente attraverso l’erogazione di servizi puntuali ed efficienti.

L’opportuna applicazione delle metodologie di TM abilita i clienti all’analisi dell’attività della concorrenza nei diversi ambiti del mercato: in questo caso gli strumenti di Text Mining permettono di verificare, in funzione di determinati parametri, (ad esempio storicamente) l’impegno di una determinata azienda in un settore specifico e successivamente di organizzare le informazioni estratte.Il sistema consente attraverso meccanismi di Clustering di mettere in relazione determinati eventi quali la partecipazione di un azienda a particolari congressi o conferenze, la presenza di determinati brevetti, etc. e individuare quali relazioni intercorrono tra la stessa società e specifiche metodologie di produzione al fine di intuire quali nuovi prodotti sono in fase di studio o di test.

Tecnologia
Il Technology Watch consente di individuare l’emergere di nuovi trend nell’ambito delle tecnologie già affermate o al contrario di mostrare l’inizio del declino di altre tecnologie consolidate e tutto questo fin dai primi indizi.
Stime recenti attestano che il TW riesca ad identificare una nuova via d’accesso sul mercato tecnologico con circa cinque anni di anticipo rispetto al suo definitivo consolidamento.
Il Technology Watch consente di monitorare in modo costante l’attività di diversi attori della scena tecnologica, identificando gli eventuali legami e determinando l’andamento nel tempo del loro impegno nello sviluppo di specifiche tecnologie.
L’attività di Technology Watch riguarda argomenti diversi, dando così vita a varie tipologie di monitoraggio tecnologico:

  • Monitoraggio tecnologico sulle innovazioni e i servizi di Ricerca e Sviluppo
  • Monitoraggio sulle pubblicazioni scientifiche
  • Analisi dei brevetti

Il TW è indirizzato:

  • All’azienda che desidera ricercare in modo efficiente nuove metodologie di produzione o individuare tempestivamente le strategie della concorrenze
  • Al parco scientifico e tecnologico impegnato in ambito nazionale nella valorizzazione, nell’analisi e nel trasferimento dell’innovazione verso il tessuto produttivo.

Continua...