statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

16
Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete” Maria Gabriella Grassia 1 Università degli Studi di Napoli “Federico II” Paolo Mariani Università degli Studi di Milano-Bicocca Biancamaria Zavanella Università degli Studi di Milano-Bicocca Riassunto. Obiettivo del presente lavoro è illustrare una strategia di analisi utile a studiare le richieste del mondo del lavoro per i laureati in discipline statistiche, suggerendo la possibilità di sfruttare nuove fonti informative per descrivere in modo qualitativo l’effettiva domanda di questi laureati da parte degli operatori. A questo fine si è sfruttato il patrimonio informativo reperibile a costo zero sul Web. Attualmente, infatti, le aziende, principalmente quelle del settore privato, ricercano candidati mediante la pubblicazione di annunci su siti web specializzati. Sono stati analizzati tutti gli annunci pubblicati da aziende private nei siti specializzati nel mese di settembre 2010, contenenti un esplicito riferimento alla statistica. Le tecniche utilizzate per l’analisi dei testi degli annunci sono ascrivibili all’ambito dell’analisi automatica di dati testuali e alla classificazione automatica dei documenti. I risultati mostrano l’eterogeneità delle offerte di lavoro, a conferma del ruolo multidisciplinare, ma anche sfocato, dello statistico. Parole chiave: Profili occupazionali; Inserzioni web; Analisi testuale dei dati; Expectation- maximization algorithm. 1. Introduzione All’interno delle aziende in cui operano, gli statistici svolgono ruoli e mansioni diverse (Martini e Fabbris, 2005): dalla gestione dei sistemi informativi al controllo della qualità e della pianificazione della produzione, dal marketing alle attività di 1 Il presente lavoro è stato finanziato nell’ambito del progetto PRIN 2007 “Modelli, indicatori e metodi statistici per rappresentare l’efficacia formativa di corsi di laurea ai fini dell’accreditamento e del miglioramento”, cofinanziato dal MIUR e dall'Università di Padova (CUP: C91J11002460001), coordinato da Luigi Fabbris. La nota, pur essendo frutto di un lavoro comune è stata redatta da: Biancamaria Zavanella per il Par. 1, Paolo Mariani per i Parr. 2, 4.2 e 5, Maria Gabriella Grassia per i Parr. 3 e 4.1. I dati sono stati raccolti da Chiara Longeri.

Upload: unimib

Post on 20-Nov-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

Maria Gabriella Grassia1

Università degli Studi di Napoli “Federico II”

Paolo Mariani Università degli Studi di Milano-Bicocca

Biancamaria Zavanella

Università degli Studi di Milano-Bicocca Riassunto. Obiettivo del presente lavoro è illustrare una strategia di analisi utile a studiare le richieste del mondo del lavoro per i laureati in discipline statistiche, suggerendo la possibilità di sfruttare nuove fonti informative per descrivere in modo qualitativo l’effettiva domanda di questi laureati da parte degli operatori. A questo fine si è sfruttato il patrimonio informativo reperibile a costo zero sul Web. Attualmente, infatti, le aziende, principalmente quelle del settore privato, ricercano candidati mediante la pubblicazione di annunci su siti web specializzati. Sono stati analizzati tutti gli annunci pubblicati da aziende private nei siti specializzati nel mese di settembre 2010, contenenti un esplicito riferimento alla statistica. Le tecniche utilizzate per l’analisi dei testi degli annunci sono ascrivibili all’ambito dell’analisi automatica di dati testuali e alla classificazione automatica dei documenti. I risultati mostrano l’eterogeneità delle offerte di lavoro, a conferma del ruolo multidisciplinare, ma anche sfocato, dello statistico.

Parole chiave: Profili occupazionali; Inserzioni web; Analisi testuale dei dati; Expectation-maximization algorithm. 1. Introduzione All’interno delle aziende in cui operano, gli statistici svolgono ruoli e mansioni diverse (Martini e Fabbris, 2005): dalla gestione dei sistemi informativi al controllo della qualità e della pianificazione della produzione, dal marketing alle attività di

1 Il presente lavoro è stato finanziato nell’ambito del progetto PRIN 2007 “Modelli, indicatori e metodi statistici per rappresentare l’efficacia formativa di corsi di laurea ai fini dell’accreditamento e del miglioramento”, cofinanziato dal MIUR e dall'Università di Padova (CUP: C91J11002460001), coordinato da Luigi Fabbris. La nota, pur essendo frutto di un lavoro comune è stata redatta da: Biancamaria Zavanella per il Par. 1, Paolo Mariani per i Parr. 2, 4.2 e 5, Maria Gabriella Grassia per i Parr. 3 e 4.1. I dati sono stati raccolti da Chiara Longeri.

78 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

previsione, dalla consulenza vera e propria alle attività di supporto alle decisioni aziendali.

Ciò rende la figura dello statistico piuttosto indefinita. Non è chiaro, infatti, se lo statistico sia da ricondurre a una sola figura o a più figure professionali. A conferma di questo, le richieste di lavoro sono indirizzate non solo a laureati in statistica, ma anche a laureati in altre discipline quali economia, ingegneria gestionale, informatica. In alcuni casi, benché le competenze richieste siano specifiche della figura dello statistico, gli annunci si rivolgono esclusivamente a laureati in altre discipline.

Obiettivo di questo lavoro è indagare gli ambiti occupazionali dello statistico e le mansioni ed i ruoli a lui associati nelle richieste provenienti dal mercato del lavoro italiano, intendendo con il termine “statistico” non solo il laureato in statistica, ma più in generale, chiunque svolga attività professionali connesse alla statistica.

Le usuali fonti disponibili per lo studio della transizione università-lavoro sono relative ad indagini rivolte prevalentemente agli stessi laureati (offerta di lavoro), mentre fonti che descrivano in modo qualitativo il lato della domanda sono molto esigue. Da qui l’esigenza di progettare un approccio per reperire i dati che rispondano a questa esigenza informativa. La soluzione di progettare indagini ad hoc rivolte agli operatori del mercato del lavoro è di difficile realizzazione, a causa degli elevati costi. Si è privilegiata, di contro, una soluzione a costo zero, che consentisse di sfruttare il patrimonio informativo presente sul web, estraendone l’informazione richiesta. Attualmente, infatti, le aziende domandano lavoro pubblicando annunci su siti web specializzati. Si è deciso, perciò di studiare questi annunci di lavoro e di valutarne le potenzialità informative.

Il riferimento è al settore privato, dato che, nel pubblico, il reclutamento avviene attraverso procedure concorsuali, raramente attraverso canali quali il web. Per questo motivo, alcune specializzazioni riferite alla statistica nella pubblica amministrazione probabilmente non compariranno frequentemente su questo canale.

Nel lavoro si analizzano gli annunci di lavoro rivolti a posizioni di statistico, reperiti nei principali siti specializzati nell’incontro tra domanda ed offerta di lavoro, nel mese di settembre 2010. La metodologia di analisi utilizzata è l’analisi di dati testuali, che permette di estrarre informazioni non note a priori, contenute in dati non strutturati.

Il lavoro è nel seguito così organizzato. Nel Par. 2 vengono illustrati l’utilizzo e l’importanza dei siti internet per l’accesso al mercato del lavoro, nel Par. 3 vengono brevemente richiamate le tecniche statistiche utilizzate per l’analisi dei dati testuali, nel Par. 4 viene illustrata la procedura seguita per l’analisi degli annunci di lavoro on-line e i relativi risultati. Infine, nel Par. 5 si traggono alcune considerazioni conclusive.

Il profilo professionale dello statistico: ruoli, competenze e prospettive 79

2. Internet come canale di accesso al lavoro L’attività di reclutamento di personale è da intendersi come la ricerca, sulla base di determinate esigenze dell’azienda, di un certo numero di persone in possesso di un minimo di requisiti tali da soddisfare le esigenze stesse. I datori di lavoro investono una considerevole quantità di tempo e di risorse nella ricerca di nuovi dipendenti per individuare e attrarre i candidati con le caratteristiche desiderate.

Nella letteratura che tratta del mercato del lavoro, la maggior parte degli studi ha considerato le questioni relative al posto da ricoprire, alla durata del periodo di selezione dei candidati e alle strategie che le imprese possono adottare per ridurre al minimo tempi e risorse (Mariani et al., 2011). Questo filone di letteratura si è concentrato sull'utilizzo di canali di ricerca, sulle fonti utilizzate dalle imprese per reperire nuovi lavoratori e sui canali utilizzati dai candidati per accedere al mondo del lavoro (Mocavini e Paliotta, 2002; Zerilli, 1998).

La scelta dei canali di ricerca è di strategica importanza nella maggior parte dei programmi di ricerca del personale, poiché incide sia sul numero dei potenziali candidati, sia sulle loro competenze in termini di conoscenze ed esperienza, sia sull’effettiva corrispondenza tra il posto da ricoprire ed il candidato idoneo a ricoprirlo.

Per quanto riguarda il canale delle inserzioni pubblicate dalle aziende, è opportuno offrire una prima differenza tra quelle pubblicate su carta stampata e quelle on-line. Le prime rivestono un ruolo non trascurabile nella ricerca di personale, nonostante il costo elevato che le imprese devono sostenere per accedervi. Si tratta di un canale particolare, visto dalle imprese come la via per raggiungere personale non altrimenti reperibile, in grado di raggiungere un numero di candidati potenzialmente alto ed operare contestualmente una selezione dovuta al target di lettori della rivista o del quotidiano su cui si pubblica l’annuncio. Tale selezione a priori non avviene su web se non per caratteristiche legate all’accessibilità e alla capacità di ricerca del singolo. Per avere una dimensione del fenomeno, i posti di lavoro offerti tramite inserzioni sui quotidiani italiani hanno registrato nel primo semestre 2009 un numero di annunci pari a 31.8412 (Corsi, 2003; Cuppone et al., 2009). Se si analizza il canale utilizzato per la ricerca del primo impiego, (tendenzialmente un contratto di stage), secondo la ricerca effettuata dall’Istituto per lo Sviluppo della Formazione Professionale dei Lavoratori in collaborazione con il sito “La repubblica degli stagisti”, si nota che il canale informale costituito da internet copre il 26% del flusso di ricerca (ISFOL, 2009).

2 In diminuzione rispetto al primo semestre 2008 (numero di annunci pari a70.319) con un calo del 54,7% .

80 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

Nell'agosto del 2000, un disoccupato su quattro in cerca di lavoro negli Stati Uniti ha riferito di avere regolarmente utilizzato internet per cercare lavoro, una persona occupata su dieci ha detto di aver cercato regolarmente altri posti di lavoro utilizzando il web (Fountain, 2005).

Inoltre, l'uso di internet e dei siti che offrono posti di lavoro è in genere gratuito per i lavoratori e molto più conveniente per le imprese rispetto alle inserzioni di pubblicità effettuate sulla stampa tradizionale. Questi servizi offrono alle imprese e ai lavoratori la possibilità di un accesso immediato a un numero molto maggiore di annunci e inserzioni rispetto ai canali tradizionali, così come le informazioni potenziali che si possono scambiare sono molto più dettagliate da entrambi le parti, azienda e candidato.

Il mismatch nel mercato del lavoro è legato alle caratteristiche del capitale umano dei lavoratori, ai requisiti e ai compensi dei posti di lavoro, ma anche al processo attraverso il quale si ha l’incontro tra i lavoratori e i posti di lavoro (Centra e Tronti, 2011).

Poiché questo processo di incontro dipende in modo cruciale dalla disponibilità di informazioni, sia per lavoratori sia per i datori di lavoro, internet rappresenta un nuovo spazio attraverso il quale queste informazioni possono fluire meglio rispetto ai tradizionali luoghi di incontro di domanda ed offerta.

La proliferazione di migliaia di siti internet che riportano annunci di lavoro, per non parlare degli annunci on-line e dei posti di lavoro pubblicati sui siti web aziendali, indica che il canale è aperto. A tal proposito, in riferimento al mercato italiano, Staglianò (2001) riporta che il Ministero del Lavoro, in un recente censimento, ha contato circa 200 siti specializzati in reclutamento e selezione del personale e, secondo uno studio di Forrester Research, circa il 30% delle persone che hanno accesso a internet li avrebbe visitati almeno una volta.

I disoccupati in cerca di lavoro che utilizzano internet sono anche più propensi a usare allo stesso tempo i tradizionali canali di ricerca di lavoro; ciò sembra suggerire un’attività di ricerca più intensa, orientata su più fronti, offrendo un criterio di segmentazione dell’offerta. Ci sono molti siti internet, come Monster o Infojobs3, progettati per mediare il processo di incontro tra lavoratori e datori di lavoro, oltre agli annunci di lavoro pubblicati direttamente su siti web aziendali dalle imprese stesse. Gran parte dei maggiori quotidiani pubblica i propri annunci economici on-line e spesso includono strumenti che rendono facile la ricerca di offerte di lavoro.

Ma come utilizzare tutto questo patrimonio informativo testuale “a basso costo” presente sul web, al fine di delineare il ruolo che le stesse aziende intendono affidare ai laureati in statistica?

3 Per una rassegna sui principali siti specializzati nell’offerta di lavoro si rimanda alla pagina del seguente sito: www.trovareillavorochepiace.it/links/links annunci di lavoro.htm.

Il profilo professionale dello statistico: ruoli, competenze e prospettive 81

3. La statistica testuale ed il text mining La crescente disponibilità di risorse linguistiche informatizzate e la crescente diffusione dei testi consultabili on-line hanno portato a trovare soluzioni che non si fondano più soltanto su strumenti derivanti dalla statistica testuale (Bolasco, 2004; Lebart e Salem, 1984; Lebart e Morineau, 1985; Lebart e Salem, 1988), ma che scaturiscono da una stretta multidisciplinarità che associa a questi, con uguale importanza, strumenti informatici e linguistici nell’area del text mining.

Il text mining è un’applicazione specifica di text analysis e costituisce solo una delle possibili finalizzazioni di un’analisi testuale in forma automatica (Berry e Kogan, 2010; Bolasco, 2005; Bramer, 2007; Hearst, 2003).

Per text mining si intende l’insieme di tecnologie e procedure che mettono in concatenazione operazioni di information retrieval e information extraction. Tali tecnologie, tendenti a catturare la sola informazione rilevante presente nei testi, integrano in maniera intrinsecamente interdisciplinare metodi statistici propri del data mining e tecniche di intelligenza artificiale, al fine di creare, a partire da fonti non strutturate, conoscenza utilizzabile.

Il text mining è, quindi, un processo che impiega un insieme di algoritmi per la conversione dei testi non strutturati in dati strutturati e fa ricorso a metodi quantitativi di analisi.

Un processo di text mining prevede i seguenti passi: a) la fase dei testi (in cui prevale l’informatica), che consiste nel reperimento dal web

o dai database aziendali delle fonti dei testi (es.: articoli di stampa, annunci di lavoro o altre basi documentali), nella loro formattazione (pre-processing) e nella costituzione del document warehouse;

b) la fase di lexical processing (in cui prevale la linguistica), che consiste nel riconoscere i vocaboli, individuare parole chiave o concetti già noti (text parsing), effettuare lemmatizzazioni;

c) la fase di vero e proprio text mining, in cui la statistica e le tecniche di data mining hanno un ruolo cruciale.

Le procedure e le tecniche di text mining tendono in sostanza a trattare i materiali testuali in formato libero, usa quindi dati non strutturati, estraendo da questi informazioni specifiche da riportare in database tradizionali e creando dati codificati in campi strutturati, dai quali trarre informazione che crei valore. La statistica testuale riveste una funzione cruciale nel text mining per il successo dell’applicazione.

Tecniche di text mining sono state più volte utilizzate per studiare gli annunci di lavoro al fine di comprendere la domanda proveniente dal mercato (Balbi et al.,

82 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

2008; Di Meglio et al., 2007), ma non sono mai state applicate allo studio della professione dello statistico.

4. L’analisi degli annunci di lavoro Lo studio ha riguardato gli annunci di lavoro pubblicati on-line e rivolti a possibili candidati laureati in statistica.

Grazie al processo di text mining, è stata estratta l’informazione utile a delineare il ruolo, le competenze e le prospettive assegnate agli statistici in azienda.

Gli annunci sono il risultato di una ricerca delle parole chiave “offerta lavoro statistica” effettuata on-line tramite il motore di ricerca Google.it4 ed i documenti oggetto dell’analisi sono le offerte di lavoro per statistici collezionati nel mese di settembre 2010. Il corpus è formato da 55 annunci che hanno un orizzonte temporale di pubblicazione che spazia da giugno a settembre 2010.

Gli annunci sono stati classificati in base a: - sito internet su cui erano stati pubblicati; - presenza o meno di una società esterna di recruiting e laddove presente la sua

ragione sociale; - candidato a cui era rivolto, se neolaureato o con esperienza; - settore dell’azienda che ricercava (ove possibile); - contratto offerto, ad esempio stage, contratto a tempo determinato, contratto a

tempo indeterminato (ove possibile); - sede di lavoro (ove possibile). Per quanto riguarda queste ultime tre variabili, non è stato possibile effettuare

classificazioni complete, in quanto si tratta di informazioni non sempre presenti nella descrizione dell’annuncio. Gli annunci per tipologia del sito, sito e relative frequenze sono riportati in Tab. 1.

I siti internet da cui sono stati tratti gli annunci sono 30; il 63,6% presenta l’intermediazione di una società di selezione, mentre i restanti annunci sono stati pubblicati direttamente da aziende. Le società di selezione sono 18: Adecco, Alma Spa, Alvin Consulting, Aquerò, Articolo 1, Gi Group Spa, Hays, Help Lavoro, Manpower Spa, Metis Spa, Obiettivo Lavoro Spa, Page Personnel Italia Spa, Quanta Spa, Randstad Italia Spa, Sixtema, Skill Risorse Umane, Star People Spa, Umana Spa.

4 Il ricorso a Google è giustificato dal fatto che si tratta del motore di ricerca maggiormente utilizzato per scopi sia privati sia lavorativi.

Il profilo professionale dello statistico: ruoli, competenze e prospettive 83

La metà degli annunci è rivolta a persone con una precedente esperienza lavorativa, l’altra metà a neolaureati.

Tabella 1. Annunci per tipologia del sito, sito e relative frequenze, settembre 2010. Fonte: www.google.it

TIPOLOGIA SITO FREQUENZA SITO INTERNET N

JOB-RECRUITING 32

infojobs.it 6 helplavoro.it 3 lavoro.ilcurriculum.net 3 offerte-lavoro.monster.it 3 lavoro.wickedin.it 2 assores.it 1 iowork.it 1 bollettinodellavoro.it 1 cambiolavoro.com 1 candidate.adecco 1 careerbuilder.it 1 catapulta.it/ 1 categorieprotette.it 1 dovajobs.com 1 eurometis.it 1 experteer.it 1 ialweb.it 1 it.fashionjobs.com 1 offertedilavoro.info 1 techcareers.com 1

INFORMAZIONE 12

lavoro.corriere.it 7 lavoro.milanofinanza.it 2 annunci.repubblica.it 2 miojob.repubblica.i 1

ANNUNCI GENERICI 7

kijiji.it 5 milano.bakeca.it 1 subito.it 1

AZIENDA 1 accenture.it 1 UNIVERSITA' 2 almalaurea.it 2 OPERATORI ISTITUZIONALI 1 riminimpiego.it

1

84 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

Con riferimento al luogo, 21 offerte di lavoro provengono da aziende di Milano e provincia, per un totale di 25 annunci dalla Lombardia; 28 annunci provengono da altre regioni dell’Italia, mentre per 2 annunci non è presente l’informazione sulla sede del lavoro. Secondo una recente ricerca pubblicata da Monster, il profilo di chi accede ai siti di reclutamento on-line è costituito per l’11% da manager, per il 4% da figure di minore esperienza. Il 45% di chi si candida on-line dichiara di avere esperienza. Il 34% possiede una laurea, il 30% è costituito da diplomati.

4.1 Le fasi del Text Mining Al fine di evitare che testi più lunghi, con un dizionario quindi più ampio, potessero impattare sui risultati, è stata effettuata una normalizzazione dei testi sugli annunci (in tutto quattro) che presentavano una lunghezza superiore a 200 parole eliminando i frammenti che si allontanavano dalla descrizione vera e propria dell’offerta di lavoro. A seguito di ciò si sono ottenuti annunci di lunghezza compresa tra le 20 e le 160 parole; si è poi proceduto con le varie fasi del text mining che riguardano il trattamento delle parole.

A titolo di esempio si riportano l’annuncio più breve e quello più lungo: “LAUREATO/A in STATISTICA per il ruolo di analista dati: analisi flussi magazzino. Si offre contratto di STAGE” – Adecco; “Il nostro cliente è un importante Gruppo Bancario che, in una fase di sviluppo della propria Area Pianificazione e Marketing, sta ricercando LAUREATO/A IN MATEMATICA/STATISTICA Ricerchiamo un/una giovane laureato/a con interesse a formarsi nell'ambito delle analisi di dati numerici finalizzate ad attività di budgeting e marketing. Il candidato verrà inserito nell'area Pianificazione/Marketing (ricerche di mercato) alle dirette dipendenze del responsabile di settore. In particolare si occuperà di: - fornire supporto al team nell'elaborazione della reportistica richiesta in area

marketing, pianificazione e controllo di gestione - effettuare analisi e la gestione dei dati per vari prodotti dell’azienda - effettuare

attività di analisi previsionali su alcuni prodotti finanziari. - elaborare dati per la definizione del budget - elaborare dati per il controllo di gestione. Il candidato ideale possiede una buona capacità di utilizzo dei principali sistemi di office automation in generale e di Excel nonché la predisposizione ad utilizzare programmi dedicati all'analisi statistica. L'interesse per il settore finanziario rappresenta un elemento preferenziale. Completano il profilo doti di comunicazione e di relazione, predisposizione al lavoro di squadra e capacita di pianificazione e organizzazione della propria attività” - Skill risorse umane.

Il profilo professionale dello statistico: ruoli, competenze e prospettive 85

Nella fase di parsing si è proceduto ad individuare le polirematiche, ossia le prole composte, come ad esempio Knowledege_management, contratto_determinato, contratto_indeterminato.

Con la lemmatizzazione si sono ricondotte le parole al loro lemma, in modo da non avere impatti sull’analisi dovuti a forme lessicali che differiscono solo in base a genere, quantità o, come nel caso dei verbi, a coniugazione. In questo modo, per esempio, nel calcolo delle frequenze del termine “azienda” sono ricomprese le frequenze anche degli aggettivi “aziendale”, “aziendali” e così via.

Nella stessa ottica si è provveduto a tradurre, laddove necessario e possibile, termini dall’inglese all’italiano (es: monitoring in monitoraggio, tool in strumenti), e a rendere omogenee le abbreviazioni (es: telco/ telecomunicazioni/tlc in tlc).

Nella fase di analisi lessicale è stata creata una lista di “parole vuote”, ovvero la lista delle parole da non includere nell’analisi La stop list è stata aggiornata più volte nel corso dell’analisi in quanto, oltre alle preposizioni, congiunzioni, avverbi sono state aggiunte altre forme testuali che non apportavano valore all’analisi, perché presenti con alta frequenza per tutti i testi inseriti nel corpus (Tab. 2).

Tabella 2 Selezione di termini aggiunti alla stop list per numero di annunci e frequenza. Fonte: elaborazioni su dati www.google.it

Termini Numero annunci Frequenza

Esperienza 29 45 Inglese 31 34

Economia 25 28 Capacità 19 25

Ingegneria 22 23 Team 16 19 Excel 15 17

Le forme testuali inserite nella lista sono “vuote”, ma solo fino ad un certo

punto: indicano, infatti, che per fare statistica in azienda sono richieste caratteristiche ricorrenti quali: la laurea in statistica, economia o ingegneria; l’esperienza e la capacità di lavoro in team; la conoscenza di strumenti informatici di base (Excel); la conoscenza della lingua inglese.

Eliminando le forme presenti nella stop list si è proceduto ad analizzare le co-occorrenze rispetto ad alcune parole pivot.

In Fig. 1 sono mostrate le forme più associate alla parola statistica. Dal grafico è possibile anche leggere il livello associazione delle forme, in base allo spessore del

86

raggio che collega la parola dal software.

Le forme che co-occorrono più frequentemente quando è presente la parola statistica sono: marketing, rigestionale, quantitativo, analisi, business, indagine, elemento.

Figura 1. Analisi delle forme associate a "statistica"

4.2 L’estrazione delle tipologie di profili prof Una delle attività più importanti all’interno del processo di nell’analizzare una raccolta di documenti in modo da creare cluster di documenti caratterizzati da specifici termini. La documenti è ottenuta sulla base della presenza e dell'assenza dei concetti centrali estratti nel testo. Idealmente, ogni cluster contiene un diverso insieme di questi concetti. I cluster sono caratterizzati dalle forme testuali che meglio li dequindi consentono una facile interpretazione del loro contenuto.

L’analisi condotta si basa sull’algoritmo non gerarchico maximization (Mitchell,

Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

raggio che collega la parola pivot al centro dell’analisi con le altre forme individuate

occorrono più frequentemente quando è presente la parola sono: marketing, risultato, campagna, comunicazione, analitico, ingegneria

gestionale, quantitativo, analisi, business, indagine, elemento.

Analisi delle forme associate a "statistica"

L’estrazione delle tipologie di profili professionali richiesti

Una delle attività più importanti all’interno del processo di text miningnell’analizzare una raccolta di documenti in modo da creare cluster di documenti caratterizzati da specifici termini. La “clusterizzazione” non supervidocumenti è ottenuta sulla base della presenza e dell'assenza dei concetti centrali estratti nel testo. Idealmente, ogni cluster contiene un diverso insieme di questi concetti. I cluster sono caratterizzati dalle forme testuali che meglio li dequindi consentono una facile interpretazione del loro contenuto.

L’analisi condotta si basa sull’algoritmo non gerarchico , 1997; Prescher, 2004), che integra la ricerca della massima

Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

al centro dell’analisi con le altre forme individuate

occorrono più frequentemente quando è presente la parola sultato, campagna, comunicazione, analitico, ingegneria

text mining consiste nell’analizzare una raccolta di documenti in modo da creare cluster di documenti

non supervisionata dei documenti è ottenuta sulla base della presenza e dell'assenza dei concetti centrali estratti nel testo. Idealmente, ogni cluster contiene un diverso insieme di questi concetti. I cluster sono caratterizzati dalle forme testuali che meglio li descrivono e

L’analisi condotta si basa sull’algoritmo non gerarchico expectation-ricerca della massima

Il profilo professionale dello statistico: ruoli, competenze e prospettive 87

verosimiglianza nella stima dei parametri in modelli statistici. La metodologia itera le seguenti fasi: - Expectation: nel quale si effettua una prima allocazione dei documenti nei cluster

(si calcola la probabilità che un documento appartenga ad un cluster); - Maximization: si parte dalle allocazioni del passo precedente per stimare, in

maniera pesata in base alla probabilità di appartenenza di un documento al cluster, i parametri dei modelli.

Si iterano expectation e maximization fino alla convergenza dei parametri che si stanno stimando.

La procedura di classificazione ha riguardato la totalità degli annunci collezionati ed ha prodotto una classificazione in cinque classi di cui una formata da un solo annuncio, definita come indistinta e della quale non verrà effettuata alcuna trattazione.

In Tab. sono riportate in sintesi le tipologie, con forme testuali e frequenze degli annunci, di seguito descritte.

Gruppo 1: Pianificazione/Produzione (13 annunci) - Sono richiesti in particolare da società di job-recruiting (ad esempio: RANDSTAD ITALIA:3 annnunci; GI Group:3 annunci). Le forme che caratterizzano la tipologia sono: mensile, pianificazione della produzione, produzione, pianificazione, sistema, supportare, progetto, scientifico, definizione, dirigere.

Tabella 3 Tipologie, forme e frequenze degli annunci Forme Frequenze Tipologie

mensile, pianificazione della produzione, produzione, pianificazione, sistema, supportare, progetto, scientifico, definizione, dirigere

13 PIANIFICAZIONE/

PRODUZIONE

information, intelligence, sas, tecnologia, informatica, business, matematica, applicazione, realizzazione, comunicazione

11 INFORMATICA

derivato, econometrico, project, risk management, risk, finanziario, management, financial

7 FINANZA

vendita, dato, marketing, elaborazione, creazione, prodotto, valutazione, analisi, mercato, quantitativo

23 ANALISI DATI

3

88 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

Esempio di inserzione: “La posizione ha lo scopo di garantire alle consociate il corretto livello di stock e di servizio in base agli accordi presi, garantire alla pianificazione della produzione corretta visibilità dei fabbisogni e al Customer Service corretta visibilità dei piani di spedizione, alimentare correttamente la revisione mensile delle previsioni export; la persona si occuperà di controllare settimanalmente le previsioni ricevute dalle consociate, preparare i piani di spedizione, allineamento con la produzione, aggiornamento per i materiali di Packaging; Laurea in Statistica o Ingegneria gestionale. Esperienza gradita di un anno in contesto multinazionale area Supply Chain, sales support, customer service; Ottimo Inglese, Buon utilizzo Pc, Excel e Access, pacchetto office in generale. Gradito SAP. Ottime doti relazionali e ottime capacità analitiche”

Gruppo 2: Informatica (11 annunci) – È la tipologia meno numerosa. Sono pubblicati in particolare da siti di informazione e generici (lavoro.corriere.it - 3; offerte-lavoro.monster.it - 2). I termini caratterizzanti la tipologia sono: information, intelligence, SAS, tecnologia, informatica, business, matematica, applicazione, realizzazione, comunicazione. Esempio di inserzione: “Approfondire le tue conoscenze informatiche e costruirne di nuove integrandole a competenze funzionali relative a diversi settori aziendali. Analisi di processi aziendali implementazione di pacchetti software gestionali sviluppo di soluzioni tecnologiche "customizzate" analisi di ambienti e architetture tecnologiche disegno e ottimizzazione di infrastrutture tecnologiche e applicative information management. Neolaureati specialistici in Ingegneria, Informatica, Matematica, Fisica e Scienze Statistiche Attitudine al problem solving. Spiccata propensione al lavoro in team. Intraprendenza e autonomia organizzativa Buone capacità di comunicazione, scritta e orale. Interesse per le nuove tecnologie. Buona conoscenza della lingua inglese”.

Gruppo 3: Finanza (7 annunci) - Sono pubblicati sia da siti generici sia da società di job-recruiting (cambiolavoro.com; GI Group - 2). I termini caratterizzanti la tipologia sono: derivato, econometrico, project, risk management, risk, finan-ziario, management, financial. Esempio di inserzione: “Ricerchiamo per importante azienda del credito:"Addetto al Risk Management". Requisiti richiesti: Il Candidato deve possedere Laurea in Statistica e/o in Economia. E' richiesta un'esperienza da tirocinio/stage di almeno 6 mesi fino ad impiego di 2 anni, preferibilmente presso Banche Finanziarie, Centri Elaborazione Dati. Sede di lavoro Bologna Centro.”

Gruppo 4: Analisi Dati (23 annunci) - È la tipologia più numerosa. Sono pubblicati in particolare da società di job-recruiting (ad esempio: Page Personnel Italia - 2; GI Group - 4). I termini caratterizzanti la tipologia sono: vendita, dato, marketing, elaborazione, creazione, prodotto, valutazione, analisi, mercato, quantitativo. Esempio di inserzione: “Ricerche e studi di mercato; Elaborazione di dati e reporting; Consumer Panel; Supporto alla progettazione delle indagini di mercato condotte da agenzie esterne. Il tutto a supporto delle attività dei Team

Il profilo professionale dello statistico: ruoli, competenze e prospettive 89

Marketing, Sales e Ricerca e Sviluppo, nell’obiettivo di fornire elementi utili per la revisione delle strategie di marketing, per la valutazione dei volumi di vendita e del potenziale prodotti, e per l’individuazione di segmenti commerciali e di mercato in cui potersi inserire. Laurea in Economia e Commercio/Marketing o in Statistica o affini. - Ottima conoscenza del pacchetto Office (excel livello avanzato) e buona conoscenza della lingua inglese - Esperienza minima di stage o tirocinio - Passione ed entusiasmo per l’analisi quantitativa e le dinamiche legate alle ricerche di mercato - Predisposizione all’uso costante di software gestionali e database di mercato. Precisione, autonomia, problem solving e buone doti relazionali ne completano il profilo”. 5. Conclusioni Obiettivo del presente articolo era dimostrare le potenzialità informative degli annunci di lavoro presenti sul web in merito ai ruoli dello statistico richiesti dal mondo del lavoro, attraverso la sperimentazione e valutazione della procedura di selezione ed analisi degli annunci, al fine di utilizzarla poi su di un insieme riferito ad un arco temporale più ampio, almeno annuale.

La procedura seguita ha consentito di comporre cluster degli annunci relativi ai laureati in statistica, separando i ruoli e le competenze richieste.

Dall’analisi dei risultati ottenuti sul corpus dei soli 55 articoli, appare chiaro che i ruoli e le competenze richieste agli statistici dalle imprese private sono molto differenti: si passa da ruoli dirigenziali legati alla progettazione, alla pianificazione, alla definizione dell’intero sistema, alle mansioni “classiche” di analisi ed elaborazione dei dati in campi quali la finanza ed il marketing, fino ad arrivare a ruoli tecnici e specialistici legati alle funzioni informatiche. Tutto ciò confermerebbe quanto ipotizzato in partenza: all’interno delle aziende gli statistici svolgono ruoli e mansioni molto diverse tra loro e tutto ciò rende la figura dello statistico una figura professionale dai contorni poco definiti e molto sfumati.

Per ottenere una piena conferma empirica sulla figura professionale dello statistico, la procedura descritta verrà ripetuta sugli annunci di lavoro estratti ad intervalli mensili in un arco temporale annuale. Se i risultati ottenuti in questo lavoro fossero confermati, bisognerebbe far riflettere il mondo accademico sull’importanza di una migliore caratterizzazione della professione dello statistico. Sarebbe necessario far capire che lo statistico non è solo colui che utilizza o progetta software informatici per diffondere tabelle e grafici, ma soprattutto la risorsa aziendale che riempie di significato tali tabelle e grafici, in quanto utilizza tutte le sue conoscenze e

90 Statistici e lavoro: un’analisi testuale sui profili richiesti “in rete”

competenze al fine di diffondere un’informazione affidabile. In tal modo sarebbe possibile diffondere una maggiore consapevolezza del ruolo di statistico e stimolare un numero più elevato di richieste da parte del mondo del lavoro di laureati in statistica da impiegare in ruoli appropriati.

Riferimenti bibliografici BALBI S., GRASSIA M.G., INFANTE G. (2008). La rappresentazione delle competenze

nel linguaggio delle università e in quello degli operatori del settore. Relazioni tra corpora. In: S. BALBI, G. BOCCUZZO, M.G. GRASSIA (a cura di) Profili formativi e bisogno di competenze nel terzo settore. CLEUP, Padova, 83-94.

ISFOL (2009). Gli stagisti italiani allo specchio. Sondaggio Isfol- Repubblica degli stagisti.

BERRY M., KOGAN J. (2010). Text mining, applications and theory. Wiley, Chicester.

BOLASCO S. (2004). L’analisi statistica dei dati testuali: intrecci problematici e prospettive. In: E. AURELI, S. BOLASCO (a cura di) Applicazioni di analisi statistica di dati testuali. Casa Editrice Università “La Sapienza”, Roma: 9-26

BOLASCO S. (2005). Statistica testuale e text mining: alcuni paradigmi applicativi, Quaderni di Statistica, 7, Napoli: 17-53.

BRAMER M. (2007). Principles of Data Mining. Springer, London.

CENTRA M., TRONTI L. (2011). Capitale umano e mercato del lavoro, Osservatorio Isfol, 1: 31-44.

CORSI E. (2003). La domanda di lavoro attraverso le inserzioni sui giornali - L’anno dei paradossi. Rapporto 2002 sul mercato del lavoro e le politiche di lavoro in provincia di Milano. Osservatorio del mercato del lavoro, Franco Angeli, Milano: 493-519.

CUPPONE M., MOCAVINI A., PALIOTTA A.P., RAUCO G. (2010). La domanda di lavoro qualificato nel 1 semestre 2009: le inserzioni sui quotidiani, Collana Studi Isfol, n. 2/2010.

DI MEGLIO E., GRASSIA M.G., MISURACA M. (2007). The Ideal Candidate. Analysis of Professional Competences through Text Mining of Job Offers, in: L. FABBRIS (a cura di), Effectiveness of University Education in Italy. Physica Verlag, Heidelberg: 261-275.

FOUNTAIN C. (2005). Finding a job in the Internet age, Social Forces, 83: 1235-1262.

HEARST M.A. (2003). What is Text Mining. Berkeley. Unpublished essay.

LEBART L., MORINEAU A. (1985). Systeme Portable pour l’Analyse des Données (SPAD). Cesia, Paris.

LEBART L., SALEM A. (1988). Analyse Statistique des Données Textuelles. Dunod, Paris.

LEBART L., SALEM A. (1994.) Statistique Textuelle. Dunod, Paris.

Il profilo professionale dello statistico: ruoli, competenze e prospettive 91

MARIANI P., MUSSINI M., ZAVANELLA B. (2011). Servizi pubblici per l’impiego e imprese: un’analisi della relazione tra preselezione e job matching, Rivista di Economia e Statistica del Territorio, n.1, Franco Angeli, Milano: 106-133.

MARTINI M., FABBRIS L. (2005). Analisi delle competenze dei laureati in Scienze Statistiche di Padova, in F. D’OVIDIO (a cura di), Professioni e competenze nel lavoro dei laureati, Cleup, Padova: 295-315.

MITCHELL T.M. (1997). Machine Learning, McGraw-Hill, New York.

MOCAVINI A., PALIOTTA A.P. (2002). I canali di ricerca del personale tra tradizione e innovazione, Franco Angeli, Milano.

PRESCHER D. (2004). A Tutorial on the Expectation-Maximization Algorithm Including Maximum-Likelihood Estimation and EM Training of Probabilistic Context-Free Grammars, arXiv:cs.CL/0412015

ZERILLI A. (1998) (a cura di). Reclutamento, selezione e accoglimento del personale, Franco Angeli, Milano.

Work and Statisticians: Analysis of the job offers on the web by textual analysis

Summary. Aim of this paper is to propose a strategy for the analysis of the job offers for statisticians. We propose the use of job advertising published on the web. Especially private firms use specialized web sites in order to find the ideal candidate for whom they are looking. We analyzed with text mining techniques the job advertisements published in September 2010, that required statistical competences. Our results show that job advertisements for statisticians are disparate, because of the multidisciplinary, but also vague, role of this profession.

Keywords. Occupational Profiles; Web Advertisements; Textual Data Analysis; Algorithm Expectation-Maximization.