*

Pycon otto

firenze

6-9 aprile 2017

Word Embedding: come codificare il linguaggio naturale per algoritmi di previsione e classificazione

Da qualche anno si parla sempre più insistentemente di Word Embedding, identificando così quell’insieme di tecniche che tentano di modellare il linguaggio umano creando una mappatura delle parole nel campo vettoriale. Come spesso accade per ambiti in rapido sviluppo, si è assistito alla nascita di diversi approcci algoritmici tra i quali a volte è difficile districarsi. Da questo punto di vista un linguaggio di propotipazione rapida come Python consente l’implementazione e l’utilizzo di una serie di librerie al fine di scegliere di volta in volta quelle che meglio modellano il problema in esame. Il talk mostra la potenzialità del word embedding entrando nel merito di due applicazioni reali relative a due contesti lontani fra loro, quali quelli della pubblica amministrazione e del privato. In ambito PA viene mostrato come, analizzando le descrizioni progettuali presentate da un insieme di aziende ad un importante istituto italiano, è possibile prevedere l’esito delle rispettive richieste di finanziamento, consentendo di aumentare in modo sostanziale il numero degli investimenti. Nella seconda parte ci spostiamo invece nel privato e mostriamo come codificare un’informazione naturalmente non strutturata, come la descrizione di un intervento in una officina meccanica, rendendola così gestibile al pari di quella strutturata.

in on sabato 8 aprile at 09:45 See schedule

Comments

  1. Gravatar
    Il talk eventuale sarà fatto da me e da Felice Tuosto.
    — Andrea Ianni,
  2. Gravatar
    C'e' gia' un'idea delle librerie/framework che saranno presentati? Grazie.
    — Alberto Pettarin,
  3. Gravatar
    Sicuramente scikit-learn, gensim, pandas e le altre per visualizzazione
    — Felice Tuosto,
  4. Gravatar
    Ciao, sono interessato all'argomento ma difficilmente riuscirò ad essere presente fisicamente.
    Sarebbe possibile assistere alla presentazione via streaming, anche nei giorni successivi eventualmente?

    Grazie
    — Fabio Pettenuzzo, Reply,
  5. Gravatar
    Ciao Fabio! Sicuramente sarà tutto on-line nel post-evento (nel caso ci sentiamo per slides e quant'altro)! Sai che ci farebbe comodo un'opinione? Sei più interessato alla parte matematica dietro il funzionamento degli algoritmi, all'implementazione in python oppure a come l'approccio word embedding è stato usato per lo specifico problema? Siamo in fase di sviluppo del discorso e stiamo cercando di capire che tipo di platea potremmo trovare...!
    — Andrea Ianni,

Nuovo commento