DBpedia al Google Summer of Code 2013

Comments Off on DBpedia al Google Summer of Code 2013
Share

GSoC 2013

Siamo orgogliosi di annunciarvi che il progetto DBpedia è stato accettato al Google Summer of Code 2013!!!

Attenzione! Le application degli studenti terminano il 3 maggio alle 19 UTC, ovvero alle 21 ora italiana! Le linee-guida per una buona application con DBpedia le trovate qui. Che aspettate?

Di seguito le idee che porterebbero grande beneficio alla DBpedia italiana. Marco F. ne sarà mentore ufficiale. Contattatelo direttamente via mail o Twitter.

Inferenza dei tipi per estendere la copertura dell’ontologia

Attualmente, esistono molte entità prive di un tipo in DBpedia. Estendere la copertura dell’ontologia di DBpedia è un passo fondamentale per l’esposizione di dati ad alta qualità.
Diversi articoli scientifici pubblicati recentemente utilizzano varie funzioni (categorie, infoboxes, abstract, altre proprietà DBpedia, etc.), per dedurre in automatico il tipo delle entità.
Altre idee includono lo sfruttamento delle coordinate (geolocalizzazione) per inferire che l’entità sia un luogo. Siccome Freebase ha più tipi di DBpedia, creare uno strumento di importazione sarebbe estremamente utile.

Verifica della consistenza dell’ontologia

Data la natura comunitaria dell’ontologia DBpedia, chiunque può modificarla e aggiungere / eliminare / modificare le sue classi e proprietà. Questo ha portato ad una struttura concettuale ‘caotica’ , che è in completo contrasto con l’idea fondamentale di un’ontologia, cioè, di fornire uno strato di coerenza ai dati eterogenei provenienti dai diversi capitoli di Wikipedia.
Gli approcci automatici recentemente proposti possono essere un valido punto di partenza per pulire lo stato attuale della ontologia, a cominciare dalla gerarchia delle classi.
Inoltre, possono essere utilizzati come strumento per evitare la ridondanza, ad esempio per avvisare un contributore umano quando sta cercando di aggiungere qualche nuova classe o proprietà già presente con un nome simile.

Estendere la sintassi del Wiki per i mapping

Attualmente, editare un mapping che abbia una buona copertura, cioè che non generi problemi a un sottoinsieme particolare di articoli Wikipedia, è un’impresa complessa.
È necessario quindi estendere le potenzialità del Wiki di mapping, risolvendo i seguenti problemi già segnalati nell’issue tracker di DBpedia. Il più importante per la DBpedia italiana è evidenziato in grassetto:

  • Gestire correttamente la presenza di più template in una pagina (issue #17)
  • Costruire oggetti con l’aggiunta di prefissi / suffissi (issue #20)
  • Estendere mappature condizionali a condizioni più complesse (issue #19)
  • Generare proprietà invertite (issue #32)
  • Mappare le categorie sulle classi (issue #21)
  • Aggiungere un nuovo estrattore che sarà la combinazione di infobox mapping e parsing, per produrre solo triple nel namespace property, se non sono mappate (issue #22)

Tutte le altre idee le trovate sulla pagina ufficiale.

Non sapete cos’è il Google Summer of Code?

Semplice, è un evento all’insegna dell’open source dove Google funge da agenzia tra una miriade di aziende, enti, istituzioni e altrettanti (anzi molti di più) studenti desiderosi di dare il loro contributo.
Gli studenti selezionati ricevono gloria e remunerazione da Google e le organizzazioni ottengono gratuitamente miglioramenti al proprio software.

Comments are closed.