Download

I dataset della DBpedia Italiana possono essere scaricati dai link nella tabella sottostante.
Tutte le risorse si trovano nel namespace:

http://it.dbpedia.org/resource/

Siccome l’italiano è una lingua con segni diacritici (per lo più accenti), le risorse sono espresse in formato IRI con codifica di caratteri UTF-8, prive di tutti quei simboli percentuali che le renderebbero illeggibili. Ad esempio:

http://it.dbpedia.org/resource/Canicattì

I dataset estratti si riferiscono al dump di Wikipedia in italiano del 21 gennaio 2015.

Dataset Triple Scarica
Tipi DBTax 1608958 ttl.gz
Link agli articoli Wikipedia 6963670 ttl.gz
Etichette Risorse 1740919 ttl.gz
Template Wikipedia 6246466 ttl.gz
Coordinate Geografiche 100146 ttl.gz
Redirezioni 566972 ttl.gz
ID Pagine 2255412 ttl.gz
Tipi Stimati Airpedia 3398500 ttl.gz
Link Interlingua 5597508 ttl.gz
URI Revisioni 2255412 ttl.gz
ID Revisioni 2255412 ttl.gz
Gerarchia Categorie 1007680 ttl.gz
Proprietà Mappate 6646810 ttl.gz
Etichette Categorie 257976 ttl.gz
Disambiguazioni 314538 ttl.gz
Tipi Mappati 8927793 ttl.gz
Link Ufficiali 133477 ttl.gz
Riassunti Brevi 307008 ttl.gz
Riassunti Lunghi 307066 ttl.gz
Etichetta e Tipo Proprietà Template 25320 ttl.gz
Link Interni 38831300 ttl.gz
Risorse Concettuali 528 ttl.gz
Immagini 2571332 ttl.gz
Proprietà Mappate Specifiche 330460 ttl.gz
Link Esterni 1199719 ttl.gz
Categorie Wikipedia 1597718 ttl.gz
Proprietà Grezze 22992460 ttl.gz
Link a Wikidata 1433621 ttl.gz