I dati delle nostre API

 Come sono strutturati, le fonti che usiamo, e i contenuti che offrono. Con esempi pratici di output.

        

Atoka API: struttura, fonti e logiche di interrogazione dati

 1. Come sono organizzati i nostri dati
 2. Fonti
 3. Dati


1. Come sono organizzati i nostri dati

Struttura logica

Questa sezione illustra la struttura logica dei dati disponibili via API, al di là di come sono fisicamente memorizzati e di come possono essere interrogati programmaticamente. Ci limiteremo, in questa sede, ad una vista semplificata e “a volo d’angelo”, al solo fine di facilitare la comprensione della struttura generale. I dettagli saranno discussi nelle sezioni seguenti.

La struttura dei dati è nativamente relazionale e non può quindi essere semplicemente rappresentata in una tabella bidimensionale (si pensi ad esempio ad una azienda che possiede numerosi immobili, ciascuno dei quali avente un proprio indirizzo e una propria dimensione in vani). Per semplicità e per meglio comprendere la struttura dei dati, possiamo pensare ad essi come ad un grafo: i nodi del grafo rappresentano le entità principali (aziende, persone, immobili, luoghi, etc.) e gli archi tra i nodi rappresentano le relazioni esistenti tra le entità (es: possesso, localizzazione, ruolo, etc.).

Si noti che sia alle entità, sia alle relazioni, possono — e spesso lo sono — essere associate una serie di “proprietà”, che ne descrivono ulteriormente alcuni aspetti (es: nome, partita iva, natura giuridica per una azienda; codice fiscale, genere e data di nascita per una persona, etc). Nella figura qui sotto, visualizziamo a titolo di esempio solo alcune delle proprietà e delle relazioni esistenti.

Struttura fisica: scegliere la strategia di interrogazione

Data la struttura altamente relazionale dei dati, per gestire la complessità e l’ampia dimensione dei nostri archivi, i dati vengono resi accessibili in forma “denormalizzata” in differenti API Endpoints. I diversi endpoint corrispondono più o meno ai diversi tipi di entità presenti nel grafo (esiste ad esempio un endpoint per le aziende, uno per le persone, un altro per i luoghi, etc.). Sebbene accedendo ad un endpoint sia spesso comunque possibile seguire certe relazioni e accedere alle entità connesse e alle loro proprietà, questo non è sempre possibile per motivi di performance. Ad esempio: interrogando l’endpoint companies per Poste Italiane SPA è possibile accedere solo ad alcune delle decine di migliaia di sedi locali dell’azienda! Per ottenere una lista completa con tutti i dettagli e gli indirizzi è necessario usare l’endpoint Locations.

La scelta della modalità con cui interrogare i dati, degli endpoints e dei parametri da usare in una query dipendono quindi dal vostro specifico caso d’uso, non esiste una strategia universalmente valida.

I “cittadini di prima classe”: le entità principali della struttura dati

Alle entità principali rappresentate nella struttura dati, corrisponde nella maggior parte dei casi uno specifico endpoint. Le entità principali sono univocamente identificate da almeno un identificatore, detto “atoka id”, ciò non toglie che ad una entità possa corrispondere più d’un identificatore[1] (ad esempio la partita iva e il numero REA per le aziende, il codice fiscale per le persone, etc).

 

Soggetti Economici

 

        Aziende

        Sono l’entità principale e raccolgono oltre 15 milioni di aziende operative e non operative, tra quelle iscritte e non iscritte al REA (Repertorio delle notizie Economiche e Amministrative). Tra le iscritte vi sono Società di Capitali (sottoposte, tra l’altro, all’obbligo di deposito dei bilanci), Società di Persone, Società Cooperative, Ditte Individuali e numerose altre tipologie di aziende. Tra le aziende non iscritte al REA, sono presenti circa 2 milioni di organizzazioni, tra cui professionisti, associazioni, condomini e molte altre tipologie di organizzazioni non soggette all’obbligo di registrazione al REA.

        

        Pubbliche Amministrazioni

        Oltre 22mila enti pubblici suddivisi in più di 90mila unità organizzative, provenienti dall’indice nazionale delle Pubbliche Amministrazioni.

 

        Persone Fisiche (Soci ed Esponenti)

        Comprendono i soci e gli esponenti (persone fisiche che detengono cariche e poteri all’interno di una organizzazione), per circa 13mln di persone. Ove disponibili, oltre alle quote di partecipazione e le cariche aziendali, alle persone fisiche sono associati gli immobili di loro proprietà.

 

Sedi

Rappresentano le unità territoriali delle aziende (compresa la sede legale) e possono essere di diversa natura (sede operativa, magazzino, punto vendita, etc.).

 

Luoghi (entità geografiche)

Rappresentano le unità amministrative territoriali, organizzate secondo un albero logico, che va dalla regione fino alla cella censuaria.

 

Immobili

Sono gli immobili da fonte catastale associati alle aziende o alle persone fisiche. Tra le proprietà degli immobili sono disponibili l’indirizzo, la tripla catastale, la categoria catastale, la rendita e, per determinate tipologie di immobile, anche le dimensioni e una stima del valore di mercato (secondo il modello proprietario di Cerved Group).

 

Contratti

Sono i contratti pubblici banditi da Pubbliche Amministrazioni e appaltati a una o più aziende. Comprendono tutti i contratti sottoposti a vigilanza dell’Autorità Nazionale Anti Corruzione.

 

News

Si tratta di oltre 70mila news analizzate ogni giorno da algoritmi automatici, i quali le associano alle aziende e agli esponenti aziendali che vi sono menzionati. Le news provengono da oltre 3000 quotidiani e periodici cartacei e digitali, nazionali e locali.

 

Liste

Sono insiemi arbitrari di aziende definite dagli utenti della piattaforma Atoka. Una lista appartiene a uno specifico utente e può essere condivisa in lettura o in scrittura con altri utenti della piattaforma.

 

Settori

È l’insieme dei settori nazionali definiti dalla Classificazione delle Attività Economiche (ATECO), allineati alla nomenclatura internazionale NACE

 

Entità (concetti/keywords)

Si tratta di un vocabolario di oltre 4 milioni di differenti concetti, ciascuno corrispondente ad una pagina Wikipedia, associati automaticamente ai soggetti economici mediante l’analisi semantica dei loro siti web, dell’oggetto sociale, dei social media e di altre fonti documentali.

 

Tecnologie

Si tratta di un insieme di tecnologie web, tra le quali piattaforme di ecommerce, sistemi di pagamento, sistemi di content management e molte altre, associate ai soggetti economici mediante l’analisi automatica dei loro siti web.

 


2. Fonti

Di seguito un elenco generale delle fonti che vengono utilizzate per reperire i dati disponibili sulla piattaforma Atoka:

  • Registro Imprese della Camera di Commercio — visure camerali, bilanci, XBRL
  • Cerved Group S.P.A. — calcolo e rielaborazioni di vari dati: bilanci d’esercizio, gruppi finanziari ed altri
  • Siti web delle aziende — meta-informazioni e testo delle pagine web
  • Account social delle aziende (facebook, twitter)
  • IndicePA — indice delle pubbliche amministrazioni
  • Registro Informatico dei Protesti ed altri registri — l’estrazione di negatività e calcolo di relativi score
  • Consit — pregiudizievoli e altri atti di conservatoria
  • ANAC (Autorità Nazionale AntiCorruzione) — contratti pubblici
  • SISTER di Agenzia delle Entrate — dati immobiliari e catastali
  • OpenPolis — dati sulle persone politicamente esposte
  • INPS — dati trimestrali su numero dipendenti
  • Accredia — certificazioni ISO
  • Numerosi siti web per l’estrazione di notizie collegate ad esponenti ed aziende

A seconda della natura delle fonti e di logiche di ottimizzazione, gli aggiornamenti seguono profili diversi, come giornalieri (es. notizie), settimanali (es. dati da Registro Imprese, IndicePA), mensili (es. dati web), fino a quasi annuali (es. dati da bilanci).


3. Dati

Alcuni numeri

  • aziende operative: 6MLN
  • aziende non operative: 9MLN
  • aziende con stato di operatività ignoto: 2.3MLN
  • persone: 14MLN
  • contratti pubblici: 12.8MLN
  • sedi aziende operative: 17MLN

 

Nota: le metriche di copertura vengono fornite generalmente per aziende operative. In particolare, le aziende il cui stato di operatività non è noto non sono incluse nei conteggi in quanto generalmente molto variabili per quantità e qualità di dati ad esse collegati.

Dati anagrafici

Frequenza di aggiornamento: giornaliera

Dato presente per: 95% - 100%/ aziende operative, 62 - 100%/non operative[2] 

 

I dati anagrafici di aziende e persone fisiche sono ricavati dalle visure camerali, le quali vengono raccolte e processate da Cerved. Questo vale sia per le aziende — persone giuridiche — che per le persone fisiche collegate alle aziende tramite legami di partecipazioni o cariche ufficiali.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_base.html#companies_packages

pacchetto: base

endpoint: companies

Esempio

id

6da785b3adf2

vat

02241890223

taxID

02241890223

legalName

SpazioDati S.R.L

legalClass

Società di Capitale

legalForms

{

"level": 1,

    "name": "Società Di Capitale"

},

{

"level": 2,

    "name": "Società A Responsabilità Limitata"

}

startup

false

…*

...

REA

210089

founded

2012-02-13

*la numerosità delle colonne in esempio è stato limitata per questioni di visualizzazione.

Sedi

Frequenza di aggiornamento: giornaliera

Dato presente per (sedi legali): 98%/ aziende operative, 86% /non operative

 

Gli indirizzi di sedi legali e unità locali sono geolocalizzati e arricchiti con coordinate per permetterne la visualizzazione su una mappa. Questo non avviene per gli indirizzi legati alle persone.

L’indirizzo è esposto sia in formato completo, sia diviso per componenti: toponimo, nome della via, numero civico, codice avviamento postale etc.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_locations.html#companies_packages

pacchetto: locations

endpoint: companies

 

Nota: l’endpoint /company ha un limite riguardo le sedi pari a 10. Il numero totale delle sedi disponibili per l’azienda viene mostrato nel campo count.

Per ottenere informazioni circa tutte le sedi di un’azienda è necessario utilizzare l’endpoint /locations.

Esempio

oggetto registeredAddress (sede legale):

pacchetto: base

address

"fullAddress": "Via Dell'Unione Europea, 6/A-6, 20097, San Donato Milanese (MI)",

"lat": 45.41691,

"lon": 9.25743,

"latlonPrecision": 90,

"macroregion": "Nord-ovest",

"municipality": "San Donato Milanese",

"postcode": "20097",

"province": "Milano",

"provinceCode": "MI",

"region": "Lombardia",

"state": "Italia",

"streetName": "Dell'Unione Europea",

"streetNumber": "6/A-6",

"toponym": "Via"

 

oggetto location:

pacchetto: locations

id

0ef76064b441

type

Studio

address

"fullAddress": "Via Mario Giuntini, 25, 56023, Navacchio, Cascina (PI)",

"hamlet": "Navacchio",

"lat": 43.68490295,

"lon": 10.48699555,

"latlonPrecision": 90,

"macroregion": "Centro",

"municipality": "Cascina",

"postcode": "56023",

"province": "Pisa",

"provinceCode": "PI",

"region": "Toscana",

"state": "Italia",

"streetName": "Mario Giuntini",

"streetNumber": "25",

"toponym": "Via"

Bilanci e dipendenti

Frequenza di aggiornamento: annuale, ~6 mesi dopo la data di chiusura

Dato presente per:

Bilanci — 16% / aziende operative[3]

58% / Società di Capitale2 (le uniche soggette in Italia all’obbligo di deposito del bilancio)

Dipendenti — 74% / aziende operative

 

Il dato grezzo è rappresentato da bilanci e documenti ad esso collegati — come XBRL, bilanci ottici, note integrative, etc  — di fonte Deposito Bilanci di Registro Imprese (Camera di Commercio). Sulla base di questi dati Cerved elabora i cosiddetti “bilanci riclassificati” in seguito a normalizzazioni, verifiche e modifiche per correggere eventuali errori; questi dati comprendono anche ulteriori indicatori e quantità calcolate dal gruppo Cerved utili per analisi di bilancio. Si noti che per effetto di suddette modifiche alcune voci generalmente disponibili nei bilanci “originali” sono mancanti o modificate, in quanto — ad esempio — possono riguardare valori e dimensioni spesso effetto di operazioni contabili e di conseguenza non robuste per la creazione di indici e analisi di bilancio.

Il dato esposto è denominato riclassificato per via della riclassificazione che viene operata basandosi su diverse tipologie di aziende (industriale, immobiliare, finanziaria, leasing, holding).

È compresa la differenziazione tra bilanci d’esercizio e consolidati.

 

Nel pacchetto economics è anche presente l’info sulla serie storica trimestrale dei dipendenti di fonte Infocamere.

I campi capitalStock e public infine mostrano rispettivamente il capitale sociale estratto da Visura camerale e se l’azienda è quotata in borsa.

 

Sono inoltre disponibili a richiesta (contattare sales@atoka.io):

  • fino alle ultime tre annualità della totalità delle voci presenti nei bilanci riclassificati Cerved Group (CeBi)
  • fino alle ultime dieci annualità dei bilanci in formato IV direttiva CEE

 

Qui di seguito un esempio preso dal tab Bilanci di Atoka. In questo caso sono selezionati per il confronto due bilanci d’esercizio IV direttiva CEE:

 

 

In questo caso l’azienda presenta tutti i bilanci disponibili tra: riclassificato CeBi d’esercizio e consolidato (3 annualità); IV direttiva d’esercizio e consolidato (10 annualità).

Atoka API

documentazione: https://developers.atoka.io/v2/companies_economics.html#companies_packages

pacchetto: economics

endpoint: companies

Esempio

balanceSheets

[

  {

    "assets": 598900000,

    "capitalStock": 50450000,

    "currency": "EUR",

    "date": "2017-12-31",

    "latest": true,

    "profit": 48435000,

    "revenue": 3790000,

    "staffCosts": 4294000,

    "year": 2017

  },

]

employees

[

   {

        "date": "2018-09-01",

        "latest": true,

        "value": 1075,

        "year": 2018

   },

]

 

capitalStock

"value": 50521142

public

true

Partecipazioni

Frequenza di aggiornamento: giornaliera

Dato presente per: 24% / aziende operative

 

Le partecipazioni derivano anch’esse dai dati disponibili tramite visura camerale. Sotto una soglia minima non vengono mostrate su Atoka (percentuali irrisorie).

Per ogni azienda sono disponibili sia le informazioni sugli azionisti dell’azienda che le partecipazioni in possesso della stessa. È incluso in questo pacchetto di informazioni anche il dato sul chi possiede più del 25%, talvolta identificabile come “titolare effettivo”; tuttavia, vi sono alcune eccezioni (tra cui finanziarie, holding ed altre) per le quali questo non è individuato con una persona fisica.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_shares.html#companies_packages

pacchetto: shares

endpoint: companies

Esempio

beneficialOwnerOf

[

 {

        "active": true,

        "cervedId": 364943955,

        "id": "1335c3c19a47",

        "legalName": "CERVED RATING AGENCY S.P.A.",

        "name": "CERVED RATING AGENCY S.P.A."

},

]

shareholders

[

{

        "active": true,

        "cervedId": 6436606,

        "company": true,

        "id": "d8a23b3def67",

        "lastUpdate": "2019-02-27",

        "legalName": "\"GRUPPO MUTUIONLINE S.P.A.\" IN BREVE \"GRUPPO MOL S.P.A.\" O ANCHE MOL HOLDING S.P.A.\"",

        "name": "\"GRUPPO MUTUIONLINE S.P.A.\" IN BREVE \"GRUPPO MOL S.P.A.\" O ANCHE MOL HOLDING S.P.A.\"",

        "ratio": 0.03,

        "typeOfRight": "proprietà"

},        

]

sharesOwned

[

{

        "active": false,

        "amount": 50000000,

        "cervedId": 362377641,

        "id": "936f12733738",

        "lastUpdate": "2014-05-06",

        "legalName": "CERVED GROUP SPA",

        "name": "CERVED GROUP SPA",

        "ratio": 1,

        "typeOfRight": "proprietà"

},

{

        "active": true,

        "amount": 10776,

        "cervedId": 2118704,

        "id": "fabf60f9ca03",

        "lastUpdate": "2018-05-16",

        "legalName": "MAJOR 1 S.R.L.",

        "name": "MAJOR 1 S.R.L.",

        "ratio": 1,

        "typeOfRight": "proprietà"

},        

]

Persone

Frequenza di aggiornamento: settimanale

Copertura: 14 MLN di persone

 

I dati sulle persone mostrate su Atoka si riferiscono prettamente a individui collegati ad aziende tramite legami di partecipazione o cariche ufficiali. Il numero complessivo ad oggi è di circa 14 milioni. La fonte primaria è sempre il Registro Imprese, dal quale vengono reperite informazioni quali:

  • generalità
  • codice fiscale (e di conseguenza luogo e data di nascita)
  • ultimo indirizzo noto (ove disponibile)
  • ruoli ufficiali e partecipazioni in imprese

 

Ulteriori informazioni possono essere legate ad un individuo:

  • contatti: email lavorative ricavate dal sito web aziendale
  • sottoscore di negatività, calcolato sulla base delle negatività direttamente collegate alla persona e/o delle aziende a cui essa è legata
  • sottoscore immobiliare, calcolato sui dati immobiliari (quantità, tipo, dimensione etc.)
  • sottoscore centralità: indicatore dell’influenza della persona nella rete aziendale italiana
  • immobili: dato puntuale sugli immobili legati alla persona riportato in SISTER
  • cariche politiche nelle amministrazioni locali e centrali, presenti o passate
  • notizie: news che gli algoritmi di SpazioDati associano a quella persona

 

 

Atoka API

Nota: l’endpoint /company ha un limite riguardo gli esponenti pari a 10. Il numero totale viene comunque mostrato nel campo count. L’ordine rispecchia l’importanza della persona secondo le cariche ad essa attribuite. Nel caso sia necessario ottenere informazioni sulle eventuali altre persone associate all’azienda, oltre le 10 fornite tramite il pacchetto people nell’endpoint /companies si prega di contattare sales@atoka.io.

 

documentazione: https://developers.atoka.io/v2/companies_people.html#companies_packages

pacchetto: people

endpoint: companies

 

Esempio

Livello 0:

count

37

 

Per persona:

birthDate

"1964-09-15"

cLevels

["CEO"]

familyName

De Bernardis

gender

M

givenName

Gianandrea

id

py4FRPsOixZ6ugCImG

name

Gianandrea De Bernardis

roles

[

        {

        "name": "amministratore delegato",

        "since": "2018-10-29"

        },

        {

        "name": "vice presidente consiglio amministrazione",

        "since": "2016-05-03"

        },

        {

        "name": "consigliere",

        "since": "2014-03-25"

        },

        {

        "name": "vice chairman e chief executive officer"

        }

]

 

Network (relazioni dirette e indirette)

Utilizzando i dati relativi alle partecipazioni, cariche ufficiali, titolari effettivi ed eventuali gruppi vengono sviluppati i grafici disponibili alla voce Network su Atoka.

Atoka API

L’informazione è accessibile tramite API Cerved: https://developer.cerved.com/.

Entities

Frequenza di aggiornamento: settimanale

Dato presente per: 42% /aziende operative (aziende con almeno un entity associata)

 

Tecnologia proprietaria di SpazioDati, le entities — anche chiamate parole chiave — sono un ricco dato collegato a concetti individuati da pagine Wikipedia; possono essere legate ad aziende o persone.

Le fonti per la rilevazione di queste parole chiave sono: dati testuali provenienti da Registro Imprese (es. descrizione attività), testo del sito web e account social.

Le entities sono anche collegate a persone fisiche qualora queste posseggano partecipazioni di, o abbiano ruoli ufficiali in aziende alle quali sono state a loro volte assegnate delle entities.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_entities.html#companies_packages

pacchetto: entities

endpoint: companies

 

 

Esempio

de

[{

        "name": "Ausbildung",

        "score": 0.3333333333333333,

        "uri": "http://de.wikipedia.org/wiki/Ausbildung"

}]

en

[{

        "name": "Education",

        "score": 0.3333333333333333,

        "uri": "http://en.wikipedia.org/wiki/Education"

}]

fr

[{

        "name": "Éducation",

        "score": 0.3333333333333333,

        "uri": "http://fr.wikipedia.org/wiki/%C3%89ducation"

}]

it

 [{

        "name": "Educazione",

        "score": 0.3333333333333333,

        "uri": "http://it.wikipedia.org/wiki/Educazione"

}]

pt

[{

        "name": "Educação",

        "score": 0.3333333333333333,

        "uri": "http://pt.wikipedia.org/wiki/Educa%C3%A7%C3%A3o"

}]

Contatti

Frequenza di aggiornamento: giornaliera

Dato presente per:

numeri di telefono: 37.8% / aziende operative

email: 11.3% / aziende operative

 

I contatti (email, fax, numeri di telefono) legati ad aziende derivano sia da fonti ufficiali — visure camerali, pubblica amministrazione —, che non ufficiali — siti web, social. 

Atoka API

documentazione: https://developers.atoka.io/v2/companies_contacts.html#companies_packages

pacchetto: contacts

endpoint: companies

Esempio

emails

{

        "address": "consit@cerved.com",

        "type": "other",

        "verified": true

},

fax

[

   "+39 02 2940 1153"

]

phones

[

   {

        "fullAddress": "Via Dell'Unione Europea, 6/A-6, 20097, San Donato Milanese (MI)",

        "locationId": "3063a2fa9127",

        "number": "+39 02 277 1121",

        "source": "phone books",

        "verified": true

   },

   {

        "number": "+39 800 029 029",

        "source": "web",

        "verified": false

   },

...

]

Siti web

Aggiornamento: mensile

Dato presente per: 11.3% / aziende operative

 

SpazioDati utilizza tecniche di crawling del web per poter ottenere un database esaustivo dei possibili siti web corporate; in seguito a specifiche logiche di matching questi siti web, ove possibile, vengono accoppiati ad un’azienda.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_web.html#companies_packages

pacchetto: web

endpoint: companies

Esempio

allDescriptions

[

        {

                "provenance": [

                        "facebook"

                ],

                "source": "https://www.facebook.com/cervedgroup/",

                "text": "Cerved è il più grande Information Provider in Italia e una delle principali agenzie di rating in Europa"

}

]

description

"Cerved è il più grande Information Provider in Italia e una delle principali agenzie di rating in Europa"

keywords

[ "cerved", "smart data" ]

languages

[ "en",   "it" ]

logo

https://s3-eu-west-1.amazonaws.com/static-mastergraph-spaziodati-eu/resources/logos/47cf3b46031d9bd9491ea76ec64f1b20f49ed7ba.png

websites

[

   {

        "active": true,

        "url": "http://www.cerved.com"

   },

   {

        "active": true,

        "confidence": 0.9547110921,

        "url": "http://company.cerved.com"

   }

]

Account social

Frequenza di aggiornamento: mensile

Dato presente per: almeno un social: 5.1% / aziende operative

 

Tramite le suddette procedure di crawling del web, SpazioDati estrae anche gli account social relativi alle aziende. I social ad oggi supportati sono:

  • facebook
  • twitter
  • linkedin
  • instagram
  • youtube
  • vimeo
  • flickr
  • googleplus

 

Sono disponibili anche degli indici di attività dei suddetti account social, in riferimento a due differenti finestre temporali: globale è calcolato sui 12 mesi mentre locale su 3; questi indici sono espressi in termini di quantili. Per dettagli si faccia riferimento al link alla documentazione qui di seguito.

Atoka API

documentazione: https://developers.atoka.io/v2/companies_socials.html#companies_packages

pacchetto: socials

endpoint: companies

Esempio*

facebook

"id": "158085997557040",

"likes": [

{

        "count": 763,

        "date": "2015-12-31T12:00:00.000000"

},

{

        "count": 1002,

        "date": "2016-06-02T12:00:00.000000"

},

{

        "count": 1023,

        "date": "2016-06-09T12:00:00.000000"

},

...

],

"url": "https://www.facebook.com/cervedgroup"

 

linkedin

[

{

        "url": "http://www.linkedin.com/company/cerved-group-spa"

},

]

scores

{

        "blog": 0,

        "facebookGlobal": 0.6877,

        "facebookLocal": 0.7536,

        "global": 0.9106,

        "globalLabel": "top",

        "local": 0.9267,

        "localLabel": "top",

        "presence": 0.75,

        "twitterGlobal": 0.8389,

        "twitterLocal": 0.813,

        "updateTime": "2019-02-24"

},

 

twitter

"followers": [

{

        "count": 269,

        "date": "2016-06-16T12:00:00.000000"

},

{

        "count": 357,

        "date": "2017-01-19T12:00:00.000000"

},

],

"friends": [

{

        "count": 247,

        "date": "2016-06-16T12:00:00.000000"

},

{

        "count": 263,

        "date": "2017-01-19T12:00:00.000000"

},

],

"url": "https://twitter.com/cervedcom"

*non incluse perché non presenti per quest’azienda esempio:  instagram, vimeo, flickr, youtube.

Immobili

Frequenza di aggiornamento: settimanale sulla base delle movimentazioni dei giornalieri di conservatoria

Dato presente per: 9.5% / aziende operative

Copertura: 98.2% di Società di Capitale e Società di Persone operative

 

Dati resi disponibili da SISTER (gestito dall'Agenzia delle Entrate), compresi di:

  • indirizzo dell’immobile
  • metadati (lotto, sezione, …)
  • tipo (residenza ad uso abitativo, terreno, ...)
  • dimensione
  • proprietà (titolari[4], quote, etc)

 

A queste informazioni Cerved aggiunge una stima relativa al valore dell’immobile.

Nelle API Atoka informazioni base circa le categorie aggregate degli immobili possono essere ricavate tramite l’endpoint /companies — descritte qui sotto —, mentre i dati completi sono reperibili mediante l’utilizzo dell’endpoint /realestate dedicato.

Atoka API

Per l’endpoint companies:

documentazione: https://developers.atoka.io/v2/companies_realEstate.html#companies_packages

pacchetti: realestate

endpoint: companies

Esempio

categories

[

   {

        "code": "A/10",

        "label": "Uffici e studi privati"

   },

   {

        "code": "C/6",

        "label": "Stalle, scuderie, rimesse, autorimesse (senza fine di lucro)"

   },

]

 

Per l’endpoint realestate:

documentazione: non ancora disponibile

pacchetti: base,owners

endpoint: realestate

Esempio

Lista di oggetti così definiti:

 

pacchetto base

address

{

        "fullAddress": "Via Londra, Rende (CS)",

        "macroregion": "Sud",

        "municipality": "Rende",

        "province": "Cosenza",

        "provinceCode": "CS",

        "region": "Calabria",

        "state": "Italia",

        "streetName": "Via Londra"

}

cadastralInfo

{

        "category": "Stalle, scuderie, rimesse, autorimesse (senza fine di lucro)",

        "categoryCode": "C/6",

        "floor": "S2",

        "income": 163.82,

        "layout": "31",

        "lot": "517",

        "subLot": 9,

        "updateTime": "2019-02-25"

}

estimation

{

        "averageMax": 48880,

        "averageMin": 37440

},

size

{

        "unit": "mq",

        "value": 52

},

type

building

 

 

pacchetto owners

id

8b2d6ff2b408

company

true

entitlement

Proprieta’

label

CERVED GROUP S.P.A.

ratio

1

 

Contratti Pubblici

Frequenza di aggiornamento: giornaliero

Dato presente per: 9.4% / operative

12.8 MLN di contratti dal 2014 ad oggi (che rappresentano il 99.3% dei contratti presenti nel registro dell’Autorità Nazionale Anticorruzione)

 

Dati esposti dall’ Autorità Nazionale Anticorruzione e processati da SpazioDati. Comprendono:

  • committente
  • tipo e descrizione del bando
  • aziende partecipanti al bando
  • aziende vincitrici
  • valore economico, con eventuali importi parziali già erogati
  • datazione e scadenze

 

Atoka API

I dati sono disponibili sia azienda per azienda (se ha partecipato e eventualmente vinto almeno un bando), che nel dettaglio (endpoint /contracts).

documentazione: https://developers.atoka.io/v2/companies_govcontracts.html#companies_packages

pacchetto: govcontracts

endpoint: companies

 

Esempio

applied

true

won

false

 

Per dettagli sui contratti pubblici azienda per azienda invece la risposta sarà come segue. Si tenga presente che la fonte non offre nessun dato ufficiale per operare un matching affidabile (come ad esempio partita iva o codice fiscale).

 

 

documentazione: https://developers.atoka.io/v2/contracts_base.html#contracts_packages

pacchetto: base

endpoint: contracts

Esempio

id

61635e0dfd26

subject

"Servizio 2017"

 

pacchetto base

amount

7000

amountPaid

0

cig

Z461D7E0DA

commissioningBody

{

        "atokaMatched": true,

        "id": "cb7b48472d51",

        "legalName": "UNIVERSITA' DEGLI STUDI DI TRENTO",

        "registeredAddress": {

                "macroregion": "Nord-est",

                "municipality": "Trento",

                "postcode": "38122",

                "province": "Trento",

                "provinceCode": "TN",

                "region": "Trentino-Alto Adige/Südtirol",

                "state": "Italia"

        },

        "taxId": "00340520220",

        "vat": "00340520220"

}

contractorSelection

{

        "code": "4",

        "label": "Procedura negoziata senza previa pubblicazione del bando"

}

participantGroups

[

   {

        "awarded": true,

        "id": "cad77176b112",

        "participants": [

        {

                "ateco": [

                        {

                                "code": "82.91.10",

                                "description": "Attività di agenzie di recupero crediti",

                                "rootCode": "N"

                        }

                ],

                "atokaMatched": true,

                "id": "cad77176b112",

                "legalForms": [

                        {

                                "level": 1,

                                "name": "Società Di Capitale"

                        },

                        {

                                "level": 2,

                                "name": "Società Per Azioni"

                        }

                ],

                "legalName": "INNOLVA S.P.A.",

                "registeredAddress": {

                        "macroregion": "Nord-est",

                        "municipality": "Buja",

                        "postcode": "33030",

                        "province": "Udine",

                        "provinceCode": "UD",

                        "region": "Friuli-Venezia Giulia",

                        "state": "Italia"

        },

                "taxId": "01836920304",

                "vat": "01836920304"

                }

        ]

   },

]

participantGroupsCount

3

startDate

"2017-09-11"

Score di affidabilità / rischio (CGR & CGS)

Frequenza di aggiornamento: settimanale

Dato presente per: CGS — 93.6% / operative

 

Score proprietario di Cerved che utilizza svariate fonti di dati (dati sui pagamenti, negatività, indici di stabilità finanziaria, etc) per produrre una stima della probabilità di default, e in generale dell’affidabilità dell’azienda. Può risultare non calcolabile o soggetto a riesaminazione nei casi in cui non vi siano dati sufficienti o i dati presenti non siano stati adeguatamente verificati.

Questo viene calcolato sia per le aziende che per le persone fisiche, ma con scale diverse: 0-100 per le aziende, dove 100 rappresenta affidabilità massima e rischio pressoché nullo e 0 rischio molto alto di default / affidabilità molto bassa.
Per le persone fisiche lo score è inteso come rating, con scala 1-10; 1 rappresenta affidabilità massima e 10 affidabilità minima.

Inoltre per l’endpoint /people è anche disponibile una variabile booleana indicante la presenza di negatività relative alla persona fisica stessa.

Sottoscore

Su richiesta sono anche disponibili alcuni sottoscore specifici, sia per l’oggetto azienda che per l’oggetto persona; la lista di questi è disponibile nelle pagine di documentazione linkate qui sotto.

L’utilizzo di questi sottoscore richiede autorizzazioni speciali da parte del nostro partner, per cui si prega di contattare sales@atoka.io qualora ci fosse interesse per questi dati.

 

Atoka API

oggetto azienda:

documentazione: https://developers.atoka.io/v2/companies_cervedIndicators.html#companies_packages

pacchetto: cervedindicators

endpoint: companies

Esempio

subscores 

"C13_MBD": {

        "classValue": "4.0",

        "description": "Affidabile",

        "realTime": false,

        "updateTime": "2019-03-23"

},

"C4_EVNT": {

        "classValue": "0.0",

        "description": "ASSENZA DI EVENTI",

        "realTime": false,

        "updateTime": "2019-03-02",

        "value": 50

}

cgs

{

        "label": "Buona",

        "updated": "2019-03-04",

        "value": 69

}

 

oggetto persona:

documentazione: https://developers.atoka.io/v2/people_cervedIndicators.html#people_packages

pacchetto: cervedindicators

endpoint: people

Esempio

cgrP15

{

        "linked": false,

        "updated": "2019-03-05",

        "value": "1.0"

}

cgrP4

{

        "linked": false,

        "updated": "2019-03-05",

        "value": "0.0"

}

cgs

{

        "realTime": true,

        "updated": "2019-03-27",

        "value": "2.0"

}

negativities

false

 

Score propensione al mercato estero

Frequenza di aggiornamento: semestrale

Dato presente per: 11.2% /aziende operative

 

Score calcolato da SpazioDati sulla base di dati ufficiali e non ufficiali riguardo alla propensione di un’azienda a commerciare con l’estero. Le fonti utilizzate sono sia registri ufficiali che indicano una presenza certa di rapporti mercati esteri utilizzati come ground truth, sia dati vari provenienti da visura camerale, siti web, bilanci, ed altri. Non viene calcolato per pubbliche amministrazioni, imprese molto piccole o aventi alcuni codici ATECO specifici che suggeriscono attività per cui la propensione al mercato estero non è indicativa (ad esempio, attività ristorative).

Atoka API

documentazione: non ancora disponibile

pacchetto: foreignmarket

endpoint: companies

Esempio

areas

[

   {

        "continent": "019",

        "continentLabel": "America",

        "lastUpdate": "2019-02-27",

        "official": false,

        "provenance": [

         "webLang"

      ],

        "type": "continent"

    },

    {

        "continent": "142",

        "continentLabel": "Asia",

        "lastUpdate": "2018-10-07",

        "official": true,

        "provenance": [

         "infocamere"

       ],

        "state": "CN",

        "stateLabel": "Cina",

        "subRegion": "030",

        "subRegionLabel": "Asia orientale",

        "type": "state"

    },

]

exportPropensity

{

        "score": 1,

        "scoreLabel": "certain",

        "updateTime": "2018-09-27"

}

Score innovazione, centralità web, Indice di Disagio Sociale e Edilizio

Frequenza di aggiornamento: mensile / mensile / ogni censimento

Dato per presente per::

innovazione: 10.9% / aziende operative

centralità web: 12.7% / aziende operative

IDE & IDS: 92.3% / aziende operative

 

L’innovation score di SpazioDati è indice dell’affinità di un’azienda con il mondo delle startup e aziende innovative. È sviluppato a partire dalle entities (o concetti chiave), le quali a loro volta sono ricavate da SpazioDati a partire da informazioni disponibili su siti web e in visura camerale. È disponibile sia per categoria (cioè confrontato con aziende con ateco simili) e globale. Espresso sempre in forma di quantile.

Lo score centralità web indica l’importanza dei siti dell’azienda (se presenti) all’interno del grafo dei siti corporate. Similmente allo score innovazione comprende uno score per categoria e uno globale, sempre espressi in forma di quantile.

Gli indici di disagio sociale (IDS) e di disagio edilizio (IDE) sono due score calcolati a partire dagli ultimi dati di censimento, calcolato per ogni azienda sulla base della cella censuaria della sede legale della stessa. Uno score alto rappresenta un livello alto di disagio.

Per web centrality score e indici territoriali si prega di contattare sales@atoka.io

Atoka API

documentazione: https://developers.atoka.io/v2/companies_atokaIndicators.html#companies_packages 

pacchetto: atokaindicators

endpoint: companies

Esempio

innovation

{

        "categoryScore": 0.59,

        "categoryScoreLabel": "medium",

        "score": 0.57,

        "scoreLabel": "medium",

        "updateTime": "2019-02-24"

}

territorialScores

{

        "IDE": {

        "label": "minimum",

        "value": 0,

        "valueNational": 0

    },

        "IDS": {

        "label": "medium",

        "value": 0.67,

        "valueNational": 0.7092

   }

}

webCentrality

{

        "categoryScore": 0.97,

        "categoryScoreLabel": "top",

        "score": 0.95,

        "scoreLabel": "top",

        "updateTime": "2019-02-24"

}

News

per informazioni riguardo l’utilizzo di questo endpoint, si prega di contattare sales@atoka.io

 

Frequenza di aggiornamento: giornaliera

Copertura: 213000 articoli con menzioni di aziende negli ultimi 60gg

 

Questo endpoint permette di ottenere informazioni su notizie, in particolare quelle con riferimenti ad aziende o persone con partecipazioni o ruoli all’interno delle aziende.

Viene anche calcolato uno score di confidence che misura la probabilità che la menzione trovata per una data azienda sia effettivamente corretta (nomi simili, out-of-context, etc.), per cui è possibile, a discrezione dell’utente, selezionare una soglia per poter scegliere situazioni quali:

  • preferire eventuali menzioni quasi certe e rimuovere quelle più incerte
  • selezionare quasi tutte le menzioni anche quelle più incerte (valore minimo del parametro 0.6)

 

Atoka API

documentazione: https://developers.atoka.io/v2/news.html#news_companies

pacchetto: 

endpoint: news

 

Esempio

sector

"borsa"

body*

"Borsa italiana news. Piazza Affari non attende [...] 252 punti base."

date

"2019-03-26T04:44:57"

sourceType

"press"

sourceName

"ilsussidiario.net"

abstract

"Borsa italiana news. Piazza Affari non attende molti dati macroeconomici in giornata. Previste però emissioni di Btp e Bund. Gli aggiornamenti sulle azioni più importanti 26.03.2019 - Lorenzo TorrisiLapressePIAZZA..."

companies

[

                {

                        "mentions": [

                                {

                                "field": "body",

                                "confidence": 0.971,

                                "end": 14,

                                "start": 0

                                },

                                {

                                "field": "body",

                                "confidence": 0.885,

                                "end": 34,

                                "start": 21

                                },

                                {

                                "field": "body",

                                "confidence": 0.87,

                                "end": 740,

                                "start": 727

                                }

                        ],

                        "companyId": "bccbdeb3dab1"

                },

                ...

        ]

free

true

summary

"Piazza Affari non attende molti dati macroeconomici in giornata. Gli aggiornamenti sulle azioni più importanti 26.03.2019 - Lorenzo TorrisiLapressePIAZZA AFFARI LOTTA PER I 21.000 PUNTI Non sono previsti molti dati macroeconomici di rilievo nella giornata di oggi. Lo spread tra Btp e Bund è salito a 252 punti base."

entities

{

        "it": [

                        {

                        "url": "http://it.wikipedia.org/wiki/Prodotto_interno_lordo",

                        "relevance": 0.056,

                        "confidence": 0.858,

                        "image": {

                        "full": "https://commons.wikimedia.org/wiki/Special:FilePath/GDP_EU_TOP_5.svg",

                        "thumbnail": "https://commons.wikimedia.org/wiki/Special:FilePath/GDP_EU_TOP_5.svg?width=300"

                                },

                "label": "PIL"

                        },

                ...

                ]

        }

 

sourceLocality

"national"

url

"https://www.ilsussidiario.net/news/economia-e-finanza/2019/3/26/borsa-italiana-oggi-piazza-affari-lotta-per-i-21-000-punti-26-marzo-2019/1863452/"

headline

"BORSA ITALIANA OGGI/ Piazza Affari lotta per i 21.000 punti (26 marzo 2019)"

newsId

b_ada25f3f5d297216ef344f4f3879941b

highlight

 {

        "headline": "BORSA ITALIANA OGGI/ Piazza Affari lotta per i 21.000 punti (26 marzo 2019)",

        "abstract": "Borsa italiana news. Piazza Affari non attende molti dati macroeconomici in giornata. Previste però emissioni... i ribassi di Amplifon (-1,1%), <em>Banco Bpm</em> (-1,4%), <em>Cnh Industrial</em> (-1,1%) e Tenaris (-1%). Lo spread... <em>Borsa italiana</em> news. Piazza Affari non attende..."

},

 

categories

[

                "sport",

                "economy_business_and_finance",

                "stock_market_news"

]

lang

"it"

*il testo completo dell’articolo è stato tagliato per questioni di visualizzazione.

** campi mancanti perché non presenti per questa notizia: events, personNames.

Tecnologie

Frequenza di aggiornamento: mensile

Dato presente per: 5.3% / aziende operative

 

Questo pacchetto offre i dati ricavati sulle tecnologie utilizzate a partire dal sito (o da più siti, se presenti) associato all’azienda.

Queste sono raggruppate per categoria per poter individuare in maniera più efficace quali tipi di tecnologie vengono utilizzate, tra:

  • analytics
  • apps
  • blog
  • cms (content management system)
  • e-commerce
  • marketing
  • payments

Atoka API

documentazione: https://developers.atoka.io/v2/companies_technologies.html#companies_packages

pacchetto: technologies

endpoint: companies

Esempio

blog

[

  {

        "name": "wordpress",

        "sources": [

"http://glammilano.it"

],

        "version": "4.9.9"

  }

]

cms

[

  {

        "name": "wordpress",

        "sources": [

"http://glammilano.it"

],

        "version": "4.9.9"

  }

]

marketing

[

  {

        "name": "yoastseo",

        "sources": [

"http://www.glammilano.it"

        ]

  }

]

*non incluse perché non presenti per quest’azienda esempio:  analytics, apps, ecommerce, payments.

Certificazioni

Frequenza di aggiornamento: bimestrale

Dato presente per: 1.2% / aziende operative

 

Questi dati rappresentano le certificazioni ISO di fonte Accredia. È possibile ricavare info sul tipo di certificazione, l’istituzione che l’ha fornita, la data di riferimento e l’attività per cui è stata certificata l’azienda.

Ogni azienda può presentare una o più certificazioni.

Atoka API

documentazione: non ancora disponibile

pacchetto: certifications

endpoint: companies

Esempio

singolo oggetto:

activity

"Gestione energetica della progettazione e fabbricazione di macchine per movimento terra e sollevatori telescopici mediante le fasi di costruzione di componenti (taglio, lavorazioni meccaniche, assemblaggio), verniciatura e montaggio"

institution

"DNV GL BUSINESS ASSURANCE ITALIA S.R.L."

startDate

"2016-12-30"

type

"UNI CEI EN ISO 50001:2011"

 

Note & sales funnel

FEATURE IN VERSIONE SPERIMENTALE

per informazioni riguardo l’utilizzo di questo endpoint, si prega di contattare sales@atoka.io

 

Utilizzando le API di Atoka è altresì possibile gestire un sales funnel per i propri clienti presenti su Atoka.

I cosiddetti lead status — Nuovo, Primo Contatto, Appuntamento, Proposta, Negoziazione, Vinto — rappresentano lo stato di avanzamento delle trattative con i propri clienti. Questa informazione è corredata da una data di aggiornamento ed eventuali note, in forma di testo, che accompagnano un cambiamento di status nel sales funnel.

Per poter utilizzare questa funzione è necessario l’Atoka ID dell’azienda stessa (disponibile tramite l’endpoint /companies).

Atoka API

documentazione: non ancora disponibile

pacchetto:

endpoint: leadevents

Liste

FEATURE IN VERSIONE SPERIMENTALE

per informazioni riguardo l’utilizzo di questo endpoint, si prega di contattare sales@atoka.io

 

Il servizio permette di gestire (creare, leggere, aggiornare, cancellare) liste di aziende.

È possibile anche gestire la condivisione e visibilità di liste ad altri utenti appartenenti allo stesso gruppo (applicazione).


[1] Si noti che alcuni identificatori non sono necessariamente univoci. Esistono ad esempio dei casi limite per cui la partita IVA e il Codice Fiscale, non identificano univocamente un singolo soggetto (es: Omocodie)

[2] la copertura può variare per ogni tipo di dato: ad es. la partita IVA è presente per il 95% delle aziende operative, mentre scende al 61% per le non operative. Nome legale e natura giuridica hanno invece copertura del 100% sia per operative che per non operative.

[3] dati riferiti ai bilanci chiusi nell’anno 2017

[4] la proprietà può essere legata a persone o ad aziende.