O službe

Údaje v databáze, ich kvalita

Služba Datanest je databáza rôznorodých informácií o fungovaní Slovenska: o vládach, úradoch, politických stranách, hospodárení, ale napríklad aj o väzbách medzi jednotlivými subjektmi pôsobiacimi v rámci krajiny.

Väčšinu informácií týkajúcich sa spravovania a fungovania štátu majú úrady povinnosť na vyžiadanie poskytovať verejnosti. Aliancia Fair-play si takéto informácie pýta a v podobe surových dát ich následne zverejňuje v Dataneste.

Všetky informácie zhromaždené v Dataneste sa nachádzajú v sekcii “Katalóg údajov”. Ten obsahuje dáta z niekoľkých hlavných oblastí:

  1. registre organizácií, občianskych združení a nadácií
  2. databázu údajov o verejných obstarávaniach
  3. zoznamy osôb: advokátov, poslaneckých asistentov, funkcionárov strán, veľvyslancov a diplomatov, poradcov vlád alebo poslancov Europarlamentu
  4. informácie o dlhoch subjektov voči štátu: napríklad zoznam daňových dlžníkov
  5. informácie o peňažných tokoch v politike, financovaní politických strán a sponzoroch politikov
  6. informácie o dotáciách z grantov a eurofondov
  7. zoznamy členov vlád, šéfov úradov alebo štátnych podnikov
  8. informácie o privatizáciách, predajoch a prenájmoch verejného majetku.

Všetky údaje sú v Dataneste zverejnené vo forme tabuliek v jednoduchom grafickom rozhraní. V tabuľkách je možné vyhľadávať s pomocou vyhľadávacieho nástroja v pravom hornom rohu stránky. Na hlbšiu prácu s údajmi je pri niektorých tabuľkách k dispozícii API – rozhranie pre programovanie aplikácií. Ako používať API? (Odklik na kapitolu o API)

Poslanie projektu

Datanest bol Alianciou Fair-play vytvorený ako nástroj na boj proti korupcii na Slovensku. Katalóg verejných informácií slúži ako zdroj pre investigatívu Aliancie Fair-play a pre novinárov, analytikov, watchdogové organizácie, ale aj pre občanov. Dáta je možné z Datanestu zdarma čerpať a používať v iných projektoch na základe licenčných podmienok, spôsob použitia dát všek nesmie byť v rozpore s poslaním projektu.

Ako získavame údaje pre Datanest

Veľkú časť informácií zverejnených v Dataneste získala Aliancia Fair-play od štátnych inštitúcií na základe Zákona č. 211/2000 o slobodnom prístupe k informáciám.

Ďalšia časť informácií pochádza z verejne dostupných zdrojov, napríklad z Vestníku verejného obstarávania alebo zo Štatistického registra organizácií.

Vo výnimočných prípadoch (zoznamy členov parlamentu, zoznamy ministrov) čerpáme informácie z oficiálnej komunikácie inštitúcií.

Dáta, ktoré dokážeme získavať strojovo (napríklad Vestník verejného obstarávania), automatizovane sťahujeme z Vestníka a zverejňujeme v Dataneste. Informácie získané na základe Zákona o slobodnom prístupe k informáciám dostávame od inštitúcií poštou alebo e-mailom, spracúvame ich na príslušný formát a následne zverejňujeme v Dataneste. Podobným spôsobom upravujeme a následne zverejňujeme aj dáta získané z webových stránok inštitúcií.

Chybovosť dát

Vzhľadom na množstvo dát, ktoré sa pokúšame v Dataneste zverejniť, nevieme stopercentne zaručiť, že dostupné dáta sú bezchybné. Väčšina informácií je na zverejnenie pripravovaná manuálne a za takýchto okolností je ľudský faktor vždy riziko.

Nepresnosti a nedostatky, ktoré si všimneme, sa snažíme odstrániť. Tam, kde nie je možné alebo vhodné chybu opraviť, snažíme sa situáciu riešiť najmä tým, že na konkrétne chyby upozorňujeme. Popis chýb je zverejnený v jednotlivých tabuľkách v záložke “Informácie”.

V prípade, že v Dataneste nájdete nesprávne údaje, alebo údaje, ktoré nepôsobia vierohodne, prosíme vás, aby ste túto skutočnosť nahlásili na e-mailovej datanest(at)fair-play.sk. Na chybovosť dát je tiež možné upozorňovať v komentároch, využívajte ich.

Aktuálnosť dát

Niektoré údaje zverejnené v Dataneste už nemusia byť aktuálne. Všetky tabuľky, pri ktorých chýbajú údaje za určité obdobia, sa snažíme zaktualizovať, no je to postupný proces. Venujte preto pozornosť dátumom, ku ktorým bola informácia označená za aktuálnu, prípadne ku ktorým sa informácia viaže.

Poskytované informácie sa aktualizujú v rôznych intervaloch. Informácia o aktualizácii je uvedená v jednotlivých tabuľkách.

Právna váha dát a overovanie dát
Kvôli možnej chybovosti odporúčame s dátami pracovať iba ako s orientačnými. Dáta nie sú použiteľné na právne úkony. V prípade, že chcete mať istotu, odporúčame informácie samostatne overiť na príslušnom úrade.

V aplikáciách využívajúcich dáta z Datanestu odporúčame uvádzať upozornenie, že informácie majú len orientačný charakter.

Ako pracovať s API Datanestu

API slúži na čerpanie informácií z Datanestu vo formáte, ktorý je jednoducho spracovateľný externými stránkami alebo aplikáciami. Tieto aplikácie nevyrába Aliancia Fair-play, vyrábať by ich zároveň s použitím dát z Datanestu mala verejnosť.

Pre používanie API majú konto aktivované všetci zaregistrovaní používatelia. Ak sa stretnete s chybou access_denied, požiadajte správcu stránky o aktiváciu vášho konta pre používanie API.

K použitiu API je potrebný API kľuč. K dispozícii ho dostáva každý zaregistrovaný používateľ a pre každého používateľa je API kľúč unikátny. Nájdete ho vo sekcii “Moje konto”, v nej možné aj nechať si vygenerovať nový kľúč.

Potrebné pre prácu s API je vo väčšine prípadov ID datasetu, s ktorým chcete pracovať. Dataset ID je unikátne číslo datasetu. Ak si otvoríte dataset, v adrese uvidíte napríklad /datasets/1, pričom 1 je číslo datasetu.

Rozhranie pre API metódy je na adrese: /api/[metóda]?api_key=[váš kľúč] a ďalšie parametre.

Na stiahnutie popisu datasetu vo formáte XML a iných slúži metóda dataset_description s parametrom dataset_id. Príklad: /api/dataset_description?api_key=123&dataset_id=1

Na stiahnutie celého datasetu, slúži metóda dataset_dump s parametrom dataset_id. Príklad: /api/dataset_dump?api_key=123&dataset_id=1

Pre stiahnutie záznamu vo formáte XML a iných slúži metóda record s parametrami dataset_id a record_id. Príklad: /api/record.xml?api_key=123&dataset_id=1&record_id=1

Funkcionalita na manuálny prístup k dátam

Relácie XML – stiahne zoznam relácií v datasete vo formáte XML
Zmeny XML – stiahne zoznam zmien v datasete vo formáte XML
Popis XML – stiahne informácie o datasete a štruktúru tabuľky vo formáte XML
Obsah CSV – stiahne obsah datasetu vo formáte CSV

Dokumentácia

Zdrojovové kódy a dokumentácia sa nachádzajú na:


  1. http://github.com/fairplaysk/datacamp
  2. http://github.com/Stiivi/Datacamp-ETL

Iné záujímavé dáta (vhodné pre mash up) môžete nájsť na: http://px-web.statistics.sk/PXWebSlovak/