Set de date

Diverse grafice ale setului de date multivariate setul de date floare de iris introdus de Ronald Fisher (1936).[1]

Un set de date (sau un set de date) este o colecție de date. În cazul datelor tabelare, un set de date corespunde unuia sau mai multor tabele de bază de date, în care fiecare coloană a unui tabel reprezintă o anumită variabilă, iar fiecare rând corespunde unei înregistrări date a setului de date în cauză. Setul de date listează valori pentru fiecare dintre variabile, cum ar fi, de exemplu, înălțimea și greutatea unui obiect, pentru fiecare membru al setului de date. Seturile de date pot consta, de asemenea, dintr-o colecție de documente sau fișiere.[2]

În disciplina de date deschise, setul de date este unitatea de măsurare a informațiilor eliberate într-un depozit public de date deschise. Portalul european data.europa.eu reunește mai mult de un milion de seturi de date[3]. Alte probleme (surse de date în timp real,[4] seturi de date non-relaționale etc.) sporesc dificultatea de a ajunge la un consens în acest sens.[4]

Referințe

  1. ^ Eroare la citare: Etichetă <ref> invalidă; niciun text nu a fost furnizat pentru referințele numite fisher36
  2. ^ Snijders, C.; Matzat, U.; Reips, U.-D. (). „'Big Data': Big gaps of knowledge in the field of Internet”. International Journal of Internet Science. 7: 1–5. Arhivat din original la . Accesat în . 
  3. ^ „European open data portal”. European open data portal. European Commission. Accesat în . 
  4. ^ a b Atz, U (). „The tau of data: A new metric to assess the timeliness of data in catalogues” (PDF). CEDEM 2014 Proceedings. Arhivat din original (PDF) la . Accesat în . 

Legături externe

Wikţionar
Wikţionar
Caută „Set de date” în Wikționar, dicționarul liber.
  • Data publice Guvernul României
  • GCMD – the Global Change Master Directory containing over 34,000 descriptions of Earth science and environmental science data sets and services
  • Humanitarian Data Exchange(HDX) – The Humanitarian Data Exchange (HDX) is an open humanitarian data sharing platform managed by the United Nations Office for the Coordination of Humanitarian Affairs.
  • NYC Open Data – free public data published by New York City agencies and other partners.
  • Relational data set repository Arhivat în , la Wayback Machine.
  • Research Pipeline – a wiki/website with links to data sets on many different topics
  • StatLib–JASA Data Archive
  • UCI – a machine learning repository
  • World Bank Open Data – Free and open access to global development data by World Bank