Data zijn overal: gecreëerd door mensen of gegenereerd door machines, zoals sensoren die informatie verzamelen over klimaatverandering, satellietbeelden, digitale foto's en video's, gegevens over onlinewinkelen, gps-signalen, enz. Deze informatie is een ware goudmijn, maar brengt ook nieuwe uitdagingen met zich mee: de datasets zijn zo groot en zo complex dat nieuwe ideeën, instrumenten en infrastructuur nodig zijn om ze te verwerken.
Data is everywhere: it can either be created by people or generated by machines, such as sensors gathering climate information, satellite imagery, digital pictures and videos, purchase transaction records, GPS signals, etc. This information is a real gold mine. But it is also challenging: today's datasets are so huge and complex to process that they require new ideas, tools and infrastructures.