Ryan H. Rindlisbacher
O big data está na moda na mineração de dados, mas normalmente está limitado apenas às grandes empresas. O small data é geralmente considerado um subconjunto do big data. Por exemplo, o Google detém triliões de registos utilizados para pesquisas, mas isso não é útil por si só. Quando alguém pesquisa algo no Google, normalmente apenas são mostrados dez a quinze resultados na primeira página. Para que tal ocorresse, a Google pegou em big data e produziu pequenos dados. O verdadeiro valor está nos pequenos subconjuntos de dados. Esta ideia, no entanto, de que os dados pequenos são o subconjunto dos grandes dados, não é a única definição de dados pequenos. As pequenas empresas, que produzem apenas pequenos dados, também podem beneficiar das práticas de data mining. Que problemas surgem quando se olha apenas para pequenos dados?