Оскільки еволюція великих даних продовжується, ці три питання, пов’язані з великими даними — конфіденційність даних, безпека даних і дискримінація даних — стануть пріоритетними питаннями для узгодження для федеральних урядів і урядів штатів, власників бізнесу, спеціалістів із великих даних і споживачів.
Однією з основних проблем, пов’язаних із великими даними, є можливість порушення конфіденційності даних і вразливості безпеки. Збір і аналіз великих обсягів даних підвищує ризик несанкціонованого доступу, витоку даних і кібератак, створюючи загрози конфіденційності та безпеці для окремих осіб і організацій.
Великі обсяги великих даних створюють серйозні проблеми з безпекою, зокрема проблеми конфіденційності даних, створення підроблених даних і потреба в аналітиці безпеки в реальному часі. Без належної інфраструктури відстеження походження даних стає складним під час роботи з масивними наборами даних.
Упередженість і дискримінація в аналізі даних є третім етичним аспектом. Алгоритми, які використовуються в аналітиці великих даних, схильні до успадкування зміщень від даних, на яких вони навчаються. Це може призвести до несправедливих або дискримінаційних результатів у таких сферах, як наймання, кредитування та правоохоронна діяльність, увічнюючи існуючу суспільну нерівність.
Зберігання. Великі набори даних вимагають значної ємності, а також керувати і підтримувати інфраструктуру для зберігання таких даних може бути дорогим і складним. Крім того, через розмір важливо, щоб інструменти аналізу даних не вимагали копіювання даних для доступу кількох користувачів.
Оскільки великі дані збільшуються в розмірі, а мережа підключених пристроїв вибухає, все більше наших даних піддаються потенційним порушенням безпеки. Багато організацій уже стикалися з безпекою даних ще до ускладнень, доданих великими даними, тому багато з них потонули, щоб не відставати.