Попри те, що сам термін Big Data з’явився близько 10 років тому, чіткого визначення він не має й досі. Втім, у цій статті ми все пояснимо. Простими словами «big data» — це сукупність даних та методи їхнього аналізу.

З огляду на постійне збільшення населення й пропорційне зростання кількості ґаджетів, обробка щораз більших обсягів даних стала необхідністю. Сьогодні у нашому світі інформації не те що багато — її занадто багато, і щодня стає більше.

Зверніть увагу на Google, YouTube чи Instagram — їхня аудиторія вимірюється мільярдами живих людей. Навіть якщо ми відкинемо усіх ботів — спробуйте лиш уявити собі, скільки дій виконують ці люди одночасно. У цьому випадку Big Data — це логи дій користувачів.

Ці дії слід не тільки правильно зібрати, а ще й структурувати та проаналізувати. Основна відмінність Big Data від звичайної бази даних у тому, що інформація надходить постійно, її стає дедалі більше, але аналізувати ці дані потрібно враховуючи усі попередні кластери інформації.

Дуже багато таких даних виробляє й інтернет речей: фітнес-трекери, смарт-годинники, камери відеонагляду збирають і кластеризують інформацію про користувачів у гігантських масштабах. Але ще одна проблема аналітиків криється у тому, що інформація про кожного користувача має безліч критеріїв — від режиму сну до музичних вподобань і останніх придбаних товарів.

Якщо хочете краще зрозуміти аналітику поведінки клієнтів, зверніть увагу на різні «картки лояльності» у вашому гаманці. Як гадаєте, магазини справді хочуть відшкодувати вам якісь кошти?

Можна сказати, що Big Data були давно, нам просто бракувало простору, щоб їх зберігати й обробляти. Як і будь-яка технологічна інновація, що вмить з’являється у нашому житті, методи обробки й аналізу Big Data найбільше вплинули на промисловість, торгівлю та медицину.

Big Data і медицина

Найпопулярнішими сферами обробки великих даних у медицині є офтальмологія та дерматологія. Це ті галузі сучасної медицини, де найбільше зображень, що впливають на діагностику. Раніше старенькі комп’ютери кілька хвилин відкривали картинки. Сьогодні ситуація зовсім інша: потужні машини зберігають та обробляють дедалі більшу кількість біомедичних зображень, допомагаючи медикам вивчати взаємозв’язки між хворобами.

Компанія Catapult, наприклад, завдяки аналізу великих даних допомагає виявити залежність між травмами та тренуваннями, стежить за інтенсивністю вправ і застерігає людину, якщо та потенційно може травмуватись. Послугами Catapult користуються провідні команди НХЛ та НБА.

Google співпрацює з американськими клініками, відстежує пошукові запити щодо епідемії грипу та передбачає, в якому регіоні виникне спалах хвороби.

Невдовзі вся історія медичних «маніпуляцій» конкретної особи буде зберігатися у великій базі даних. Обробка цих даних виявляє статистичні збіги, прогнозує розвиток хвороби і генерує рекомендації як для лікаря, так і для пацієнта. Обробка великих реєстрів медичних даних також допоможе прогнозувати «хвилі» захворювань.

2013 року завдяки електронній медкартці, де зберігалась уся інформація про клієнта, вчені знайшли залежність між мозковою деградацією та цукровим діабетом. Науковці з Університету Кейптауну, наприклад, проаналізували найпоширеніші види онкологічних захворювань і з’ясували, що злоякісні пухлини кишечника, легень та яєчників мають чіткі генетичні маркери. Без правильного аналізу Big Data до цього висновку неможливо було б дійти.

Медичні Big Data допомагають запобігти розвитку хвороби на ранній стадії завдяки аналізу серцево-судинного тиску, пульсу, дихання та рівня цукру в крові.

Техніка

Для обробки петабайтів медичної інформації є комп’ютер під назвою IBM Watson. Він аналізує дані про лікування величезної кількості осіб і допомагає лікарю підібрати оптимальне лікування для конкретного пацієнта.

IBM Watson

Кілька років тому Apple та IBM об’єднали зусилля, аби IBM Watson отримував ще більше структурованої інформації з iPhone та Apple Watch. Одним із найперспективніших векторів розвитку Big Data у медицині є хірургія.

Навіть найдосвідченішим хірургам не хочеться оперувати пацієнта, що може померти за кілька хвилин. Тому система аналізує усі наявні протоколи операцій і візуалізує кольорами зони ризику. Це дозволяє лікарю набагато краще оцінити ризики при операції. У побуті ж американці просто підключають стетоскоп до iPhone та відправляють дані своєму лікарю.

Водночас у великий кластер збирається інформація по всіх пацієнтах. Її сортують за критеріями і згодом шукають залежності, підтверджують або спростовують міфи.

Дуже  важливо, аби великі бази даних пацієнтів із різних країн були зібраними та структурованими. Нині це — одне з основних завдань Big Data медицини.

І що більше спеціалістів із Big Data Analytics та Machine Learning у нас буде, то більше шансів, що великі дані не лише сприятимуть прогресу, але й зроблять людське життя безпечнішим.

Коменти